本3ではない Forbes global 2000における国別シェアの推移(2005年〜2017年)

これは本 Advent Calendar 2017 - Adventar 3日目の記事ですが、本の話ではないです。

Forbes Global 2000のデータを集めてみた。

Forbes Global 2000はフォーブス誌が毎年発表する、世界の公開会社(public company)上位2000社のランキングリストです。Fortune Global 500、Financial Times Global 500も似たような世界の企業のランキングですが、集計する範囲とランキング方法が違います。

Forbes Fortune Financial Times
集計する範囲 公開企業 収益を公開している企業 不明
ランキング方法 Sales(売上高)、Profits(利益)、Assets(資産)、Market Value(市場価値)に基づく Revenues(収益) Market Caps(時価総額

Fortuneはすでにまとまってリストが存在したのでForbesのデータを収集することにしました。

2003年から毎年発表されていましたが、2005年以降13年分が収集できました。(残念)

データの収集にはrequestとpandasを用い、データの加工にsed,awk、可視化にRを用いました。

以下のサイトからデータを収集しました。

各年ごとのcsvを作成し、国別の数をカウントしました。yearのカラムを追加し、catしました。終り

f:id:raven38:20171205000225p:plain

こうゆうデータを販売するのにいい方法はないだろうか。

TODO

  • R力が足りないので鍛える
  • 国を減らす
  • 地域ごとで集計してみる

他にありますか?