本3ではない Forbes global 2000における国別シェアの推移(2005年〜2017年)
これは本 Advent Calendar 2017 - Adventar 3日目の記事ですが、本の話ではないです。
Forbes Global 2000のデータを集めてみた。
Forbes Global 2000はフォーブス誌が毎年発表する、世界の公開会社(public company)上位2000社のランキングリストです。Fortune Global 500、Financial Times Global 500も似たような世界の企業のランキングですが、集計する範囲とランキング方法が違います。
Forbes | Fortune | Financial Times | |
---|---|---|---|
集計する範囲 | 公開企業 | 収益を公開している企業 | 不明 |
ランキング方法 | Sales(売上高)、Profits(利益)、Assets(資産)、Market Value(市場価値)に基づく | Revenues(収益) | Market Caps(時価総額 ) |
Fortuneはすでにまとまってリストが存在したのでForbesのデータを収集することにしました。
2003年から毎年発表されていましたが、2005年以降13年分が収集できました。(残念)
データの収集にはrequestとpandasを用い、データの加工にsed,awk、可視化にRを用いました。
以下のサイトからデータを収集しました。
- https://www.forbes.com/static/for2k2005/rank_1.html
- https://www.forbes.com/lists/2006/18/06f2000_The-Forbes-2000_Rank.html
- https://www.forbes.com/lists/2007/18/biz_07forbes2000_The-Global-2000_Rank.html
- https://www.forbes.com/lists/2008/18/biz_2000global08_The-Global-2000_Rank.html
- https://www.forbes.com/lists/2009/18/global-09_The-Global-2000_Rank.html
- https://www.forbes.com/lists/2010/18/global-2000-10_The-Global-2000_Rank.html
- https://www.forbes.com/lists/2012/18/global2000_2011.html
- https://www.macrofocus.com/treemap/Forbes%20Global%202000%20-%202012.xls
- https://www.macrofocus.com/treemap/Forbes%20Global%202000%20-%202013.xls
- https://www.macrofocus.com/treemap/Forbes%20Global%202000%20-%202014.xls
- https://www.macrofocus.com/treemap/Forbes%20Global%202000%20-%202015.xls
- https://www.macrofocus.com/treemap/Forbes%20Global%202000%20-%202016.xls *https://www.macrofocus.com/treemap/Forbes%20Global%202000%20-%202017.xls
各年ごとのcsvを作成し、国別の数をカウントしました。yearのカラムを追加し、catしました。終り
こうゆうデータを販売するのにいい方法はないだろうか。
TODO
- R力が足りないので鍛える
- 国を減らす
- 地域ごとで集計してみる
他にありますか?