データサイエンスの学習には、実際のデータセットを用いた実践的な経験が不可欠です。
しかし、どこで適切なデータセットを見つけることができるのでしょうか?今回は、日本政府が提供する統計データポータル「e-Stat」をご紹介します。
このサイトは、データサイエンスの学習に適したリソースが豊富に揃っており、初心者から上級者まで幅広く利用できます。本記事では、e-Statの特徴とその活用方法について詳しく解説します。
豊富なデータセットが入手できる「政府統計の総合窓口(e-Stat)」
日本政府が公開している「政府統計の総合窓口(e-Stat)」は、データサイエンスの学習に適したリソースが豊富に揃っています。このウェブサイトは、各府省が公表する統計データを一つにまとめて提供しており、統計データの検索や地図上での表示など、統計を利用する上で多くの便利な機能を備えています。
データサイエンスを学ぶ上で重要なのは、実際のデータを用いて分析を行うことです。このサイトでは、様々な分野の統計データを探すことができます。また、主要指標をグラフや時系列表で表示する機能、地図上に統計データを表示する機能などを利用することで、データの視覚化や地域分析の技術を学ぶことも可能です。
入手先サイト
政府統計の総合窓口(e-Stat)のサイトは以下となります。

今回はこのe-Statのサイトから都道府県別の人口推計のデータをダウンロードする方法を解説します。

人口推計のデータを入手する手順
e-Statのサイトにアクセスしたら、キーワード検索
の欄に人口統計 都道府県別
と入力して検索
をクリックします。

政府統計一覧の中から人口推計
をクリックします。

人口推計
のデータベース
をクリックします。

人口推計のページが表示されたら画面を下方向にスクロールします。

今回は平成26年10月1日現在人口推計[21件]
の項目をクリックします。

データセット一覧のページから、表番号005
の都道府県,男女別人口-総人口,日本人人口
をクリックします。

統計表・グラフ表示のページで、画面右側のダウンロード
をクリックします。

ダウンロード設定
の項目を以下の赤枠のように設定します。設定し終わったら、画面を下方向にスクロールします。

注釈を表示する
にチェックが入っていないことを確認し、ダウンロード
をクリックします。

ファイル名FEH_00200524_230716174817.csv
のダウンロードをクリックします。

これで人口推計のデータをダウンロードすることができました。

ダウンロードしたデータ(CSV)
ダウンロードしたデータはcsvファイルとなっており、Excelで開くと以下のようになっています。
2010年~2014年までの各都道府県の人口の変化が確認できるデータとなっています。

まとめ
「政府統計の総合窓口(e-Stat)」は、データサイエンスの学習に必要なデータや情報を提供する優れたリソースです。
データサイエンスを学びたい方々にとって、すぐに使用できるデータセットが多く公開されていますので、ぜひ活用してみてください。
また、以下の記事で効率的にPythonのプログラミングスキルを学べるプログラミングスクールの選び方について解説しています。最近ではほとんどのスクールがオンラインで授業を受けられるようになり、仕事をしながらでも自宅で自分のペースで学習できるようになりました。
スキルアップや副業にぜひ活用してみてください。

スクールではなく、自分でPythonを習得したい方には、いつでもどこでも学べる動画学習プラットフォームのUdemyがおすすめです。
講座単位で購入できるため、スクールに比べ非常に安価(セール時1200円程度~)に学ぶことができます。私も受講しているおすすめの講座を以下の記事でまとめていますので、ぜひ参考にしてみてください。

それでは、また次の記事でお会いしましょう。


コメント