Topics

「Think IT」サイトに執筆記事掲載!「Excelで本格的なデータ分析が出来る!? プロが教えるPower BI入門」

2015年2月12日(木)、「Think IT」のWebサイトに当社の米倉 宏治が執筆した記事「Excelで本格的なデータ分析が出来る!? プロが教えるPower BI入門」が掲載されました。

記事では、身近なExcelを利用してデータの統計を行い、結果を可視化するPower BIというサービスを実例を交えてわかりやすく紹介されています。Power BIは、Excelのアドインとして機能するBI(Business Intelligence)ツールです。

ぜひ、ご一読ください。

Excelで本格的なデータ分析が出来る!? プロが教えるPower BI入門

※本記事は、インプレス「Think IT」の掲載内容を転載したものです。

読者の皆様はExcelを「使いこなして」いますか? 普段から使っていても意外に使いこなせていない人も多いのではないでしょうか? 広く使われているExcelでも、使い方によってはかなり高度な分析もできるようなります。仕事でちょっとした分析が必要なこともあると思います。また場合によっては、朝までに分析をしたい! ということもあるでしょう。実際に、昨今のデータ分析指向のブームに乗って、Excelをツールに採用するケースが増えています。この状況を肌感覚で感じられている方もいるでしょう。

今回は身近なExcelを利用してデータの統計を行い、結果を可視化するPower BIというサービスをご紹介します。Power BIは、Excelのアドインとして機能するBI(Business Intelligence)ツールです。

はじめに、広く行われている一般的なデータ処理の手順を示します。

  • データをワークシートに作成する。
  • ワークシートのデータの範囲を指定して、ピボットテーブルを作成し、データの統計を行う。
  • ワークシートのデータの範囲を指定して、ピボットグラフを作成し、データを可視化する。

このようなExcel単体での分析処理では、処理対象のデータがワークシートの範囲に限られるため、統計分析結果の活用も限られたものになります。

Power BIの4つの基本機能であるPower Query、Power Pivot、Power View、Power Mapを利用することで、上記の作業内容を次のように拡大できます。

  • Power Queryを利用することで、Excelブック内のデータだけでなく、CSVなどの外部ファイル、Webページ、XMLやJSON 形式のデータ、データベースで管理するデータなどを、テーブルとしてExcelに取り込む。
  • Power Pivotを利用することで、テーブル間のリレーションを定義して、テーブル内のフィールドを自由に選択して、ピボットテーブルやピボットグラフが作成できる。
  • Power Viewを利用することで、インタラクティブに変化する統計結果のレポートを作成できる(図1)。さらに、Power Mapを利用することで、データをリアルな地図にマッピングして可視化できる(図2)。
図1:Power View
図1:Power View
図2:Power Map
図2:Power Map

さらにOffice 365との連携により、成果物の共有化や、オンライン上でのレポート作成などのサービスが利用可能になります。

Power BIの基本機能である Power Query、Power Pivot、Power View、Power Mapの使用方法の概略について、実例を交えて紹介します。

データを集めるPower Query

Power Queryは、分析対象のデータを「集める」機能を提供するものです。検索キーワードを使ってインターネット上のデータを探したり、CSVやXML、JSONなどいろいろなフォーマットのデータを取り込んだり、データベースにアクセスしてデータを読み込んだりと、様々なデータの入手が可能です。取り込んだデータは、テーブルという形式で管理します。

今回は、2種類のデータを扱います。1つ目は「政府統計の総合窓口」からダウンロードした、1975年から2012年までの都道府県別の男女別人口推移データです。CSV形式でダウンロードしたものを、ExcelのVBAマクロを用いて、次の形式に変換しました(図3)。

図3:人口推移データのテーブル(部分)
図3:人口推移データのテーブル(部分)

これをPower Queryを用いてテーブルとして取り込みます。テーブル名は「人口統計」とします。

2つ目は国土交通省国土地理院が公開する都道府県庁の経度・緯度情報です。Power Queryを使って、次のようにWeb ページから直接テーブルとして取り込みます。こちらのテーブル名は「都道府県位置」とします(図4)。

図4:都道府県庁の位置情報をPower Queryで取得
図4:都道府県庁の位置情報をPower Queryで取得

都道府県位置テーブルの見出し行の直後の1行は不要です。また、都道府県名の文字列中に空白文字があったり、「県」「府」「都」が省略されたりしています。さらに、東経、北緯が度、分、秒に分かれています(図5)。このようなデータを適切な形式に変換するには、Power Queryの機能である「クエリエディター」を利用します。クエリエディターを用いて、テーブルの内容を図6のように変更しました。

図5:変換前のデータには不要な行や空白などが含まれている
図5:変換前のデータには不要な行や空白などが含まれている
図6:クエリエディターを利用して、経度や緯度、都道府県名を変換
図6:クエリエディターを利用して、経度や緯度、都道府県名を変換

データ同士を関連付けするPower Pivot

次にPower Pivotを利用して、2つのテーブル間の関係を定義します。これを「リレーションシップ」と呼びます。Power Pivotで処理するデータをデータモデルに追加することで、PowerPivotウィンドウでの管理が可能になります。Power Pivotウィンドウ上で、リレーションシップを定義します。今回は、人口統計テーブルの地域名フィールドと、都道府県位置テーブルの都道府県フィールドを関連付けます(図7)。

図7:人口統計テーブルの地域名と都道府県位置情報テーブルの都道府県を関連付ける
図7:人口統計テーブルの地域名と都道府県位置情報テーブルの都道府県を関連付ける

レポートを作成するPower View

Power Viewは、Power Pivotで定義したデータモデルを対象に、レポートを作成します。ここでは、都道府県別、男女別の人口状況を、グラフで描画してみます。

Power Viewによる描画イメージを、視覚エフェクトと呼びます。視覚エフェクトの基本は、図8のようなテーブルです。これは「人口統計」テーブルの地域名、人口総数(男)、人口総数(女)のフィールドを用いて、作成したものです。リレーションシップのある「都道府県位置」テーブルのフィールドを加えることもできます。

図8:Power Viewで扱うテーブル
図8:Power Viewで扱うテーブル

各県の人口を確認すると、実際の値よりかなり大きな数値になっています。これは、1975年から2012年までの値の合計値であるためです。ある1年のデータだけを表示したい場合、フィルターの機能を使って、対象のデータを絞り込みます(図9)。

図9:フィルター機能を用いて、1年分のデータだけを取得する
図9:フィルター機能を用いて、1年分のデータだけを取得する

視覚エフェクトを切り替えることで、棒グラフや円グラフ、折れ線グラフなどの表示を行うこともできます。それでは、男女の人口を積み上げた棒グラフを表示します(図10)。

図10:Power Viewで作成した都道府県別の人口分布棒グラフ
図10:Power Viewで作成した都道府県別の人口分布棒グラフ

データを可視化するPower Map

Power Mapは、統計データを地図の上で視覚化するものです。時間の経過による値の推移をアニメーションで表示することもできます。Power Mapで作成するコンテンツを「ツアー」と呼びます。ツアーの定義は、Power Mapウィンドウで行います。今回は図11、図12に示したようなパラメータを設定しました。

図11:ツアーの見本で使用するパラメータ
図11:ツアーの見本で使用するパラメータ
図12:ツアーの見本で使用するパラメータ(続き)
図12:ツアーの見本で使用するパラメータ(続き)

[地理およびマップ レベル]は、データを表示する地理上の位置を示すテーブルのフィールドを指定します(図11)。都道府県位置テーブルの県庁所在地の緯度、経度を設定します。グラフの種別は、積み上げ棒グラフを設定します(図12)。[高さ]はグラフの値となるものです。人口統計テーブルの男女の人口総数を設定します。[分類]は凡例で表示される項目です。ここでは[高さ]と同様にします。[時間]は、データの時間情報を示すものです。ここでは人口統計テーブルの調査年度を指定しました。以上のように設定後、ツアーを再生することで、人口の推移がアニメーションで表示されます(図13)。

図13:都道府県別の人口推移をグラフのアニメーションで可視化
図13:都道府県別の人口推移をグラフのアニメーションで可視化

いかがでしたでしょうか? 操作自体は簡単だと思いますが、やり方を知らないとなかなかここまではできないと思います。ただ、手順を理解すれば、今回ご紹介したこと以上の分析でも、Excelを使用してできるようになります。興味がある方はぜひ、お手元のExcelを使用して実際にトライしてみて下さい。業務効率の向上に加えて、業務も可視化されるので、メリットは大きいはずです。

NECマネジメントパートナー株式会社 人材開発サービス事業部 エキスパート 米倉 宏治
NECマネジメントパートナー株式会社
人材開発サービス事業部 エキスパート
米倉 宏治

NECマネジメントパートナーのPower BI関連情報

■特集/おすすめコースセレクション

■コースラインアップ

■関連ページ

お問い合わせ

ページの先頭へ戻る