2005/11/22
BIZine ~ビジネスインテリジェンス、データマイニングを学ぶメルマガ~ No.003
☆〜--------------------------------------------------------------〜☆ ◆ビジネスインテリジェンス、データマイニングを学ぶメルマガ◆ ◇ BIZine ◇ ☆〜--------------------------------------------------------------〜☆ No.003 クロス集計表の話 こんにちは。オフィス エヌ・ビー・アイの本田です。 さてさて、今回はクロス集計表の話です。 前回は、データウェアハウス(DWH)について簡単な説明を書きました。 DWHは、大規模なデータベースなのですが、単に業務データをドンドン溜 め込んでいくだけではまったく意味がありません。 DWHを作成する目的は何だったでしょうか? そう、業務の中から(あるいは外部データも含めて)出てきたデータの分析 を行い、企業活動に活かす為です。 そうなると、DHWの中にあるデータを抜き出して、分析する必要がありま すが、そのために必要不可欠なツールが“OLAPツール”になります。 ところで、“OLAP”(オーラップ)(※1)って何でしょうか? これは、“OnLine Analytical Processing”の略で、エンドユーザが直接デ ータベースを検索・集計することで、問題点を見つけ出し、対策を講ずる分析 アプリケーションの総称です。 具体的には、データの検索やレポーティング、グラフの作成など、データの 分析を行うために必要な出力が簡単に出来ると言えます。 世の中には、ビジネスオブジェクツ社のBusiness Objectsやコグノス社の Power Playなど、様々なOLPA製品がありますが、どのような製品を選んだ ら良いかについては、ITコーディネータなどの専門家に相談し、目的に合った ものを適切に選択してください。 △▼△▼△▼△▼△▼△▼△▼△▼△▼△▼△▼△▼△▼△▼△▼ さて、先に書いたように、世の中にはたくさんのOLAP製品が存在します が、マイクロソフト社のExcelでも、実は、それなりのことが出来たりし ます。 DWHに収めるような、大量のデータが企業内に存在する場合はExcel だけではなく、その他にデータベースソフトが必要になってきますが、数万件 程度のデータであれば、取り敢えず、Excelだけでも簡単な分析が出来ま す。 手書きか、マクロを組むかを問わなければ、皆さんもExcelでレポート 表を作ったことがあるかもしれませんね。 Excelは、表計算ソフトと呼ばれるアプリケーションの一つですが、非 常に便利なソフトで、計算をしないまでも、マトリクス表を作ったり、簡単な レポートを作ったりという用途に使われている方も多いのではないかと思いま す。 そこで、今回のテーマである「クロス集計表」です。 一般的なレポートが、一覧表形式であるのに対し、クロス集計表は、例えば、 縦軸に商品、横軸に店舗をとった売上表のように、マトリクス形式を取ってい ます。 例えば、 | A店 | B店 | C店 | D店 | E店 | F店 | +--------+--------+--------+--------+--------+--------+ 魚| 10,000| 12,000| 9,000| 11,200| 14,000| 60,000| +--------+--------+--------+--------+--------+--------+ 肉| 28,000| 30,000| 9,400| 10,000| 14,000| 12,000| +--------+--------+--------+--------+--------+--------+ 野菜| 18,000| 10,020| 13,000| 20,000| 16,000| 12,000| +--------+--------+--------+--------+--------+--------+ 菓子| 3,000| 11,000| 13,600| 10,000| 14,000| 8,000| +--------+--------+--------+--------+--------+--------+ のような形で表現します。 このような表を作成する場合、手で、いちいち表を作成していては、大変で すよね? Excelには、このような表を作成するための便利な機能が備わっていま す。 「ピボット」という機能が、それです。 これは、リスト形式の大量データを集計して、上の例のような表にしてくれ る、とてもすばらしい機能です。 うちのホームページ(http://www.office-nbi.com/)にサンプルデータを置い ておきましたので、ぜひ、その機能を試してみてください。 サンプルデータは、 「月」、「製品ID」、「大分類」、「中分類」、「店舗名」、「店舗売上」、 「顧客ID」の7項目から構成されるCSVデータとなっています。 では、実際にクロス集計表を作ってみましょう。 (私は、Excel2003を使っているので、他のバージョンでは、多少、 違ってくるかもしれません) (1) まずは、このデータをExcelで読み込んでください。 (2) 次に、Excelのメニューバーから 【データ】>【ピボットテーブルとピボットグラフ レポート】 を選びます。 (3) ウィザードが出てきますので、今回の場合は、分析するデータのある場 所として、【Excelのリスト/データベース】を選び、作成するレポートの種類 としては、【ピボットテーブル】を選択してください。 (4) 【次へ】のボタンを押すと、使用するデータ範囲の指定画面に移ります ので、Excelシート上のデータ部分(A列〜G列)を全て選択します。 (5) 更に、【次へ】のボタンを押すと、ピボットテーブルをどこに作成する か聞いてきますので、今回は【新規のワークシート】を選んでください。 これで、準備は完了です。 上記の操作を終えると、新しいワークシートに、「ここにデータアイテムを ドラッグします」などと書かれたクロス集計表の枠組みが出来上がります。 また、別ウィンドウとして、ピボットテーブルのフィールドリスト一覧が出 てきますので、ここから、分析の切り口となる項目(今回のサンプルデータで は、月、製品ID、大分類、中分類、店舗名、顧客ID)と分析データ(店舗売上 )をドラッグ&ドロップします。 まずは、縦軸に『製品ID』、横軸に『月』、分析項目に『店舗売上』をドラ ッグ&ドロップしてみましょう。 これで、クロス集計表が出来上がります。 ただし、これでは、表が大きすぎますので、『大分類』、『中分類』にデー タをまとめて表示してみることにします。 これを実現するのは簡単で、先程作った表の縦軸に、『大分類』、『中分類 』を追加することで実現することが出来ます。 順序は『大分類』、『中分類』、『製品ID』にしましょう。 そうすると、各中分類、大分類ごとに集計結果が出てきた表が作成されます。 ただし、この段階では、まだ最下層の項目まで展開された表となっています ので、例えば、大分類の「飲料」と書いてあるセルの上でダブルクリックする と「大分類:飲料」配下のデータが集計された状態で、レコードがまとまった 表になります。 これは、中分類でも同じことが言えます。 このようにして、データの粒度を細かくしたり、荒くしたりして、全体の傾 向を把握して、気になる部分を細かく見て行くことができます。このような表 示のデータ粒度を様々に変化させることをドリリングといい、粒度が荒いデー タから細かいデータに変化させること(大分類→中分類→単品など)を「ドリ ルダウン」、逆に細かいデータから荒いデータに変化させること(日→月→四 半期→年など)をドリルアップと言います。 ここまでの表は、全ての店舗をまとめたデータでしたので、これを店舗ごと の表にしてみます。 画面上部にある「ここにページのフィールドをドラッグします」と書いてあ る部分に、「店舗名」をドラッグ&ドロップすることで、店舗ごとの集計結果 を表示することができます。 ドロップした直後は、全店舗が出ていますので、画面上部の『店舗名』と書 いてあるセルの右隣のセルについている逆三角形のボタンをクリックし、表示 させたい店舗を選んで(例えば西支店)OKボタンを押すことにより、各店舗の 集計結果を表示することができます。 このように、ある集計表の要素軸(今回の例では商品と月)を入れ替えずに 切り口(店舗)を変えることをスライスといいます。 逆に、要素軸を入れ替えることをダイスと呼びます。 このように、ピボット機能を使って、データの集計を行うことによって、色 々な切り口からデータを分析することができます。 今回のデータでは、時間軸は「月」という単一レベルでしか持っていません が、ここに日のレベルや週、四半期、年という様々な粒度のデータを持たせる ことにより、更に詳細な分析を行うことができます。 ちなみに、小売などでは、ウィークリーマネジメントといって、週単位での 分析が行われることが、結構、多いですね。 皆さんも、今回使ったデータを色々と加工して、ピボットの使い方を研究し てみてください。 それでは!(^_^)/" ★---------------------------------------------------------- BIZine 【発行】オフィス エヌ・ビー・アイ 代表 本田 秀行 (HONDA, Hideyuki) 〒984-0825 仙台市若林区古城1丁目5−5−801 TEL/FAX : 050-7503-2489 / 022-781-1526 E-Mail: info@office-nbi.com URL: http://www.office-nbi.com 発行システム:『まぐまぐ!』 http://www.mag2.com/ 配信中止はこちら http://www.mag2.com/m/0000176018.html ----------------------------------------------------------★ ※1 OLAP "OnLine Analytical Processing"の略。 直訳するとオンライン分析処理。エンドユーザが直接、データベースから様 々な切り口で分析を行い、問題点を発見するために使用する。 大きく、M-OLAP(多次元データベース型)とR-OLAP(リレーショナルデータ ベース型)という2つに分類されるが、両方の特徴を兼ね備えたH-OLAP(ハイ ブリッドOLAP)と呼ばれる製品も存在する。


