有用な情報の発見、結論の通知、意思決定の支援を目的として、データを検査、クレンジング、変換、およびモデリングするプロセスです。
ウィキペディア(英語)
データ分析には、さまざまな名前のさまざまな手法を含む複数のファセットとアプローチがあり、さまざまなビジネス、科学、社会科学の分野で使用されています
データ分析には一連のプロセスがあります。今回はそちらを紹介します。
データ分析のプロセス
分析の目的
まず、1.分析の目的では、データ分析を行うにあたり目的を設定します。
例えば、
店舗の売上を上げる
集客力をアップする
客単価を上げる
など、状況や業種によって適宜設定します。
なぜ目的を定めるかという点については、データありきの分析をしてしまうと
どこから手をつけていいかが分かりづらく、迷いやすくなるからです。
目的を設定せずに、結果を資料にまとめて共有しても
意思決定者からすると「すでに知っている内容だ」、「それで何が言いたいの?」
となってしまいます。
意思決定者、分析者双方で認識を合わせ目的に合わせた分析を行うのがベストです。
よくあるケースとしては、「はい、とデータだけ渡されて何かわかった知見があったら教えてね」と丸投げされるケースです。
このケースに関しては上長や、経営者がデータ分析に対して誤解をしていることがほとんどで、失敗してしまう例になります。
意思決定者、分析者双方で認識を合わせ目的に合わせた分析を行うのがベストです。
会議の場を設けられない様子でしたら、会社が困っていること担当者が困っていることをイメージしてその問題を解決する目的という切り口から対応していきましょう。
データ分析をする目的を定めることにより次のステップに移ります。
目標設定
2.目標設定では、経営する上で重要な指標を設定します。
KGIと言われます。Key Goal Indicator 重要目標達成指標
KPIと言われます。Key Perfomance Indicator 重要業績評価指標のことです。
KGIはより具体的な目標を定めます。例えば売上高前年度比○%アップなどです。
ここでやってはいけないのは、いきなり200%達成など達成不可能な目標にしないということです。
目標設定には現実的かつ根拠のある、目標達成可能な数値を設定しましょう。
過去の売上高の平均値、中央値、四分位などから数値を設定します。
KPIはKGIを達成するために影響している指標を探していきます。
売上高は顧客数 x 購入頻度 x 客単価とするとそれぞれ分けて考えます。
顧客数を増やしたほうが達成しやすいのか、購入頻度を上げることで達成しやすいのか、客単価を上げるのが良いのか。
サービスによって適宜変更していきましょう。トライアンドエラーが大切です。
指標を設定する上では運営側がコントロールできる指標を優先度をつけて選択します。

データ収集
目標設定が終わったら、次は3.データ収集及び検証を行います。
社内データの場合はデータの所有者に連絡しデータを取得します。SNSサービスのデータを利用する場合はアカウントデータを共有してもらいます。
その他アンケートデータやオープンデータなど外部にある場合はそれらを取得します。
紙ベースのデータの場合はそのままでは利用できませんので、エクセルデータとしてデジタル化します。
データ検証
データ検証では、そのデータが正しいかどうかチェックしていきます。
データ分析における最も重要なポイントです。
データ前処理と表現され、データクレンジング、エラーやノイズ、欠損値の取り扱いやデータの統合、削除を行います。
データ分析
データ分析では、データ検証を行ったデータを利用し、様々な手法を試すフェーズです。
クロス集計、可視化、ABC分析、RFM分析、必要に応じて高等数学を用いた分析を行います。
大抵の場合エクセルベースで出来る手法で事足ります。
ビジネスの分野にもよりますが割合としては8:2程度でしょうか。
何が何でもAI・機械学習というわけではないということです。
考察
考察では、データ分析を行った結果に対して更に問題の本質に迫り、
これまで行ってきた内容が本当に求められている内容なのかを再確認するフェーズです。
分析結果の評価を行う際に最も重要なのは、客観的、中立的に判断することです。
何らかのバイアスがかかり、主観的で都合のいい解釈をするのはご法度です。
決して事実を捻じ曲げること無く判断を誤らないように気をつける必要があります。
そしてこれからは運用ステップです。PDCAサイクルを回すという表現をします。
仮説立案(Plan)
仮説立案ではデータに基づく仮説を立てていく、KGIを達成するためにボトルネックになっている要素を洗い出す。
ここでは、3つの仮説を立案しそれぞれを解決するための施策を考える
例えば飲食店の場合だと
1.売上が上がらないのは他の店舗にお客さんが流れているからだ
2.固定費などのコストが想定よりもかかっていて売上に影響を与えているからだ
3.既存客が離脱していて売上に影響を与えているからだ
状況に応じて仮説を立案します。
それぞれ立てた仮説に対しての解決策として施策を考えます。
1.メニューの入れ替え、価格変更を検討する
2.あまりオーダーされないメニューを洗い出し、ロスになっている在庫を抑える
3.クーポンの発行や、スタンプカードの発行を行いリピートにつなげる
実行(Do)
実行では、仮説を元に施策を考えて実行に移す。A/Bテスト、レイアウトの変更、導線の追加、機能追加など多岐にわたる。
効果検証(Check)
効果検証では、実施した施策の効果測定を行います。
その施策を行った結果、どれくらいKPIが改善しているのか、またはいい影響を与えてないのか状況を把握することが大切です。
もし、この段階で改善の見込みがなかった場合は仮説立案に戻って新たな施策を練り直します。
改善(Action)
改善では、効果検証の結果に基づき、効果がなかった場合は仮説を再度立て直して
施策を変更するか、改善の傾向がある場合はパラメータ修正などを行い継続する。
このPDCAサイクルを1週間、2週間などチームの最適な期間で回していくことが
重要です。
最後に
いかがでしたか、データ分析は意思決定の質を上げるための一連のプロセスであり、
データがあればできるものではありません。
目標設定、データ分析、フィードバックというサイクルをうまく回し、多部署との連携をする必要があります。
なかなかうまくいかない場合は多部署との連携を深め、信頼されることから始めましょう。