皆さんは示唆を出すときにどこに気をつけていますか?

私は約1年前にデータアナリストの職種につき、データ分析、特に行動データの分析を多くしてきました。アナリストになる前までデータから示唆を得るような分析の経験はありませんでした。しかし、1年間データ分析を行ってきたわけですから、初心者ながら示唆の出すために着目すべきポイントを徐々に理解してきたと感じています。

今回の記事では、初心者でもデータから示唆を出せるように気を付けたいポイントを中心にお伝えできればと思います。

北澤 茜(きたざわ・あかね)氏
株式会社メンバーズ北澤茜株式会社メンバーズ メンバーズデータアドベンチャーカンパニー データアナリスト/データエンジニア
SIerでシステム開発に従事した後、現職でデータアナリスト/データエンジニアをやっています。現在は大手ECサイト等のサービス事業会社に常駐しており、施策効果検証やユーザー行動の分析、データ分析基盤構築などの業務に携わっています。絵を描くこととゲームが好きです。

示唆出しってなに?

データ分析としての示唆とはなんでしょうか。
まずは定義についてお話します。あわせて示唆を語る上で重要なファクトにも触れます。

【ファクト】
客観的に示される事実

【示唆】
事実(ファクト)から考えられる解釈や仮説、推論

データ分析におけるファクトとはデータの数字に該当します。そして、示唆はファクトであるデータの数字に対する解釈になります。示唆は新たな仮説につながりますし、次の施策や戦略に生かすことができます。そのため、示唆を出すことはデータアナリストの重要な業務の一つと言えます。

示唆出しには程遠かったときの話

少し自分の経験を話します。
データ分析をはじめた頃は、なんとなくデータから棒グラフや折れ線グラフを作って、そこから得られる事実をレポートしていました。確かにグラフを使って可視化することでデータの見え方や印象を変えることができました。その結果、事実を理解してもらいやすくなったことから、データの可視化は効果絶大だと感じました。

しかし同時に、うん、そうだよね、それで?と思うようになり、これはデータ分析なのだろうか…と疑問を持つようになりました。
当時の分析の目的は、特定のターゲットユーザーの行動の特徴を見つけて、次の施策に活かすことでした。可視化することである程度目的を達成していましたが、なぜそのファクトが発生したのかといった事実の+αの解釈、つまりは示唆出しができずにいました。

差があるところに糸口がある

示唆出しができていないと思いながら業務を進めていく中で、「差」があるところは解釈しやすいポイントの一つだと気付きました。差は比較によって相対的に現れるもので、初心者でも見つけやすい点だと感じます。

比較の例

時系列データで別の期間と比較する

例えば気温が影響するアイテムの売り上げは、季節性が伴い一年周期で規則がある場合があります。その場合は前期比をみることで示唆につながる差を見つけることができます。

グループ間で比較する

データをクラス分類やクラスタ分類などのグループに分けて、グループ間で比較するとターゲットグループが相対的に良いのか悪いのかが明確になりターゲットに関する示唆を見つけることができます。

ベンチマークと比較する

例えば市場での自社のポジションを分析する際は、ライバル企業もあわせてデータを取得し相対的なポジションの差をみて示唆を見つけることができます。

以上のようなあらゆる比較をすることで、ターゲットの特徴や良し悪しを相対的に評価することができます。
当たり前だと思うかもしれませんが、データ分析初心者だった私はその視点が圧倒的に欠けており、絶対的な数字や局所的な見方しかできていませんでした。初心者だと同じ状況に陥っている方もいるのではと思います。

差を見つけるために気をつけたい点

データ分析初心者が示唆出しで気をつけたいポイントのまとめ

比較による差から何かを得られやすいと気づいてからは、その差をいかに発見しやすくするかを考えました。その結果、以下の点を気を付けるようになりました。

データの集め方、持ち方

  • どの観点で比較するのかを意識してデータ設計する。また、収集する。

データの可視化方法

  • 差が目立つような色使い、配置に気を付ける。
  • 単位やスケールを合わせる。
  • サンプルサイズが異なる場合、実数ではなく割合で表現する。
  • 場合によっては差の変化に着目した可視化も検討する。

時系列データの比較は慎重に

  • 季節性が関与している可能性を考慮する。
  • 前年比、前期比、前月比、前日比など比較期間は分析内容の特性によって検討する。

示唆を出すためにはドメイン知識が必須

示唆を得られそうなポイントの一つが比較による差であることはわかりました。
ここから実際に示唆を出していきます。「ターゲット層より別の層の方が○○%多く利用されていた」ということがわかった時、その差はなぜ発生したのか、何が原因なのかを考えます。
手段として、その答えをデータに求めて、さらに深掘り分析をすることも可能だと思います。しかしその手段をとる前に、確認しておきたいのはドメイン知識で説明できないかということです。

ドメイン知識

業界やサービスに関する常識や事実、知見など

データが全てを物語っていてくれたら楽なのですが、集められるデータにも限界はありますし、結局原因が分からないこともあります。実際に私も分析をしているとき、確実に特徴と言える差が出ているのに、その原因をデータから探しても分からなかったことがありました。
そこでドメイン知識に詳しい方に話を聞くと、過去にこのターゲット層向けにサービスの利用を訴求する施策を打ったからではと教えてもらったことがあります。確かにその事実を当てはめてみると辻褄があうことがわかりました。
もともと業界やサービスに詳しい場合はまだしも、業界に明るくない場合はドメイン知識をインプットする努力が必要です。特に初心者は日頃からアンテナを貼っておきましょう。

示唆出しで迷子にならないために事前の仮説を大切に

今までのことを通して、ある程度示唆が出せるようになりました。しかし、次に待ち受けていたのは小さな差でも示唆を出そうとしてしまう状態でした。示唆は多ければ多いほどいいじゃないかと思うかもしれませんが、そうではありません。多角的な解釈ができるため、何が重要なファクトと示唆なのかが分からなくなることがあります。
それを防ぐために、分析の前に必ず仮説を立てる必要があります。
データ分析初心者は闇雲にデータを見始めがちです。そうすると、本当にしたかった分析ができているのか分からなくなることが多々あります。データ分析で何を示したいのか事前に仮説を立てておくと、分析指針も決まり、どのファクトと示唆が価値の高いものであるかを判断しやすくなると思います。

データ分析初心者が示唆出しで気をつけたいポイントのまとめ

  • 示唆出しはデータアナリストの大事な業務の一つ
  • 差でているところに着目しよう
  • 示唆を出すためにドメイン知識は必須
  • 仮説を立てておくことで、重要なファクトと示唆を見失わずに済む

以上が私が業務を通して学んだ初心者がデータ分析で示唆出しをするために気をつけたいポイントでした。私と同じくデータ分析初心者で、次のアクションに繋がる示唆が得られず困っている方は何か解決のヒントになるかもしれません。