クラスターとは「集団」を意味する言葉です。クラスター分析とは、複数の性質が混在した購買データや消費者アンケートから「似たものの“集団”」を作り、分類する分析手法を指します。「似ているもの」という基準でグループを作ることで、年齢・性別・職業といった属性によるグループ分けでは出てこなかった「消費者の傾向」を見つけることができます。消費者行動や心理の理解を深められることから、クラスター分析はターゲット分析やペルソナ分析などで多く活用されています。今回は、そんなクラスター分析の特徴とマーケティングにおける活用・応用方法をご紹介しましょう。
クラスター分析とは?
クラスター分析とは、仮説を元に情報の相互関連を分析する「多変量解析(統計的技法の総称)」のひとつです。さまざまな性質のものが混ざり合っている集団から、似た性質のもので「集落(クラスター:cluster)」を作り、対象を分類する統計的な分析手法です。
簡単に説明すると、チーズケーキ・チョコレートケーキ・マカロン・クッキーといった異なる性質のものが混在する集団の中から、「チーズケーキとチョコレートケーキ」や「マカロンとクッキー」など類似したものを集めて分類し、分析します。性質が「似ているか?」「似ていないか?」が分類の基準です。クラスター分析は、パッと見で分類が難しいデータを分類するのに向いています。
クラスター分析は、市場調査・顧客アンケート・購買データなどはもちろん、統計データなどの膨大なデータの分析にも有効です。消費者の行動特性、意識、好みなどから分類してクラスター分析をすることで、マーケティング戦略に活用できるのです。クラスター分析を実施すれば、性別・年齢別・在住エリア別などのデモグラフィック(属性情報)の分類とは異なった、新たなマーケティング施策が見えてくるでしょう。
クラスター分析の種類
クラスター分析の手法は2種類です。「階層クラスター分析」「非階層クラスター分析」の特徴をご紹介します。
・階層クラスター分析
階層クラスター分析は、似た性質のものの組み合わせからスタートして順々にグルーピングを行ない、最終的に類似性が低いものを組み合わせる分類形式です。途中のプロセスが階層のように見えるのが特徴です。
階層クラスター分析を行うと、樹形図(デンドログラム)ができあがります。樹形図(デンドログラム)は、トーナメント図をイメージしてもらえばわかりやすいでしょう。樹形図(デンドログラム)は、クラスター間の組み合わせと類似度を表します。この方法の良いところは、どの要素をグルーピングすればよいのかを把握できることです。
・非階層クラスター分析
グループの数(クラスター数)を最初に決め、グルーピングを行なう手法を「非階層クラスター分析」と呼びます。「非階層クラスター分析」によって、関連性の強いクラスターと関連性の弱いクラスターが明らかになります。
「非階層クラスター分析」には、自動でクラスター化ができるアルゴリズムが用いられます。「非階層クラスター分析」の手法の代表例は「k-means法」です。
・それぞれの使い分けについて
「階層クラスター分析」は、直感的にわかりやすく、視覚的なアウトプットができます。はじめにクラスター数を決定する必要がないという長所もあります。しかし、クラスター同士の関係性が一目瞭然になるものの、クラスター数が多いと樹形図が大きくなりすぎてわかりにくくなることもあります。そのため、「階層クラスター分析」は、膨大なデータの分析には向いていません。「階層クラスター分析」は、約30以下のクラスター数が少ない分類で用いるようにしましょう。
一方、「非階層型クラスター分析」は、ビッグデータを扱う分析に活用しやすいことがメリットです。約30以上のクラスター数であれば、「非階層型クラスター分析」が向いています。ただし、クラスター数を事前に決める必要があり、分析ごとに結果が異なるケースもあります。効果的な分析を実施するためには、具体的な仮説を立てることが重要です。
クラスター分析の利用シーン
・マーケティングの市場調査の分類
市場調査の分類を行なうことで、「商圏の特性」や「ブランドのポジショニング」などを分析できます。ターゲットへの効果的なアピールに、クラスター分析が効果的です。
・アンケート結果の分類
アンケート結果をクラスター分析すれば、消費者の特性によるグルーピングができます属性(性別、年齢、住所など)のわかりやすいデータだけでなく、特性や趣向による振り分けができ、マーケティング施策に有効です。
・クレジットカードなどの顧客情報の分類
カードの顧客情報には、属性(性別、年齢、住所など)と利用履歴があります。利用履歴は多岐にわたるため、クラスター分析をすることで消費傾向の分類をするのに役立ちます。
クラスター分析を実施する際の注意点
類似度・対象間の距離の定義が必要
クラスター分析には、分類をするために「対象間の距離」を決める必要があります。例えば〇〇未満の距離内にあれば「似ている」、〇〇以上の距離が離れていれば「似ていない」と判定する基準を定義します。距離測定をしたうえで類似度または非類似度を計算しなければ、「似ている」「似ていない」の基準が曖昧になり、正確な分類結果が得られません。
クラスター分析単体では不十分な可能性がある
集団の中から類似性を見つけて分類するクラスター分析は、あくまでも「分類」を目的とした分析です。クラスター分析で得られた結果から、法則性や因果関係を読み解かないといけません。マーケティング戦略では、クラスター分析に加えて、「相関分析」や「回帰分析」など複数の手法を併用して検証する必要があります。
クラスター分析を実施する手順
分析の種類を選ぶ
まずはクラスター分析をする目的を決めましょう。例えば、「商品の売上UP」などが目的に該当します。データの対象が「人なのか?商品なのか?」「どのデータを使うのか?」などを決定後、「階層クラスター分析」か「非階層クラスター分析」のどちらかを選びます。ビッグデータの場合、ほとんどが「非階層クラスター分析」になるでしょう。
類似度・対象間の距離を選ぶ
異なる性質のものが集まる集合から、何を類似性において分類するかを決定します。そして、対象間の距離を選びましょう。距離の算出方法には、「ユークリッド距離(2点間の直接距離)」「マハラノビス距離(テーマ群からの距離)」があります。
距離の測定方法を選ぶ
クラスター同士の距離を測る方法としては、「ウォード法」「群平均法」「最短距離法」「最長距離法」「k-means法(k平均法)」などがあります。
クラスター分析のモデル
ファッションに関するアンケートのモデル
アンケート結果から見えるターゲットの意識、例えば、「どこに着ていくためのファッションなのか」「関連アイテムも購入したいのか」「平均購入金額はいくらか」などを分類の基準にして、クラスター化できます。「クラスター1:ビジネス系意識高い女子」「クラスター2:ワーキングママ」「クラスター3:サブカル&文化系女子」「クラスター4:アウトドア大好き女子」などで分類することも可能です。
食品を中心としたネットショップの顧客分類のモデル
購買データで見える顧客の行動特性、例えば、「サイトへのアクセス回数」「購買回数」「商品の価格帯」などを分類の基準にして、クラスター化できます。「クラスター1:トライアル層」「クラスター2:ヘルシー層」「クラスター3:スイーツ層」「クラスター4:ギフト層」などで分類することも可能です。
クラスター分析の応用例
商品設定
アパレルショップの購買データから、例えば、「セーターを買いに来た客」と「薄手のコートを買いに来た客」をクラスター化して、「平均購入金額がそれほど高くない」「手頃価格の小物を買っている」という傾向に気づいたとします。そして購買データのなかでそのボリュームが大きかったとしましょう。クラスター化された「季節感追求タイプ(セーターを買いに来た客・薄手のコートを買いに来た客)」に購買余裕があると推定できたら、連アイテムとして、店舗にニット帽やマフラーをコーディネートしてディスプレイすることで余剰資金のある顧客の購買を引き出すことが期待できます。またクラスター分析から読み解くことで、余剰で購入できる金額などを割り出すことが出来るようになるかもしれません。
新商品開発
家具屋のアンケート結果から頻出ワードを抜き出して、クラスター分析ができます。例えば、同じクラスター内に「アレルギーがある」「洗濯しやすい」「持ち運びやすい」などの単語が集まっていることに気づいたとします。
こうした消費者の価値観がヒントになり、属性情報だけの分類では見えてこなかったアプローチで、掃除しやすい家具の新商品開発につながる可能性があります。
まとめ
ご紹介したように、クラスター分析によって消費者や商品をクラスター化でき、マーケティングに活用できます。「顧客層の特性分け」「商圏の特性分け」「ブランドのポジショニング」などの分析でも利用されている「クラスター分析」は、新たなマーケティング戦略を模索中の方におすすめの分析手法といえるでしょう。