非構造化データは、新たな顧客インサイトを引き出す大きな可能性を秘めています。組織がこのデータを顧客に関する理解しやすいストーリーに変換できれば、顧客満足度の向上や顧客離れの原因となる対策を講じることができます。
非構造化データは豊富に存在しています。実際、ある推定によれば、全データの90%が非構造化データで、その増加速度は構造化データを大きく上回っています。テキスト、画像、音声などの非構造化顧客データは、Discord、Reddit、Slack 、Xといったさまざまなプラットフォーム上で急速に増え続けています。これらのデータを収集し、有益なインサイトへと変換するのは難しい作業ですが、その価値はその労力に十分に見合うものです。
私がGoogleでUXエンジニアとして働いていたとき、生成AIの技術と顧客データを組み合わせることで、デジタルエクスペリエンスを向上させられることを実感しました。当時、私はcloud.google.comのホームページを含むマーケティングWebページの製作に携わる素晴らしいチームの一員でした。その中で、Salesforceへの販売やサポートに関する問い合わせ対応を部分的に自動化する会話型UI(ユーザーインターフェース)の構築にも取り組みました。半自動化されたサポート応答により、お客様の問題に迅速に対処し、顧客満足度の向上に貢献できました。
多くの企業では、顧客フィードバックの流れがうまく機能していません。Sushidataでは、その修正に取り組んでいます。私は当社の共同創設者兼CEOとして、当社の才能あるチームと共に、非構造化データにAIを適用することで企業が顧客インサイトを深め、顧客体験を改善できるよう支援しています。これまでの事業運用を通じて、私たちはどこに労力を集中させるべきか、データを最大限に活用する方法について、いくつかの重要な教訓を学びました。
既存顧客の体験に注力することには、最大の効果をもたらす可能性が秘められています。新規顧客の獲得は、既存の顧客を維持するよりもはるかに多くの労力が必要です。もちろん新規顧客の獲得活動は続けるべきですが、既存顧客のニーズに応えることを最優先事項の一つにするべきです。
非構造化データからインサイトを得ることで、潜在的な問題を早期に発見することができます。例えば、当社がクライアントのために収集するデータの一部には、問題解決にかかるサポートに時間がかかることに不満を抱いているお客様からの苦情も含まれています。そこで現在、自然言語処理(NLP)を活用し、問題が発生した際にSlack、メール、テキストメッセージなどの任意の手段で、適切なチームにアラートを自動送信する仕組みを開発しています。この仕組みを使用することで、競合ソリューションを検討し始めるよりも前に問題に対処できるようになります。
また、お客様のニーズをリアルタイムで把握することで、新たなアップセルの機会を生み出すことができます。例えば、顧客によるSlackで特定のビジネス課題の相談や、Discord上で機能リクエストの投稿があれば、その要望に応じたソリューションを提供できるかもしれません。ここで少し考えてみましょう。誰かから「エンタープライズ向けの価格を教えてほしい」と質問された場合、どう対応すべきでしょうか?私に とっての答えは、その顧客に積極的に関わり、見込み客として可能な限り丁寧にサポートすることです。
膨大な顧客データの中から価値ある情報を見つけ出すにはどうすればよいでしょうか?非構造化データを最大限に活用するにはAIが必要です。大規模言語モデル(LLM)を活用することで、複数の情報源から顧客データを効率的に収集し、異なる場所から取得したデータを繋ぎ合わせ、複数のプラットフォームにまたがるユーザーを統合し、データを分析して感情を理解し、リアルタイムのトレンドを把握し、視覚的な形式でのインサイトの提示まで行うことができます。
この取り組みは、AIなしではほぼ不可能だったでしょう。例えば、複数のオンラインフォーラムで交わされた会話データを集約し、自社製品に関する一貫した顧客ストーリーを作成したいとします。単に製品名の言及を見つけるだけでなく、数多くあるメッセージ間の関係性を見極め、特定の情報をつなぎ合わせ、意味を成す1つのストーリーを生成することができるコンテキスト認識型システムが必要になります。人間のコミュニケーションは微妙で曖昧な性質があるため、このプロセスには高度なAI技術と、複雑に絡み合った会話の流れを正確に把握する能力が求められます。
AIを活用して非構造化データから顧客のインサイトを得るには、どのように進めればよいのでしょうか?この豊富なデータを活用し始める前に、いくつかの重要な判断を下し、乗り越えるべき課題があります。
収集
どのような規模の組織にとっても、Discord、Slack、X、Redditなどのコミュニティプラットフォームは、顧客の思いや意見収集の場として活用できます。これらのプラットフォーム上で提供される貴社のチームが顧客と行う直接の会話や、顧客が同業者(見込み客)と貴社や貴社の製品について会話した情報などは重要な役割を果たします。
これらのデータを活用するため、組織はプラットフォームの規則およびデータプライバシー規制を遵守しながら、すべての関連データを迅速かつ効率的に収集するためのテクノロジーを選定する必要があります。Sushidataでは、Zapierを使用する代わりにOAuthを使用してデータ収集を促進しています。これは、Zapierへの接続の煩わしさがユーザーから敬遠されるものであるためです。当社では、各情報源に特別な注意を払いながら、可能な限り高速かつ効率的に接続できるようにしています。OAuthは、当社および当社のクライアントが各プラットフォームからAPIに接続することを可能にするオープンスタンダードです。OAuthを使用することで、企業は、公開フォーラムからデータをスクレ イピングするという倫理的にグレーなやり方を使用することなく、顧客情報に簡単にアクセスできます。
集約
複数の情報源からのデータの集約は、顧客データを分析する上で最大の課題の1つです。一方で、分散したデータをすべて1つにまとめたいと考えます。しかし、適切な場所でアクションを実行できるように、どの情報がどのプラットフォームから来たのかを理解する必要もあります。
Sushidataでは、情報源である各プラットフォームごとにIDを割り当てています。特定の製品の問題、バグ、機能リクエストについて、さらに掘り下げたい場合は、クリック1回で直接情報源にアクセスすることができます。
ストレージ
収集するデータが主にテキストデータである場合は、従来のデータベースを使用することもできます。Sushidataでは、Cloudflareのサーバーレスデータベースを使用し、各テナントに個別のデータベースインスタンスを使用することで、各組織のデータが他のすべての組織のデータと確実に分離されるようにしています。
画像など、他の種類のデータを含む場合は、ベクトルデータベース(関連データを近接して保持する)を使用することでパフォーマンスを高速化させることができます。Cloudflareの開発者プラットフォームは、どのデータをベクトルデータベースに含めるべきかを決定することができます。
また、Cloudflare R2などのオブジェクトストレージを選択すると、テキスト、画像、動画からログ、イベントデータまで、大量かつ多様なデータを保存することができます。
分析
現在、多くの組織は膨大な量のデータにアクセスできますが、そのデータを活用して情報に基づいた意思決定を行うには、分析が必要です。AIは、そのようなデータすべてをタグ付けし分析し、実用的なインサイトを得るために不可欠です。
適切なAIモデルを見つけること、または構築することが重要です。Sushidataでは、複数のAIモデルにアクセスできるため、新しいモデルが利用可能になり次第、すぐに試すことができます。当社ではCloudflare Workers AIを使って、ユーザーに近いエッジで実行される埋め込みやテキスト生成モデルへの対応を行っています。
適切なモデルを使用することで、収集した非構造化データのコンテキストを分析し、多次元的な感情分析を行うことができます。Sushidataの共同創業者であるVictor Sanchez、Victor Ilise、そして私は、お客様が感じている感情を測定する際、満足、悲しみ以外のさらに多くの感情を評価したいと思いました。探求できる感情には多くのものがあります。
私たちはAIを使って、5つの視点で感情分析を行うことにしました。これにより、顧客が確度を持っているのか、不安を感じているのか、混乱しているのか、明確に理解しているのかなどを把握できるようになります。適切な感情を見極めることで、取るべき行動をより的確に判断することができます。
可視化
ほとんどの場合、顧客インサイトを利用する人はカスタマーエクスペリエンスまたはコミュニティマネジメントチームのメンバーであり、データサイエンティストではありません。そのため、インサイトを視覚的にわかりやすく、素早く情報を伝えられる形式で提示できるソリューションを見つける必要があります。
適切な視覚化機能を使用することで、チームは自社がより多くのフィードバック、機能リクエスト、不具合報告、またはその他の問題の言及を受けているかをすぐに把握できます。また、カスタマーエクスペリエンスチームも、顧客の行動パターンを可視化し、体験を最適化することに取り組むことができます。また、視覚化したデータを活用して、企業のリーダーとインサイトを共有することもできます。
セキュリティ
顧客データを保護し、データプライバシー規制に準拠することは極めて重要です。個々の顧客のプライバシーを保護するためには、データ収集時に個人を特定できる情報(PII)を削除し、データを匿名化する方法が必要になります。また、データ収集に関するプラットフォームのルールに準拠する必要があります。さらに前述のとおり、複数の顧客データを安全に管理するためにはマルチテナンシーも重要です。
自社でAIモデルをトレーニングする場合、モデルに入力するデータが改ざんや汚染されていないことを確認する必要があります。例えば、ある企業がReddit(アメリカ合衆国の掲示板型ソーシャルニュースサイト)で交わされた従業員と顧客の会話などのデータを生成AIモデルの訓練に使用し、これらのモデルをフォーラム上にデプロイし、顧客の質問に自動で回答させることを計画しています。しかし、データが正確で信頼できるものでなければなりません。もし誰かがフォーラムでユーザーになりすまして書き込みを行った場合、そのデータを基にしたモデルの回答は正確性とで有益性に欠けたものになってしまいます。
非構造化データにAIを活用することで、顧客の製品に対する感想や抱えている問題などをより深く理解できる可能性があります。その知識を基に、顧客満足度を高め、顧客離れを減らし、最終的には収益を上げるための行動を起こすことができます。