Teddyで実現するユーザーレビュー探索パイプライン

  Teddy を用いたユーザーインタラクション  

ユーザーレビューには、オンラインショッピングサービスのユーザー体験を向上させるのに役立つデータが豊富に含まれています。 しかし、レビューからカスタマーインサイトを引き出すのは容易ではありません。 Megagon Labs による最新の CHI’20の論文 では、レビューマイニングを簡単に実現することを目的としたインタラクティブなシステム Teddy を紹介しました。Teddy を使用することで、データサイエンティストが大規模なカスタマーレビューを探索し、オピニオンマイニングのパイプラインの抽出スキーマを反復的に改良し、迅速にインサイトを得ることが可能になります。Teddy は、レビュー分析のワークフローと課題を理解するために行ったデータサイエンティストとのインタビューから得た知見をもとに設計されました。この研究の結果はTeddyだけではなく、テキストマイニングにおける共通のプラクティスと問題について有用な情報を提供し、ユーザーレビューや一般的なテキスト分析における今後のシステム開発全体に役に立つ情報にも触れていきます。 

eコマースの市場規模は米国(左)と世界(右)において急激に拡大している [出典:statista.com]

なぜレビュー分析にこだわるのか?

カスタマーレビューは今やありとあらゆるビジネスにおいて重要な役割を果たしています。世界中のeコマースサービスやプロダクトの急速な成長によってその普及率は加速し、レビューの普遍性とパワーはあらゆる分野に広がっています。

eコマースの市場規模は指数関数的に拡大しており、米国だけでも2023年までに1兆ドル、世界では6兆ドル以上に達すると予測されています。この前例のない成長は、様々なプロダクトやサービスに対して利用可能なユーザーによるテキスト(レビュー、Q&A、ディスカッションなど)の量に直接比例しています。

多くの場合、レビューにはその主題に関する有益な情報が豊富に含まれており、通常、大量のレビューから特定のサービスやプロダクトの質に関する関連性と信頼性のシグナルを得ることができます。その結果、消費者は定期的にレビューをチェックし、購入の選択肢の詳細、利点、リスク、予想される結果などをより知るためにこれらのシグナルを利用しています。

企業もあらゆる形でレビューの恩恵を受けています。多くのeコマースプラットフォームでは、購入者の意思決定を容易にするために、ユーザーレビューをサマリーと合わせて表示しています。

レビューには、プロダクトやサービスの改善に関するフィードバックやインサイトも含まれます。一部の企業は、レビューを利用してカスタマーのフィードバックを追跡し対応するだけでなく、レビューをもとに提供プロダクトやサービスの改善にも活用幅を広げています。しかし、プロダクトに関する新しいタイプの表現として、カスタマーのレビューができることはこれだけではありません。

プロダクトに関する全てのユーザー体験の集合が、プロダクトの本当の姿を反映した効果的な表現になるはず

プロダクトを分布的に映し出すユーザー体験

プロダクトの効果的な表現とは具体的に何を指すでしょうか?販売者が提供する仕様には重要な情報が含まれていることは周知の事実ですが、使用中のプロダクトのパフォーマンスを推測する手がかりとしては情報が限られており、消費者の意思決定に役立つ情報としても限定的です。

Megagon Labsでは、プロダクトを真に表す表現とは、そのプロダクトを使用した全てのユーザーの体験の集合体である、と提唱しています。この提題は表現の時間的および分布的な性質にかなりの影響を受けますが、その議論については別のブログ記事に譲ることにします。理想的には、消費者向けソフトウェアサービスも法人向けのソフトウェアサービスも、プロダクトの分布表現としてユーザー体験の集合を活用する必要があります。このような表現を適切に取り入れ、モデル化することは、今後数年間におけるeコマースを改善する上で非常に重要になると考えています。

ユーザー体験表現としてのレビュー

消費者の体験の中に閉じ込められた体験データにアクセスするにはどうすればいいのでしょうか?ここで話はカスタマーレビューに戻ります。ノイズが大量に含まれていたり、内容的に不十分であったとしても、レビューはプロダクトに対するユーザーの体験を記録したものです。したがって、消費者および法人向けサービスは、プロダクト全体をより良く表現するためにレビューを一層活用することができるのです。

レビューはプロダクトのユーザー体験を表現するもの

今日、多くのeコマース企業、特にアグリゲーションおよび検索サービスを提供する企業は、レビューから情報を分析、抽出、要約するためにデータサイエンティストを採用しています。しかし、前述の通り、消費者が作成したレビューテキストは、ノイズ(断片的、不完全、スパム、詐欺的など)が多いことで知られており、情報の内容が乏しいことも頻繁にあります。たとえば、ホテルのレビューでは、通常、多くの潜在的な関連性のある特徴の中でも、清潔さや立地など、その宿泊施設のいくつかの断片的な側面にしか言及されていません。効果的なツールがなければ、それらを分析し、理解し、解釈するために何千ものレビューを読み解くことが必要となり、非常に時間のかかる困難な作業になります。

Megagon Labsは、Teddyの設計の参考にするために、まずはレビューマイニングの現在の慣例と課題をよりよく理解したいと考えました。そこで、様々なテクノロジー企業でレビューテキストのマイニングに日頃から取り組んでいる15人のデータサイエンティストにインタビューを行いました….

いかがでしたか? Making Review Analysis Easier with Teddy のサマリーを日本語でお届けしました。データサイエンティストのインタビューから得られた課題や今後の展望についてはMegagon Labs 英語ブログで続きをお楽しみください!

 

もっと読む (英語)  >>

(翻訳:Megagon Labs Tokyo


Share:

More Blog Posts: