Megagon Team Profile : 叶内 晨 リサーチサイエンティスト

Megagon Labs Tokyo のメンバーズ・ボイスへようこそ!  連載 2 回目となる今回は、東京オフィスで日本語自然言語処理技術の研究を担当し、国内学会をはじめ国際学会でも着々と成果を創出している 叶内 晨 さんがMegagon Labsに至るまでのバックグラウンド、興味・関心や現在取り組まれている研究、そしてトップ研究者として走り続ける秘訣に迫ります。 

これまでの経歴と、Megagon Labsにジョインした理由を教えてください

首都大学東京(現・東京都立大学)で情報学修士号を取得し、その後Recruit Technologies Co., Ltd.でデータエンジニアとして働いていました。学生の時はソーシャルメディア分析と機械翻訳の研究に従事し、データエンジニアとしては業務支援システムの開発や各種分析業務を担当していました。私自身のキャリアとしてはAIという技術を軸としたT字型の人材になることを志向していたため現場での数年間の実務を経た後に、学生の時から取り組んでいた言語処理に関してより専門的な能力を伸ばしたいと考えMegagon Labs*注)へジョインしました。

現在取り組んでいる仕事・研究を教えてください

私は現在、ユーザーの要求に対する推薦根拠を説明する技術の研究開発に取り組んでいます。根拠説明の取り組みに関しては言語処理を伴わないECサイトのレコメンド機能などがよく知られています。例えば「この商品の購入を検討している人は、こちらの商品も注目しています」という推薦根拠の説明があります。確かに言語処理を利用しなくてもユーザーに対して根拠説明は可能ですが、一方で推薦根拠を説明するために言語処理が必要なケースも多くあります。

旅行に行きたいユーザーが代理店を利用するケースでは、コンシェルジュがユーザーの抽象的な意向を深掘りしながら、その要求に対して様々な提案を実施し、そしてその提案の根拠となる情報を提示します。このようなユーザーとのやりとりをWeb上で再現するために言語処理による説得力のある根拠説明が必要となります。これらの技術は特に日本語環境では不足しているため研究テーマとして取り組んでいます。

直近ではデータ整備に取り組んでおり、2020年10月に「根拠説明データセット」を公開しました。このデータセットは実際の口コミデータを元にして作成しており、ユーザーの漠然とした要求に対してホテルを推奨する際のエビデンスを説明することを目指しています。

データセット整備と並行して論文執筆にも取り組んでいます。AACL-IJCNLP 2020では『You May Like This Hotel Because … : Identifying Evidence for Explainable Recommendations』、言語処理学会 (NLP) 2020では『旅行情報サイトのレビューを用いた抽象的な要求に対する根拠付き推薦文の生成』を発表しました。

これらの研究成果や技術を通して出力された根拠が実際にユーザーにとって魅力的な情報になっているのかという評価も現在は進めており、ビジネスの現場で活用することができることを目指して研究活動を進めています。

Megagon Labsで研究する魅力と、今後の目標を教えてください

Megagon Labs*注)最大の魅力は実サービスを見据えた研究に取り組めることです。研究の取り組み自体が数年後の実サービスでの活用を見据えたものとなるため、実際のサービス内容とセットで検討が進みます。そのため自社に必ずデータがある環境で研究を進めることが可能です。またサービスに導入するという具体的な目標があるので研究テーマの設定もしやすくなります。このように目標が明確で、その目標を達成するためのデータが存在している点は非常に魅力的だと感じています。

今後の目標に関してはこれまで取り組んできた研究成果を実際の事業へプロダクトとして入れ込んでいく部分を進めていきたいです。もちろんそのためには解決しなければならない課題がまだまだあります。例えば、実際のサービスにおけるクエリでは過去形のクエリが入力されることはない、という課題などです。ホテルや宿の口コミでは一般的に「このホテルは景色がよかった」など過去形で記載されることが多いのですが、一方でホテルを探しているユーザーは「景色が良いホテル」などとクエリを入力するので過去形で検索することはありません。このような実用上のユーザー行動との乖離をなくしていきたいです。他にも実際のAPIの速度の問題などもあるので、先述のような言語処理上の課題とシステム構成上の課題の双方に取り組んでいきたいと考えています。

学生や若手のエンジニアに向けてアドバイスなどがあればお願いします

最近では個人のキャリアの考え方として「山登り型」と「川下り型」という表現を聞くことが増えました。それぞれ簡単に説明すると「山登り型」は明確な目標を設定した上で、その目標に到達するためにキャリアを積んでいくという考え方です。一方の「川下り型」とは、その時々の環境やチャンスに臨機応変に対応していくことで自分に合ったキャリアを積んでいくという考え方です。当然、どちらの考え方にもメリット・デメリットがあるのですが、Megagon Labsのような企業研究所で働くためにはかなり「山登り型」のキャリアを意識する必要があるなと個人的には感じています。

学生が大学の研究室で研究をする際には、既に研究室ごとに研究テーマが概ね決まっており、加えて先輩から研究内容を引き継ぐケースも多いかと思います。このように予め与えられたテーマを踏まえてその成果を最大化することになるので川下り型の取り組みに近いものになります。しかし企業の研究所では目標や研究テーマを自分自身で決める必要があります。

自分が研究を通してどのようなことを実現したいのか、その実現のためにどのような課題が存在し、その課題をどのような筋道で解決していくのかを自身で考えて研究テーマを設定する必要があります。このように自分で目標を設定し、研究を着実に進めていく「山登り型」の能力が必要な能力になると思います。

最後に日本のお勧めスポットなどを教えてください

高尾山が非常におすすめです。私は東京の出身なのですが、毎年紅葉のシーズンには必ず高尾山に登りに行きます。子供の頃から毎年登っていますが景色がとても綺麗でおすすめですよ。都心からも非常にアクセスがよく、数時間程で昇り降りできるので気軽にいくことができる点もお勧めできるポイントです。

 (話者: 叶内 晨 / インタビュアー: Megagon Labs Tokyo)

 *注)Megagon Labs Tokyoは株式会社リクルートの研究チームです。

Share:

More Blog Posts: