Megagon Team Profile : 林部 祐太 リサーチサイエンティスト

Megagon Labs Tokyoのメンバーズ・ボイスへようこそ! 連載 1 回目となる今回は、東京オフィスで日本語自然言語処理技術の研究を主導し、国内学会をはじめ国際学会でも着々と成果を創出している 林部 祐太 さんがMegagon Labsに至るまでのバックグラウンド、興味・関心や現在取り組まれている研究、そしてトップ研究者として走り続ける秘訣に迫ります。 

これまでの経歴と、Megagon Labsにジョインした理由を教えてください

大阪大学、奈良先端科学技術大学院大学を経て博士(工学)の学位を取得しました。大学院から自然言語処理の研究を始め、博士課程修了後は京都大学で研究員として勤務しました。そこで日本語NLPの研究を続けていく中で音声言語処理にも関心を持ったこと、企業にも興味があったことからインダストリアル側に軸足を移し、音声認識などに関する研究開発を行いました。このように研究開発の仕事をしてきた中でMegagon Labsと出会いました。

Megagon Labs*注)を選んだ大きな理由はメンバーの人柄と、目指している世界観や取り組む研究内容に非常に共感できたことです。研究においてはデータなどの学習資源も重要ですが、私にとってはチームが目指していること、一緒に働く人達やビジョンがより大事だったので、それらが決め手になりました。

現在取り組んでいる仕事・研究を教えてください

私の取り組みの大きな目標は「人がウェブで何か(例えば宿や不動産など)を探している時に、コンピュータが言葉を介してユーザーから要望を引き出す」ことの実現です。ユーザーが何かを探しているとき、実はそもそもユーザー自身がどんな要望を持っているのか言語化できていないケースも多いのです。私はそのような「言葉になっていなかったり、できていなかったりする要望」を引き出すための手助けをしたいと考えています。

この目標の実現に向けて現在はデータ整備に取り組んでいます。特に口コミなどのデータは人々の体験や知識を共有するリアルな言語情報として注目しています。データセット整備の一例を挙げると2020年10月に「含意関係データセット」を公開しました。今後も日本語NLPの発展に寄与できればと考えています。

データセットの整備と並行して論文執筆にも取り組んでおりLREC 2020では『Japanese Realistic Textual Entailment Corpus』、W-NUT 2020では『Sentence Boundary Detection on Line Breaks in Japanese』を発表しました。これらの研究も実際の口コミデータを活用するための前処理の一環として取り組んでいます。例えば、W-NUTで発表した論文は文の区切りに関する内容となっています。一般的に日本語NLPは文単位の処理をするために句読点を基準とした文の区切りを設定します。一方で口コミを含むウェブテキストには改行記号での区切りがしばしばあるため文分割に失敗することがありました。こういった課題を解決し、データのいっそうの活用を目指して研究を進めています。

Megagon Labsで研究する魅力と、今後の目標を教えてください

Megagon Labs*注)で働く魅力は大きく3つあると感じています。1点目はしっかり研究に取り組めることです。企業の研究所では研究との関わりの薄い技術開発的な業務にも取り組む場合もしばしばあるかと思います。一方Megagon Labsでは、技術コンサルティングではなく学術・ビジネス両面での新しい価値を生み出していくのがミッションとして、単なるお題目ではなく、実際にそのために働けています。2点目は、研究の応用先が明確に定まっているためメンバー全員の向いている方向性が揃っていることです。「その研究が最終的にビジネスに繋がるのか?」を常に意識する必要があるため評価としてもわかりやすく、納得感のあるものになっています。最後にメンバーの多様性です。Megagon Labsのメンバーのバックグラウンドは様々で、色々な企業や研究組織で経験を積んできた研究者やエンジニアが揃っています。そのため、色々な視点からの議論ができて楽しいです。

私の目下の目標は、自分の研究活動を通して作成・整備した学習用データがビジネス、アカデミアを問わず多くの言語処理関係者に役立つことです。新しい分野を切り拓き、その分野の第一人者として自分だからこそ提供できる価値がある研究者になれるよう、今後も研究活動に取り組みます。そして最終的には、全ての日本語ユーザーが自身が言葉にできていなかった要望を明確にし、本当に必要としている情報に辿り着ける状態を実現したいです。

研究を継続するにあたりアドバイスなどがあればお願いします

自分が日々心掛けていることをいくつか述べさせていただきます。まず研究者として一番心掛けていることは「実データをしっかり観察する」ということです。アカデミアにいた時から教授に言われ続けていることなのですが、研究の第一歩として実際のデータをじっくり見ることが非常に大事です。単に論文などの実験データや数値だけを追っても大事なものは見えてきません。研究の対象が言語という例外処理が多発するものである以上、具体的な事例を詳細に見ることが何より大切です。そして実際のデータを仔細に眺めることでどういう部分が課題なのか、どのあたりに研究としての価値があるのかが見えてきます。

研究者としての心掛け以外では常に「自分の強みの活かし方」を意識しています。自分自身の性質を理解し準備することで、チャンスが巡ってきた時にそれが自分にとって活かすことができるものなのかを判断できるようになると考えています。

他には少し角度は変わりますが、学生の時の自分にアドバイスするのであれば「色々な機会があるから積極的に関わっていくこと」「色々な人にお世話になったので人とのつながりを大事すること」を伝えたいですね。

最後に日本のお勧めスポットなどを教えてください

Megagon Labs Tokyoオフィスは東京の銀座にあります。東京と聞くと自然が少ないイメージがありますが、実は意外と都内でも自然を感じることができる場所があります。例えば、東京には庭園や大きな公園が多いので、時間があるときは気分転換に散策に行きます。個人的にはお台場海浜公園や等々力渓谷が気に入っています。特に等々力渓谷は都心とは思えないほど自然が豊かな場所なのでお勧めですよ。

 (話者: 林部 祐太 / インタビュアー: Megagon Labs Tokyo)

 *注)Megagon Labs Tokyoは株式会社リクルートの研究チームです。


Share:

More Blog Posts: