言語処理学会(NLP)

2021
林部 祐太
宿を探しているカスタマーへの接客では,オペレータは宿が満たすべき要件を整理して検索し,検索結果を基に適切な宿を提案する.カスタマーが最初から要件を列挙できることはほとんど無く,漠然とした希望しか持っていないこともしばしば有る.そのため,要件の整理にはカスタマーの発話の意図を的確に解釈するだけでなく,質問・補足・提案などしてカスタマーの希望を言語化する手助けが必要である.本研究ではその整理の過程を分析するため,宿を検索する際の要件を列挙した時点までの対話を収集し,次の 3 つのアノテーションを行う. 1 つ目は要約文で,省略されている言葉を補いながら,発話文を簡潔に要約する.例えば,「それがいいです」といった発話文に対して「朝食はバイキングを希望する」といったような要約文を作成する.これは,発話が何を意図しているのかを解釈するためである.2 つ目は,発話文と要約文の語句の対応付けである.例えば,「それが」と「朝食はバイキングを」,「いいです」と「希望する」をそれぞれ対応付ける.これは,どのような言い換えや補足によって要約が生成されたのかを明らかにするためである.3 つ目は,要約文とオペレータが列挙した要件の対応付けである.これは,どのようにして要約文が取捨選択され要件としてまとめられるのかを明らかにするためである.我々は 210 対話を収集し,要約文 3,282 文と 2,134個の要件,およびそれらの対応付けがアノテーションされているコーパスを構築した.このコーパスは談話理解,要約生成,対話応答生成など幅広い言語処理の研究に役立てられると考えている.