言語処理学会(NLP)

2025
スキルマッピングは職務記述書や履歴書中の文で言及されるオントロジーで定義されたスキルを特定する作業であり労働市場の分析に不可欠である.詳細な分析に必要な細分化されたスキルが付与された学習データを人手で構築するのは高いコストなため既存研究は Large Language Model (LLM) が生成した合成データが bi-encoder の学習に用いる.合成データを活用したさらなる精度改善のため,提案手法 (𝑘NNBE) は推論時に学習に利用したラベル付き合成文を 𝑘-nearest neighbor (𝑘NN) によって取得し入 力文との類似度を bi-encoder のスコアに加える.実験により 𝑘NNBE は bi-encoder の精度改善,さらに既存の最高精度を示す LLM でスキルをリランキングする手法と比較して高いスループットを維持しながら精度改善を確認した.