自然言語処理

テキストソースから情報を自動的に、一貫して、正確に理解し(および抽出)する能力は、多くの現実世界のAIアプリケーションにおいて重要な特性です。この特性は、人事(HR)分野においても同様に重要です。近年、最先端の大規模な事前学習済み言語モデルは、自然言語生成、要約、質問応答、読解、固有表現抽出/解決を含む幅広いNLPタスクで、目覚ましい性能を実証しています。しかし、解釈可能性、制御可能性、透明性、公平性といった点では限界も見られます。

Megagon Labsでは、大規模な事前学習済み言語モデルを活用し、現状の最先端を超えていく方法に焦点を当てています。私たちは、新しいモデル、システム、アプローチを研究し、提案、展開することで、自然言語処理の能力を向上させることを目指しています。これを実現するために、新しいアーキテクチャの定義、ハイブリッドニューロンシンボリックパラダイムの使用、そしてHRや関連分野におけるソリューションの品質、一貫性、公平性、真実性にプラスの影響を与えるドメイン固有の特性の探求に取り組んでいます。

 

Recent Publications:

Reasoning Capacity in Multi-Agent Systems: Limitations, Challenges and Human-Centered Solutions

Retrieval Helps or Hurts? A Deeper Dive into the Efficacy of Retrieval Augmentation to Language Models

Large Language Models Sensitivity to The Order of Options in Multiple-Choice Questions

Characterizing Large Language Models as Rationalizers of Knowledge-intensive Tasks

XATU: A Fine-grained Instruction-based Benchmark for Explainable Text Updates

Less is More for Long Document Summary Evaluation by LLMs

Human-LLM Collaborative Annotation Through Effective Verification of LLM Labels

MEGAnno+: A Human-LLM Collaborative Annotation System

Related Projects:

CoCoSum: 比較可能な2つのエンティティの対比的サマリ

私たちは、新しい復号アルゴリズム”co-decoding”を開発しました。異なる意見要約の生成では、対象エンティティと相手エンティティのトークン確率分布を対比することで、特徴的な単語を際立たせます。共通する意見要約の生成では、トークン確率分布を集約することにより、エンティティペア特有の単語を際立たせます。

Coop: 意見要約のための凸型アグリゲーション

Coopは、潜在空間内でより良い要約ベクトルを見つけることで、より具体的な要約を生成することを可能にしました。

GiNZA: 日本語自然言語処理オープンソースライブラリ

GiNZAはオープンソースの日本語自然言語処理ライブラリです。ワンステップでの導入、高速かつ高精度な日本語の解析処理、依存構造(係り受け)解析や固有表現抽出などの高度なNLP技術を国際化されたフレームワーク上で利用可能などの特徴を備えています。
Please select listing to show.