口コミや記事などの文書を分析する際に単語の極性情報は重要であり,日本語では小林ら [1] の日本語評価極性辞書や高村ら [2] の単語感情極性対応表,また梶ら [3] の評価表現辞書などが利用できる.しかしこれらの評価極性辞書に含まれる単語は,特定のドメインにおけるテキストに対しては適合しないことがある.一例として,本研究でデータセットとして用いる旅行情報サイトの口コミデータでは,評価極性辞書に含まれる 13,625 個の単語のうち約 6 割強の単語はデータの語彙に含まれず,ドメインに適応した単語が辞書に含まれているとは言い難い.また「静か」のように極性辞書では negative な極性単語として登録されているが,実際の口コミデータにおいては肯定的な意味合いで使われる単語も存在する.このようなドメインに特化した辞書を用いたい場合,ドメインに応じて低コストで辞書の拡張を行う必要がある.そこで,本研究では極性既知の単語のベクトルに対して類似度の高いベクトルを,評価極性辞書への新たな追加候補語として取得する方法を提案する.まず極性が既知で対義関係にある単語対の差分を差分ベクトルとして算出し,元の極性既知の単語ベクトルに差分ベクトルを加えたベクトルに対する高類似度単語を取得することで,反対極性の単語を除外した追加候補語の獲得を試みる.