有意義な体験を増やすには、人々の幸福の要因を理解する必要があります。Megagon Labsは不特定多数の人々の協力から成る10万件の幸福な瞬間を収集したHappyDBを開発し、一般に公開しています。私たちが開発を目指す自然言語処理技術は、人々が文章でどのように幸福を表現するかを理解し、幸福が主体のイベントやシナリオを一定の尺度で洞察できるものです。また、各個人が実際に幸福と感じる瞬間の幸福感がさらに高まるような持続可能な行動を提案するシステムの開発も視野に入れています。HappyDBは、自然言語処理とポジティブ心理学にまたがる新たな研究分野において、期待の持てるリソースです。
HappyDBとは?
HappyDBは、クラウドソーシングによる10万件におよぶ幸福の瞬間のコーパスです。その目的は、テキストから収集可能な幸福の要因を理解する最先端技術を進化させることにあります。
データセットを使用するには?
@inproceedings{asai2018happydb,
title = {HappyDB: A Corpus of 100,000 Crowdsourced Happy Moments},
author = {Asai, Akari and Evensen, Sara and Golshan, Behzad and Halevy, Alon
and Li, Vivian and Lopatenko, Andrei and Stepanov, Daniela and Suhara, Yoshihiko
and Tan, Wang-Chiew and Xu, Yinzhan},
booktitle = {Proceedings of LREC 2018},
month = {May}, year={2018},
address = {Miyazaki, Japan},
publisher = {European Language Resources Association (ELRA)}
データセットの内容
HappyDBは、一言でいうと、様々な個人が経験に基づいて記した’私の幸福な瞬間’を収集したデータベースです。以下はその例です:
- When I was on top of a hotel, looking at the city below me.(ホテルの最上階から眼下に広がる街の景色を見渡した時)
- in the morning I received my college degree, receiving the title turn and behind me all my proud of my family was, for the goal that had just turned. (午前中に、大学の学位を取得しました学位を受領して振り返ると、後ろには念願がかなったばかりの私を自慢に思ってくれている家族がいました。)
- today was a school holiday for my son , woke up and played with him. (今日は息子の学校が休みでした。朝起きて息子と遊びました。)
- IT WAS VERY RELAXING TO COME HOME AFTER A LONG DAYS WORK. (長期間の仕事を終えて自宅に戻り、とてもリラックスした。)
- The kitchen now gleams with new paint. Our annual renovation is over and all the colors we chose are set for at least a year. I love our new colors.(新たに塗装したキッチンが輝いています。毎年恒例の家の手直しが終わり、私たちが選んだ色は少なくとも今年1年活躍してくれるでしょう。どの色もとても気に入っています。)
幸福な瞬間を収集する
これらの幸せな瞬間の収集には、Amazonのクラウドソーシングサービスである「メカニカルターク (Mechanical Tuk)」を利用し、其々の協力者には以下の質問に回答を寄せてもらいました。
- あなたは今日、どんなことに幸せを感じましたか。
- 過去24時間を振り返り、あなたが実際に体験して幸せを感じた出来事を思い出してください。
- そして、その幸せな瞬間を文章で説明してください。(当てはまる3つの瞬間を書き出してください)
このタスクでは、「過去24時間」をリフレクション期間と呼びますが、HappyDBにはリフレクション期間が「過去1週間」や「過去1か月」の幸せな瞬間も含まれています。このタスクでは、それぞれの幸せの瞬間とともに記述者のデモグラフィック情報も収集しています。
Lab in the wild
幸福のサイエンスに関心を抱く研究者に一層充実したリソースを提供するために、 Lab In The Wild との提携を通してさらに多くの幸福な瞬間を収集しています。Lab In The Wildでの私たちの試みをぜひご覧ください。
コーパスの修正
人が生み出した他のデータと同様に、HappyDBのコーパスにもエラーが含まれており、クリーニングする必要があります。記述には不完全な文章やスペルミスが多数含まれているためです。 コーパスの利便性を高めるために、クリーニング処理をしたバージョンを提供しています。具体的には以下の処理を行っています。
- 1語のみで記述された幸福な瞬間を削除
- 誤字を修正 (文脈から正しいスペルを推測できる場合のみ)
[原文へ]
(翻訳:Megagon Labs Tokyo)