人々が辞書のように利用するウィキペディアも、裏ではその正確性を維持し続けるための苦労がある。日々登場する新しい情報に合わせて、記事内容を更新するためには、膨大なマンパワーが必要なのだ。
このほどMITの研究チームは、ウィキペディア更新の時間と労力を大幅に削減できる技術を開発した。
同システムでは、まず新しい情報を持っている人が、文法やスタイルなど細かいこと抜きで、とにかくインターフェースに内容を入力する。するとシステムがウィキペディアを検索し、適切なページとその中の古い内容を見つけて、よしなに書き換えてくれるようだ。
・より正確で人間のに近い文法
研究チームは、古い情報を見つけて内容を置き換えるだけでなく、文法を合わせた更新のためのモデルを作成した。
古い文章と更新情報が含まれた文章(文法やスタイルはバラバラ)のペアを、情報が一致する部分(置き換え必要なし)と一致しない部分(置き換え必要)、どちらともいえない「中立」部分を識別してラベル付け。中立部分を置き換えるためには、そのままではなく文法の変更が必要になる。
古い文章の「中立」部分の単語を、保持するものと削除するものに分け、削除した部分を埋めるのに適切な新たな単語を生成した。
テストでは、今回作成されたモデルによる更新が、より正確で人間のに近い文法と評価されたようだ。
・フェイクニュース検出器の精度向上にも
同システムはウィキペディア更新に限らず、他のテキスト生成技術にも利用できる。
例えばフェイクニュース検出器のトレーニングデータセット。意図しないバイアスが含まれていることが知られるデータセットのペアを、同システムを用いて増強したところ、トレーニング後のフェイクニュース検出器でエラー率が13%減少したとのこと。
また将来的には、Webから最新情報を持ってきてウィキペディアに反映する、完全自動化が実現する可能性があるとのことで、さらなる研究に注目だ。
参照元:Automated system can rewrite outdated sentences in Wikipedia articles/ MIT News
- Original:https://techable.jp/archives/117117
- Source:Techable(テッカブル) -海外・国内のネットベンチャー系ニュースサイト
- Author:YamadaYoji