プレスリリース

ニュースリリース

PRESS RELEASE

データマイニングのトップカンファレンス「KDD 2018」
産業技術総合研究所×電気通信大学×ドワンゴ人工知能研究所の共同研究
「等価性構造抽出」に関する論文が採録

株式会社ドワンゴ
2018年8月24日
   

 株式会社ドワンゴ(本社:東京都中央区、代表取締役社長:荒木隆司)は、8月19日(日)から23日(木)までイギリス・ロンドンで開催された知識発見・データマイニングなどに関するトップレベルの国際会議「KDD 2018」のResearch Track部門において、同社のドワンゴ人工知能研究所、産業技術総合研究所および電気通信大学の三者による共同研究「等価性構造抽出」の論文が採録されたことをお知らせします。

 今年で24回目を迎えるKDD(KDD=Knowledge Discovery and Data Mining)は、米国コンピュータ協会ACMの分科会であるSIGKDDが毎年北米を中心に開催する、データマイニング分野で最も権威のある国際会議の一つです。同会議における、データマイニングの手法や理論などの提案・改良を対象としたResearch Track部門の論文採録率は例年20%弱(今年は18%)となっており、この分野では最難関な国際会議として位置づけられています。参加人数は毎年数千人に上り、最先端技術を追求する研究者と、実問題への応用を求む利用者が集まり、情報共有とネットワーキングが行われています。

KDD 2018に採択された論文内容


等価性構造抽出の例

 等価性構造抽出では、二つ以上の組を比較して、必ずしも同時でない時刻(非同期)において「似た部分列が含まれている」ときに、「等価」というメタ関係を持つ構造が発見されたと考えます。この抽出は「属性が未知である」といった場合でも利用できる特徴を持ちます。
 等価性構造(ES)抽出の大きな問題点は、その計算量の多さです。すべての系列の数をNとし、組の大きさをKとしたとき、探索する組の数はN個の中からK個を並べる順列になり、その中で部分列の比較も行う必要があります。これを解消する手段として研究グループは既に、直接K順列を計算するのではなく,Kを逐次的に増やす探索手法(IS法)を提案し、これにより計算時間を削減しました。

 今回の研究では、ESの要素をペアごとに検索するPairwise Incremental Search (PIS)を提案しました。PIS法はIS法よりもはるかに高速です。例えば、2人の異なる人が歩いているデータセット(mocap)を用いた場合には、IS法に比べて1/171の計算時間で、IS法とほぼ同じ結果が得られました。
 本技術を応用できる分野は、「非同期」かつ「属性が未知である」データの例としてヒトとチンパンジーの脳波の中にある等価な関係を見つけるタスクが考えられます。このようなデータでは一般的に同期していないため、時刻の違いを吸収する必要があります。また、ここで言う属性が未知であるとは、ヒトとチンパンジーでは各脳波の持つ属性(働きや意味)がどう対応しているのか分からないということです。このようなデータ間で等価性構造を見つけられれば、脳波の何れの系列同士が対応しているのかを解明する上で役に立ちます。

■関連リンク

KDD公式ページ:http://www.kdd.org/kdd2018/
論文:http://www.kdd.org/kdd2018/accepted-papers/view/accelerated-equivalence-structure-extraction-via-pairwise-incremental-searc

【ドワンゴ人工知能研究所について】

「ドワンゴ人工知能研究所」は2014年10月1日にドワンゴによって設立された人工知能研究機関です。人類の課題である、教育、エネルギー、環境、水資源、食糧、貧困、セキュリティ等に対して大きな貢献をなしうる高度な人工知能を日本発で早期実現することを目的として、全脳アーキテクチャや汎用人工知能に関わる研究を、産学官を含むさまざまな機関と連携して行っています。
http://ailab.dwango.co.jp/