理解可能な多変数決定木によるデータ分類と解析 ~全体像を見れば隠されている規則がよくわかる~
概要
〇機械学習のモデルには、ニューラルネットのような非記号的モデルと決定木のような記号的モデルがある。前者は、データに含まれる情報を効率よく取り入れることができるが、学習結果はブラックボックスであり、人間も機械も理解できない。後者は理解しやすいモデルとされている。しかし、記号的モデルの学習結果は、機械的に形式的には解釈できるが、人間が理解できないものが多い。
〇様々な応用において、コンピュータは補助的に使用され、人間が最終決断を行う。故に、学習結果を「人間に理解しやすく」する必要がある。多変数決定木技術は前記二つのモデルを融合したもので、一つのソリューションを提供する。本技術には以下の特徴がある。
?類似度を基にした多変数決定木を利用しているので、人間にも理解可能なルールを学習結果として提供することができる。
?忘却学習、注意学習、次元圧縮などいくつかの技術を採用しているので、コンパクトな多変数決定木を効率よく構築することができる。
?データ間の位相関係を階層的に可視化し、学習結果が直感的に理解できる。