Machine Learning
口頭発表
分離度を用いた分岐関数選択によるRandom Forests の高精度化
- Author
- 三品陽平, 山内悠嗣, 藤吉弘亘
- Publication
- 楽天研究開発シンポジウム, 2011
Download: PDF (Japanese)
近年,機械学習やパターン認識の分野において,大規模なデータベースを用いて効率よく学習できるRandom Forests が多く利用されている.Ranfom Forests は,決定木の分岐関数選択に分岐したサンプルの情報利得を用いて評価している.しかし,情報利得はクラスの生起確率に基づいているため,分岐関数のしきい値とサンプルの分布の関係性が考慮されていない.よって,分岐関数のしきい値とクラスの分布が近い場合,未知入力サンプルが反転し誤識別する可能性がある.そこで,本研究ではサンプルの分布に着目し,クラス間の分布の広さを評価するために分離度を導入することを提案する.これにより,分岐関数とクラス間の分布が広く汎化性能の高い分岐関数を選択することで識別性能の向上が期待できる.比較実験の結果,従来のRandom Forests より約3.39% の識別性能向上を確認した.