機械知覚&ロボティクスグループ
中部大学

Machine Learning 口頭発表

並列分散処理における共変量シフトを導入したRandom Forestsの学習

Author
若山涼至, 木村昭悟, 山下隆義, 山内悠嗣, 藤吉弘亘
Publication
パターン認識・メディア理解研究会, 2015

Download: PDF (Japanese)

データの大規模化は,統計的機械学習において高い識別性能を得るために重要な要件の 1 つであるが,学 習時間を増加させる問題がある.しかし複数の計算機や GPU を用いて並列分散処理を適切に用いることができれ ば,学習時間を大幅に削減できる.本研究では,効率的に並列分散処理を行うモデルとして MapReduce を採用し, MapReduce モデルに適した識別器の 1 つである Random Forests の並列分散学習法を提案する.Map 処理では,並列 分散学習に共有データを導入し,転移学習を行うことで各ワーカノードに割り当てられた学習データあ少量であって も高い識別性能を獲得する.Reduce 処理では決定木を削除することで識別時の計算コストを削減する.提案手法では, 各ワーカノードに分布の偏りが強いデータが与えられた場合においても,識別性能の低下を防ぐことが可能である.

※本発表はPRMU研究奨励賞を受賞しました。

前の研究 次の研究