Random Forests®
ブライマンとカトラーのrandom forests
Random Forests®モデリングエンジンは、分類木と回帰木(CART®)のコレクションに基づいて、CARTのそれぞれの木の予測を要約し、決定木が互いに影響しないようにしながら、森全体の予測を出します。
Random Forestsは、カリフォルニア大学バークレー校のレオ・ブライマン氏およびアデル・カトラー氏が開発した強力なアンサンブル手法です。予測モデリングの実践者の多くに支持されています。アルゴリズムは一見したところ単純ですが、独立木を数百本も構築し、観測値と変数のどちらからも多くのサンプリングを行います。
アウトオブバッグデータに基づいて偏りのないモデルのパフォーマンスを評価するRandom Forestsの独自の機能により、個別の検定または検証サンプルを用意する必要がなくなります。これにより、変数の数が観測値の数を超えることの多い幅広いデータ使用において、Random Forestsはトップ予測モデリングツールになります。
責任追跡性
Random Forestsには、過剰適合の危険なしにデータセット内のすべての記録を活用する独自の機能があります。これは特に、それぞれの記録に何らかの価値のある小さなデータセット(観測値の観点から)には重要です。Random Forestsは、すべての記録がモデルで考慮されて、洞察が失われないようにします
ロバスト変数の重要度
Random Forestsは、新しい手法を利用して、重要度に応じて予測変数をランク付けします。これは、データに数千、数万、数十万の変数または予測変数が含まれている場合に便利で、従来の回帰ツールと分類ツールよりも優れています。Random Forestは、このような極端な状況を処理し、追跡調査で使用すべき変数を報告できます。複数のサンプリングにより、洞察に堅牢さと質が付加されます。
人気の高いモデリング エンジンRandom Forestsを試すことに興味をお持ちですか?
Minitabの木ベースの方法
開始して間もない場合でも、予測分析を次のレベルに引き上げる場合でも、Minitabの木ベースのモデリングエンジンには必要なパワーがあります。
CART®
高度な分析に革命をもたらし、データサイエンスの現代を始動した、究極の分類木アルゴリズム。
Random Forests®
複数の代替分析、ランダム化戦略、アンサンブル学習を、1つの便利な場所で活用可能。
TreeNet®
極めて正確なモデルを一貫して生成できる、非常に柔軟で強力な機械学習ツール。