Random Forests®

Breiman & cutler의 random forests

CART®(Classification & Regression Trees) 컬렉션에 기반을 두고 있는 Random Forests® (랜덤 포레스트)모형화 엔진은 각 CART 트리에서 수행하는 예측을 합해 포레스트의 전체 예측을 결정하면서 의사결정 트리가 서로의 영향을 받지 않도록 합니다.

Random Forests에 생소한 이들은 Random Forests가 Leo Breiman과 Adele Cutler가 캘리포니아 대학교 버클리에서 개발한 강력한 앙상블 기술로, 여러 예측 모형화 실무자들의 선택을 받고 있다고 이해하면 쉽습니다. 알고리즘은 단순해 보이지만 독립적인 트리를 수백 개 작성하고 관측과 변수 모두전체에서 추출한 여러 표본을 사용합니다.

OOB(out-of-bag) 데이터를 기준으로 편향 없이 모형의 성능을 평가하는 Random Forests만의 고유한 기능을 사용하면 학습/검증 표본을 따로 추출해야 할 필요가 없어집니다. 이를 통해 Random Forests는 변수 수가 사용 가능 관측 수보다 몇 배가 더 많은 다양한 데이터 애플리케이션에 가장 많이 사용되는 예측 모형화 도구로 등극했습니다.

Play Video
video-altText

설명 책임

Random Forests는 과적합 위험 없이 데이터 집합의 모든 기록을 활용할 수 있는 고유한 기능을 갖고 있습니다. 이 기능은 각 기록이 귀중한 것을 기여할 수 있는 소규모(관측 수 기준) 데이터 집합에 특히 중요합니다. Random Forests는 모형의 모든 기록이 설명되고 단일 통찰력이 손실되지 않도록 보장합니다.

로버스트 변수 중요도

Random Forests는 새로운 기법을 이용하여 예측 변수를 중요도에 따라 순위를 매깁니다. 이 기법은 데이터에 변수 또는 예측 변수가 기존 회귀 분석 및 분류 도구에서 감당할 수 있는 것보다 훨씬 많은 수천, 수만 또는 수십만 개까지 포함되어 있는 경우에 편리합니다. Random Forest는 이런 극단적인 상황에 대처하고 후속 연구에 어떤 변수를 사용해야 하는지 다시 보고할 수 있습니다. 표본을 여러 차례 추출하므로 통찰력의 견고함과 품질 수준이 향상됩니다.

가장 인기가 높은 모형화 엔진인 
Random Forests를 사용해 보고 싶으십니까?

 

Minitab의 트리 기반 방법

이제 막 시작하는 사용자나 예측 분석 능력을 한 단계 더 높이려는 사용자 모두 Minitab의 트리 기반 모형화 엔진으로 필요한 성능을 얻을 수 있습니다. 

Minitab의 모든 예측 분석 솔루션에 대해 자세히 알아보기

CART

CART®

고급 분석을 혁신하고 지금의 데이터 과학 시대를 시작한 궁극의 분류 트리 알고리즘.

Random Forests

Random Forests®

여러 대체 분석, 랜덤화 전략 및 앙상블 학습을 한 곳에서 편리하게 이용할 수 있는 기능.

TreeNet®

매우 정확한 모형을 일관되게 생성할 수 있는 가장 유연하고 강력한 머신 러닝 도구.

Minitab의 예측 분석 솔루션에 대해 알아볼 준비가 되셨습니까?