用Python实现机器学习:随机森林

之前,我一直使用R语言实现随机森林等机器学习模型,在遇到报错情况时想和身边朋友交流,发现一个很尴尬的事情,擅长使用R的朋友不懂机器学习,而擅长机器学习的只用Python。所以,掌握Python来实现机器学习,是与同行顺畅交流的前提,现在开始总结用Python实现随机森林。

数据来源:波士顿房价数据boston
操作流程如下:

首先,载入boston数据,并取出数据矩阵X与响应变量y,

Boston = load_boston()
X = pd.DataFrame(Boston.data, columns = Boston.feature_names)
y = Boston.target

其次,随机抽取30%的数据作为测试集

X_train, X_test, y_train,y_test = train_test_split(
	X,y,test_size=0.3, random_state=1)

接着,使用sklearn的BaggingRegression类,进行袋袋法估计:

model = BaggingRegressor(base_estimator=
	DecisionTreeRegressor(random_state=123),
	n_estimators=500, oob_score=True, random_state=0)

其中,参数“base…123”表示以回归树作为基学习器,参数“n_…500”表示共有500课树,而参数“oob…True”表示保留OOB的袋外估计结果,

你可能感兴趣的:(python,机器学习,随机森林)