3.6 KiB

Raw Permalink Blame History

梯度推进模型——用 Python 实现

原文：https://www.askpython.com/python/examples/gradient-boosting-model-in-python

读者朋友们，你们好！在本文中，我们将关注 Python 中的梯度增强模型，以及实现细节。

所以，让我们开始吧！

第一，什么是梯度提升模型？

在深入探讨梯度提升的概念之前，我们先来了解一下机器学习中的提升概念。

Boosting 技术试图通过以串行方式构建弱模型实例来创建强回归器或分类器。也就是说，前一个实例的错误分类误差被馈送到下一个实例，并且它从该误差中学习以提高分类或预测率。

梯度推进算法就是这样一种机器学习模型，它遵循预测推进技术。

在梯度推进算法中，预测器的每个实例从其前一个实例的误差中学习，即它校正由前一个预测器报告或引起的误差，以具有更好的模型和更少的误差率。

每个梯度提升算法的基础学习器或预测器是分类和回归树。学习的过程继续进行，直到我们决定构建的所有 N 棵树都已经从模型中学习，并且准备好进行具有更少量的错误分类错误的预测。

梯度推进模型适用于回归和分类变量。

推荐阅读——Python XGBoost 教程

梯度推进模型——一种实用的方法

在本例中，我们利用了自行车租赁计数预测数据集。你可以在这里找到数据集！

首先，我们使用 read_csv() 函数将数据集加载到 Python 环境中。

为了进一步实现，我们使用来自sklearn.model selection库的train_test_split()函数将数据集分成训练和测试数据值。

分离数据后，我们进一步使用 MAPE 作为评估算法的误差度量模型。

现在，让我们来关注一下在 Python 中实现梯度推进模型的步骤

我们利用 GradientBoostingRegressor()函数对训练数据应用 GBM。
在此基础上，我们利用 predict()方法对测试数据进行建模。

举例:

import pandas
BIKE = pandas.read_csv("day.csv")

#Separating the depenedent and independent data variables into two dataframes.
from sklearn.model_selection import train_test_split 
X = bike.drop(['cnt'],axis=1) 
Y = bike['cnt']
# Splitting the dataset into 80% training data and 20% testing data.
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=.20, random_state=0)

import numpy as np
def MAPE(Y_actual,Y_Predicted):
    mape = np.mean(np.abs((Y_actual - Y_Predicted)/Y_actual))*100
    return mape

from sklearn.ensemble import GradientBoostingRegressor
GR = GradientBoostingRegressor(n_estimators = 200, max_depth = 1, random_state = 1) 
gmodel = GR.fit(X_train, Y_train) 
g_predict = gmodel.predict(X_test)
GB_MAPE = MAPE(Y_test,g_predict)
Accuracy = 100 - GB_MAPE
print("MAPE: ",GB_MAPE)
print('Accuracy of Linear Regression: {:0.2f}%.'.format(Accuracy))

输出:

结果，我们从数据集上的梯度推进模型获得了 83.10%的准确度。

MAPE:  16.898145257306943
Accuracy of Linear Regression: 83.10%.

结论

到此，我们就结束了这个话题。如果你遇到任何问题，欢迎在下面评论。

更多与 Python 编程相关的帖子，请继续关注我们。

在那之前，学习愉快！！🙂

3.6 KiB Raw Permalink Blame History Unescape Escape

梯度推进模型——用 Python 实现

第一，什么是梯度提升模型？

梯度推进模型——一种实用的方法

结论

3.6 KiB

Raw Permalink Blame History