机器学习-sklearn-多项式回归-对函数拟合-看学习曲线(均方误差MSE)-pipeline

上一篇说到了sql留存率的代码,那能不能做一个留存率预测呢?Hive-SQL取一个月用户留存率、留存用户数_lanston别熬夜了的博客-CSDN博客

可以用到sklearn-库中的pipeline库进行多项式回归预测,此类预测还可用与一些有趋势的线性或非线性预测,类似于波士顿放假变化趋势和牛市的时候股价上升趋势等等。

代码如下:

首先读取数据

import pandas as pd
import numpy as np
import math
df = pd.read_excel('留存.xlsx')
X = df['X']
Y = df['Y']

定义一个多项式函数,主要返回pipeline ,代码如下

from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import Pipeline


def PolynomialRegression(degree):
    return Pipeline([
        ("poly", PolynomialFeatures(degree)),
        ("std_scaler

你可能感兴趣的:(sklearn,机器学习,回归,python)