使用Python+支持向量机预测广州车牌拍卖价格

首先附上我收集的2018年以来的广州车牌拍卖信息

  指标数量 参与人数 第一次报价 第二次报价 上次最低价 上次平均价 上上次最低价 上上次平均价 本次最低价
2020年1月 3634

11917

(数据缺失,取得是历史平均数)

12181 12591 13800 15461 13200 15917 14800
2019年12月 7693 14725 12495 12861 13200 15917 10000 20306 13800
2019年11月 5701 11051 12500 12764 10000 20306 20200 24164 13200
2019年10月 9068 10356 17365 18134 20200 24164 21800 23779 10000
2019年9月 8165 15925 17891 18895 21800 23779 18800 22047 20200
2019年8月 6366 17220 17204 18056 18800 22047 14100 28966 21800
2019年7月 5422 13142 16082 16581 14100 28966 40000 42846 18800
2019年6月 5457 7932 21129 22641 40000 42846 38600 40395 14100
2019年5月 3618 9782 28637 30736 38600 40395 36000 37953 40000
2019年4月 3622 11794 26753 28709 36000 37953 33000 36240 38600
2019年3月 3635 12278 25493 27287 33000 36240 33900 39196 36000
2019年2月 3662 10935 23552 25352 33900 39196 37000 40985 33000
2019年1月 3657 12604 23772 25296 37000 40985 36800 39585 33900
2018年12月 3641 13169 24141 26066 36800 39585 33100 35434 37000
2018年11月 3632 14877 23546 25165 33100 35434 29700 32205 36800
2018年10月 3630 16330 21612 22974 29700 32205 25500 31654 33100
2018年9月 3695 15124 20202 21516 25500 31654 12100 56152 29700
2018年8月 4541 11522 19450 20181 12100 56152 52000 57283 25500
2018年7月 3600 6408 40251 43583 52000 57283 41300 44225 12100
2018年6月 3554 9275 34894 38147 41300 44225 32100 34455 52000
2018年5月 3538 12576 27014 29117 32100 34455 25300 26939 41300
2018年4月 3549 10708 22339 23941 25300 26939 22800 24560 32100
2018年3月 3547 10210 19367 20489 22800 24560 21000 25213 25300
2018年2月 3541 10102 18089 18934 21000 25213 18000 32312 22800
2018年1月 3687 7966 18405 19126 18000 32312 30700 34046 21000

使用语言: Python,请先pip install好pandas和sklearn。

1、import需要的包

import pandas as pd
from sklearn.svm import SVR
# 导入支持向量机

2、将上文的表格复制到excel里面,删除第一行表头,然后保存成csv,命名为data.csv保存在程序目录下。

3、读取csv并转为DataFrame

carPrice = []
with open('data.csv', 'r', encoding='utf-8') as f:
    for line in f.readlines():
        l = line.split(',')
        carPrice.append({
            'zbs': int(l[1]),
            'bms': int(l[2]),
            'fp': int(l[3]),
            'sp': int(l[4]),
            'nlp': int(l[5]),
            'nap': int(l[6]),
            'nnlp': int(l[7]),
            'nnap': int(l[8]),
            'lp': int(l[9])
        })

df = pd.DataFrame(carPrice)
# 将数据转换成DataFrame,其实我觉得直接用pd.read_csv方法更快,这个程序从整理数据到写好也就用了几十分钟。

 4、进行机器学习,输出结果,本次将通过2018-2019年的数据,以及公布的2020年1月车牌拍卖相关数据,预测2020年1月车牌拍卖最低价格。

X_train = df.drop(['lp'], axis=1)[1:]
# 训练数据集
y_train = df['lp'][1:]
# 训练结果集
X_test = df.drop(['lp'], axis=1)[:1]
# 测试数据集

clf = SVR(kernel='linear')
clf.fit(X_train, y_train)
preds = clf.predict(X_test)
print('预测结果是:',preds,'元')

5、输出结果

预测结果是: [17110.34942555] 元

Process finished with exit code 0

 

总结:2020年1月广州车牌拍卖,最低价格为14800元……跟预测结果还是有2千多块钱的差距的。主要原因还是样本数量太少了……

你可能感兴趣的:(使用Python+支持向量机预测广州车牌拍卖价格)