本来呢,最近看了人类简史,想写一篇偏见相关的,思路还没整理好不好放出来,先写个技术的吧。最近真是忙成狗,搬职场,找房子租,参加各种各样的会议,还有开发任务,做屁屁踢,接下来架构的规划,知识储备。
可是毕竟我也不想跳票的嘛。T_T
说实话。
时间还是蛮充裕的,啊哈哈哈哈哈哈!!!!!!!
突然想起上一篇忘了开原创忘了开赞赏而且忘了放二维码,现在心塞塞塞塞塞的,大家点个赞或者分享一下我会很开心的。
今天就用比较主流的架构,来简单实现这个在线预测系统,来完全打消小伙伴们对机器学习的恐惧感,它不难,但是我从没说过它很简单。
整套代码核心的代码不超过10行,相信我,就算你完全不会任何数学,也不会对开发造成任何的影响。
当然我之前说过,想要往深了做,要有扎实的数学和英语基础。为什么??因为AI这个技术还是个小BB,还没长大,还要用各种各样的论文来喂它茁壮长大,要是看不懂别人的论文或者无法复现,那咋跟进最新技术进展??
架构是django+scikit-learn,这个在我上一篇已经提到过了,这是最最最简单的实现方式,不服来辩。
敲黑板!!!课前要准备好这些,开发环境环境为ubuntu14.04,不会安装的,问度娘或者谷哥去。
python2.7,pip,django,scikit-learn,pandas,numpy,Pycharm,。
好,随便找个目录,哐哐哐输入下面这样django初始化项目的脚本。
django-admin startproject ph_ml_core
好了,项目初始化完了。目录结构长啥样的呢?
看起来特么好多啊,那既然说了很简单了,其实绝大部分我们都不需要去改动。那,有哪些是我们自己要去写的呢?
Advertising.csv是数据文件,QualifiedModel.py是我们核心的业务逻辑代码,view.py是我们的视图,urls.py是django的路由+控制器。
第一步先给我们的系统加一个路径叫predict的玩意,这个就是暴露给http请求的接口,至于咋实现或者啥意思,就是个正则表达式有兴趣的小伙伴自己去看。
urlpatterns = [
url(r'^admin/', admin.site.urls),
url(r'^predict/$', predict),
]
第二步就是写视图了,这个比较掺杂,大致意思就是调用一个模型进行评分,核心的就这一句score = qual.predict()。
没错调模型就是这么简单。
def predict(request):
# 获得请求数据,并转成字典格式。
rowData = eval(request.GET['a'])
# 获得已经训练好的模型
qual = QualifiedModel()
# 直接对新进件的数据进行评分
score = qual.predict(np.array([[rowData['TV'],rowData['Radio'],rowData['Newspaper']]]))
# 组装返回数据
result = {}
result['score'] = score[0]
return HttpResponse(json.dumps(result),content_type='application/json')
第三步,训练模型,就在上一步我们调用了模型,那模型怎么来的呢?肯定是通过我们的训练数据来的。这里使用Lasso,什么是Lasso我这里就不介绍了有必要的话我后面起个文章单独说,现在先自行问度娘去,一个线性模型。
哈什么?你对模型不熟,不会对模型调参?没问题,sklearn都帮咱实现好了,直使用交叉验证,连调参都不用了。交叉验证是什么,就是给它一大堆参数组合,然后我不管,我就要那个训练结果最佳的。
def initModel(self):
#获取数据
data = pd.read_csv(os.path.join(os.path.abspath(os.path.dirname(__file__)),'Advertising.csv'))
#取得特征值
x = data[['TV','Radio','Newspaper']]
#取得结果值
y = data['Sales']
#通过交叉验证训练得到最佳模型
model = Lasso()
alpha_can = np.logspace(-3, 2, 10)
np.set_printoptions(suppress=True)
lassoModel = GridSearchCV(model,param_grid={'alpha':alpha_can},cv=5)
lassoModel.fit(x_train,y_train)
第四步,调用试试看吖。
http://127.0.0.1:8000/predict/?a={"TV": 65, "Newspaper": 15, "Radio": 30}
返回:{"score": 11.328439830355411}
http://127.0.0.1:8000/predict/?a={"V": 29, "Newspaper": 15, "Radio": 30}
返回:{"score": 9.6539587774368592}
到这里,我们所有的功能都已经实现完了。是不是非常简单?其实我们很多时候害怕一个东西是因为这个东西不熟悉,就像我之前说的,做做做,做起来,慢慢你就不怕了。
在这里我要说一个事实,智商是不可逾越的,这句话还真有可能是正确的。让一个智商普通的人去突破物理学的界限,这显然,不太可能会实现,只能说P(突破物理界限|已知是一个智商普通的人)很低,我这里说的智商是思维能力,并不是指什么什么智商测试的结果。但是也是很明显的,很多人都是日复一日做着一样的事情,被各种各样的会议,各种各样的繁琐的事情,禁锢了自己的思维,也禁锢了自己的潜力,都没到开始拼智商的时候好吗??
到现在还有人说开发工程师是一个要求很高的职业,其实这个职业的要求真心不算高,任何一个经过系统培训的小白,都能按照老师教的结果哐哐哐写出一些"业务逻辑",但要是止步于此不去做任何的思考,不理解为什么是这样做,那你的上限也就这样了。
凡事问三层,"为什么这样就有这样的效果呢"?可能会有不同的结果。
但是呢,在你跟别人讨论或者请教的时候,自己还是要先有料,自己做足各种各样的研究,准备好各种各样的资料,再去开始请教,可能会比较。不然我就会说一句乔布斯回答别人经常说的话---"it is complicated",没错,那我只能告诉你,这很复杂。
当然付费的一般就不存在这个问题,比如老师啊,培训师啊,各种网红的收费栏目啊,就不存在这个问题。为什么呢,因为你做了其他的努力去赚取这个付费的款项,也算是做足准备了吖。
好了,后台回复 第一只 ,获取这次的小玩具,大家一起愉快地玩耍吧。要是分享给其他小伙伴我会很开心的。