使用PyQt5从零进行大数据app构建(五)使用用户画像和随机森林模型进行预测

前言:想写一个应用好久了,独立开发大概是每个程序员的梦想。自从之前写了一个数据挖掘的小模型,一直想封装一下,故而上路,所以此系列算不上教程,只是记录分享这个过程的坑点和经验,力求有头有尾,网上抄来抄去的教程真的看的头疼,己所不欲勿施于人,在封装完毕之后我会将完整的代码贴出来与大家分享。

教程合集地址:https://blog.csdn.net/infent/column/info/30927

第五篇 纵表转横表的用户画像,和随机森林模型预测。

原始数据我们已经在MySQL里存好了,总共有114万多条数据,但是这是基于事件的数据,我们想把它转换成基于车牌号的用户数据,具体的用户画像模型构建我会在单独总结,这里我们主要说明和应用封装有关的东西,所以数据处理部分就直接粘贴代码了。

计算完横表我们就可以把它存入数据库了,用来在计算时调用,这部分不太涉及到算法,主要是pandas处理技巧,接下来我们将对页面获取的数据进行数据预处理和随机森林模型调用。

使用PyQt5从零进行大数据app构建(五)使用用户画像和随机森林模型进行预测_第1张图片

因为选用的模型,要求计算概率,所以输入的必须是浮点型数据,第一步,我们需要将获取到的用户输入的标签类型数据,转换为数值类型。我们在主界面中已经设置好槽函数了,上图展示的就是querybyid的结果,接下来我们要接到用户输入的数据,通过getinfo函数将其封装到数组,返回做为rf_predict()的参数。

在数据标签型转换为整型的部分,我们采取用历史数据建立映射表并存入到MySQL的方式,每次从MySQL读取到dataframe,将传进来的list转换为整型然后传入模型,但是这种方式的健壮性还需要完善,不仅仅是因为可能出现映射表外的类型,而且错误的输入会导致dataframe的columns找不到对应的整数值,这里需要进行完善。

 

 

使用PyQt5从零进行大数据app构建(五)使用用户画像和随机森林模型进行预测_第2张图片

 

 

 

你可能感兴趣的:(PyQt5,pyqt5开发流程)