2018.01.28.一周机器学习周记

时间:2018.01.28.一周


主要内容


1.TensorFlow环境搭建完工

2.把jupyter notebook 用起来

3.拓展:实践Python圈中的符号计算库-Sympy

4.继续对腾讯算法大赛进行项目研究

  4.1 为进一步了解体会机器学习的流程,实践了两个微型精简项目(关于sklear提供的数据集iris)

  4.2 特征工程在项目中举住轻重,由此本周还拜读了一篇有关于特征工程的优秀文章并实践了相关实例



内容概况


TensorFlow环境搭建

  具体内容整理于文档 关于TensorFlow的安装和心得


jupyter notebook

  具体内容整理于文档 关于Jupyter notebook的安装以及一些使用心得


符号计算库-Sympy

  Sympy库提供了诸多符号计算的方法函数,如解方程、解方程组(二式二元一次方程组可以用一行代码解决)、函数赋值运算、求导数及偏导数、求积分、求极限的函数等等,十分实用,方便快捷!此处附上相关文档链接。


关于腾讯算法大赛

  具体内容整理于文档 关于腾讯算法大赛


两个关于数据集iris精简项目

  参考文档 scikit-learn-intro

项目一思路及步骤总结

1.抽取特征(萼宽,瓣长)

2.散点画图(x,y|萼宽,瓣长)完成直观分布

3.染色完成分类(染色分类依据每条记录对应的target属性值及其值对应的target_names,即何值何类何色)

补充:关于clim函数:matplotlib官方文档->docs->The Pyplot API->clim

项目一代码解析


2018.01.28.一周机器学习周记_第1张图片

项目一实现


2018.01.28.一周机器学习周记_第2张图片

项目二代码


2018.01.28.一周机器学习周记_第3张图片

项目二实现


特征工程解读

   参考文档 使用sklearn做单机特征工程

补充

1.哑编码实例:(参考于使用scikit-learn对数据进行预处理

>>>from sklearn.preprocessing import OneHotEncoder

2018.01.28.一周机器学习周记_第4张图片

2.连续型特征:相对于离散型特征而言

3.缺失值

4. “2.5 数据变换”中多项式的“度”:可以联想一下“阶”进行思考

5.关于lamda  :python lambda的用法

6.关于filter对象的注意事项:filter函数

7.利用sklearn训练LDA主题模型及调参详解

你可能感兴趣的:(2018.01.28.一周机器学习周记)