本文前半部分介绍numpy、scipy、matplotlib、pandas、pyTorch等机器学习的基本函数库。后半部分介绍cloud autoML和autoML Version、以及X度的Apollo 2.0/auto技术。
numpy库是python中用来处理数据的函数库,核心是数组计算。
http://nbviewer.jupyter.org/github/lijin-THU/notes-python/blob/master/03-numpy/03.03-numpy-arrays.ipynb、数组的方法常用的有数组求和sum()、数组求积prod()、求最值函数min()/max()、求最大最小值在数组中的位置argmin()/argmax()、求数组均值的函数mean()、标准差std()、将数组值限定在某个范围clip()、数组元素的排序sort()、数组的形状函数shape()\reshape()函数、数据转置函数transpose()、将多维数组转换为一维的flatten()、将数组转为字符串的tastring()、from string()读出数组、生成数组的函数orange()、linespace()、等等。numpy库的存在大大提高了python数组矩阵计算的速度,较少了二次开发底层数学运算的工作量。
scipy库是科学计算的第三方库,当然以numpy为基础。该库提供了一些列科学计算函数,比如高斯函数、插值函数、scipy.stats类中包含了nanmedian()中位数函数、众数mode()、skew()偏度、kurtosis()峰值函数,正态分布norm()类、离散pmf()、曲线拟合的函数polyfit()、linregress()的回归函数、integrate()的积分运算函数、稀疏矩阵操作函数sparse()、线性代数计算模块linalg模块。
matplotlib库是python的2D图像包,https://matplotlib.org 这个函数库比较简单,用来显示图,当然,显示的前提是在python 中已经绘制了图片,绘图函数plot()、显示图像的函数show()、axis()函数表示坐标轴显示的范围、subplot()绘制子图。各种实例如下:
http://nbviewer.jupyter.org/github/lijin-THU/notes-python/blob/master/06-matplotlib/06.10-different-plots.ipynb
pandas库是python的数据分析库,可以生产数据、分析数据、产生数据视图、操作文件csv、内存读写等等。最好用的就是时间序列数据生产和分析系列函数。
pandas
中有三种基本结构:
Series
DataFrame
Panel
Series
是一维带标记的数组结构,可以存储任意类型的数据(整数,浮点数,字符串,Python
对象等等)。
作为一维结构,它的索引叫做 index
,基本调用方法为
s = pd.Series(data, index=index)
其中,data
可以是以下结构:
ndarray
5
index
是一维坐标轴的索引列表。
DataFrame
是 pandas
中的二维数据结构,可以看成一个 Excel
中的工作表,或者一个 SQL
表,或者一个存储 Series
对象的字典。
DataFrame(data, index, columns)
中的 data
可以接受很多数据类型:
Series
的字典Series
DataFrame
index
用于指定行的 label
,columns
用于指定列的 label
,如果参数不传入,那么会按照传入的内容进行设定。
小字部分参考官方文档。
期待这一天的带来。希望大家先入为主。
再送大家一点福利,阿波罗2.0,机器学习在无人驾驶方面的应用。
2017年7 月5 日,百度在首届 AI 开发者大会宣布开放 Apollo 自动驾驶平台以来,受到了社会各界的广泛关注,更在自动驾驶开发者群体中引发了热烈反响。
2017年7月22日举办的第73期百度技术沙龙上,百度自动驾驶事业部资深架构师、数据平台专家杨凡,百度自动驾驶资深架构师何玮,百度智能驾驶事业部资深架构师郁浩三名讲师在中关村创业大街车库咖啡,向参加沙龙的三百多名开发者们深度解析了Apollo平台与智能驾驶方案。对自动驾驶技术感兴趣的读者可以留意下。在后面的章节中,我会介绍一些slam方面的东东。
总结:九层高抬起于垒土,牛逼的应用离不开对基础知识的厚积薄发。