《Python机器学习及实践——从零开始通往Kaggle竞赛之路》学习笔记(1)——简介篇

机器学习的结构

经验
特征
训练集
任务
监督学习
无监督学习
分类
回归
数据降维
聚类
性能
测试集
准确性

Python编程库

  • Python是一门解释性编程语言,与JAVA类似,源代码都需要通过一个解释器Interpreter转换为独特的字节码。这个过程不需要保证全部代码一次性通过编译,解释器逐行处理这些代码。
  • NumPy:提供高级数学运算、高效的向量和矩阵运算功能。
  • SciPy:在NumPy基础上构建的更强大、应用领域更广泛的科学计算包。
  • Matplotlib:仿MATLAB绘图工具包。
  • Scikit-learn:封装了大量经典以及最新的机器学习模型。
  • Pandas:数据预处理工具包。

Python编程基础

  • 命令提示符:>>>,在Python命令行环境中,两个提示符之间的代码会当即被解释器处理。
  • Python允许使用者在访问列表的同时修改列表里的数据,而元组则不然。
  • 成员运算符in,只能用来考量目标是否是字典的键,而不能在值中检索。
  • 对字典进行遍历:
d = {1: '1', 'abc': 0.1, 0.4: 80}
for k in d:
	print k, ":", d[k]

Python基础综合实践

  • 良/恶心乳腺癌肿瘤预测:
  1. 使用pandas读原始文件,分成训练集测试集
  2. 使用matplotlib.pyplot画图。
  3. 两类肿瘤分界线的函数表达需要留意。
  4. 使用sklearn.linear_model中的LogisticRegression进行分类。
  5. lr.score输出Accuracy。
  6. 获取拟合系数,绘制预测分界线。

你可能感兴趣的:(传统机器学习,机器学习,python,python,机器学习,人工智能)