机器学习中文教程

介绍

sklearn (scikit-learn) 是基于 Python 语言的机器学习工具

  1. 简单高效的数据挖掘和数据分析工具
  2. 可供大家在各种环境中重复使用
  3. 建立在 NumPy ,SciPy 和 matplotlib 上
  4. 开源,可商业使用 - BSD许可证

目录

  • 安装 scikit-learn
  • 用户指南
    • 1. 监督学习
      • 1.1. 广义线性模型
      • 1.2. 线性和二次判别分析
      • 1.3. 内核岭回归
      • 1.4. 支持向量机
      • 1.5. 随机梯度下降
      • 1.6. 最近邻
      • 1.7. 高斯过程
      • 1.8. 交叉分解
      • 1.9. 朴素贝叶斯
      • 1.10. 决策树
      • 1.11. 集成方法
      • 1.12. 多类和多标签算法
      • 1.13. 特征选择
      • 1.14. 半监督学习
      • 1.15. 等式回归
      • 1.16. 概率校准
      • 1.17. 神经网络模型(有监督)
    • 2. 无监督学习
      • 2.1. 高斯混合模型
      • 2.2. 流形学习
      • 2.3. 聚类
      • 2.4. 双聚类
      • 2.5. 分解成分中的信号(矩阵分解问题)
      • 2.6. 协方差估计
      • 2.7. 新奇和异常值检测
      • 2.8. 密度估计
      • 2.9. 神经网络模型(无监督)
    • 3. 模型选择和评估
      • 3.1. 交叉验证:评估估算器的表现
      • 3.2. 调整估计器的超参数
      • 3.3. 模型评估: 量化预测的质量
      • 3.4. 模型持久化
      • 3.5. 验证曲线: 绘制分数以评估模型
    • 4. 检验
      • 4.1. 部分依赖图
    • 5. 数据集转换
      • 5.1. Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器
      • 5.2. 特征提取
      • 5.3 预处理数据
      • 5.4 缺失值插补
      • 5.5. 无监督降维
      • 5.6. 随机投影
      • 5.7. 内核近似
      • 5.8. 成对的矩阵, 类别和核函数
      • 5.9. 预测目标 (y) 的转换
    • 6. 数据集加载工具
      • 6.1. 通用数据集 API
      • 6.2. 玩具数据集
      • 6.3 真实世界中的数据集
      • 6.4. 样本生成器
      • 6.5. 加载其他数据集
    • 7. 使用scikit-learn计算
      • 7.1. 大规模计算的策略: 更大量的数据
      • 7.2. 计算性能
      • 7.3. 并行性、资源管理和配置
  • 教程
    • 使用 scikit-learn 介绍机器学习
    • 关于科学数据处理的统计学习教程
      • 机器学习: scikit-learn 中的设置以及预估对象
      • 监督学习:从高维观察预测输出变量
      • 模型选择:选择估计量及其参数
      • 无监督学习: 寻求数据表示
      • 把它们放在一起
      • 寻求帮助
    • 处理文本数据
    • 选择正确的评估器(estimator.md)
    • 外部资源,视频和谈话
  • API 参考
  • 常见问题
  • 时光轴

你可能感兴趣的:(机器学习中文教程)