机器学习简介

简介

机器学习基本概念,原理,历史,未来趋势,常见算法
语音识别
ocr工具(图像转文本)、 tts(文本转语音)、ASR_APP(语音转文本)
图像检测
机器翻译
风格迁移
NLP(自然语言处理)
搜索引擎
。。。。
算法模型 训练集 测试集 验证集

5W2H
how machines learning works:
1. select data (training data,
 validation data,test data) -> 训练集 测试集 验证集
2. Model data(训练集构建相关特征的model) ->
3. Validate Model ->
4. test model ->
5. use the model ->
6.  Tune model 

Machines can 'learn' by analyzing large amounts of data.
它通过数据分析获得数据规律,并将这些规律应用于预测或判定其他未知数据
数据科学Work Flow:
获取(数据存在不同的格式) -> 检查和探索 -> 清理和准备 -> 建模 -> 评估 -> 最后的部署

数据科学的工作流程

  1. 获取:
    不同的数据源,不同的数据格式
  2. 检查和探索:
    合理地检查数据
    检查最极端的情况
    统计测试,并将数据可视化
    数据是否缺失或者不完整
    Jupyter pandas matplotlib
    Seaborn = 专门为统计可视化创建的库
  3. 清理和准备
    转换为适合于模型使用的格式
    过滤 - 聚集 输入 - 转化
  4. 建模
    选择适当的算法,并在数据上训练出一个模型
    将数据分割为训练 测试和验证的集合
  5. 评估
    模型构建完成并开始进行预测
    实际值与评估之间的距离测量
  6. 部署
    一个定制的Web应用程序,甚至是一个简单的cron作业

常见机器学习算法

  1. 决策树(Decision Tree)
NLP
nlu 自然语言理解包括三块:
1. 领域识别
2. 意图识别
3. 槽填充

参考链接: http://www.cyzone.cn/article/159742.html
https://easyai.tech/ai-definition/machine-learning/

你可能感兴趣的:(机器学习简介)