机器学习笔记1 -- 机器学习简介

每日有进步,每日有记录,每日有输出

原文来自网站 Artificial Inteligence

目的:不用额外的“编程”让计算机来“学习”如何处理问题
过程:给出数据和训练模型,用训练得到的结果来对新的数据进行预测
基本的及其学习可以划分为有监督学习和无监督学习两种;
有监督学习:一开始给计算机input和对应的output,之后计算机将对新的input计算output,按照一定条件(开始给定的input/output的对应法则)进行筛选后再输出output。
无监督学习:直接让计算机进行学习,并且不给定任何期望输出。

有监督学习的典型应用
图片分类(分类模型)
在训练时给出图片标签,之后计算机收到新的符合预期的图片会自动识别进行分类;
市场预测(回归模型)
给出市场的历史数据,计算机根据这些历史数据进行学习和分析,然后能够通过历史数据预测之后的市场情况

无监督学习的典型应用
聚类:让计算机将分散的数据按照一定的规律聚类,该方法在科研中使用的频率非常高。
多维度可视化:提高数据可视化的维度。
生成模型:通过输入数据的概率分布,自动生成更多数据。

特征
假设现在我们要开发一个肿瘤类型预测系统(恶性or良性),那么我们第一个需要输入的特征就是肿瘤的大小,然后考虑输入更多的特征,比如年龄。这样做的目的就是通过添加更多相关特征使系统更加健壮可靠,可以添加的特征多达几千种…具体的添加方法通常需要通过数学工具来对数据进行处理。

训练
给出一组输入数据和对应的理想输出,经过训练后即可得到理想的模型。

你可能感兴趣的:(机器学习,大数据,学习笔记,机器学习,大数据)