领域概念

一、机器学习领域的相关概念

数据挖掘(data mining),机器学习(machine learning),和人工智能(AI)之间的区别。这三者的区别主要是目的不同,其手段(算法,模型)有很大的重叠,所以容易混淆。

数据挖掘 (data mining)

有目的地从现有大数据中提取数据的模式(pattern)和模型(model)。
数据挖掘是从现有的信息(existing information)中提取数据的模式(pattern)和模型(model),即精选出最重要的信息,以用于未来机器学习和AI的数据使用。其核心目的是找到数据变量之间的关系。其发展出来的主要原因是大数据的发展,用传统的数据分析的方式已经无能处理那么多大量的看似不相关的数据的处理,因此需要数据挖掘技术去提取各种数据和变量之间的相互关系,从而精炼数据。
数据挖掘本质上像是机器学习和人工智能的基础,他的主要目的是从各种各样的数据来源中,提取出超集(superset)的信息,然后将这些信息合并让你发现你从来没有想到过的模式和内在关系。这就意味着,数据挖掘不是一种用来证明假说的方法,而是用来构建各种各样的假说的方法。数据挖掘不能告诉你这些问题的答案,他只能告诉你,A和B可能存在相关关系,但是它无法告诉你A和B存在什么相关关系。
当然,数据挖掘会使用大量机器学习的算法,但是其特定的环境和目的和机器学习不太一样。

机器学习(machine learning):

自动地从过往的经验中学习新的知识。
机器学习其实是人工智能很重要的一部分,因为目前,在实践过程中,大多数的人工智能处理的任务,其实是用机器学习的方式完成的。机器学习可以用程序和算法自动地学习,只要被设计好了,这个程序可以进行自我优化。同时,机器学习需要一定数量的训练数据集(training data set),用于构建来自过往经验的“知识” 。
且机器学习目前在实践中最重要的功能便是预测结果。比如机器学习已经学习结束了,现在有一个新的数据集x,需要预测其分类,机器学习算法会根据这个新数据与学习后的“知识”相匹配(实际上,知识指的是学习后的数学模型),然后将这个数据集x分类某类C去。再比较常见的机器学习,比如amazon的推荐系统。

人工智能(AI)

一个广泛的概念,本质是用数据和模型去为现有的问题(existing problems)提供解决方法(solutions)
人工智能是一个与机器学习和数据挖掘相对不同的概念,人工智能的目的是为了去创造有智力的电脑(不知道怎么翻译好,可以假设其为机器人)。在实践中,我们希望这个电脑可以像有智力的人一样处理一个任务。因此,理论上人工智能几乎包括了所有和机器能做的内容,当然也包括了数据挖掘和机器学习的内容,同时还会有监视(monitor)和控制进程(process control)的内容。


二、推荐算法领域的相关概念

推荐算法

推荐算法是计算机专业中的一种算法,通过一些数学算法,推测出用户可能喜欢的东西。推荐算法有很多种有基于内容、协同、规则、效用、知识等,它们各有优劣也可以结合起来使用。

协同过滤 (Collaborative Filtering)推荐算法

基于协同过滤的推荐算法理论上可以推荐世界上的任何一种东西。图片、音乐、样样可以。 协同过滤算法主要是通过对未评分项进行评分 预测来实现的。不同的协同过滤之间也有很大的不同。
协同过滤算法又分为基于用户的协同过滤算法和基于物品的协同过滤算法

  • 基于用户的协同过滤算法
    用户A/B都喜欢物品A和物品B,从而用户A/B的口味最为相近,因此,为用户A推荐物品时可参考用户B的偏好。
  • 基于物品的协同过滤算法
    物品组合(A,D)被同时偏好出现的次数最多,因而可以认为A/D两件物品的相似度最高,从而,可以为选择了A物品的用户推荐D物品

参考
https://www.cnblogs.com/DonJiang/p/5744535.html
https://baike.baidu.com/item/%E6%8E%A8%E8%8D%90%E7%AE%97%E6%B3%95/6560536?fr=aladdin
https://blog.csdn.net/sdksdk0/article/details/80248999

你可能感兴趣的:(领域概念)