信息检索与数据挖掘 |(一)介绍

文章目录

  • 信息检索
    • 概念
    • 结构化与非结构化数据
    • 信息检索的基本假设
    • 信息检索小结
    • 附:IR新课题
  • 数据挖掘
    • 定义
    • 数据挖掘 vs 机器学习

信息检索

概念

  • 信息检索是从大型集合(通常存储在计算机上)中寻找非结构化(通常是文本)的材料(通常是文档),以满足信息需求。信息检索与数据挖掘 |(一)介绍_第1张图片

结构化与非结构化数据

  • 结构化数据倾向于引用“表格”中的信息,通常允许数值范围和精确匹配查询。
    信息检索与数据挖掘 |(一)介绍_第2张图片
  • 非结构化数据通常引用自由文本,允许关键字查询(包括操作符)以及更复杂的“概念”查询。它是文本文档检索的经典模型。
  • 结构化数据即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据。
  • 非结构化数据是相对于结构化数据而言的,不方便用数据库二维逻辑表来表现的数据。

信息检索的基本假设

  • 集合:一组文档(假设它目前是静态集合)。
  • 目标:检索与用户信息需求相关的文档,并帮助用户完成任务。
  • 经典搜索模型
    信息检索与数据挖掘 |(一)介绍_第3张图片

信息检索小结

信息检索与数据挖掘 |(一)介绍_第4张图片


附:IR新课题

信息检索与数据挖掘 |(一)介绍_第5张图片


信息检索与数据挖掘 |(一)介绍_第6张图片


信息检索与数据挖掘 |(一)介绍_第7张图片


信息检索与数据挖掘 |(一)介绍_第8张图片


信息检索与数据挖掘 |(一)介绍_第9张图片


信息检索与数据挖掘 |(一)介绍_第10张图片


信息检索与数据挖掘 |(一)介绍_第11张图片信息检索与数据挖掘 |(一)介绍_第12张图片

数据挖掘

定义

信息检索与数据挖掘 |(一)介绍_第13张图片

数据挖掘 vs 机器学习

  • AI说:
    • 数据挖掘和机器学习都是处理大数据的方法,它们之间的区别在于目的和方法。
    • 数据挖掘旨在寻找数据中的模式、规律和关系,以从中提取有价值的信息。数据挖掘的方法是使用各种技术和算法,例如聚类、分类、关联规则挖掘等。
    • 机器学习则是一种人工智能技术,在某种程度上可以看做是数据挖掘的一种扩展。机器学习旨在让计算机根据数据自主学习,建立模型,从而预测、分类或识别未来的数据。机器学习的方法包括监督学习、无监督学习和半监督学习等。

  • 数据挖掘是用来理解事物的。

  • 机器学习是用来预测事物的。
    信息检索与数据挖掘 |(一)介绍_第14张图片

  • 人工智能是用来生成行动的。


  • Data contains value and knowledge.
  • Data mining around us.

分类
信息检索与数据挖掘 |(一)介绍_第15张图片
信息检索与数据挖掘 |(一)介绍_第16张图片


信息检索与数据挖掘 |(一)介绍_第17张图片
聚类
信息检索与数据挖掘 |(一)介绍_第18张图片降维
信息检索与数据挖掘 |(一)介绍_第19张图片

  • PCA主成分分析
  • 降维:LDA

你可能感兴趣的:(#,信息检索与数据挖掘,数据分析,数据挖掘,数据库,人工智能,信息检索)