文本挖掘是一种从大量文本数据中提取信息和知识的方法。它通常使用自然语言处理技术来识别文本中的模式和关系,并使用数据挖掘技术来发现隐含的规律。文本挖掘的应用领域广泛,包括情感分析、市场调研、客户服务、新闻摘要、舆情分析等。
文章目录
- 文本挖掘的发展历程
- 数据挖掘和文本挖掘的区别
- 文本挖掘的通常流程
- 文本挖掘的优势
- 使用文本挖掘应用
-
- 文本挖掘局限性
文本挖掘的发展历程
- 上世纪50年代,H.P.Luhn提出词频统计的思想用于自动分类。
- 上世纪60年代后围绕研究主要再文本特征抽取、文本挖掘算法。(主要有关联规则抽取、语义关系挖掘、文本聚类、主题分析等)。
- 上世纪70年代后从规则到统计,基于统计的NLP产生了NLP (Natural Language Processing) 是人工智能(AI)的一个子领域。
- 现如今基于神经网络、深度学习进行NLP处理操作。
数据挖掘和文本挖掘的区别
数据挖掘是一种从大量数据