E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数据挖掘导论
大数据入门的部分推荐书单
-N.Tan等人著,《
数据挖掘导论
》,范明泽等人译,人民邮电出版社,2010。[专业][4]吴军,《数学之美》,人民邮电出版社,2012。[半专业]机器学习方面推荐的教材和专著[1]E.Alpay
happyorg
·
2017-08-27 15:52
机器学习
数据挖掘
[推荐算法]ItemCF,基于物品的协同过滤算法 - 在路上的学习者 - CSDN博客
比如,用户A之前买过《
数据挖掘导论
》,该算法会根据此行为给你推荐《机器学习》,但是ItemCF算法并不利用物品的内容属性计算物品之间的相似度,它主要通过分析用户的行为记录计算物品之间的相似度。
·
2017-08-21 13:00
推荐算法
itemcf
物品
推荐系统系列之隐语义模型
假设用户A喜欢《
数据挖掘导论
》,用户B喜欢《三个火枪手》,现在小编要对用户A和用户B推荐其他书籍。
萌新之机器学习
·
2017-07-20 11:05
支持向量机(一)
1鸡汤在先机器学习是一个不断学习发展加深的过程,正如一个读书人学习SVM的时候,他看书的境界分为三层,如先读
数据挖掘导论
,而后他觉讲得太浅,于是去读支持向量机导论,甚而,他觉还是不够,于是他去
dlphay
·
2017-06-21 09:30
SVM
支持向量机
机器学习
分类算法
ML
机器学习笔记-聚类分析之K-means算法案例及其Python实现
算法是数据挖掘最核心的部分,作为一名学习新人,在参考《
数据挖掘导论
》、《Python数据分析与挖掘实战》、《Python数据挖掘入门与实战》等前辈的书籍下,谨以
lilu916
·
2017-06-10 17:30
python数据分析
机器学习算法
【笔记】
数据挖掘导论
(持续更新)
第一章绪论数据分析技术的应用:商务、医学、科学与工程数据挖掘:在大型数据存储库中,自动地发现有用信息的过程。与信息检索不同。KDD:knowledgediscoveryindatabase数据库中知识发现。1.2数据挖掘要解决的问题可伸缩高维性一种数据与复杂数据数据的所有权与分布非传统的分析1.3数据挖掘的起源统计学的抽样、估计和假设检验;人工智能、模式识别和机器学习的搜索算法、建模技术和学习理论
徐徐徐徐大牙
·
2017-04-20 12:10
笔记
数据挖掘导论
读书笔记
本文主要对相关系数做出介绍,了解各种相似性和相异性度量的方法,以及适用的场景。一、数据类型 首先对数据的类型进行介绍:在统计学上,将数据分为定性和定量两种类型。定量数据表示事物的数量或者个数,用数值标度度量。例如:转账的金额1000/次,转账的笔数2次/月。定性数据是指的没有量的解释,它们只能分类,例如:性别,职业,学历等。因为用来描述和分析数据的合适的统计工具依赖于数据类型的,因此,区别定量数据
飞翔小鸥
·
2017-04-18 08:32
读书摘要
数据科学十篇
详细目录:
数据挖掘导论
和信贷模型回归模型和房价预测感知机和逻辑回归决策树和集成学习特征工程参数调优无监督学习文本挖掘神经网络深度学习欢迎forkandmakecontr
米乐乐果
·
2017-04-04 00:51
利用spark做文本聚类分析
《
数据挖掘导论
》是给出了这样的定义:聚类分析仅根据在数据中发现的描述对象及其关系的信息,将数据对象分组。其目标是,组内的对象相互之间是相似的(相关的),而不同组中的对象是不同(不相关的)。
Quincy1994
·
2017-02-07 14:28
spark
spark
文本聚类
数据挖掘
数据挖掘导论
笔记
引论1.1为什么进行数据挖掘?信息时代的来临不贴切,我们的时代其实是数据时代,还没有真正步入信息时代,现在数据爆炸增长,需要将数据转化为知识。1.2什么是数据挖掘?即KDD,数据中的数据发现知识发现的迭代步骤为:1)数据清理2)数据集成3)数据选择4)数据变换5)数据挖掘6)模式评估7)知识表示广义的数据挖掘可表述为:从大量数据中挖掘有趣模式和知识的过程。1.3可以挖掘什么类型的数据?1)数据库数
o漠海行吟o
·
2016-11-30 22:30
数据挖掘概念与技术
数据挖掘导论
《
数据挖掘导论
》知识点整理
数据挖掘上课没怎么好好听,反而现在想自己多学一点了。最近发现Kaggle竞赛很有意思,但是自己基础太差了,所以定计划,每天看书30页左右,把自己感觉之前不知道的东西记录在这里。第3章探索数据众数(mode):具有最高频率的值。百分位数(percentile):第p个百分位数xp是一个x值,使得x的p%的观测值小于xp截断均值(trimmedmean):丢弃高端和低端(p/2)%的数据,再计算均值。
wshxj123
·
2016-11-24 15:29
数据挖掘导论
:2、密度聚类
密度聚类知识介绍:参见了这篇文章http://blog.csdn.net/uestcfrog/article/details/6876360定义: 1. 对于空间中的一个对象,如果它在给定半径e的邻域中的对象个数大于密度阀值MinPts,则该对象被称为核心对象,否则称为边界对象。2. 如果p是一个核心对象,q属于p的邻域,那么称p直接密度可达q。3. 如果存在一条链,满足
qingyuanluofeng
·
2016-07-08 19:00
guide2datamining阅读笔记(1)
推荐系统入门最近无意间看到了面向程序员的
数据挖掘导论
,看了第一段就感觉很简单粗暴,看了第一章,记录一下吧~第一章主要内容:推荐系统工作原理社会化协同过滤工作原理如何找到相似物品曼哈顿距离欧几里得距离闵可夫斯基距离皮尔逊相关系数余弦相似度使用
binks_
·
2016-05-24 23:40
算法学习
python大法好
读书笔记
数据挖掘导论
--数据
数据写在前面的话:学习过的知识不常用就会生疏,概念的东西特别容易遗忘,还是老老实实过一遍书,并做好笔记,以待日后快速查阅。属性的类型标称(nominal):定性属性。仅仅是不同的名字,如性别,邮政编码,判别用=,≠序数(ordinal):定性属性。能提供足够的信息确定序,成绩(优良中差),病情严重(好,较好,一般,差),判别:区间(interval):定量属性。值之间的查是有意义的,如温度抽样方法
IrisDestroyer
·
2016-04-21 23:30
数据挖掘
Numpy 初试
《NumpyBeginner’sGuide》是数据挖掘中继《
数据挖掘导论
》之后又一本非常棒的书,尽管才开始学习它,但是它的强大让我深深的爱上了它的cool。
Mukever
·
2016-03-27 18:25
python
[数据挖掘]关联规则学习笔记
关联规则频繁项集的产生规则产生基于置信度的剪枝频繁项集的紧凑表示41极大频繁项集42闭频繁项集6FP增长算法61FP树表示法关联规则参考资料:《
数据挖掘导论
》人民邮电出版社Pang-NingTan等著关联规则是形如
u010536377
·
2016-01-26 11:00
算法
数据挖掘
[数据挖掘]离群点检测---基于kNN的离群点检测、LOF算法和CLOF算法
基于聚类和密度的离群点检测方法[D].华南理工大学,2014.[2].王雪英.离群点预处理及检测算法研究[D].西南交通大学,2009.[3].胡婷婷.数据挖掘中的离群点检测算法研究[D].厦门大学,2014.[4].谭(美).
数据挖掘导论
u010536377
·
2016-01-16 11:00
FEKM: fast and extract out-of-core k-means clustering
;;Kmeans的时间复杂度是O(m)(《
数据挖掘导论
》,m是数据规模)。
·
2015-11-13 05:08
cluster
【cs229-Lecture8】顺序最小优化算法
blog:http://zhihaozhang.github.io/2014/05/20/svm4/ 《
数据挖掘导论
·
2015-11-02 12:59
算法
【cs229-Lecture7】支持向量机(SVM)
/pan.baidu.com/s/1hqw0Rnm 密码: asec blog:http://www.blogjava.net/zhenandaci/category/31868.html 《
数据挖掘导论
·
2015-11-02 12:53
SVM
关于数据挖掘的書籍
综合书我看过不错的有《
数据挖掘导论
》introduction to data mini
·
2015-10-23 08:31
数据挖掘
数据挖掘方面的三本够专业不够实用书:《
数据挖掘导论
(完整版)》《可视化数据》《业务建模与数据挖掘》
最近买的三本数据挖掘相关的书《
数据挖掘导论
(完整版)》《可视化数据》《业务建模与数据挖掘》,共性是比较专业,都是英文书翻译过来的,翻译质量不错。不过都算比较专业,相对不够实用。
·
2015-10-23 08:34
数据挖掘
图灵图书列表
序号 书名 作者 译者 定价 出版时间 图灵原版计算机科学系列 1
数据挖掘导论
(英文版) Pang-Ning Tan 59.00
·
2015-10-20 08:41
列表
数据挖掘导论
总结之分类技术
博主是浙江大学一名在校学生,现在把这几天读的《
数据挖掘导论
》中的几个常见的分类技术进行简要的总结汇报,做成PPT并截图,有什么不对的地方欢迎大家指正。
pangjiuzala
·
2015-10-18 20:00
数据挖掘
技术
浙江大学
数据挖掘导论
学习笔记之分类基本概念、决策树与模型评估
分类分类任务的输入数据是记录的集合,每条记录也称实例或样例,用元组(x,y)来表示,其中x是属性的集合,而y是一个特殊的属性,指出样例的类标号。类标号在分类中是离散属性,回归确是一种预测建模任务,其中目标属性y是连续的。概念分类任务就是通过学习得到一个目标函数f,把每个属性集x映射到一个预先定义的类标号y。目标函数也称分类模型,具有以下目的:描述性建模。分类模型可以作为解释性工具,用于区分不同类中
pangjiuzala
·
2015-10-11 22:00
数据挖掘导论
:从包含d个项的数据集提取的可能规则总数
在
数据挖掘导论
(完整版)一书中的第6章讲到了关联分析,并在6.1问题定义中提到了关联规则。
wxbmelisky
·
2015-09-07 17:00
数据挖掘
关联规则
关联分析
数据挖掘基本概念
最近在自学数据挖掘的知识,看的教材是《
数据挖掘导论
(完整版)》Pang-NingTan著。为了更好的归纳总结,开一系列DM的帖子,记录书中的重点和自己的心得。
·
2015-07-14 22:00
数据挖掘
数据挖掘导论
之 分类
这篇总结一下《
数据挖掘导论
》中的分类部分:分类含义:确定对象属于哪个预定义的目标类。通过学习得到一个目标函数(targetfunction)f,把每个属性集x映射到一个预先定义的类标号y。
claire_bear7
·
2015-07-01 22:49
机器学习
数据挖掘导论
之 聚类分析
这篇文章对《
数据挖掘导论
》中聚类分析这部分做一个总结。聚类含义:根据在数据中发现的描述对象及其关系的信息,将数据对象分组目标:组内的对象相互之间是相似的,而不同组中的对象是不同的。
claire_bear7
·
2015-07-01 16:29
机器学习
数据挖掘入门 资料和步骤
CourseraMachineLearning byAndrewNg 作为入门还是不错的,而且对于初学者而言,视频比较容易理解中文:《数据挖掘概念与技术》 这本书我自己也挺喜欢的,适合初学者,涉及的面比较多,不过不够深入(备选:《
数据挖掘导论
bingyan_827
·
2015-05-20 09:09
数据挖掘
【SQL Server 2008商务智能BI】
数据挖掘导论
数据挖掘到底是什么呢?显然数据挖掘不是变魔术,数据挖掘是使用复杂的数学算法,使我们能够运用计算机强大的计算能力对大量细节数据进行筛查、梳理,找出一些有意义的信息,发现数据中的模式、相关性和聚类。同时它也让我们摆脱了手工进行这种数字运算的劳累工作。我们为什么要去学习数据挖掘呢?因为数据太多。。。关系数据库系统擅长记录日常的业务事务,积累了大量的数据。而多维数据系统通过聚合对数据进行汇总,但由于要按照
yupeigu
·
2015-04-25 22:00
[推荐算法]ItemCF,基于物品的协同过滤算法
比如,用户A之前买过《
数据挖掘导论
》,该算法会根据此行为给你推荐《机器学习》,但是ItemCF算法并不利用物品的内容属性计算物品之间的相似度,它主要通过分析用户的行为记录计算物品之间的相似度。
qwurey
·
2015-03-09 15:10
algorithm
&
data
structure
《数据挖掘概念与技术》读书笔记(一)
转自:http://blog.csdn.net/zhucanxiang/article/details/9843901之前看过经典的《
数据挖掘导论
》,然后又看了韩家炜的《数据挖掘概念与技术》这本数据挖掘入门书籍
u012875880
·
2014-12-01 13:00
数据挖掘概念与技术
机器学习与知识发现教材和参考答案
课程信息:机器学习与知识发现授课老师:陈恩红 上课地点:3C223 上课时间:周三上午9点45分 课程学分:3 【机器学习教材】
数据挖掘导论
(完整版)电子版http://www.kechengliu.com
bob601450868
·
2014-10-14 22:00
机器学习
中国科学技术大学
机器学习与知识发现
教材和参考答案
陈恩红
聚类分析
摘自《
数据挖掘导论
》聚类分析仅根据在数据中发现的描述对象及其关系的信息,将数据对象分组。其目标是,组内对象相互之间是相似的(相关的),而不同组之间的对象是不同的(不相关的)。
onmyway_1985
·
2014-07-05 22:00
分析
关联分析
【摘自《
数据挖掘导论
》】关联分析用于发现隐藏在大型数据集中的有意义的联系,例如通过分析大量购物单发现购买奶粉的人同时也购买了尿布。所发现的联系可以用关联规则或频繁项集的形式表示。
onmyway_1985
·
2014-06-28 19:00
分析
决策树扩展
之前写过决策树的一篇blog:http://blog.csdn.net/ice110956/article/details/10049149这几天看
数据挖掘导论
发掘一些新的东西,记录下来。
ice110956
·
2014-06-07 09:00
决策树
[Kaggle实战] Titanic 逃生预测 (4) - 决策树建模
关于决策树模型以及ID3算法,具体的概念以及思路就不在这里重复写了,可以参考《
数据挖掘导论
》相关章
RangerWolf
·
2014-06-02 22:00
决策树
[Kaggle实战] Titanic 逃生预测 (3) - Age离散化
对于连续属性离散化,可以参考《
数据挖掘导论
》2.3.6小节。首先,我们试着将数据图形化,看看是否有明显的间隔区间。画图依然使用JFreeChart来进行。
RangerWolf
·
2014-06-02 09:00
java
数据挖掘
Kaggle
数据挖掘导论
-分类
分类 ,classification,分类任务就是通过学习得到一个目标函数(target function),把每个属性集x映射到一个预先定义的类标号y。 目标函数也称为分类模型(classification model) 决策树,decistion tree 1.概念 决策树是一种由节点和有向边组成的层次结构,树中包含三类节点 (1)根节点,root node ,没有入边,但有0条或者
y_x
·
2014-02-23 23:00
数据挖掘
数据挖掘导论
-数据
1.数据集的一般特征 (1)维度, dimensionality ,是数据集中的对象具有的属性数目。 (2)稀疏性,sparsity (3)分辨率 resolusion 2.数据质量 噪声、伪像、偏倚、精度、准确率、离群点、遗漏、不一致的值、重复数据 (1)测量误差和数据收集错误 测量误差,measurement error,测量过程中导致的问题,测量值与实际值的差称为误差。 (2
y_x
·
2014-02-23 23:00
数据挖掘
数据挖掘导论
-概述
1、数据挖掘概念 数据挖掘是在大型数据存储库中,自动的发现有用信息的过程。数据挖掘是数据库中知识发现(knowledge discovery database KDD)不可缺少的 部分,而KDD是将未加工过的数据转换为有用信息的过程,包括数据预处理、数据挖掘和后处理等过程。 数据预处理:目的是将未加工的输入数据转化成适合分析的形式,包括融合多个数据源的数据,清洗数据以消除噪声或者重复的观测值,
y_x
·
2014-02-23 16:00
数据挖掘
数据挖掘导论
(学习笔记)――2.5 数据仓库应用实例
2.5数据仓库应用实例数据仓库在线分析(OLAP)和数据挖掘(DM)是数据仓库上两种获取不同目标的数据增值技术,这两类技术如果能够在一定程度上融合,会使分析操作智能化,使挖掘操作目标化,从而全面提升商务智能技术的实用价值。一方面,OLAP技术可以为数据挖掘提供预期的挖掘对象和目标,避免挖掘的盲目性。另一方面,数据挖掘技术可以使OLAP处理智能化,减少分析人员手工操作的繁杂性,减轻分析人员的负担。商
zoufangyun
·
2013-12-04 11:32
olap
数据挖掘导论
数据挖掘导论
(学习笔记)――2.4 数据仓库在线分析
2.4数据仓库在线分析OLAP委员会对联机分析处理的定义为:使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的并真实反映企业特性的信息进行快速、一致、交互的存取,从而获得对数据的更深入了解的一类软件技术。它的目标是满足决策支持或多维环境特定的查询和报表需求以及展示,其技术核心是“维”这个概念,从这个角度说,OLAP也是多维数据分析工具的集合。OLAP是专门
zoufangyun
·
2013-12-04 10:42
数据仓库
多维分析基本操作
数据挖掘导论
(学习笔记)――2.3数据仓库构建
2.3数据仓库构建整个数据仓库系统由数据源、数据存储与管理、OLAP服务器、前端工具等组成。数据仓库系统前端工具包括各种报表、查询、数据分析工具、数据挖掘工具以及各种基于数据仓库或数据集市的应用开发工具。其中,数据分析工具主要针对OLAP服务器,报表工具、数据挖掘工具主要针对数据仓库。ETL,是指数据抽取(Extract)、转换(Transform)、清洗(Cleaning)、装载(Load)的过
zoufangyun
·
2013-12-04 08:47
仓库构建
数据挖掘导论
数据挖掘导论
(学习笔记)――2.2 数据仓库数据模型
2.2数据仓库数据模型数据仓库是企业一个专门的数据存储结构,其存储的数据是面向分析主题的、不同粒度的多维数据,应用在线分析(OLAP)等工具,可满足快速、灵活的查询需要,最终支持企业决策。数据仓库建模技术分为实体关系建模和维度建模。其中维度建模是一种逻辑设计技术,它通过相对独立的业务创建有针对性的分析模型来进行组织设计。模型本身主要是由事实表和维度表组成的:事实表是维度模型的主表,一般含有两个或者
zoufangyun
·
2013-12-03 15:17
星形
事实星座
数据仓库模型
雪花模型
数据挖掘导论
(学习笔记)――2.1数据仓库的概念
2.1数据仓库的概念20世纪90年代初,数据仓库的创始人InmonW.H.提出了“数据仓库”的概念:数据仓库是面向主题的、集成的、具有时间特性的、稳定的数据集合,用以支持经营管理中的决策制定过程。由数据仓库的概念可知,一般数据仓库具有以下4个典型特征:(1)数据仓库面向主题的(2)数据仓库中的数据是集成的(3)数据仓库中的数据是相对稳定的(4)数据仓库中的数据是随时间不断变化的,表现在3个方面:数
zoufangyun
·
2013-12-03 14:10
数据挖掘
数据仓库
数据挖掘导论
数据挖掘作为一个新兴的多学科交叉应用领域,正在各行各业的决策支持活动扮演着越来越重要的角色。数据挖掘(DataMining)与数据库知识发现(KnowledgeDiscoveryfromDataBase)的基本知识,以及从大量有噪声、不完整、甚至是不一致数据集合中,挖掘出有意义的模式知识所涉及的概念与技术方法。 人类的各项活动都是基于人类的智慧和知识,即对外部世界的观察和了解,做出
liuguiyangnwpu
·
2013-07-19 21:00
数据挖掘
导论
数据挖掘 自习笔记 第三章 定性归纳实践(上)
下面是《
数据挖掘导论
》原文提供的算法——AOI方法(基于属性归纳方法),我本来概念挺模糊的,但后来自己还是思考了,发现这个算法可以看成为一个泛化表的程序。 (1)选择数据表。
urge104
·
2013-05-15 22:00
数据挖掘 自习笔记 第三章 定性归纳
以下内容从《
数据挖掘导论
》中学习总结。本章要点:(1)概念描述(2)数据泛化方法(3)属性相关分析(4)概念对比方法相关实践在下一章笔记中讨论。
urge104
·
2013-04-21 14:00
上一页
1
2
3
4
5
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他