E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数据挖掘导论
《
数据挖掘导论
》实验课——实验一、数据处理之Numpy
实验一、数据处理之Numpy一、实验目的1.了解numpy库的基本功能2.掌握Numpy库的对数组的操作与运算二、实验工具:1.Anaconda2.Numpy三、Numpy简介Numpy的英文全称为NumericalPython,指Python面向数值计算的第三方库。Numpy的特点在于,针对Python内建的数组类型做了扩充,支持更高维度的数组和矩阵运算,以及更丰富的数学函数。Numpy是Sci
weixin_34010949
·
2020-07-06 19:31
推荐系统实践:基于物品的协同过滤算法原理及实现(含改进算法)
比如:该算法会因为你购买过《
数据挖掘导论
》而给你推荐《机器学习》。不过ItemCF算法不利用物品的内容属性计算物品之间的相似度,它主要通过分析用户的行为记录计算物品之间的相似度。
猪逻辑公园
·
2020-07-02 16:14
推荐算法
itemCF
斯坦福CS229机器学习课程笔记一:线性回归与梯度下降算法
应该是去年的这个时候,我开始接触机器学习的相关知识,当时的入门书籍是《
数据挖掘导论
》。
diezhangu4106
·
2020-07-01 22:19
基尼不纯度(随机森林)
(书上解释)一个随机事件变成它的对立事件的概率(简单理解)计算公式:(fi为某概率事件发生的概率)下图是相关曲线图,可以参考
数据挖掘导论
的98页:从上图可以看出,基尼系数和熵之半的曲线非常接近,仅仅在45
baidu_252253
·
2020-07-01 17:51
机器学习
数据挖掘导论
课后习题答案-第六章
最近在读《IntroductiontoDataMining》这本书,发现课后答案只有英文版,于是打算结合自己的理解将答案翻译一下,其中难免有错误,欢迎大家指正和讨论。侵删。第六章(a)Se=8/10=0.8Sbd=2/10=0.2Sbde=2/10=0.2(b)Cbd→e=0.2/0.2=1Ce→bd=0.2/0.8=0.25(c)Se=4/5=0.8Sbd=5/5=1Sbde=4/5=0.8(d
KeEN丶X
·
2020-07-01 10:47
习题答案
迟来的面经,回馈牛客
给自己也给未来面试的同学,少走弯路,命中率更高点~祝大家满意的offer多多(迟来的总结[算法岗-机器学习方向])直接上干货前期准备理论:统计学习(李航)+机器学习(周志华)+推荐系统实战(项亮)+深度学习(那本花书)+
数据挖掘导论
牛客网
·
2020-07-01 06:06
数据挖掘经典图书:多角度领略数据挖掘的方法和技术
2019独角兽企业重金招聘Python工程师标准>>>
数据挖掘导论
(英文版)特色说明:数据挖掘入门读物,通俗易懂,全面介绍了数据挖掘的理论和方法;以实例为重,给出了常用算法的伪代码。
weixin_34128534
·
2020-06-28 12:55
机器学习的分类算法——集成学习
比如在周志华的西瓜书中,称为集成学习/多分类器系统/基于委员会的学习;在李航的《统计学习方法》中,称提升方法;在《
数据挖掘导论
》中,又称为组合方法/分类器组合。
weixin_30273763
·
2020-06-27 15:41
数据挖掘(一)你真的了解什么是数据挖掘和数据本身吗?
接下来自己打算写一个数据挖掘的系列,主要对应于自己最近在看的《
数据挖掘导论
》这本书,一方面写一些读书笔记,另一方面
王大宝的CD
·
2020-06-26 10:25
数据挖掘
漫谈数据挖掘从入门到进阶
IanH.Witten/EibeFrank的《数据挖掘实用机器学习技术》TomMitchell的《机器学习》TOBYSEGARAN的《集体智慧编程》AnandRajaraman的《大数据》Pang-NingTan的《
数据挖掘导论
mykelia
·
2020-06-24 16:25
转载
数据挖掘
推荐系统实践:基于物品的协同过滤算法原理及实现(含改进算法)
比如:该算法会因为你购买过《
数据挖掘导论
》而给你推荐《机器学习》。不过ItemCF算法不利用物品的内容属性计算物品之间的相似度,它主要通过分析用户的行为记录计算物品之间的相似度。
我是刘刘啊
·
2020-06-24 12:45
推荐系统
数据挖掘,你不应该错过的六本书
1.IntroductiontoDataMining作者:Pang-NingTang、MichaelSteinbach、VipinKumar中文译名:
数据挖掘导论
(完整版)适合人群:初级到中级学者推荐指数
IT派
·
2020-06-23 20:18
数据挖掘导论
笔记 第一章
上网课真是听不进去1.数据挖掘有许多不同的定义:书里的定义是:在大型数据存储库中,自动的发现有用信息的过程。JiaweiHan的定义:从大型数据集中提取有趣的(非平凡的,蕴涵的,先前未知的并且是潜在有用的)信息或模式。从这些定义中,我自己对数据挖掘的理解是:从大量数据中挖掘出隐含的、先前未知的、对决策有潜在价值的信息的过程。2.知识发现(KDD)是将未加工的数据转换为有用信息的整个过程。数据库中知
来日可期呀
·
2020-06-22 01:09
数据挖掘导论
数据挖掘导论
课后习题答案-第二章
最近在读《IntroductiontoDataMining》这本书,发现课后答案只有英文版,于是打算结合自己的理解将答案翻译一下,其中难免有错误,欢迎大家指正和讨论。侵删。第二章字段3×3≈字段2。字段2和字段3很有可能包含相同的信息,尽管从一个很小的样本中得出结论是非常不可靠的行为。(a)二元的,定性的,序数的(b)连续的,定量的,比率的(c)离散的,定性的,序数的(d)连续的,定量的,比率的(
KeEN丶X
·
2020-06-21 23:44
习题答案
浅谈数据挖掘(概论)
《
数据挖掘导论
》-戴红,清华大学出版书,数据挖掘算法原理与实现。笔者自述:不知道什么时候就开始有想学习数据挖掘这一块的知识,但是却从来都没有过开始。
一直飞不快的鸟
·
2020-03-13 14:15
集成学习方法(组合分类器)
本文参考《
数据挖掘导论
》,简单回顾一下几种集成学习方法的要点。
吴金君
·
2020-03-05 04:26
大数据挖掘1|数据预处理
之前买的《
数据挖掘导论
》今天终于到了,准备好好看看好好研究。在群里看见其他人讨论简历,其实实习经历也没有很多,一般就两段,而且都是不怎么出名的公司,
是蓝先生
·
2020-02-26 08:45
PYTHON Booklist
卡牌大师的回答深入浅出数据分析深入浅出SQL利用python进行数据分析数据分析:企业的贤内助
数据挖掘导论
集体智慧编程推荐系统实践机器学习系统设计R语言实战统计思维统计学习方法机器学习:使用案例分析Python
Lapizico
·
2019-12-24 18:45
第二章 数据(1) --《
数据挖掘导论
》
layout:posttitle:第二章数据(1)--《
数据挖掘导论
》categories:Coursedescription:数据类型、数据质量keywords:数据、类型、质量参考书:Pang-NingTan
毛毛虫_wendy
·
2019-12-19 16:51
数据预处理之变量变换
在学习「
数据挖掘导论
」的数据预处理时,里面谈到了变量变换,我联想到了在基因表达量分析时的常见操作,例如FPKM,TPM,CPM,log对数变换。
徐洲更hoptop
·
2019-11-30 14:10
【学习】
数据挖掘导论
链接:https://pan.baidu.com/s/1pIbKslArK8zlQ3f4UOyJZA提取码:t537第一章绪论1.1什么是数据挖掘?image.png1.4数据挖掘任务预测任务:用自变量来预测因变量,又可分为分类和回归;描述任务:导出概括数据中潜在的联系模式(相关、趋势、聚类等)第二章数据2.1数据类型数据的属性:温度、颜色等。数据类型:不同的属性又有不同的类型,标称(几个分类之间
X_Ran_0a11
·
2019-11-17 16:32
小咖秀第三期活动总结
分享沿袭了PMGO小咖秀的往常套路——PPT展示+演讲,本次的分享这有三位——Zoe\Joe\Laura,分享的话题分别是:
数据挖掘导论
、演讲的艺术、赢取竞争的工具箱。
PMGOGO
·
2019-11-02 13:35
数据挖掘导论
- 第四章:决策树 - 笔记
文章目录预备知识分类与回归分类模型的目的解决分类问题的一般方法决策时归纳决策树工作原理如何建立决策树表示属性测试条件的方法选择最佳划分的度量决策树归纳算法实例:Web机器人检测决策树归纳的特点模型的过分拟合过分拟合的原因泛化误差估计处理决策树归纳中的过分拟合评估分类器的性能保持方法随机二次抽样交叉验证自助法比较分类器的方法估计准确度的置信区间比较两种分类方法的性能预备知识分类与回归通过学习得到一个
MaskedRuler
·
2019-09-17 13:21
数据挖掘
数据挖掘导论
- 第二章:数据 - 笔记
文章目录数据类型描述数据属性属性类型定义属性层次的变换非对称的属性数据质量鲁棒算法数据预处理聚集定义动机抽样动机方法简单随机抽样信息损失渐进抽样维归约维归约的线性代数技术特征子集选择特征子集选择体系结构特征加权特征创建特征提取映射数据到新的空间傅里叶变换小波变换特征构造离散化和二元化变量变换简单函数规范化或标准化数据类型描述数据属性相异性=!=序>=加法+-乘法*/属性类型标称:分类的=!=不同的
MaskedRuler
·
2019-09-13 11:50
数据挖掘
《
数据挖掘导论
》实验课——实验七、数据挖掘之K-means聚类算法
实验七、数据挖掘之K-means聚类算法一、实验目的1.理解K-means聚类算法的基本原理2.学会用python实现K-means算法二、实验工具1.Anaconda2.sklearn3.matplotlib三、实验简介1K-means算法简介k-means算法是一种聚类算法,所谓聚类,即根据相似性原则,将具有较高相似度的数据对象划分至同一类簇,将具有较高相异度的数据对象划分至不同类簇。聚类与分
知亦行
·
2019-06-24 20:00
《
数据挖掘导论
》实验课——实验七、数据挖掘之K-means聚类算法
实验七、数据挖掘之K-means聚类算法一、实验目的1.理解K-means聚类算法的基本原理2.学会用python实现K-means算法二、实验工具1.Anaconda2.sklearn3.matplotlib三、实验简介1K-means算法简介k-means算法是一种聚类算法,所谓聚类,即根据相似性原则,将具有较高相似度的数据对象划分至同一类簇,将具有较高相异度的数据对象划分至不同类簇。聚类与分
知亦行
·
2019-06-21 09:00
《
数据挖掘导论
》实验课——实验六、数据挖掘之关联分析
实验六、数据挖掘之关联分析一、实验目的1.理解Apriori算法的基本原理2.理解FP增长算法的基本原理3.学会用python实现Apriori算法4.学会用python实现FP增长算法二、实验工具1.Anaconda2.sklearn3.Pandas三、实验简介Apriori算法在发现关联规则领域具有很大影响力。算法命名源于算法使用了频繁项集性质的先验(prior)知识。在具体实验时,Aprio
知亦行
·
2019-06-21 09:00
《
数据挖掘导论
》实验课——实验四、数据挖掘之KNN,Naive Bayes
实验四、数据挖掘之KNN,NaiveBayes一、实验目的1.掌握KNN的原理2.掌握NaiveBayes的原理3.学会利用KNN与NavieBayes解决分类问题二、实验工具1.Anaconda2.sklearn三、实验简介1.KNNKNN(K-NearestNeighbor)工作原理:存在一个样本数据集合,也称为训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类对
知亦行
·
2019-06-21 09:00
《
数据挖掘导论
》实验课——实验三、数据挖掘之决策树
实验三、数据挖掘之决策树一、实验目的1.熟悉掌握决策树的原理,2.熟练掌握决策树的生成方法与过程二、实验工具1.Anaconda2.sklearn3.pydotplus三、实验简介决策树是一个非参数的监督式学习方法,主要用于分类和回归。算法的目标是通过推断数据特征,学习决策规则从而创建一个预测目标变量的模型。四、实验内容1.自己创建至少2个向量,每个向量至少1个属性和1个类标号,根据向量生成决策树
知亦行
·
2019-06-21 09:00
《
数据挖掘导论
》CH2数据-读书笔记
2.1数据类型2.1.1属性和度量2.1.2数据集的类型-数据集的一般特性:维度,稀疏性,分辨率-数据集类型:记录数据、基于图形的数据、有序数据(时序数据,序列数据,时间序列数据,空间数据)2.2数据质量通常必须解决的数据质量问题包括:噪声和离群点,数据遗漏,不一致或重复,数据有偏差2.2.1测量和数据收集问题噪声和伪像/精度、偏倚和准确率(鲁棒算法)/离群点/遗漏值/不一致值2.2.2关于应用的
Schnell
·
2019-05-07 21:49
决策树python实现
参考书籍:机器学习--周志华/
数据挖掘导论
/统计学习方法参考代码链接:https://blog.csdn.net/weixin_40683253/article/details/81941583#commentsedit
simple的课
·
2019-04-14 23:17
学习周记4:2019.3.11-2019.3.17
课程:算法设计与分析、数字图像处理、程序设计实习、游戏AI中的算法、视觉计算与深度学习、人工智能引论及实践课(NLP)、Python程序设计与
数据挖掘导论
、计算机图形学2019.3.11课程:算法设计与分析
陶晨毅
·
2019-03-14 17:00
学习日记系列
基于时间序列的异常检测算法小结
综合引用以下文章:
数据挖掘导论
时间序列异常检测机制的研究KPI异常检测竞赛笔记异常检测之时间序列的异常检测Skylinetimeseries
Roy-Better
·
2019-03-13 11:56
数据挖掘之异常点检测
学习周记3:2019.3.4-2019.3.10
课程:算法设计与分析、数字图像处理、程序设计实习、游戏AI中的算法、视觉计算与深度学习、人工智能引论及实践课(NLP)、Python程序设计与
数据挖掘导论
、计算机图形学TODOList周五算分论文Pre
陶晨毅
·
2019-02-24 21:01
学习日记系列
基于物品的协同过滤
基于物品的协同过滤ItemCF大致含义该算法会因为你购买过《
数据挖掘导论
》而给你推荐《机器学习》。
锦绣拾年
·
2019-02-21 22:47
学习周记2:2019.2.25-2019.3.3
课程:算法设计与分析、数字图像处理、游戏AI中的算法、视觉计算与深度学习、人工智能引论及实践课(NLP)、Python程序设计与
数据挖掘导论
、计算机图形学。
陶晨毅
·
2019-02-20 14:41
学习日记系列
学习周记2:2019.2.25-2019.3.3
课程:算法设计与分析、数字图像处理、游戏AI中的算法、视觉计算与深度学习、人工智能引论及实践课(NLP)、Python程序设计与
数据挖掘导论
、计算机图形学。
陶晨毅
·
2019-02-20 14:41
学习日记系列
学习周记1:2019.2.18-2019.2.24
课程:算法设计与分析、数字图像处理、程序设计实习、游戏AI中的算法、视觉计算与深度学习、人工智能引论及实践课(NLP)、Python程序设计与
数据挖掘导论
、大数据分析中的算法2019.2.18课程:大数据分析中的算
陶晨毅
·
2019-02-18 22:51
学习日记系列
《
数据挖掘导论
》:第一章笔记
1.1什么是数据挖掘数据网挖掘是在大型数据存储库中,自动地发现有用信息的过程。并非所有信息发现任务都被视为数据挖掘。数据框中知识发现(KDD)数据挖掘是KDD中不可缺少的一部分。1.2数据挖掘要解决的问题可伸缩性高维性异种数据和复杂数据数据的所有权与分布非传统的分析1.3数据挖掘与其他领域的联系其中,数据库技术、并行计算、分布式计算起到了重要的支撑性作用。1.4数据挖掘任务预测任务:根据其他属性的
1ia0
·
2019-02-02 22:32
数据挖掘
K-Means(一)K值的选择
算法1.1基本K均值算法1:选择K个点作为初始质心2:repeat3:将每一个点指派到最近的质心,形成K个簇4:重新计算每个簇的质心5:until质心不发生变化关于K值的选择Tanetal.的《
数据挖掘导论
shijiatongxue
·
2018-10-11 21:58
机器学习实战-第12章Fpgrowth代码勘误+递归打印效果分析
我们修改数据集,使用:《
数据挖掘导论
》中的数据集:defloadSimpDat():simpDat=[['a','b'],['b','c','d'],['a','c','d','e'],['a','d'
俞驰的博客
·
2018-09-28 09:22
传统算法
数据挖掘导论
学习总结——第四章
第四章:分类与预测分类方法用于预测数据对象的离散类别,预测则用于预测数据对象的梁旭取值,例如我们可以构造一个分类模型来对银行贷款进行风险评估,也可以简历一个预测模型以利用顾客收入与职业预测其可能用于购买计算机设备的支出大小。最初的数据挖掘方法大多都是建立在机器学习、专家系统、统计学和神经生物学等领域的分类与预测算法,目前数据挖掘方法都要求具有基于外存以处理大规模数据集合能力且具有可扩展性。本章讲初
AAAlice0707
·
2018-08-23 12:45
数据挖掘导论
学习总结——第三章
第三章:定性归纳从数据分析的角度出发,数据挖掘可以分为两类,描述性数据挖掘和预测性数据挖掘,而接下来要介绍的就是第一种情形,描述性数据挖掘,即以简洁概述的方式表达数据中存在的一些有意义的性质,也称为概念描述,或概要性总结。概念描述基本知识数据查询处理负责从数据库中取出数据并在必要时进行一些数据合计处理,而数据挖掘则是对数据进行深度分析并发现隐藏在数据中有意义的模式。最简单的描述性数据挖掘就是定性归
AAAlice0707
·
2018-08-22 23:44
数据挖掘导论
学习总结——第二章
数据预处理由于数据库系统所获数据量的迅速膨胀,从而导致了现实世界数据库中通常包含许多含有噪声、不完整、甚至是不一致的数据。数据预处理主要包括数据清洗、数据集成、数据转换和数据消减等。所谓噪声数据是指数据中存在着错误、或异常的数据。不完整数据是指感兴趣的属性没有值。不一致数据是指数据内涵出现不一致的情况。而数据清洗是消除数据中所存在的噪声以及纠正其不一致的错误;数据集成是指将来自多个数据源的数据合并
AAAlice0707
·
2018-08-15 23:48
数据挖掘导论
学习总结——第一章
数据挖掘基本知识DataMining,即数据挖掘,是指从大量数据中挖掘或抽取知识,又称从数据库中知识发现(KnowledgeDiscoveryfromDatabase,KDD),它是指从大量数据抽取挖掘出未知的、有价值的模式或规律等,包括以下几个主要步骤:数据清洗(DataCleaning):清楚数据噪声和挖掘主题明显无关的数据数据集成(DataIntegration):将来自多数据源中的相关数据
AAAlice0707
·
2018-08-15 20:53
人工智能-书单
语言实战4.R语言编程艺术5.数据挖掘概念与技术6.推荐系统实战7.笨方法学Python8.Python核心编程9.利用Python进行数据分析10.机器学习实战11.统计学习方法12.集体智慧编程13.
数据挖掘导论
下木
·
2018-07-03 11:43
决策树中基尼不纯度初步理解
(书上解释)一个随机事件变成它的对立事件的概率(简单理解)计算公式:(fi为某概率事件发生的概率)下图是相关曲线图,可以参考
数据挖掘导论
的98页:从上图可以看出,基尼系数和熵之半的曲线非常接近,仅仅在45
青山孤客
·
2018-04-23 15:49
数据挖掘导论
什么是数据挖掘数据挖掘(Datamining),它是数据库知识发现(英语:Knowledge-DiscoveryinDatabases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。通常,数据挖掘任务分为两大类预测任务——产生预测性模型根据一部分属性的值,预测特定属性的值,用来做预测的属性称作自变量/说明变量;被预测的属性称作因变量/目标变量两种常用方
EvanForEver
·
2018-04-15 18:35
推荐系统系列之隐语义模型
假设用户A喜欢《
数据挖掘导论
》,用户B喜欢《三个火枪手》,现在小编要对用户A和用户B推荐其他书籍。
visiontry
·
2018-01-29 02:29
机器学习路径规划
machinelearning的学习路径视频台大林轩田《机器学习基石》台大林轩田《机器学习技法》小象学院机器学习2017年4月份课程AndrewNGMachineLearning书李航《统计学习方法》范明《
数据挖掘导论
panda桑
·
2017-09-25 13:56
机器学习
上一页
1
2
3
4
5
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他