E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
[集体智慧编程]
思维导图笔记(三):推荐引擎常见技术
首先是重新温习了《
集体智慧编程
》中的协作过滤的相关章节。这本书非常基础,够简单,够全面,而且有很多可供实验的例子。读起来真是轻松加愉快呀。
·
2015-10-31 08:42
推荐引擎
[转载]windows x64下正确安装PIL:解决python关联zlib、jpeg问题
最近在看
集体智慧编程
,第七章的决策树画图需要用到PIl(pythonimaginglibrary),但是装了之后运行老是提示IOError:decoderzipnotavailable,网上也有很多人遇到此类错误或者是
databatman
·
2015-10-29 12:00
windows
python
zip
zlib
PIL
decoder
IOError
机器学习:决策树ID3\C4.5\CART\随机森林总结及python上的实现 (2)
本文主要根据Mitchell的机器学习总结归纳,图片大多来源于此,同时结合网上搜索到的资料和几篇较新的文献,自己写的决策树总结,当中的python算法摘自《
集体智慧编程
》,算法可在python2.7环境下运行
databatman
·
2015-10-25 21:20
python
机器学习
机器学习:决策树ID3\C4.5\CART\随机森林总结及python上的实现 (2)
本文主要根据Mitchell的机器学习总结归纳,图片大多来源于此,同时结合网上搜索到的资料和几篇较新的文献,自己写的决策树总结,当中的python算法摘自《
集体智慧编程
》,算法可在python2.7环境下运行
databatman
·
2015-10-25 21:00
Cart
python
决策树
随机森林
C4.5
《
集体智慧编程
——导言》 有感
导言部分,截取一些概念、定义的东西如下: 什么是集体智慧 为了创造新的想法,而将一群人的行为、偏好或思想组合在一起; 什么是机器学习 机器学习是人工智能领域中与算法相关的一个子领域,它允许计算机不断的进行学习。大多数情况下,这相当于将一组数据传递给算法,并由算法推断出与这些数据的属性相关的信息——借助这些信息,算法就能够预测出未来有可能会出现的其他数据。这种
·
2015-10-23 09:54
编程
推荐算法实战
推荐算法实战本文基于《
集体智慧编程
》的第二章,提供推荐的一篇文章,不得不说,这本书真的很好,在写这一篇文章的时候,我已经看到优化那一章,单单从优化角度来讲,特别清晰,从最简单的随机优化开始,讲述了爬山法
u013473520
·
2015-10-18 23:00
机器学习经典书籍
《ProgrammingCollectiveIntelligence》(《
集体智慧编程
》)PDF作者TobySegaran也是《BeautifulData:TheStoriesBehindElegantDataSolutions
csyhhb
·
2015-06-17 10:00
漫谈数据挖掘从入门到进
###################################### 更新部分 ######################################### Q&A: Q:学习,最近在看
集体智慧编程
u011680118
·
2015-06-14 14:00
Python笔记---setuptools 、feedparser、pydelicious
最近学习《
集体智慧编程
》一书,在第二章中需要使用pydelicious这个第三方库,花了不少功夫才将其安装完成。
GuLu_GuLu_jp
·
2015-04-12 16:00
python
机器学习
setuptools
feedparser
pydelicious
二、《
集体智慧编程
》之推荐系统(协作性过滤)
摘要:按照《集体》一书的介绍这一章主要解决的问题是:如何根据群体偏好来为人们提供推荐以及怎样制作一个简单的推荐系统。主要涉及的技术为:协作型过滤。 1、何为协作性过滤协作性过滤也叫做协同过滤(CollaborativeFiltering)。协作型过滤是基于假设的:和我兴趣相投的人喜欢的东西我也应该喜欢(User-base);喜欢想撕物品的人应该和我有一样的兴趣(item-base)。
TaceyWong
·
2015-03-28 20:00
二、《
集体智慧编程
》之推荐系统(协作性过滤)
摘要:按照《集体》一书的介绍这一章主要解决的问题是:如何根据群体偏好来为人们提供推荐以及怎样制作一个简单的推荐系统。主要涉及的技术为:协作型过滤。 1、何为协作性过滤协作性过滤也叫做协同过滤(CollaborativeFiltering)。协作型过滤是基于假设的:和我兴趣相投的人喜欢的东西我也应该喜欢(User-base);喜欢想撕物品的人应该和我有一样的兴趣(item-base)。
iTacey
·
2015-03-28 20:00
一、《
集体智慧编程
》之机器学习&数据挖掘框架认识
本系列按照《
集体智慧编程
》一书的框架进行。老实说,《集体》在理论上并不算是很好的参考书,但是该书是以一个个具体场景应用为驱动的,个人认为很适合用于机器学习相关的入门教材,起码很对我的胃口。
TaceyWong
·
2015-03-28 18:00
一、《
集体智慧编程
》之机器学习&数据挖掘框架认识
本系列按照《
集体智慧编程
》一书的框架进行。老实说,《集体》在理论上并不算是很好的参考书,但是该书是以一个个具体场景应用为驱动的,个人认为很适合用于机器学习相关的入门教材,起码很对我的胃口。
iTacey
·
2015-03-28 15:00
【JAVA实现】基于皮尔逊相关系数的相似度计算
最近在看《
集体智慧编程
》,相比其他机器学习的书籍,这本书有许多案例,更贴近实际,而且也很适合我们这种准备学习machinelearning的小白。
C_son
·
2015-02-18 12:00
java
机器学习
csv(逗号分隔值)文件用Excel编辑
在阅读《
集体智慧编程
》时,看到了csv文件,咋看起来跟Excel文件样子很像,具体百度吧。这里记录下怎么用Excel来编辑csv文件。
shiquxinkong
·
2014-06-26 11:00
Excel
csv
《
集体智慧编程
》代码勘误:第六章
一:勘误classifier类中: deffprob(self,f,cat): ifself.catcount(cat)==0: return0 #notice:remberchangeinttodoubleorfloat #+0.0or*1.0isok,otherwise,mayget0. returnself.fcount(f,cat)*1.0/self.catcount(cat)nav
shiquxinkong
·
2014-06-22 21:00
python
集体智慧编程
naviebayes
[置顶] 机器学习经典书籍
《ProgrammingCollectiveIntelligence》(《
集体智慧编程
》)PDF作者TobySegaran也是《BeautifulData:TheStoriesBehindElegantDataSolutions
yeyang911
·
2014-06-11 17:00
机器学习经典书籍
比较好的书籍---计算机,信号处理等专业
1.
集体智慧编程
电子工业出版社莫映王开福译2.机器学习实战人民邮电出版 社李锐/李鹏/曲亚东/王斌译3.机器学习 tommitchell 机械工业出版社4.统计学习方法 李航 清华大学出版社5.概率图模型学习理论及应用赵悦
u010384318
·
2014-05-28 23:00
机器学习经典书籍
《Programming Collective Intelligence》(《
集体智慧编程
》)PDF 作者Toby Segaran也是《BeautifulData : The Stories Behind
·
2014-04-23 20:00
机器学习
学习数据分析、挖掘的22本好书
4.
集体智慧编程
(豆瓣)学习数据分析、数据挖掘、机器学习人员应该仔细阅
dy01dy
·
2014-04-10 10:06
数据挖掘基础
python实现数据的多维缩放(
集体智慧编程
)
多维缩放可以为数据集找到一种二维表达形式。算法根据每对数据项之间的差距情况,尝试绘制出一幅图来,图中的各数据项之间的距离远近,对应于它们彼此间的差异程度。 以分类聚集算法中的数据为例第一步:计算所有数据项两两间的实际距离(可参考皮尔逊算法或欧几里德算法)第二步:将数据项随机放置在二维图上。第三步:针对每两两构成的一对数据项,将它们的实际距离与当前在二维图上的距离进行比较,求出一个误差值第四步:根据
home198979
·
2014-03-27 17:00
算法
数据分析
数据挖掘
python
多维缩放
python实现数据的多维缩放(
集体智慧编程
)
阅读更多多维缩放可以为数据集找到一种二维表达形式。算法根据每对数据项之间的差距情况,尝试绘制出一幅图来,图中的各数据项之间的距离远近,对应于它们彼此间的差异程度。以分类聚集算法中的数据为例第一步:计算所有数据项两两间的实际距离(可参考皮尔逊算法或欧几里德算法)第二步:将数据项随机放置在二维图上。第三步:针对每两两构成的一对数据项,将它们的实际距离与当前在二维图上的距离进行比较,求出一个误差值第四步
home198979
·
2014-03-27 17:00
算法
python
多维缩放
数据分析
数据挖掘
K-均值聚类算法(
集体智慧编程
)
阅读更多上篇博客中讲到的分级聚类算法为我们返回了一棵形象直观的树,但是这个方法有两个缺点。1.在没有额外的投入的情况下,树形视图是不会真正将数据拆分成不同组的。2.该算法的计算量非常惊人,因为我们必须计算每两个配对项之间的关系,并且在合并项之后,这些关系还得重新再计算,所以在处理很大规模的数据集时,该算法的运行速度会非常缓慢。K-均值聚类完全不同于分级聚类,因为我们会预先告诉算法希望生成的聚类数量
home198979
·
2014-03-18 15:00
算法
python
数据挖掘
k-均值
聚类
K-均值聚类算法(
集体智慧编程
)
上篇博客中讲到的分级聚类算法为我们返回了一棵形象直观的树,但是这个方法有两个缺点。1.在没有额外的投入的情况下,树形视图是不会真正将数据拆分成不同组的。2.该算法的计算量非常惊人,因为我们必须计算每两个配对项之间的关系,并且在合并项之后,这些关系还得重新再计算,所以在处理很大规模的数据集时,该算法的运行速度会非常缓慢。 K-均值聚类完全不同于分级聚类,因为我们会预先告诉算法希望生成的聚类数量,然后
home198979
·
2014-03-18 15:00
算法
python
数据挖掘
聚类
k-均值
机器学习经典书籍
《ProgrammingCollectiveIntelligence》(《
集体智慧编程
》)PDF作者TobySegaran也是《BeautifulData:TheStoriesBehindElegantDataSolutions
chenglinhust
·
2014-03-11 19:00
分级聚类算法(
集体智慧编程
)
阅读更多分级聚类是通过连续不断地将最为相似的群组两两合并,来构造出一个群组的层级结构。其中的每个群组都是从单一元素开始的。如图所示:元素的相似程序是通过它们的相对位置来体现的,距离越近越相似。两两合并,直到合并最后两个群组。聚类是无监督学习的一个例子。与神经网络或决策树不同,无监督学习算法不是利用带有正确答案的样本数据进行“训练”。它们的目的是要在一组数据中找寻某种结构,而这些数据本身不是我们要找
home198979
·
2014-03-10 11:00
分级聚类
python
算法
数据挖掘
分级聚类算法(
集体智慧编程
)
分级聚类是通过连续不断地将最为相似的群组两两合并,来构造出一个群组的层级结构。其中的每个群组都是从单一元素开始的。如图所示:元素的相似程序是通过它们的相对位置来体现的,距离越近越相似。两两合并,直到合并最后两个群组。 聚类是无监督学习的一个例子。与神经网络或决策树不同,无监督学习算法不是利用带有正确答案的样本数据进行“训练”。它们的目的是要在一组数据中找寻某种结构,而这些数据本身不是我们要找的答案
home198979
·
2014-03-10 11:00
算法
python
数据挖掘
分级聚类
加权平均算法(
集体智慧编程
)
阅读更多加权平均是这样一类求平均的运算:参与求平均运算的每一个观测变量都有一个对应的权重值。加权平均的计算公式如图:其中的x1....xn是观测变量,w1....wn是权重值。我们现将其利用在影片的推荐。我们可以查找与自己口味最为相近的人,并从他所喜欢的影片中找出一部自己还未看过的影片,不过这样做太随意了。有时,这种方法可能会有问题:评论者还未对某些影片做过评论,而这些影片也许就是我们所喜欢的。还
home198979
·
2014-03-05 16:00
python
算法
加权平均
数据挖掘
加权平均算法(
集体智慧编程
)
加权平均是这样一类求平均的运算:参与求平均运算的每一个观测变量都有一个对应的权重值。加权平均的计算公式如图: 其中的x1....xn是观测变量,w1....wn是权重值。 我们现将其利用在影片的推荐。 我们可以查找与自己口味最为相近的人,并从他所喜欢的影片中找出一部自己还未看过的影片,不过这样做太随意了。有时,这种方法可能会有问题:评论者还未对某些影片做过评论,而这些影片也许就是我们所喜欢的。还有
home198979
·
2014-03-05 16:00
算法
python
数据挖掘
加权平均
皮尔逊相关系数评价算法(
集体智慧编程
)
皮尔逊相关系数是比欧几里德距离更加复杂的可以判断人们兴趣的相似度的一种方法。该相关系数是判断两组数据与某一直线拟合程序的一种试题。它在数据不是很规范的时候,会倾向于给出更好的结果。 如图,MickLasalle为>评了3分,而GeneSeyour则评了5分,所以该影片被定位中图中的(3,5)处。在图中还可以看到一条直线。其绘制原则是尽可能地靠近图上的所有坐标点,被称为最佳拟合线。如果两位评论者对所
home198979
·
2014-03-03 16:00
算法
数据分析
数据挖掘
python
皮尔逊相关系数
皮尔逊相关系数评价算法(
集体智慧编程
)
阅读更多皮尔逊相关系数是比欧几里德距离更加复杂的可以判断人们兴趣的相似度的一种方法。该相关系数是判断两组数据与某一直线拟合程序的一种试题。它在数据不是很规范的时候,会倾向于给出更好的结果。如图,MickLasalle为>评了3分,而GeneSeyour则评了5分,所以该影片被定位中图中的(3,5)处。在图中还可以看到一条直线。其绘制原则是尽可能地靠近图上的所有坐标点,被称为最佳拟合线。如果两位评论
home198979
·
2014-03-03 16:00
皮尔逊相关系数
python
算法
数据分析
数据挖掘
欧几里德距离评价算法(
集体智慧编程
)
欧几里德距离是指多维空间两点间的距离,这是一种用直尺测量出来的距离。如果将两个点分别标记为(p1,p2,p3....pn)和(q1,q2,q3.....qn),则欧几里德距离的计算公式为: 欧几里德距离评价算法是一个非常简单的计算相似度评价值的方法。它以经过人们一致评价的物品为坐标轴,然后将参与评价的人绘制到图上,并考查他们彼此间的距离远近。如图:该图显示了处于“偏好空间”中用户的分布状况。To
home198979
·
2014-03-03 14:00
数据分析
算法
python
数据挖掘
欧几里德
欧几里德距离评价算法(
集体智慧编程
)
阅读更多欧几里德距离是指多维空间两点间的距离,这是一种用直尺测量出来的距离。如果将两个点分别标记为(p1,p2,p3....pn)和(q1,q2,q3.....qn),则欧几里德距离的计算公式为:欧几里德距离评价算法是一个非常简单的计算相似度评价值的方法。它以经过人们一致评价的物品为坐标轴,然后将参与评价的人绘制到图上,并考查他们彼此间的距离远近。如图:该图显示了处于“偏好空间”中用户的分布状况。
home198979
·
2014-03-03 14:00
python
欧几里德
数据挖掘
数据分析
算法
决策树(Decision Tree)模型笔记
以前看
集体智慧编程
时觉得决策树模型没什么大不了的,看得不仔细.昨天知道网页正文抽取(full-textextraction)中对boilerplate和content块的判断就是使用该模型,终于有点直观了
jollyjumper
·
2014-01-25 17:00
决策树
欧几里德距离&皮尔逊相关度系数
本文是《
集体智慧编程
》介绍相似度算法:欧几里德距离和皮尔逊相关度系数的一次演练。本文将介绍.距离是在传统统计学和数据挖掘中衡量接近程度的关键度量。我们如何衡量接近程度或距离呢?
Coder_Jiang
·
2014-01-18 19:53
Fun
article
2014年上半年学习计划
2014年上半年学习计划初步:《大数据时代》《数据挖掘:实用机器学习技术》斯坦福大学公开课“机器学习课程”《统计学习方法》《数据之魅》《程序设计竞赛》(偶尔练习)进阶:《
集体智慧编程
》《模式分类》队列中
everettjf
·
2014-01-14 22:00
机器学习书单
《ProgrammingCollectiveIntelligence》(《
集体智慧编程
》)PDF作者TobySegaran也是《BeautifulData:T
机器学习天天向上
·
2014-01-05 00:00
机器学习
书单
聚类算法反应人们想要的物品(tanimoto相关度)
也就是tanimoto相关度能够很好的解决01关系,也就是是否关系,比如是否看过某部电影;而皮尔逊相关度能够很好的解决一些用程度衡量的,比如为某部电影打分就是程度其中用到的数据来自
集体智慧编程
的作者只是把距离函数改掉了
ygqwan
·
2013-10-04 22:00
算法
数据
数据挖掘
聚类算法之K-均值聚类
先看一张图(来自
集体智慧编程
)这个算法思路很简单,就是最开始的时候随便定k个点,然后遍历每一个原图的点,使得每一个点都归属与那k个点中的一个,然后更新那k个点的位置(一般是中点)这个算法是解决当数据太多的时候层次聚类的算法太慢而设计的
ygqwan
·
2013-10-04 19:00
推荐系统自己实践-----基于用户的推荐
最近,计划把推荐系统的几种方法一一用《
集体智慧编程
》这本书的代码实现。一来是为了自己更加熟练python语言的用法,然后可以更好的去理解这些推荐系统的概念。今天是第一个,是基于用户的推荐。
u010384318
·
2013-09-16 21:00
古人是如何确定的 节气的准确时间
集体智慧编程
学习之优化系统elite值得是种群中可以遗传到下一代的部分,maxiter迭代的最大次数。 这种推算的方法是建立在地球回归年的长度是固定365.2422天、节气的间隔是绝
i_like_cpp
·
2013-07-02 11:00
集体智慧编程
学习之核方法
欢迎关注我的个人博客blog.timene.com这个算法真是不太好懂,看了好几遍终于有点入门的感觉,就赶紧记录下这点感觉。我从复习线性分类开始,然后复习点积的含义,再引出核方法。线性分类是最容易理解的分类方法,两组数据A和B,分别求出A和B的平均值,比如M和N,当判断新数据X是属于A还是属于B呢,就看新数据X到M近还是N近,X属于距离近的那个。为了实现这个算法,我们需要计算出各分类的均值点:de
wyb_009
·
2013-05-27 21:00
数据挖掘
机器学习
核方法
径向基函数
矩阵特征
集体智慧编程
学习之非负矩阵因式分解
每日一贴,今天的内容关键字为矩阵特征 大学时我的线性代数老师寿继麟,事先六十多岁带着一副金丝眼镜精力矍铄,传说是我最尊敬的余德鴻副校长的老师。上课的课本是寿老师写的打印出来给大家,很便宜。我虽然不好好学习,但是在好老师的率领下,也不至于学的太差。余校长隔段时光总会给我们上一堂课,虽然没有说过我们什么,但总能让我们羞愧进而耐劳上一段时光。记得他说过这样一个问题,会场人声嘈杂,给你两个麦克风,怎
·
2013-05-27 19:00
编程
集体智慧编程
学习之非负矩阵因式分解
欢迎关注我的个人博客blog.timene.com大学时我的线性代数老师寿继麟,当时六十多岁带着一副金丝眼镜精神矍铄,传说是我最尊敬的余德鴻副校长的老师。上课的课本是寿老师写的打印出来给大家,很便宜。我虽然不好好学习,但是在好老师的带领下,也不至于学的太差。余校长隔段时间总会给我们上一堂课,虽然没有说过我们什么,但总能让我们惭愧进而刻苦上一段时间。记得他说过这样一个问题,会场人声嘈杂,给你两个麦克
wyb_009
·
2013-05-26 20:00
数据挖掘
机器学习
非负矩阵因式分解
乘法更新矩阵法则
集体智慧编程
学习之决策树
欢迎关注我的个人博客blog.timene.com常用的沟通工具,比如手机,QQ是和已经认识的朋友交流的工具。现在出现了一大批自诩的约炮神器,非诚勿扰挺好看的,宅男腐女的问题操碎了爸妈的心,世纪佳缘都上市了,看来大家对想认识不认识的人有巨大的热情。我也听说非诚勿扰牵手成功后最后走到一起的并不多,这些方式到底靠不靠谱?如果我去参加非诚勿扰,我会不会牵手成功?这里面是不是有一些规律可循,趁着今天被毁容
wyb_009
·
2013-05-25 12:00
数据挖掘
机器学习
决策树
熵
基尼不纯度
集体智慧编程
学习之分类系统
欢迎关注我的个人博客blog.timene.com在前面《
集体智慧编程
学习之聚类系统》中,我对收藏的一些电子书做了聚类。
wyb_009
·
2013-05-22 19:00
数据挖掘
机器学习
分类
贝叶斯
费舍尔
集体智慧编程
学习之优化系统
欢迎关注我的个人博客blog.timene.com优化系统的想法真不好简单地说的明白,这样吧,我爸在陕西西安,我妈在安徽的合肥,我弟弟在深圳,打算坐飞机到北京我这里玩。家人都比较节省,打算到了机场后互相等对方,然后一起坐车租车到我住的地方。我查了qunar,一天从西安,合肥,深圳到北京有很多航班,怎么样让总的票价最少,并且在机场互相等待的时间降到最低。这里假设一个人等1分钟相当于1块钱,这样我们的
wyb_009
·
2013-05-19 16:00
数据挖掘
机器学习
遗传算法
优化解
集体智慧编程
学习之聚类系统
欢迎关注我的个人博客blog.timene.com有句话这么说“物以类聚,人以群分”,说的很有道理,有些人就完全融入不了一些团队,我觉得这里面不只是气场的问题,我也一直在苦苦思索这个问题,每个人有自己的生活习惯和思维习惯,相同生活习惯和思维习惯的人很容易聚在一起;反之则比较难了。目标很明确,给你一堆电子书,怎么把其中一些书归为一类,其中另一些书归为另一类······,我会先看书的厚度,太厚的书(超
wyb_009
·
2013-05-14 22:00
数据挖掘
机器学习
聚类系统
均值聚类
集体智慧编程
学习之推荐系统
欢迎关注我的个人博客blog.timene.com打算从这篇开始,一边学习一边写些数据挖掘的东西,主要是督促自己学习和总结。我最开始的网购是从china-pub买了一本《Unix/Linux编程实践教程》,书好,便宜,并且可以货到付款,很是吸引我这种懒穷学生,于是一发不可收拾买了很多书,后来转战dangdang,再后来就是amazon,现在基本都在jd买了,除了书,还会在yihaodian买一些日
wyb_009
·
2013-05-11 16:00
python
数据挖掘
机器学习
推荐系统
集体智慧常用算法 算法的大致含义
《
集体智慧编程
》笔记之五:优化算法优化算法过程首先是描述题解,我们有必要明确潜在的题解将如何表达。一种非常通用的表达方式,就是数字序列。
小milely
·
2013-05-08 10:19
集体智慧常用算法
算法的大致含义
上一页
1
2
3
4
5
6
7
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他