E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
[集体智慧编程]
探索数据的奥秘:一份深入浅出的数据分析入门指南
数据分析书籍推荐入门读物深入浅出数据分析啤酒与尿布数据之美数学之美数据分析ScipyandNumpyPythonforDataAnalysisBadDataHandbook
集体智慧编程
MachineLearninginAction
uncle_ll
·
2024-01-17 05:22
数据库
数据分析
数据挖掘
入门
【配套博客】《
集体智慧编程
》推荐系统
推荐系统(建设中进度20%)背景介绍场景介绍算法介绍相似性算法欧几里得距离计算皮尔逊算法Jacard系数曼哈顿距离算法设计模式现代推荐算法基于卷积神经网络的推荐模型序列模型深度学习和注意力机制
集体智慧编程
是一本比较老的书
破幻星空
·
2023-11-21 05:47
读书笔记
算法
无关主业
算法
集体智慧编程
笔记
个人博客汇总
博客汇总建设完成的博客建设中的博客规划建设的博客看过但是暂时不会整理的博客建设完成的博客建设中的博客
集体智慧编程
redis设计与实现GRPC规划建设的博客书籍类DDIA技术方案活动增长裂变增长裂变人群打标看过但是暂时不会整理的博客刑法学讲义蛤蟆先生去看心理医生
破幻星空
·
2023-11-21 05:47
个人开发
Python编程相关的书籍
《
集体智慧编程
》。这本书用具体的例子来展示Python编程技巧,非常有用。《Head-FirstPython》。这本书是HeadFirst系列的书,
软件架构师-叶秋
·
2023-09-13 09:44
好书推荐分享
开发语言
python
互联网产品经理必读书单
个人以为互联网产品经理需要必须的书目大概可以分为三大类+一小类第一大类:计算机计算机科学概论C语言程序设计计算机程序的构造和解释深入理解计算系统数据结构算法导论计算机网络现代操作系统
集体智慧编程
第二大类
数据研究员
·
2023-08-06 08:40
集体智慧编程
:提供推荐_推荐物品
前面已经实现不同人之间相似度的计算,接下来就是根据相似度,向用户推荐物品。找到相似度最高的用户B,将他的喜好推荐给用户A,这种方式太片面。好的做法,是针对物品进行评分。首先计算用户A与用户B的相似度,把相似度作为B的评分权重,乘以B的所有评分。针对A以外的所有用户,都这么计算一次。然后,把每个物品所有的分值相加,得到总分。最后,对每个物品的总分值,除以有效相似度的总和。"""推荐物品"""#书中算
菜菜蜗牛
·
2023-07-24 04:40
协同过滤算法研习
写在前面先啰嗦几句,最近在看《
集体智慧编程
》,为了加深记忆,把学习的内容整理成文,后续还会写书中相关内容。既然是读书笔记,且本人是推荐算法入门选手,所以内容只能局限于此书。
糊君
·
2023-04-17 19:39
读书笔记:“
集体智慧编程
”之第八章:对数值进行预测(构建价格模型)
数值预测的含义在上一章节,我们接触到的决策树,比较适合对数据的分类进行预测,以及我们之前学过的分类器也是如此。但是当我们对数值型结果进行预测的时候应该怎么办呢?具体什么叫做对数值型结果进行预测首先需要明确一下。比如:我们要在拍卖行竞价购买一个笔记本电脑,这台笔记本电脑有一些参数:处理器的速度,RAM的容量,硬盘的大小,屏幕的分辨率以及其他因素。显然,我们最终对其的定价必然要考虑这些参数,而这些参数
silent狼
·
2023-04-14 10:43
机器学习
价格预测
kNN
k-最近邻算法
python
概率
淘宝穿衣搭配算法大赛有感
我的反思我是研究生阶段接触机器学习和深度学习(了解一点),然后以李航老师写的《统计学方法》和《
集体智慧编程
》入门的,在kaggle上有参
miangmiang咩
·
2023-04-14 04:22
机器学习
阿里天池在赛
《
集体智慧编程
》笔记(4 / 12):搜索与排名
由于书本未提供数据文件且提供的链接无法被链接且pysqlite安装失败,所以本章只是阅读学习。文章目录搜索引擎的组成一个简单的爬虫程序使用urllib2爬虫程序的代码建立索引建立数据库Schema在网页中查找单词加入索引查询基于内容的排名归一化函数单词频度文档位置单词距离利用外部会指链接简单计数PageRank算法利用连接文本从点击行为中学习一个点击跟踪网络的设计设计数据库前馈法利用反向传播进行训
巨輪
·
2023-04-07 00:33
集体智慧编程
python
爬虫
集体智慧编程
:提供推荐_为评论者打分
对具体的某一用户,根据其他用户的评价结果,计算出他与每一个用户的相似程度,找出相似程度最高的前N位。在函数中,通过similarity指定使用的相关性算法。"""为评论者打分"""#书中算法deftopMatches(prefs,person,n=5,similarity=sim_pearson):score=[(similarity(prefs,person,other),other)forot
菜菜蜗牛
·
2023-03-26 04:29
算法思想-PageRank
最近重新拿起《
集体智慧编程
》这本书来看,书是好书,很多人推荐计算机的学习学这本书入门机器学习的算法,但是有个问题——这本书太老了。很多代码已经跑不了了,书上爬虫要抓的网站也404了。
蜡笔不好吃
·
2023-03-15 04:03
【学习】数据挖掘—
集体智慧编程
先做一个目录吧,不然实在太长了,连我自己都记不清楚第二章提供推荐2.1算法流程2.2基于用户进行过滤2.2.1搜集偏好2.2.2相似性度量方法2.2.3用户相似度计算2.2.4加权法构建推荐物品序列2.3基于物品进行过滤2.3.1提前构造物品字典相似矩阵2.3.2根据用户历史信息加权平均法构建推荐物品列表2.4其他概念第三章发现群组3.1算法流程3.2聚类的可视化3.2.1绘制树状图3.2.2多维
X_Ran_0a11
·
2023-02-18 23:37
350多本编程书籍是每个程序员值得拥有的一套编程百科全书
热门书籍《重构》《程序员修炼之道》《计算机程序的构造和解释》《黑客与画家》《编程珠玑》《深入理解计算机系统》《代码大全》《HTTP权威指南》《UNIX程序设计艺术》《重来》《
集体智慧编程
》《疯狂的程序员
代码技巧
·
2023-02-05 21:15
python3
集体智慧编程
第九章advancedclassify.py代码
对于python2版本的
集体智慧编程
第九章SVM进行了修改,该代码适用于python3版本。
也不是很坑
·
2023-01-12 17:29
python
python3
集体智慧编程
第九章
以下是课本对应的一些练习,但有两个问题1.最后交叉验证部分我没做出来,估计我用的是python3.8的原因有大佬做出来的可以提意见2.最后Facebook的例子没有做,因为网址打不开,需要需要python3advancedclassify.py代码的见我另一篇##加载数据集importadvancedclassify#fromadvancedclassifyimport*agesonly=adva
也不是很坑
·
2023-01-12 17:29
python
推荐系统的学习笔记
一直以来对推荐系统的学习和理解来自一些机器学习书中简单介绍(如《
集体智慧编程
》和《机器学习实战》)和自己网上搜的一些资料。
白熊花田
·
2022-12-22 14:31
机器学习
推荐系统
机器学习
推荐系统
读书笔记:“
集体智慧编程
”之第三章:“发现群组”的 k均值聚类
分级聚类的缺点此前学习的分级聚类、与列聚类,有二个缺点:计算量大,数据越大运行越缓慢。没有确切的将数据分成不同的组,只是形成了树状图。虽然我倒觉得如果写过多的代码这一点还是可以搞定的。k均值聚类可以应对上述两种缺点,我们会预先告诉算法生成的聚类数量,也就是我要产生几个类。原理如下图所示,对于5个数据项和两个聚类过程是这样的,先随机产生两个聚类点,那么每一个数据项都会离一其中一个最近,那么将其分配给
silent狼
·
2022-12-16 12:38
机器学习
k均值
聚类
k
means
机器学习
读书笔记:“
集体智慧编程
”之第三章:“发现群组”的 列聚类
什么是列聚类?对博客数据使用了分级聚类的方式分析,我们可以又学的一种聚类方式:列聚类。刚刚的分级聚类就是对行进行了一个聚类。行是什么?行就是一个又一个的博客名,列是什么?列就是一个又一个的单词,那么进行行聚类的时候,我们是根据单词的词频将不同的博客聚了一次类。当我们对单词进行聚类的时候,我们就称之为列聚类。意义何在正面回答,我们知道了哪些单词会时常一起使用。对于这个列子来讲,似乎没什么意义。但是如
silent狼
·
2022-12-16 12:08
机器学习
聚类
列聚类
集体智慧编程
《
集体智慧编程
》学习笔记
连载中~~目录第一章,集体智慧导言第二章,提供推荐第三章,发现群组**该书使用python作为示例语言,2.x版本第一章集体智慧导言集体智慧为了创造新的想法,而将一群人的行为、偏好或思想组合在一起。机器学习人工智能的一个与算法相关的子域,允许计算机不断地进行学习。(计算机接收到一定的数据,通过确定的算法推断出数据相关的信息,借此来推断出未来可能会出现的数据****由此可见,需要学好数学~~~)。机
weixin_30776545
·
2022-12-16 12:07
《
集体智慧编程
》读书笔记6
最近重读《
集体智慧编程
》,这本当年出版的介绍推荐系统的书,在当时看来很引领潮流,放眼现在已经成了各互联网公司必备的技术。
weixin_30275415
·
2022-12-16 12:37
《
集体智慧编程
》读书笔记
书中涉及到一些机器学习相关的内容,在统计学习方法读书笔记和西瓜书读书笔记中有所记录,所以只简单带过.本书源代码下载地址书中使用的python技巧字典的setdefault(key,value)方法,作用是如果键不在字典中,则添加键与默认值FeedParser是一个解析RSS订阅源的库print(str,end='')可以实现输出不换行BeautifulSoup库是一个解析网页和构造结构化数据表达形
weixin_30396699
·
2022-12-16 12:37
数据库
人工智能
python
《
集体智慧编程
》读书笔记2
最近重读《
集体智慧编程
》,这本当年出版的介绍推荐系统的书,在当时看来很引领潮流,放眼现在已经成了各互联网公司必备的技术。
weixin_30429201
·
2022-12-16 12:37
人工智能
数据结构与算法
python
《
集体智慧编程
》 第三章 发现群组 学习笔记
啦啦啦聚类算法~这一章我学得比较迷糊,还需要反复理解琢磨。我刚看到这一章的时候内心是崩溃的,许多傻瓜软件点一下鼠标就能完成的事儿,到书里这一章需要许多行代码来完成,也说明了,学数据挖掘,算法real重要。。本章需要安装:feedparser(第二章安装pydelicious已经安装过了,pipinstall即可)BeautifulSoup,BeautifulSoup是用Python写的一个HTML
weixin_30657999
·
2022-12-16 12:37
读书笔记---《
集体智慧编程
》第3章:发现群组
1.关于聚类的理解聚类实际上就是分类,对一些样本(样品)进行归类分组。本章第一个例子是对99篇博客进行聚类,也就是说每一篇博客便是一个样本。要分类就要有分类的标准(指标)。比如把人按地区、身高、体重分类,那地区、身高、体重就是指标。抽象地说,对样本X,设有p个指标,即X=(X1,X2,⋯,Xp)T.在博客聚类的这个例子中,选取的分类指标是一些单词(这里暂时不管为什么要选这些单词),即为china,
lxy孙悟空
·
2022-12-16 12:07
学习笔记
读书笔记
编程
python
集体智慧编程
_3发现群组
监督式学习与非监督式学习监督式学习指的是你拥有一个输入变量(x)和一个输出变量(Y),使用某种算法去学习从输入到输出的映射函数。例如,神经网络,决策树,支持向量机以及贝叶斯过滤等非监督式学习指的是我们只拥有(X)但是没有相关的输出变量。例如,聚类,非负矩阵因式分解,自组织映射等大概结构:有监督学习(分类,回归)↕半监督学习(分类,回归),transductivelearning(分类,回归)↕半监
小八一的梦想
·
2022-12-16 12:07
基础知识
打砖
笔记
笔记
机器学习实战之
集体智慧编程
学习笔记(2):聚类
聚类的作用监督学习与无监督学习监督学习无监督学习数据源聚类分类分级聚类k-均值聚类对偏好的聚类二维聚类思维导图由于代码中都有很详细的注解所以没有做过多的解释有问题请留言或私信解决聚类的作用通过聚类,我们可以跟踪统计消费者信息,发现具有相似消费习惯的群体,并据此开发相应的产品或者市场策略监督学习与无监督学习监督学习利用样本输入和期望输出来学习如何预测的技术神经网络决策树向量支持机贝叶斯过滤无监督学习
冷鸢J
·
2022-12-16 12:36
集体智慧编程
机器学习
机器学习
分级聚类
k-均值聚类
二位聚类
《
集体智慧编程
》读书笔记 1 聚类简介
1、聚类算法的目的是采集数据,然后从中找出不同的群组。2、UniversalFeedParser可以方便地解析RSS订阅源,即从RSS或Atom订阅源中得到标题、链接和文章的内容。3、皮尔逊相关度其实判断的是两组数据与某条直线的拟合程度,当两者完全匹配时,计算结果为1.0,当两者毫无关系时,计算结果为0.0.4、分级聚类分级聚类的结果会产生一棵树:分级聚类虽然会返回一棵形象直观的树,但这种方法有两
a512977208
·
2022-12-16 12:06
集体智慧编程
的笔记
从evernote搬家过来,希望可以分享给更多的同学。EuclideandistanceandPearsonCorrelationScoreEuclideandistance:以经过人们一致评价的物品为坐标轴,然后将参与评价的人绘制到图上,并考察他们彼此间的距离远近。(处于“偏好空间”中人们的分布状况)PearsonCorrelationScore:修正了“夸大分值(gradeinflation)
柒安
·
2022-12-16 12:06
笔记
python
笔记
集体智慧编程
集体智慧编程
——发现群组
目录1.监督学习和无监督学习2.对博客用户进行聚类2.1建立单词向量2.2层次聚类2.3列聚类2.4K-均值聚类3.以二维形式展现数据1.监督学习和无监督学习监督学习:利用样本输入和期望输出来学习如何预测,如:神经网络、决策树、支持向量机、贝叶斯过滤等等;无监督学习:在一群数据中找寻某种结构,而这些数据本身并不是我们要找的答案。2.对博客用户进行聚类根据单词出现的频度对博客进行聚类,可以帮助我们分
阿泽的学习笔记
·
2022-12-16 12:06
集体智慧编程
聚类
K-means
层次聚类
《
集体智慧编程
》第3章 发现群组 个人笔记
第3章发现群组1、分级聚类分级聚类通过连续不断地将最为相似的群组两两合并,来构造出一个群组的层级结构。其中每个群组都是从单一元素开始的,在每次迭代的过程中,分级聚类算法计算每两个群组间的距离,并将距离最近的两个群组合并成一个新的群组。这一过程会一直重复下去,直到只剩一个群组为止。由于整个计算过程可能会非常耗时,所以不妨将每个配对的相关度计算结果保存起来,直到配对中的某一项被合并到另一个聚类中为止。
Amber07
·
2022-12-16 11:35
集体智慧编程
集体智慧编程
《
集体智慧编程
》阅读笔记
本书从实际业务、应用场景出发,介绍机器学习算法。提供推荐主要从如何寻找相似用户、通过相似用户对用户进行商品推荐以及相似商品进行讲述。每一位用户对部分商品如影片有评价分数,根据两个人对同一商品的打分情况可以判断两用户相似情况。判断相似程度有欧几里得距离、皮尔逊相关度等。其中欧式距离计算不同分数之差的平方和的开方,范围在0到正无穷,容易受到“夸大分数”的影响。皮尔逊相关度根据两人对同样几件商品的评价分
Lyteins
·
2022-12-16 11:35
《
集体智慧编程
》笔记(一)
1导言一、集体智慧将一群人的行为、偏好或思想组合到一起。二、注意点从一大群人中搜集的答案可以使我们得到关于群组的统计结论:组中的个体成员将会被忽略。从独立的数据提供者那里得出新的结论是集体只会所真正关注的。(有待体会)三、Wikipedia和google的例子Wikipedia明确邀请网站的用户提供内容,Google则从Web内容的创建者对自己网站的操作中提取重要信息,并利用这些信息为Google
阿飞孟德
·
2022-12-16 11:35
笔记/总结
集体智慧编程
读书笔记
《
集体智慧编程
》笔记(3 / 12):发现群组
DiscoveringGroups文章目录监督学习和无监督学习监督学习无监督学习单词向量对博客用户进行分类对订阅源中的单词进行计数分级聚类绘制树状图列聚类K-均值聚类针对偏好的聚类获取数据和准备数据BeautifulSoup收集来自Zebo的结果定义距离度量标准对结果进行聚类以二维形式展现数据有关聚类的其他事宜小结数据聚类dataclustering是一种用以寻找紧密相关的事、人或观点,并将其可视
巨輪
·
2022-12-16 11:05
集体智慧编程
聚类
学习笔记(01):以性别预测为例,谈谈数据挖掘中常见的分类算法-数据挖掘的基本流程和常见的分类算法...
utm_source=blogtoedu一.数据挖掘基础数据挖掘:用各种方法(统计学、机器学习、爬虫)来解决各种实际问题;机器学习:算法层面数据挖掘工程师:程序员入门:通俗;1.PCI(
集体智慧编程
)2
teth
·
2022-12-01 16:52
研发管理
数据挖掘
深度学习
大数据
云计算/大数据
利用皮尔逊相关度系数构建一个简单的推荐系统
最近我阅读了《
集体智慧编程
》一书,
Hou_Rj
·
2022-11-27 18:10
集体编程智慧
算法
电子商务
sns
php
产品
google
机器学习部分书籍推荐
《ProgrammingCollectiveIntelligence》(中译本《
集体智慧编程
》);作者TobySegaran也是《BeautifulData:TheStoriesBehindElegantDataSo
贾诩是也
·
2022-09-08 10:15
Machine
Learning
AI(Artificial
Intelligence)
推荐系统知识清单
《
集体智慧编程
》(ProgrammingCollectiveIntelligence)这本书非常适合数学知识相对来说较
·
2022-04-27 10:38
推荐系统
unit3 文本聚类
《
集体智慧编程
》第三单元“发现群组”主要亮点是文本的聚类。故针对第三单元的博客文本聚类做记录。1、数据对象通过读取每个博客的词汇,统计词频,形成如下单词表作为本次文本聚类的数据资料。
巴拉巴拉_9515
·
2021-06-27 06:56
Python中NameError: name 'reload' is not defined解决方案
最近在看
集体智慧编程
一书,在看第二章时,遇到NameError:name'reload'isnotdefined这个问题。
Evermemo
·
2021-06-21 22:13
黑科技的入口——机器学习书单推荐
《
集体智慧编程
》【推荐指数】★★★★★【内容简介
大圣众包
·
2021-05-21 07:20
链接
LeaningToRankLTR简介LTRforimformationretrievalLambdaMARTFromRankNettoLambdaRanktoLambdaMart时序分析时序分析实战1实战2推荐系统电影推荐实战
集体智慧编程
笔记
渡猫
·
2021-05-09 10:10
大V的微博特征提取(简单的爬虫加数据分析)
文章的思路来源是在学习《
集体智慧编程
》中关于寻找独立特征一章,想到把不同新闻来源换成不同微博大V的内容,很好奇会得到什么结果?1.内容获取1.1模拟登录微博用各大V的原创微博内容代替新闻来源。
TheMarcMa
·
2021-04-28 13:19
《
集体智慧编程
》第8章
1.P175在计算高斯函数时,代码中的默认标准差为10.0,如果默认标准差为10是得不到正文中的数据的,这里的默认值应该改为1.0附上高斯函数的公式和图像公式中的a代表高斯函数的最大值,b代表平均值(即当高斯函数取最大值时x的值),c代表标准差,c^2表示方差。上图表示a=1,b=0,c=1上图表示a=1,b=0,c=10(注意横坐标数值)★★★★★★★★★★★★★★★★★★★★★★★★★★★★★
清风不识字12138
·
2020-09-17 01:07
集体智慧编程
集体智慧编程
集体智慧编程
第二章 提供推荐
我们要知道在购物网站中,如何构建一个系统,用以寻找具有相同品味的人,并根据他人的喜好自动给出推荐。一个协作型过滤算法通常的做法是对一大群人进行搜索,并从中找到与我们品味相近的一小群人。算法会对这些人所偏爱的其他内容进行考察,并将它们组合起来构造出一个经过排名的推荐列表。搜集偏好第一件事是寻找一种表达不同人和偏好的方法,这里用Python的嵌套字典来达到目的。新建一个名为recommendation
Dr_David_S
·
2020-09-17 01:59
集体智慧编程
集体智慧编程
第2章
>>>fromrecommendationsimportcritics>>>fromimpimportreload>>>importrecommendations>>>reload(recommendations)pipinstallpydelicious
wsjtwmy
·
2020-09-17 00:49
python
读书笔记:“
集体智慧编程
”之第五章:“求最优解”的算法
优化显然刚开始我并不太明白这一章要讲什么,因为根据“优化”这个词,我还以为是对函数进行优化之类的。后来,我才明白,这一章在要讲求最最优解的算法。由于我曾在老师的算法课上讲过遗传算法,遗传算法就是用来求最优解的算法,所以我忽然明白了这个优化具体是指什么。制定旅行计划的例子情况描述显然上述内容都是废话,对于这一章,关键还是要怎么学好那些优化算法。我自己是通过举例子才明白了本章的意图,所以我突然觉得举例
silent狼
·
2020-09-12 18:29
机器学习
[总结]
集体智慧编程
中用到的数据评估模型
快速扫了一遍
集体智慧编程
的相关分类,推荐算法后,对数据的建模预处理整理总结下,以备以后使用。
binsfan
·
2020-09-12 14:49
数据分析
机器学习书单(转自算法组)
《ProgrammingCollectiveIntelligence》(《
集体智慧编程
》)PDF作者TobySegaran也是《BeautifulData:Th
机器学习天天向上
·
2020-09-12 07:39
《
集体智慧编程
》读书笔记 — Chapter 9 高阶分类:核函数与SVM_1
本实验的内容基于婚介的背景,使用到的数据集可以在https://github.com/GreenGitHuber/Programming-Collective-Intelligence/tree/master/chapter9_Advance%20Classification上面下载。基本的线性分类器:它的工作原理是寻找到所有数据的均值,并且构造一个可以代表该分类的中心位置的点。然后我们就可以通过
爱秋刀鱼的猫
·
2020-08-24 11:31
上一页
1
2
3
4
5
6
7
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他