-柚子皮-

海量数据挖掘MMDS week4: 推荐系统之数据降维Dimensionality Reduction

http://blog.csdn.net/pipisorry/article/details/49231919

海量数据挖掘Mining Massive Datasets(MMDs) -Jure Leskovec courses学习笔记推荐系统Recommendation System之降维Dimensionality Reduction

{博客内容：推荐系统有一种推荐称作隐语义模型(LFM, latent factor model)推荐，这种推荐将在下一篇博客中讲到。这篇博客主要讲隐语义模型的基础：降维技术，包括SVD分解等等}

降维Dimensionality Reduction

降维介绍

数据的低维表示：空间中的点不是完全随机分布的，而是分布lie in在它的一个子空间中。我们的目标就是找到这个可以有效表示所有数据的子空间。

降维示例

customer-day矩阵中行表示data（也就是点），列代表数据属性（也就是点的坐标）。降维就是要减少属性（列）。

这个矩阵实际只有2维，wc-th-fr和sa-su。

数据集的维度

矩阵的秩

矩阵A的秩就是A中列的无关最大组数目。下面的是坐标重新定义后A矩阵的表示。

秩即维数

通过秩来进行坐标重定义，用新坐标重新表示A矩阵，达到降维目的。

降维的实质

实质是找到一个新的数据轴。

这个例子中，我们只考虑数据在红线上的投影，而忽略与红线的距离，存在一定的error。目标就是找到一个新坐标轴让error尽量小。

降维的目的

皮皮blog

UV分解

UV分解示例

UV分解误差度量RMSE

我们一般通过RMSE（Root-Mean-Square Error, 均方根误差）度量UV和M的相近程度。

UV分解的增量式计算

{寻找具有最小RMSE的UV分解过程：初始任意选择UV，然后反复调整UV使得RMSE越来越小}

初始化

增量计算-对特定元素优化的示例

增量计算-对任意元素的优化。。。

完整UV分解算法的构建

1. 预处理

2.初始化

3. 执行优化

4. 收敛到极小值

5. 避免过拟合

皮皮blog

奇异值分解Singular Value Decomposition, SVD

{数据降维技术}

SVD定义

这里假设奇异值对角矩阵中的奇异值是降序排列的。

[矩阵论]

SVD分解的性质

Note: U、V列向量是正交的orthogonal，也就是说向量间内积为0。

SVD分解实例

users-movies矩阵，其中行代表用户，每列代表一部电影。

concepts就是SVD分解要告诉我们的，用户是sci-fi lover和romance lover类型，电影是sci-fi和romance等类型。也就是不同的genres（流派）, or topics。

SVD分解中各分解分量的实际意义解释

下面是通过matlab或者python对矩阵A进行SVD分解得到的结果。下面分别讲解U V矩阵代表的实际含义（注意这种解释性也是人为解释的，其实SVD分解的解释性并没有那么强）。

我们可以将U的列看成concepts，如U的第一列对应Sci-Fi concept，第二列对应romance concept（第三列可能代表其它的什么，其实不一定能用一个类别来描述和解释，因为SVD其解释性并不是那么强）。我们从这里可以看到，前4个用户衷情于sic-fi，后3个用户衷情于romance。

于是我们可以将U矩阵看成是user to concept matrix(user to concept similarity matrix)。其中元素代表某个用户对某个concepts的感兴趣程度。这里是说第1个用户很喜欢sci-fi concept（0.13），而第5个用户很喜欢romance concept（-0.59）。至于-0.59代表最喜欢的concept，可能是要看它的绝对值？

Sigma矩阵中的值可看做是concepts的强度，如sci-fi concept强度（12.4）就比romance concept的强度（9.5）强。

同样的，我们可以将V矩阵看成是movies to concept matrix(movies to concept similarity matrix)。注意这里还有第三种concepts，但是其强度1.3太小，可以忽略。

从V矩阵第1列我们可以看到，第1部电影与第1个concept和第3个concept相关度高，然而第3个concept的强度过低，它对解释数据并不重要。

[TopicModel主题模型 - LSA（隐性语义分析）模型和其实现的早期方法SVD]

使用concept space进行查询

如果原始矩阵中没有的一个新用户Qurncy看了一部电影The Matrix，评分为4，则Qurncy的向量表示为q=[4,0,0,0,0]。

当然使用协同过滤，不过这里可以通过qV将Qurncy map到concept space中，其中qV = [2.32, 0]，说明Qurncy对scifi有很大兴趣，对romance几乎没有兴趣。

map回movie space，qVVT = [1.35, 1.35, 1.35, 0, 0]，也就是说Qurncy会喜欢Alien and Star Wars, but not Casablanca or Titanic。

可以将所有用户都map到concept space中，再计算他们的cosin相似度。

SVD分解的计算

Note: m*n矩阵A的奇异值是矩阵乘积AAH的特征值（这些特征值是非负的）的正平方根。

当然可以使用软件来代替手动计算，如scipy中linalg.svd(A)

[SVD Dimension Reduction 奇异值分解降维]

皮皮blog

CUR分解

SVD分解的缺点在于:
计算比较耗时
存储矩阵比较占空间
CUR分解是另外一个选择，其目标是：找到输入矩阵的一个“尽可能好”的分解为三个矩阵的乘积，SVD分解是完美的分解（通过允许误差来加速计算）。

U矩阵构造

C矩阵构造

计算M所有数据平方和f，取出的行数为r

计算选取列的缩放scale因子

R矩阵构造

同C，只是概率（缩放因子计算是对行来说的）

CUR分解示例

对下面矩阵进行CUR分解

假设选取列Matrix, Alien，和行Jim, John。

所有元素平方和为243

Matrix, Alien和Star Wars的squared Frobenius norm为1^2 + 3^2 + 4^2 + 5^2 = 51，故缩放因子即概率为51/243 = .210。其它两列的概率为45/243 = .185。

7行的squared Frobenius norms分别为3, 27, 48, 75, 32,50, 8，相应的概率为.012, .111, .198,.309, .132, .206, .033.

C矩阵构造

C矩阵中选择了Alien列和Matrix 列，则

R矩阵的构造

R矩阵选择了行Jim, John。

U矩阵的构造

W矩阵为

W的SVD分解结果为：

u:

[[-0.6-0.8]

[-0.8 0.6]]

e:

[ 7.0711 0. ]

v:

[[-0.7071-0.7071]

[-0.7071 0.7071]]

1/e =

[[0.1414 0. ]

[ 0. 0. ]]

故M矩阵的CUR分解为：

[Anand.Rajaraman-Mining of Massive Datasets-mmds2014:CUR Decomposition]

[CUR Dimension Reduction CUR分解降维]

皮皮blog

。。。

Review复习

标准正交基

计算出各个选项的长度（2范数）和与[2/7...]的内积为：

0.771042151896
-0.125

1.00021697646
0.000142857142857

2.42383992871
-0.214285714286

1.00014298978
0.735

故选择选项2

Code:

a = np.array([2 / 7, 3 / 7, 6 / 7])
B = [[.608, -.459, -.119], [.728, .485, -.485], [2.250, -.500, -.750], [.429, .857, .286]]
for b in B:
    print(np.linalg.norm(b))
    print(a.dot(b))
    print()

PCA

皮皮blog

from: http://blog.csdn.net/pipisorry/article/details/49231919

ref: Anand.Rajaraman-大数据：互联网大规模数据挖掘与分布式处理

你可能感兴趣的:(海量数据挖掘MMDS,Resys)

AI驱动的知识发现：程序员的新机遇 AI大模型应用之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
AI驱动的知识发现：程序员的新机遇关键词：知识发现,AI驱动,数据挖掘,数据分析,算法优化,数据可视化,机器学习1.背景介绍1.1问题由来在当今信息化时代，数据量呈爆炸性增长，各行各业都面临着海量数据挖掘和知识发现的巨大挑战。传统的统计分析方法已难以满足需求，而人工智能（AI）技术的兴起为这一问题提供了新的解决方案。AI驱动的知识发现，即利用机器学习、深度学习等技术手段，从海量数据中自动提取有用信
好省官方邀请码是哪个?好省官方邀请码填写哪个? 氧惠评测
相较于其它返利app，氧惠佣金更高，模式更好，终端用户不流失！今天就来跟大家说说：好省官方邀请码是哪个？好省官方邀请码填写哪个?好省app是杭州嘉洁网络科技有限公司旗下的一款电商导购应用，为用户打造一个电商购物优惠平台，用户可以在这个App中领取主流商城的商品隐藏优惠券。基于第三方电商平台海量数据挖掘与分析，“好省”APP通过内容制作、分享等方式，为消费者打通吃喝玩乐购全场景全业态，让消费者省钱省
2022淘宝优惠券返利APP排行榜TOP10 日常购物技巧呀
1高省高省app是杭州长孚科技有限公司旗下[1]的一款电商导购应用，为用户打造一个电商购物优惠平台，用户可以在这个App中领取主流商城的商品隐藏优惠券以及获得返利。基于第三方电商平台海量数据挖掘与分析，“高省”APP通过内容制作、分享等方式，为消费者打通吃喝玩乐购全场景全业态[1]，让消费者省钱省时，为平台和品牌方导流创造收入[1]高省app逐渐构筑起了集各大主流电商平台，外卖平台，旅游、票务、出
五险一金的工作有哪些？什么工作有五险一金？优惠券高省
高省是杭州长孚科技有限公司旗下的一款电商导购应用，为用户打造一个电商购物优惠平台，用户可以在这个App中领取主流商城的商品隐藏优惠券以及获得返利。基于第三方电商平台海量数据挖掘与分析，“高省”APP通过内容制作、分享等方式，为消费者打通吃喝玩乐购全场景全业态，让消费者省心省钱省时省力，为平台和品牌方导流创造收入，拓展了商家新的销售渠道。高省app逐渐构筑起了集各大主流电商平台，外卖平台，旅游、票务
揭秘日入1000+的2个CPS暴利赚钱项目高省APP大九
（一定要看完！）大家好给大家介绍一款2022年最火返利app，高省app是杭州长孚科技有限公司旗下的一款电商导购应用，为用户打造一个电商购物优惠平台，用户可以在这个App中领取主流商城的商品隐藏优惠券以及获得返利。基于第三方电商平台海量数据挖掘与分析，“高省”APP通过内容制作、分享等方式，为消费者打通吃喝玩乐购全场景全业态。高省APP的创始团队来自阿里、网易及浙大等，是一群80年、90后互联网老
优惠券app哪个好?好用的优惠券app大全-手机优惠券一起高省
接下来，我们来这里当前的淘宝购物优惠券市场的2023年最顶端的十大APP排行榜！1.高省高省APP是由杭州长孚科技有限公司开发的一款电商导购应用APP，是一个为用户打造的一个可以网购下单领取优惠券的平台，用户可以在这个APP里领取到现在市场上主流商城的商品隐藏优惠券以及获得下单红包。像淘宝、京东、唯品会等等都可以。创始人员基于在这个行业里多年的经验和认识，基于第三方电商平台海量数据挖掘与分析，“高
2022-04-26 Andy华
1.1项目背景自2009年智慧城市概念兴起至今，我国已有400多个城市开展智慧城市建设，年投资额保持在15%以上，而智慧城市多个领域尚处于探索与试点阶段，市场潜力还未充分释放，全国万亿市场格局值得期待。智慧环保是智慧城市的重要组成部分！传统环境管理模式难以满足需求，孤岛现象严重。智慧城市环境检测系统是数字环保、物联网、云计算的集合。物联网、云计算、智能GIS、海陆空一体化遥感监测、海量数据挖掘、环
【无线网络技术】——无线城域网（学习笔记） HinsCoder 网络技术详解学习笔记网络
前言：无线城域网（WMAN）是指在地域上覆盖城市及其郊区范围的分布节点之间传输信息的本地分配无线网络。能实现语音、数据、图像、多媒体、IP等多业务的接入服务。其覆盖范围的典型值为3~5km，点到点链路的覆盖可以高达几十千米，可以提供支持QoS的能力和具有一定范围移动性的共享接入能力。MMDS、LMDS和WiMAX等技术属于城域网范畴。目录1.无线城域网概况2.802.16协议体系2.1IEEE80
挣钱软件排行榜前十名,我只推荐排名前三的给你测评君高省
值得推荐的五款小众赚钱APP①高省高省app是杭州长孚科技有限公司旗下的一款电商导购应用，为用户打造一个电商购物优惠平台，用户可以在这个App中领取主流商城的商品隐藏优惠券以及获得返利。高省邀请码518518基于第三方电商平台海量数据挖掘与分析，“高省”APP通过内容制作、分享等方式，为消费者打通吃喝玩乐购全场景全业态。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待
腾讯视频vip在哪里买划算？腾讯会员在哪买便宜些日常购物技巧呀
今天给大家分享我长期在做的副业，也在这里赚到人生第3桶金！高省APP佣金高，资质靠谱，各大应用市场均可搜索使用。【下高省，自用省钱，分享赚钱，佣金最高！高省邀请码222888】高省APP上线于2021年，高省app是杭州长孚科技有限公司旗下的一款电商导购应用，为用户打造一个电商购物优惠平台，用户可以在这个App中领取主流商城的商品隐藏优惠券以及获得返利。基于第三方电商平台海量数据挖掘与分析，“高省
快团团货源哪里来怎么做团长？快团团是什么平台怎么赚钱一起高省
高省APP上线于2021年，高省app是杭州长孚科技有限公司旗下的一款电商导购应用，为用户打造一个电商购物优惠平台，用户可以在这个App中领取主流商城的商品隐藏优惠券以及获得返利。基于第三方电商平台海量数据挖掘与分析，“高省”APP通过内容制作、分享等方式，为消费者打通吃喝玩乐购全场景全业态，让消费者省心省钱省时省力，是国内首家和考拉海购官方对接多电商平台的综合返利导购平台，返利比例可达到99%，
高佣联盟赚钱多吗现在？高佣联盟真的有人赚钱的吗好项目高省
今天给大家分享我长期在做的副业，也在这里赚到人生第3桶金！高省APP佣金高，资质靠谱，各大应用市场均可搜索使用。【下高省，自用省钱，分享赚钱，佣金最高！高省邀请码222888】高省APP上线于2021年，高省app是杭州长孚科技有限公司旗下的一款电商导购应用，为用户打造一个电商购物优惠平台，用户可以在这个App中领取主流商城的商品隐藏优惠券以及获得返利。基于第三方电商平台海量数据挖掘与分析，“高省
高省官方邀请码3冠是不是真的?高省官方邀请码500888是真的吗. 凌风导师
高省app是杭州长孚科技有限公司旗下的一款电商导购应用，为用户打造一个电商购物优惠平台，用户可以在这个App中领取主流商城的商品隐藏优惠券。基于第三方电商平台海量数据挖掘与分析，“高省”APP通过内容制作、分享等方式，为消费者打通吃喝玩乐购全场景全业态，高省-各大应用商城下载即可-购物领劵返利高，邀请码切记填500888，凌风高省邀请码500888，全网唯一教你技术的老师码填对码直送2皇冠总裁等级
高省为什么要邀请码高省原始邀请码（消息填）凌风导师
软件特色基于第三方电商平台海量数据挖掘与分析，“高省”APP通过内容制作、分享等方式，为消费者打通吃喝玩乐购全场景全业态，让消费者省钱省时省心省力，为平台和品牌方导流创造收入，拓展了商家新的销售渠道。高省-各大应用商城下载即可-购物领劵返利高，邀请码切记填777999，凌总导师，高省邀请码777999，全网唯一教你技术的老师码填对码直送2皇冠总裁等级，送价值百万引流技术推广绝密大礼包，后台联系老师
呆萌价赚佣金是真的嘛？呆萌价是什么平台一起高省
高省APP上线于2021年，高省app是杭州长孚科技有限公司旗下的一款电商导购应用，为用户打造一个电商购物优惠平台，用户可以在这个App中领取主流商城的商品隐藏优惠券以及获得返利。基于第三方电商平台海量数据挖掘与分析，“高省”APP通过内容制作、分享等方式，为消费者打通吃喝玩乐购全场景全业态，让消费者省心省钱省时省力，是国内首家和考拉海购官方对接多电商平台的综合返利导购平台，返利比例可达到99%，
1省欧拉欧拉
20221023周末熬夜加班上周不知道抽什么疯，突然傻笑，感觉自己好蠢，装什么幽默，蠢死了！每天在公司就不自在，不知道为什么，讨厌！开始养多肉，已经种上了，一定要好好爱护！今天发现了好多好玩的，虽然工作进度1%，了解到了mmdsaberbeatslasher和一些贴吧大佬，音游真的好好玩，不知疲倦。我在游戏上装男号忽悠人，然后突然发现零度的前男友也是女生12岁的小女生，哈，被小学生忽悠了，八嘎！发
TuGraph图学习技术详解 uncle_ll #技术分享知识图谱图谱 Tugraph
文章目录TuGraph图学习目录图学习典型工作流程整体学习架构加速稀疏计算GPC编译加速编译加速编译加速流水线GPCSPMM和SDDMM优化SPMMDSL代码生成SDMMDSL代码生成AutoTune-CostModel加速效果一键加速TuGraph图学习实践目录TuGraph采样TuGraph采样算子全图训练采样算子介绍图学习实战相关项目：TuGraphTuGraph-DB：https://gi
大学生想赚钱需要怎么做，有适合学生赚钱的行业吗，不耽误学业优惠券高省
如果你现在也是大学生，经济压力有点大，想要赚钱又无从下手。那么我想，下面我的经验或许可以让你有一定借鉴意义。偶然的一次机会被朋友推荐了高省这款购物省钱平台，本就没抱太大希望随便用用，结果居然需要的人生第一次真香大脸现场。高省是基于第三方电商平台海量数据挖掘与分析,“高省”APP通过内容制作、分享等方式，为消费者打通吃喝玩乐购全场景全业态,让消费者省钱省时省心省力，为平台和品牌方导流创造收入，拓展了
大数据常见应用场景及架构改进桥路丶大数据入门大数据架构数据仓库
大数据常见应用场景及架构改进大数据典型的离线处理场景1.大数据数据仓库及它的架构改进2.海量数据规模下的搜索与检索3.新兴的图计算领域4.海量数据挖掘潜在价值大数据实时处理场景大数据典型的离线处理场景1.大数据数据仓库及它的架构改进对于离线场景，最典型的就是数据仓库。它和传统的数仓不太一样。因为传统数仓它只能解决中小规模的数据存储与分析问题。大数据这一块要能承接海量的数据。我们来看一下它们的基本架
【海量数据挖掘/数据分析】之 K-Means 算法（K-Means算法、K-Means 中心值计算、K-Means 距离计算公式、K-Means 算法迭代步骤、K-Means算法实例）仙魁XAN 研究生考试数据挖掘算法数据分析 K-Means K-Means算法迭代
【海量数据挖掘/数据分析】之K-Means算法（K-Means算法、K-Means中心值计算、K-Means距离计算公式、K-Means算法迭代步骤、K-Means算法实例）目录【海量数据挖掘/数据分析】之K-Means算法（K-Means算法、K-Means中心值计算、K-Means距离计算公式、K-Means算法迭代步骤、K-Means算法实例）一、基于划分的聚类方法二、K-Means算法1、
【海量数据挖掘/数据分析】之决策树模型（决策树模型、决策树构成、决策树常用算法、决策树性能要求、信息增益、信息增益计算公式、决策树信息增益计算实例）仙魁XAN 研究生考试数据挖掘数据分析人工智能决策树信息增益
【海量数据挖掘/数据分析】之决策树模型（决策树模型、决策树构成、决策树常用算法、决策树性能要求、信息增益、信息增益计算公式、决策树信息增益计算实例）目录【海量数据挖掘/数据分析】之决策树模型（决策树模型、决策树构成、决策树常用算法、决策树性能要求、信息增益、信息增益计算公式、决策树信息增益计算实例）一、决策树模型1、常用算法2、属性划分策略3、其他算法三、决策树算法性能要求四、决策树模型创建(递归
【海量数据挖掘/数据分析】之贝叶斯信念网络（贝叶斯信念网络、有向无环图、贝叶斯公式、贝叶斯信念网络计算实例）仙魁XAN 研究生考试数据挖掘数据分析贝叶斯信念网络有向无环图贝叶斯公式
【海量数据挖掘/数据分析】之贝叶斯信念网络（贝叶斯信念网络、有向无环图、贝叶斯公式、贝叶斯信念网络计算实例）目录【海量数据挖掘/数据分析】之贝叶斯信念网络（贝叶斯信念网络、有向无环图、贝叶斯公式、贝叶斯信念网络计算实例）一、贝叶斯信念网络1.属性关联:贝叶斯信念网络允许数据集样本属性之间存在依赖关系;2.贝叶斯信念网络表示方法:二、概率图模型:马尔科夫假设三、贝叶斯信念网络示例1四、贝叶斯信念网络
什么是好省APP？好省APP靠谱吗？高省官方邀请码131413 高省APP
什么是好省APP？好省APP靠谱吗？好省APP好用么？好省APP如何使用？本文来自于【高省】粉丝张三斤投稿！好省app是杭州嘉洁网络科技有限公司旗下的一款电商导购应用，为用户打造一个电商购物优惠平台，用户可以在这个App中领取主流商城的商品隐藏优惠券。基于第三方电商平台海量数据挖掘与分析，“好省”APP通过内容制作、分享等方式，为消费者打通吃喝玩乐购全场景全业态，让消费者省钱省时省心省力，为平台和
产品经理从0-1搭建个性化推荐系统（上）黄昏誓 #常规篇产品经理产品设计推荐系统算法协同过滤
推荐系统的介绍什么是个性化推荐系统？个性化推荐系统是互联网和电子商务发展的产物，它是建立在海量数据挖掘基础上的一种高级商务智能平台，向顾客提供个性化的信息服务和决策支持。百度百科描述推荐系统的本质是什么？推荐系统本质是要解决用户，物品（信息）和场景的连接问题。验证推荐系统的常见指标有哪些？指标通常包括以下五个：准确率：表示给用户推荐的物品（信息）中，有多少是用户真正感兴趣的。召回率：表示的是用户感
【推荐系统入门】一窥推荐系统的原理风度78 算法大数据编程语言 python 推荐系统
一、推荐系统介绍一句话介绍推荐系统的作用：高效地达成用户与意向对象的匹配。1.1推荐系统的应用推荐系统是建立在海量数据挖掘基础上，高效地为用户提供个性化的决策支持和信息服务，以提高用户体验及商业效益。常见的推荐应用场景如：资讯类：今日头条、腾讯公众号等新闻、广告、文章等内容推荐；电商类：淘宝、京东、拼多多、亚马逊等商品推荐；娱乐类：抖音、快手、爱奇艺等视频推荐；生活服务类：美团、大众点评、携程等吃
大学生就业创业，大学生创业小案例古楼导师
如果你现在也是大学生，经济压力有点大，想要赚钱又无从下手。那么我想，下面我的经验或许可以让你有一定借鉴意义。偶然的一次机会被朋友推荐了高省这款购物省钱平台，本就没抱太大希望随便用用，结果居然需要的人生第一次真香大脸现场。高省是基于第三方电商平台海量数据挖掘与分析,“高省”APP通过内容制作、分享等方式，为消费者打通吃喝玩乐购全场景全业态,让消费者省钱省时省心省力，为平台和品牌方导流创造收入，拓展了
多维尺度MDS案例分析 spssau python 算法开发语言
多维尺度（multidimensionalscaling,MDS），是一种将研究对象之间距离或者不相似度的直观展示，较为典型的研究对象是地理位置，当然也可以是观点、颜色等任意各类实体或抽象概念，比如茶的口味不相似情况。多维尺度的目的是将距离进行可视化展示。多维尺度MDS通常分为两类，分别是度量MDS（metricmultidimensionalscaling,mMDS）和非度量MDS（nonmet
基于皮尔逊相关系数的用户相似推荐算法python实现 Mr Gao python 数据分析 python 推荐系统
基于皮尔逊相关系数的用户相似推荐算法python实现随着电子商务规模的不断扩大，商品个数和种类快速增长，顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题，个性化推荐系统应运而生。个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台，以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。
推荐系统常用的推荐算法总结技术人小柒人工智能推荐算法数据挖掘人工智能
一、推荐系统的概述个性化推荐是根据用户的兴趣特点和购买行为，向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大，商品个数和种类快速增长，顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题，个性化推荐系统应运而生。个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台，以帮助电子商务网站为其顾
关联规则常用算法华师数据学院·王嘉宁数据挖掘与大数据算法关联规则频繁模式挖掘海量数据挖掘
关联规则（AssociationRules）是海量数据挖掘（MiningMassiveDatasets，MMDs）非常经典的任务，其主要目标是试图从一系列事务集中挖掘出频繁项以及对应的关联规则。关联规则来自于一个家喻户晓的“啤酒与尿布”的故事，本文通过故事来引出关联规则的方法。啤酒与尿布的故事在一家超市里，有一个有趣的现象：尿布和啤酒赫然摆在一起出售。但是这个奇怪的举措却使尿布和啤酒的销量
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他