Datartisan数据工匠

利用 Pandas 来分析 MovieLens 数据集

为了展现 Pandas 的实用性，本文将利用 Pandas 来解决 MovieLen 数据集的一些问题。我们首先回顾下如何将数据集读进 DataFrame 中并将其合并：

利用 Pandas 来分析 MovieLens 数据集_第1张图片

评价最多的 25 部电影

利用 Pandas 来分析 MovieLens 数据集_第2张图片

利用 Pandas 来分析 MovieLens 数据集_第3张图片

上述代码的含义是先将 DataFrame 按电影标题分组，接下来利用 size方法计算每组样本的个数，最后按降序方式输出前 25 条观测值。

在 SQL 中，等价的代码为：

SELECT title, count(1)

FROM lens

GROUP BY title

ORDER BY 2 DESC

LIMIT 25;

此外，在 Pandas 中有一个非常好用的替代函数——value_counts：

利用 Pandas 来分析 MovieLens 数据集_第4张图片

评价最高的电影

利用 Pandas 来分析 MovieLens 数据集_第5张图片

我们可以利用agg方法来进行分组汇总计算，其参数包括键值和汇总方法。接下来我们对汇总结果进行排序即可得到评价最高的电影：

利用 Pandas 来分析 MovieLens 数据集_第6张图片

由于movie_stats是一个 DataFrame，因此我们可以利用sort方法来排序——Series 对象则使用order方法。此外，由于该数据集包含多层索引，所以我们需要传递一个元组数据来指定排序变量。

上表列出来的电影中评价数量都非常少，以致于我们无法从中得到一些有价值的信息。因此我们考虑对数据集进行筛选处理，只分析评价数量大于 100 的电影：

利用 Pandas 来分析 MovieLens 数据集_第7张图片

这个结果看起来比较靠谱，需要注意的是在这里我们利用布尔索引来筛选数据。

在SQL中，等价的代码为：

SELECT title, COUNT(1) size, AVG(rating) mean

FROM lens

GROUP BY title

HAVING COUNT(1) >= 100

ORDER BY 3 DESC

LIMIT 15;

筛选部分数据

为了便于进一步分析，我们从数据集中筛选出评价数最高的 50 部电影：

利用 Pandas 来分析 MovieLens 数据集_第8张图片

SQL 中的等价代码为：

CREATE TABLE most_50 AS(

SELECT movie_id, COUNT(1)

FROM lens

GROUP BY movie_id

ORDER BY 2 DESC

LIMIT 50

);

此外，我们也可以利用 EXISTS, IN 或者 JOIN 来过滤数据：

SELECT *

FROM lens

WHERE EXISTS (SELECT 1 FROM most_50 WHERE lens.movie_id = most_50.movie_id);

不同年龄段观众之间争议最大的电影

首先，我们来看下数据集中用户的年龄分布情况：

利用 Pandas 来分析 MovieLens 数据集_第9张图片

利用 Pandas 来分析 MovieLens 数据集_第10张图片

Pandas 整合了matplotlib的基础画图功能，我们只需要对列变量调用hist方法即可绘制直方图。当然了，我们也可以利用matplotlib.pyplot来自定义绘图。

对用户进行分箱处理

我认为直接对比不同年龄用户的行为无法得到有价值的信息，所以我们应该根据用户的年龄情况利用 pandas.cut 将所有用户进行分箱处理。

利用 Pandas 来分析 MovieLens 数据集_第11张图片

利用 Pandas 来分析 MovieLens 数据集_第12张图片

上述代码中，我们首先创建分组标签名，然后根据年龄变量将用户分成八组（0-9, 10-19, 20-29,...）,其中参数right=False用于剔除掉区间上界数据，即30岁的用户对应的标签为 30-39。

现在我们可以比较不同年龄组之间的评分情况：

利用 Pandas 来分析 MovieLens 数据集_第13张图片

从上表中我们可以看出，年轻用户比其他年龄段的用户更加挑剔。接下来让我们看下这 50 部热评电影中不同年龄组用户的评价情况。

利用 Pandas 来分析 MovieLens 数据集_第14张图片

利用 Pandas 来分析 MovieLens 数据集_第15张图片

需要注意的是，此处的电影标题和年龄组都是索引值，平均评分为 Series 对象。如果你觉得这个展示结果不直观的话，我们可以利用unstack方法将其转换成表格形式。

利用 Pandas 来分析 MovieLens 数据集_第16张图片

利用 Pandas 来分析 MovieLens 数据集_第17张图片

unstack方法主要用于拆分多层索引，此例中我们将移除第二层索引然后将其转换成列向量，并用 0 来填补缺失值。

男士与女士分歧最大的电影

首先思考下你会如何利用 SQL 来解决这个问题，你可能会利用判断语句和汇总函数来旋转你的数据集，你的查询语句大概会是这个样子：

SELECT title, AVG(IF(sex = 'F', rating, NULL)), AVG(IF(sex = 'M', rating, NULL))

FROM lens

GROUP BY title;

想象下，如果你必须处理多列数据的话，这样运算是多么的麻烦。DataFrame 提供了一个简便的方法——pivot_table。

利用 Pandas 来分析 MovieLens 数据集_第18张图片

利用 Pandas 来分析 MovieLens 数据集_第19张图片

利用 Pandas 来分析 MovieLens 数据集_第20张图片

利用 Pandas 来分析 MovieLens 数据集_第21张图片

利用 Pandas 来分析 MovieLens 数据集_第22张图片

从上图中我们可以看出，男性喜欢《终结者》的程度远高于女性，女性用户则更喜欢《独立日》。这个结果可靠吗？

利用 Pandas 来分析 MovieLens 数据集_第23张图片

原文链接：http://www.gregreda.com/2013/10/26/using-pandas-on-the-movielens-dataset/

原文作者：Greg Reda

译者：Fibears

你可能感兴趣的:(利用 Pandas 来分析 MovieLens 数据集)

微信小游戏源码和小程序游戏代码开发搭建部署南云放马归
本文将利用小程序游戏提供的能力制作一个简单的方块旋转小程序游戏，旨在从零开始介绍小程序游戏的开发过程。源码：casgams.top/gm注册小程序游戏账号进入小程序注册页面按照指引填写信息并提交相应信息，服务类别选择“程序游戏”，子类别可以先选择“休闲程序游戏”，您可以拥有自己的小程序游戏账号，安装并启动开发者工具。fromairtest.core.apiimport*auto_setup(__f
Flutter低代码开发：使用工具加速应用构建移动开发前沿 flutter 低代码 rxjava ai
Flutter低代码开发：使用工具加速应用构建关键词：Flutter、低代码开发、应用构建、开发工具、加速开发摘要：本文深入探讨了Flutter低代码开发的相关内容。首先介绍了低代码开发的背景和在Flutter中的应用目的，接着详细解释了Flutter、低代码开发等核心概念及其相互关系。通过具体的算法原理、数学模型和项目实战案例，展示了如何利用低代码工具加速Flutter应用的构建。还探讨了其实际
基于densenet网络创新的肺癌识别研究深度学习乐园深度学习人工智能 densenet
获取项目源码点击文末名片摘要本项目针对肺癌CT图像识别等医学影像分析场景，基于DenseNet网络进行创新性改进，综合引入多尺度卷积、深度可分离卷积、注意力机制以及空间金字塔池化（SPP）等模块，以期提升对不同大小的肺结节及关键病理特征的识别能力。同时，通过深度可分离卷积和可选的通道剪枝等策略，将网络参数量和计算开销显著降低，为实际临床应用（如实时诊断系统）提供可行性。本项目的核心内容包括以下几个
基于cnn和resnet和mobilenet对比实现驾驶员分心检测深度学习乐园 cnn 人工智能神经网络
演示效果及获取项目源码点击文末名片本项目旨在通过深度学习技术，结合卷积神经网络（CNN）模型、ResNet模型和MobileNet模型，实现对驾驶员分心行为的自动检测。我们通过训练这些模型来识别不同的驾驶员分心行为，包括如发短信、通话、喝水等行为。使用的数据集包含驾驶员行为的图片，并且针对每个行为标注了相应的标签（例如"正常驾驶"、"右手发短信"等）。MobileNetV2是Google于2018
Linux进程间通信--命名管道
目录1、什么是命名管道1.1命名管道的创建和使用1.2、命名管道的工作原理1.3、命名管道与匿名管道的区别2.命名管道的特点及特殊场景2.1特点2.2四种特殊场景3.日志类的模拟3.1可变参数的利用3.2time()函数和structtm类的介绍3.3日期类的实现1、什么是命名管道命名管道是一种在文件系统中存在的特殊文件类型，它允许不同进程通过文件名（即“命名”）来访问和进行通信。与匿名管道相比，
Python day18 赵英英俊 Python训练 python
@浙大疏锦行pythonday18.内容：昨天学习了聚类算法的一些基本内容，今天继续学习相关知识分析簇的特征和相关含义（使用可视化来进行分析，也可以使用ai）代码：shap.initjs()#初始化SHAP解释器explainer=shap.TreeExplainer(model)shap_values=explainer.shap_values(x1)#这个计算耗时shap_values.sha
天使和海豚（37）胡小莱
图片发自App何耀不知道聪明绝顶的林悦是不是已经洞悉了他的居心，所以她和他扮起了失忆。并且扮得天衣无缝，有时他竟不自禁拿她当另外一个人来对待。他想要好好呵护这个“新”的林悦，想要对她说一万遍我爱你，他积蓄了整整五年的复仇的力量，在他与这个号称失忆的林悦的相处中一点点地被腐蚀、被瓦解。图片发自App未完待续……
10万+的小秘密告诉我们，自媒体人要爆文，推广渠道的建设更重要新桌
自媒体人应该换个角度分析10万+,其实想要写出爆文,宣传和推广的渠道建设更为重要每一位自媒体人、新媒体运营者,都希望能写出更多的10W+,所以今天我们就编辑了几组数据去从另一个角度看待这个问题,当然拍脑门子想出的数据没有实际意义,但希望今天的内容可以帮助大家做一个思维的拐弯,再我们更多专注内容本身的同时,别忘了,渠道建设也很重要。只有双管齐下,才能取得好的效果。
“错过交复盘”的复盘尹建艳
Hi式复盘Day39/3652019.2.21正月初十七星期四因为今天总部品牌来地区有会议，所以在昨天晚上完成了复盘，以此避免因忙起来耽误了；今天的会议从早上10点一直进行至下午1点30结束的，中途在近1点的时候查看手机时才想起来“已经完美的错过了交复盘的时间”反思最近这几天这种情况也偶尔在出现，但就复盘来讲，都在千均一发的时刻赶上了。。。今天这事让我心里有点慌，所以要好好找找原因：因为我一直把复
看广告赚钱软件有哪些（看广告赚钱软件排行榜前十名）返金app平台高佣返利省钱
如今，随着移动互联网的普及和技术的飞速发展，人们的消费习惯也在不断变化，越来越多的人开始通过手机软件来赚取零花钱。其中，最受欢迎的莫过于看广告赚钱软件，不仅可以解决许多人的经济困境，还可以增加人们的娱乐生活和社交交流。那么，究竟有哪些看广告赚钱软件值得我们去尝试呢？下面就为大家盘点几款正规赚钱软件，让大家能够轻松赚钱、拓宽人脉和增加娱乐活动。1、「返金商城」APP，官方登录邀请码：555555分享
深入理解设计模式之外观模式：简化复杂系统的艺术 vvilkin的学习备忘设计模式设计模式外观模式
为什么需要外观模式？在软件开发中，我们经常会遇到这样的情况：一个功能需要调用多个子系统或复杂的类结构来完成。随着系统规模的扩大，子系统之间的交互变得越来越复杂，客户端代码需要了解每个子系统的细节才能正确使用它们。这不仅增加了代码的复杂度，也使得系统难以维护和扩展。想象一下，你每次开车都需要手动控制发动机的点火时机、燃油喷射量、气门开闭时间等所有细节，而不是简单地转动钥匙或按下启动按钮，这将是多么繁
利用Windows .NET特性和Unicode规范化漏洞攻击DNN (DotNetNuke) sechub windows .net dnn
概述DNN（前身为DotNetNuke）是2003年建立的最古老的开源内容管理系统之一，使用C#（.NET）编写，由活跃的爱好者社区维护。它也被企业广泛使用。漏洞背景CVE-2017-9822历史案例我们熟悉这项技术是因为CVE-2017-9822，该漏洞允许通过DNNPersonalizationcookie的不安全反序列化进行远程代码执行（RCE）。这个CVE一直是反序列化攻击的绝佳案例研究。
在家怎么赚钱？不想出去打工有在家赚钱的项目推荐吗古楼
这几年的疫情让很多人觉得钱越来越不够花了，大家都意识到发展副业很重要。平时上班已经耗费了我们很多时间和精力，所以能在家赚钱的副业才是我们最好的选择。今天我就总结了几个宅在家里就能赚钱的小技巧，一起来看看吧！副业兼职一：淘宝客（也是目前小编在做的副业之一）这个已经有好几年的历史了，经过发放链接和优惠券的方法来帮助店铺发布推行链接，获取优惠信息，网购市场非常大，任何人都需要一个买东西享最低优惠价的软件
滁州游记：醉翁之意不在酒，在乎山水之间也夏溪在冬流
“如果愿望仅靠扔下硬币就能实现的话，那么愿望还能被称为愿望吗？”——暖暖在一个35℃的天气里，和朋友来了一场特种兵式旅游。早有滁州出行计划，好几个周末都被事情打断，比如突如其来的加班，狂风暴雨的天气，本来看到35℃的天气又想退却，最终还是狠下心来，决定滁州一日游。南京离滁州很近，高铁仅有18分钟的距离，只要29块，火车更便宜，只要11块，不过大约需要1小时的时长。我们去的时候坐高铁到滁州北站，回来
Java实现简单秒杀功能
在商城项目中，秒杀功能可以说是必不可少的，下面我将使用SpringBoot集成Redis、RabbitMQ、MyBatis-Plus和MySQL来实现一个简单的秒杀系统，系统将包含以下核心功能：使用Redis进行库存预减和用户限流；使用RabbitMQ进行异步下单，提高系统吞吐量；使用MyBatis-Plus操作MySQL数据库；利用Redis执行Lua脚本的原子性防止商品超卖；接口限流（使用Re
vue实现超出字数中间用省略号显示
显示效果：传统节日里的氛围......传统节日里的氛围原理：利用vue中的过滤器filterhtml代码：{{hashName|ellipsis}}js代码：filters:{ellipsis(value){letlen=value.length;if(!value)return''if(value.length>20){returnvalue.substring(0,8)+'......'+va
MySQL 配置性能优化实操指南：分版本5.7和8.0适配方案挑战者666888 mysql 《Java面试精选》adb mysql 性能优化服务器数据库 linux 运维
在MySQL性能优化中，不同版本的特性差异会直接影响优化效果。本文基于MySQL5.7和8.0两个主流版本，通过版本适配的配置代码、场景举例和通俗解释，让优化方案更精准落地。一、硬件与系统配置优化（基础层优化）1.服务器硬件选型实战建议CPU：高并发场景优先选多核CPU（如16核IntelXeon），但避免盲目堆核（MySQL5.7对超32核利用率下降明显，8.0有显著改进）。举例：电商秒杀服务器
极限高并发压测：P7架构师与应届生的JVM调优对决搞Java的小码农 Java面试场景题 Java面试高并发性能优化 JVM调优极限场景
文章标题：极限高并发压测：P7架构师与应届生的JVM调优对决场景描述在一个互联网大厂的终面环节，面试官决定通过模拟真实业务场景来考察候选人的技术深度和解决问题的能力。面试官是一位有着丰富经验的P7架构师，而候选人是刚刚毕业的应届生小兰，她擅长手写Tomcat并自认为对JVM有一定了解。面试的背景是一个极端的高并发场景，QPS从2000飙升至10万，同时伴随着内存泄漏问题和GC暂停时间的急剧增加。第
inotify-tools监控文件的变动情况 Tim在路上
在实际的生产中，都会存在不同系统的对接问题，比如A系统将数据生产后存放到/data文件下，B系统需要监控/data文件夹下数据的变动情况，来做出调整，linux系统中inotify-tools正好可以完成系统的监控而supervise正好可以完成进程的持续监控，起到出错重启的效果。inotify-toolsinotify-tools下载地址：http://github.com/downloads/
软件测试入门指南：零基础到实战通关手册
一、为什么需要软件测试？行业现状（2024年数据）全球软件缺陷造成的经济损失高达$2.4万亿（来源：NIST报告）优秀测试人员与开发人员配比应达1:5（头部互联网企业实际数据）经典案例迪士尼+上线首日因负载测试不足导致服务器崩溃某银行系统未做金额边界测试，引发超额转账漏洞二、测试工程师的职责全景图（配图：测试工作流程图）阶段核心工作产出物示例需求分析参与评审，提取测试点测试需求跟踪矩阵测试设计编写
互联网时代来临，学习机该不该进入到校园呢？领域特长生
近日，中国政府网通报，黔南州群众反映学校变相强制学生购买高价学习机，贵州省政府认真核查推动整改。通报称，黔南州王先生通过国务院“互联网+督查”平台反映，荔波县第二中学自2019年以来变相强制学生购买高价学习机并收取服务费。那么学习机该不该进入到校园内呢？我们来一起探讨一下互联网对整个社会的影响随着信息技术的发展，互联网时代的浪潮已经悄无声息的席卷了社会的各个方面，购物、出行、餐饮等等都离不开互联网
淘宝内部优惠券领取攻略高省APP大九
在淘宝购物时，你是否曾遇到过心仪的商品却因为价格犹豫不决？别担心，高省APP来帮你解决这个问题！通过高省APP，你可以轻松领取淘宝内部优惠券，享受更多折扣和优惠。下面，我们就来详细介绍一下淘宝内部优惠券的领取方法以及高省APP的使用技巧。高省APP官网邀请码110000一、淘宝内部优惠券的领取方法淘宝内部优惠券是由商家设置的一种特殊优惠券，通常不会直接展示在淘宝平台上，而是需要通过特定的渠道或AP
UMLS（统一医学语言系统）—— 小白最强攻略（讲解+运用）
1概念介绍1.1UMLS介绍UMLS(UnifiedMedicalLanguageSystem)，是由美国国立医学图书馆（NLM）开发的，旨在通过整合各种生物医学术语系统来促进医学信息的统一检索和应用。链接：https://uts.nlm.nih.gov/uts/signUpUMLS参考手册：https://www.ncbi.nlm.nih.gov/books/NBK9676/技术上：Unifie
思考：国内自由职业者平台富庶之地
国内的威客（国外称为自由职业者）平台，如猪八戒网和一品威客网。不知道能不能称为自由职业者平台，跟国外的UpWork比起来，似乎比不倾向自由职业者，更多的是为雇主发布在线需求，让有能力的组织来承接任务。虽然也有个人做的不错，但是整个平台的氛围，是把需求托管给团队来做。再者，即使是世界顶尖的UpWork平台，浏览发布的需求，也大多是小企业主和个人创业者的需求居多。创业者的时代，人人可创业。借着互联网的
坚持锻炼、严格自律，我和儿子的假期功课伍拾范儿
图片发自App书法、英语、素描，这个假期被孩子妈妈安排的满满当当，但无论如何，每天的身体锻炼成了爸爸做主的“必须完成的任务”——俯卧撑、引体向上和深蹲，每天坚持，严格自律，而且是爸爸陪着儿子一起做。假期两周下来，锻炼成绩已达到甚至超出我的预料。上午的锻炼已经结束，孩子利用所学制作了7月15号父子三项的数据柱状图，制作了引体向上这个单项运动父子三天的数据图，从一开始的只能做一个最多两个，每一项都取得
场景压测：真实业务下的性能挑战
文章摘要场景压测通过模拟真实用户的操作路径（如电商的登录-浏览-下单流程），评估系统在多接口协同、复杂业务场景下的性能与稳定性。与单接口压测不同，它更关注全链路瓶颈、资源协作及异常处理。实施需梳理业务流程、设计用户模型、编排压测脚本，并分析系统整体表现。其核心价值在于提前暴露生产环境中可能出现的流程级问题，为业务高峰期的系统承压能力提供保障。1.场景压测和接口压测的区别接口压测：通常只针对单一接口
豆包教你如何用Python向女生表白 51reboot
一年一度的考试大会又拉开了帷幕其中的一个重头戏就是python了不知道正处于手机前的你为python又掉了多少头发呢but！！！python绝不只是你脱发的工具善于使用你将收获多多比如你知道如何利用python向女生表白吗如果不知道少年，你可要当心啦考试很危险的呢后记：某年月日，某许愿池推文：震惊！某旦python考试题新鲜出炉，考题震惊十几亿中国人！原因竟是。。。待豆包点开推文：一看考试题，嘿哈
《谷歌时间管理课》：掌握这个法则，打造自己的高效能人生日月照书时
文|深夏晚晴天ZMH“想做的事情不少，可就是没时间啊！”“我手头的工作都做不完，怎么有空做……”“等我有时间了，我就……”生活中，我们没少听到类似的抱怨。不管是他人还是自己，总是难免会有感觉时间不够用的时刻。按道理来说，近百年来科技与工具的迅猛发展，早已解放了我们的双手，我们应该多出很多时间过上一种悠闲的生活才对。但事实是，科技越发达，我们感觉越焦虑，依然还有一大堆“做不完”的事。为了应对这种情况
无人值守人工智能智慧系统数据分析：深度洞察与未来展望呆码科技人工智能数据分析数据挖掘
无人值守人工智能智慧系统数据分析：深度洞察与未来展望随着科技的飞速发展，人工智能（AI）技术已逐渐渗透到社会经济的各个领域，其中无人值守人工智能智慧系统作为AI技术应用的前沿阵地，正引领着一场深刻的行业变革。这类系统通过集成高级算法、大数据分析、物联网（IoT）及云计算等先进技术，实现了对复杂环境的自主监控、智能决策与高效管理，极大地提升了运营效率，降低了人力成本，并开启了数据驱动决策的新纪元。本
c++ 反射与QMetaObject::invokeMethod介绍
文章目录c++QMetaObject::invokeMethodC++语言标准本身并不直接支持反射机制，这与Java、C#等语言不同，它们在语言层面提供了丰富的反射API。然而，C++是一种非常灵活的语言，可以通过一些设计和编程技巧来实现类似反射的功能。在C++中实现反射通常涉及以下几种技术：动态创建对象：反射可以在运行时创建任意一个已经定义的类的对象实例，即使你在编写代码时并不知道将要创建哪个类
java的(PO,VO,TO,BO,DAO,POJO) Cb123456 VO TO BO POJO DAO
转: http://www.cnblogs.com/yxnchinahlj/archive/2012/02/24/2366110.html ------------------------------------------------------------------- O/R Mapping 是 Object Relational Mapping（对象关系映
spring ioc原理（看完后大家可以自己写一个spring） aijuans spring
最近，买了本Spring入门书：spring In Action 。大致浏览了下感觉还不错。就是入门了点。Manning的书还是不错的，我虽然不像哪些只看Manning书的人那样专注于Manning,但怀着崇敬的心情和激情通览了一遍。又一次接受了IOC 、DI、AOP等Spring核心概念。先就IOC和DI谈一点我的看法。IO
MyEclipse 2014中Customize Persperctive设置无效的解决方法 Kai_Ge MyEclipse2014
高高兴兴下载个MyEclipse2014，发现工具条上多了个手机开发的按钮，心生不爽就想弄掉他！结果发现Customize Persperctive失效！！有说更新下就好了，可是国内Myeclipse访问不了，何谈更新... so~这里提供了更新后的一下jar包，给大家使用！ 1、将9个jar复制到myeclipse安装目录\plugins中 2、删除和这9个jar同包名但是版本号较
SpringMvc上传 120153216 springMVC
@RequestMapping(value = WebUrlConstant.UPLOADFILE) @ResponseBody public Map<String, Object> uploadFile(HttpServletRequest request,HttpServletResponse httpresponse) { try { //
Javascript----HTML DOM 事件何必如此 JavaScript html Web
HTML DOM 事件允许Javascript在HTML文档元素中注册不同事件处理程序。事件通常与函数结合使用，函数不会在事件发生前被执行！注：DOM：指明使用的 DOM 属性级别。 1.鼠标事件属性
动态绑定和删除onclick事件 357029540 JavaScript jquery
因为对JQUERY和JS的动态绑定事件的不熟悉，今天花了好久的时间才把动态绑定和删除onclick事件搞定!现在分享下我的过程。在我的查询页面，我将我的onclick事件绑定到了tr标签上同时传入当前行(this值)参数，这样可以在点击行上的任意地方时可以选中checkbox，但是在我的某一列上也有一个onclick事件是用于下载附件的，当
HttpClient|HttpClient请求详解 7454103 apache 应用服务器网络协议网络应用 Security
HttpClient 是 Apache Jakarta Common 下的子项目，可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包，并且它支持 HTTP 协议最新的版本和建议。本文首先介绍 HTTPClient，然后根据作者实际工作经验给出了一些常见问题的解决方法。HTTP 协议可能是现在 Internet 上使用得最多、最重要的协议了，越来越多的 Java 应用程序需
递归逐层统计树形结构数据 darkranger 数据结构
将集合递归获取树形结构: /** * * 递归获取数据 * @param alist:所有分类 * @param subjname:对应统计的项目名称 * @param pk:对应项目主键 * @param reportList: 最后统计的结果集 * @param count:项目级别 */ public void getReportVO(Arr
访问WEB-INF下使用frameset标签页面出错的原因 aijuans struts2
<frameset rows="61,*,24" cols="*" framespacing="0" frameborder="no" border="0">
MAVEN常用命令 avords
Maven库： http://repo2.maven.org/maven2/ Maven依赖查询： http://mvnrepository.com/ Maven常用命令： 1. 创建Maven的普通java项目： mvn archetype:create -DgroupId=packageName
PHP如果自带一个小型的web服务器就好了 houxinyou apache 应用服务器 Web PHP 脚本
最近单位用PHP做网站，感觉PHP挺好的，不过有一些地方不太习惯，比如，环境搭建。PHP本身就是一个网站后台脚本，但用PHP做程序时还要下载apache，配置起来也不太很方便，虽然有好多配置好的apache+php+mysq的环境，但用起来总是心里不太舒服，因为我要的只是一个开发环境，如果是真实的运行环境，下个apahe也无所谓，但只是一个开发环境，总有一种杀鸡用牛刀的感觉。如果php自己的程序中
NoSQL数据库之Redis数据库管理(list类型) bijian1013 redis 数据库 NoSQL
3.list类型及操作 List是一个链表结构，主要功能是push、pop、获取一个范围的所有值等等，操作key理解为链表的名字。Redis的list类型其实就是一个每个子元素都是string类型的双向链表。我们可以通过push、pop操作从链表的头部或者尾部添加删除元素，这样list既可以作为栈，又可以作为队列。 &nbs
谁在用Hadoop？ bingyingao hadoop 数据挖掘公司应用场景
Hadoop技术的应用已经十分广泛了，而我是最近才开始对它有所了解，它在大数据领域的出色表现也让我产生了兴趣。浏览了他的官网，其中有一个页面专门介绍目前世界上有哪些公司在用Hadoop，这些公司涵盖各行各业，不乏一些大公司如alibaba,ebay,amazon,google,facebook,adobe等，主要用于日志分析、数据挖掘、机器学习、构建索引、业务报表等场景,这更加激发了学习它的热情。
【Spark七十六】Spark计算结果存到MySQL bit1129 mysql
package spark.examples.db import java.sql.{PreparedStatement, Connection, DriverManager} import com.mysql.jdbc.Driver import org.apache.spark.{SparkContext, SparkConf} object SparkMySQLInteg
Scala: JVM上的函数编程 bookjovi scala erlang haskell
说Scala是JVM上的函数编程一点也不为过，Scala把面向对象和函数型编程这两种主流编程范式结合了起来，对于熟悉各种编程范式的人而言Scala并没有带来太多革新的编程思想，scala主要的有点在于Java庞大的package优势，这样也就弥补了JVM平台上函数型编程的缺失，MS家.net上已经有了F#，JVM怎么能不跟上呢？对本人而言
jar打成exe bro_feng java jar exe
今天要把jar包打成exe，jsmooth和exe4j都用了。遇见几个问题。记录一下。两个软件都很好使，网上都有图片教程，都挺不错。首先肯定是要用自己的jre的，不然不能通用，其次别忘了把需要的lib放到classPath中。困扰我很久的一个问题是，我自己打包成功后，在一个同事的没有装jdk的电脑上运行，就是不行，报错jvm.dll为无效的windows映像，如截图最后发现
读《研磨设计模式》-代码笔记-策略模式-Strategy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 策略模式定义了一系列的算法，并将每一个算法封装起来，而且使它们还可以相互替换。策略模式让算法独立于使用它的客户而独立变化简单理解： 1、将不同的策略提炼出一个共同接口。这是容易的，因为不同的策略，只是算法不同，需要传递的参数
cmd命令值cvfM命令 chenyu19891124 cmd
cmd命令还真是强大啊。今天发现jar -cvfM aa.rar @aaalist 就这行命令可以根据aaalist取出相应的文件例如：在d：\workspace\prpall\test.java 有这样一个文件，现在想要将这个文件打成一个包。运行如下命令即可比如在d：\wor
OpenJWeb(1.8) Java Web应用快速开发平台 comsci java 框架 Web 项目管理企业应用
OpenJWeb(1.8) Java Web应用快速开发平台的作者是我们技术联盟的成员，他最近推出了新版本的快速应用开发平台 OpenJWeb(1.8)，我帮他做做宣传 OpenJWeb快速开发平台以快速开发为核心，整合先进的java 开源框架，本着自主开发+应用集成相结合的原则，旨在为政府、企事业单位、软件公司等平台用户提供一个架构透
Python 报错：IndentationError: unexpected indent daizj python tab 空格缩进
IndentationError: unexpected indent 是缩进的问题，也有可能是tab和空格混用啦 Python开发者有意让违反了缩进规则的程序不能通过编译，以此来强制程序员养成良好的编程习惯。并且在Python语言里，缩进而非花括号或者某种关键字，被用于表示语句块的开始和退出。增加缩进表示语句块的开
HttpClient 超时设置 dongwei_6688 httpclient
HttpClient中的超时设置包含两个部分： 1. 建立连接超时，是指在httpclient客户端和服务器端建立连接过程中允许的最大等待时间 2. 读取数据超时，是指在建立连接后，等待读取服务器端的响应数据时允许的最大等待时间在HttpClient 4.x中如下设置： HttpClient httpclient = new DefaultHttpC
小鱼与波浪 dcj3sjt126com
一条小鱼游出水面看蓝天，偶然间遇到了波浪。　　小鱼便与波浪在海面上游戏，随着波浪上下起伏、汹涌前进。　　小鱼在波浪里兴奋得大叫：“你每天都过着这么刺激的生活吗？简直太棒了。”　　波浪说：“岂只每天过这样的生活，几乎每一刻都这么刺激！还有更刺激的，要有潮汐变化，或者狂风暴雨，那才是兴奋得心脏都会跳出来。”　　小鱼说：“真希望我也能变成一个波浪，每天随着风雨、潮汐流动，不知道有多么好！”　　很快，小鱼
Error Code: 1175 You are using safe update mode and you tried to update a table dcj3sjt126com mysql
快速高效用：SET SQL_SAFE_UPDATES = 0；下面的就不要看了！今日用MySQL Workbench进行数据库的管理更新时，执行一个更新的语句碰到以下错误提示： Error Code: 1175 You are using safe update mode and you tried to update a table without a WHERE that
枚举类型详细介绍及方法定义 gaomysion enum javaee
转发 http://developer.51cto.com/art/201107/275031.htm 枚举其实就是一种类型，跟int, char 这种差不多，就是定义变量时限制输入的，你只能够赋enum里面规定的值。建议大家可以看看，这两篇文章，《java枚举类型入门》和《C++的中的结构体和枚举》，供大家参考。枚举类型是JDK5.0的新特征。Sun引进了一个全新的关键字enum
Merge Sorted Array hcx2013 array
Given two sorted integer arrays nums1 and nums2, merge nums2 into nums1 as one sorted array. Note:You may assume that nums1 has enough space (size that is
Expression Language 3.0新特性 jinnianshilongnian el 3.0
Expression Language 3.0表达式语言规范最终版从2013-4-29发布到现在已经非常久的时间了；目前如Tomcat 8、Jetty 9、GlasshFish 4已经支持EL 3.0。新特性包括：如字符串拼接操作符、赋值、分号操作符、对象方法调用、Lambda表达式、静态字段/方法调用、构造器调用、Java8集合操作。目前Glassfish 4/Jetty实现最好，对大多数新特性
超越算法来看待个性化推荐 liyonghui160com 超越算法来看待个性化推荐
一提到个性化推荐，大家一般会想到协同过滤、文本相似等推荐算法，或是更高阶的模型推荐算法，百度的张栋说过，推荐40%取决于UI、30%取决于数据、20%取决于背景知识，虽然本人不是很认同这种比例，但推荐系统中，推荐算法起的作用起的作用是非常有限的。就像任何
写给Javascript初学者的小小建议 pda158 JavaScript
　　一般初学JavaScript的时候最头痛的就是浏览器兼容问题。在Firefox下面好好的代码放到IE就不能显示了，又或者是在IE能正常显示的代码在firefox又报错了。　　如果你正初学JavaScript并有着一样的处境的话建议你：初学JavaScript的时候无视DOM和BOM的兼容性，将更多的时间花在了解语言本身（ECMAScript）。只在特定浏览器编写代码（Chrome/Fi
Java 枚举 ShihLei java enum 枚举
注：文章内容大量借鉴使用网上的资料，可惜没有记录参考地址，只能再传对作者说声抱歉并表示感谢！一基础 1）语法枚举类型只能有私有构造器（这样做可以保证客户代码没有办法新建一个enum的实例）枚举实例必须最先定义 2）特性 &nb
Java SE 6 HotSpot虚拟机的垃圾回收机制 uuhorse java HotSpot GC 垃圾回收 VM
官方资料，关于Java SE 6 HotSpot虚拟机的garbage Collection，非常全，英文。 http://www.oracle.com/technetwork/java/javase/gc-tuning-6-140523.html Java SE 6 HotSpot[tm] Virtual Machine Garbage Collection Tuning &

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他