简说Python

Python数说成龙电影 | 数据告诉你，成龙大哥真的老了吗

点击“简说Python”，选择“星标公众号”

福利干货，第一时间送达！

本文授权转载自萝卜大杂烩，禁二次转载

作者：萝卜大杂烩

阅读文本大概需要 12 分钟。

最近的电影《哪吒》绝对是风靡全国，各种“我命由我不由天”，激励着平民大众。而《上海堡垒》则彻底扑街，鹿晗也跌落神坛，流量不再。而老大哥成龙的新片《龙牌之谜》也在日前悄悄上映了，之所用悄悄是因为电影并没有做过多的宣传，低调上映。但是上映之后的口碑却不敢恭维，好多影迷都说，大哥老了，也开始持续拍烂片了。今天，我们就来分析下历年成龙的电影得分数据和《龙牌之谜》的评论，用数据来告诉你，真的是大哥老了，打不动了吗？

Part1.豆瓣数据分析

豆瓣数据获取

爬取的过程还是蛮简单的，直接给出代码

 1def get_data():
 2
 3    data = []
 4
 5    for i in range(0, 150, 25):
 6
 7        url = 'https://movie.douban.com/celebrity/1054531/movies?start=%s&format=text&sortby=time&role=A1' % i
 8
 9        res = requests.get(url).text
10
11        content = BeautifulSoup(res, "html.parser")
12
13        tbody_tag = content.find_all('tbody')
14
15        tr_tag = tbody_tag[1].find_all('tr')
16
17        for tr in tr_tag:
18
19            tmp = []
20
21            name = tr.find('a').text
22
23            year = tr.find('td', attrs={'headers': 'mc_date'}).text
24
25            rate = tr.find('td', attrs={'headers': 'mc_rating'}).text
26
27            tmp.append(name)
28
29            tmp.append(year)
30
31            tmp.append(rate.replace('\n', '').strip().replace('-', ''))
32
33            data.append(tmp)
34
35    return data
36
37
38
39if __name__ == '__main__':
40
41    data = get_data()
42
43    print(data)
44
45    with open('jack_data.csv', 'w', encoding='utf-8') as f:
46
47        f.write('name,year,rate\n')
48
49        for d in data:
50
51            try:
52
53                rowcsv = '{},{},{}'.format(d[0], d[1], d[2])
54
55                f.write(rowcsv)
56
57                f.write('\n')
58
59            except:
60
61                continue

数据拿到之后，我们再做些简单的数据处理，去除掉 rate 为空的数据，和一些异常数据

 1df = pd.read_csv('jack_data.csv')
 2
 3df.isnull().sum()  # 查看缺失值情况
 4
 5
 6
 7df_copy = df.copy()
 8
 9df_copy.dropna(how='any', inplace=True)  # 去掉缺失值
10
11
12
13# 去掉异常值
14
15except_data = df_copy[df_copy['name'].apply(lambda x: x == '喜剧之王')].index
16
17df_copy.drop(except_data, inplace=True)

一、成龙电影总体得分分布

成龙大哥的高分电影，多集中在早年。大多数电影的评分，都几种在6-7分上下浮动。而近些年的几部电影，口碑都不是很好，有持续下滑的趋势。

二、评分最高与最低影片

成龙大哥的电影，最高得分为《龙争虎斗》，8.2 分，不过这个电影好像是李小龙的呀，尴了个尬，不知道成龙在电影里干了啥，豆瓣会把这部电影分给成龙。

评分最低的是《神探蒲松龄》，只有 3.8 分。年岁增大，不能再像以前那样“功夫喜剧”了，成龙电影未来的方向在哪里呢。

而《龙争虎斗》是 1973 年上映的，《神探蒲松龄》则是 2019 年上映的，也从侧面反映出近些年龙大哥在电影市场的不给力情况。

三、出产电影年份

我们再来看看哪些年份，成龙大哥出产的电影比较多呢

1978 年，成龙出产的电影占比是最多的，总共是 6 部，接下来就是 1973、1985 和 1976 年，都是 5部电影。

我们来看下这几年电影的评分情况

1978 年

1973 年

1985 年

1976 年

可以看出来，早些年，大哥年轻的时候，无论是数量还是质量，都是比较有保证的。不过太多电影过于遥远，真心没看过啊！

虽然说，成龙电影总体评分并不是太高，最高也才 8 点几分，但是作为华语影坛的大哥级人物，大家对他的期待还是非常高的。

不管怎么说，还是希望成龙大哥能够好好保养身体，在以后的时光中，给大家带来更多好的作品。

Part2.猫眼数据分析

爬一爬猫眼上《龙牌之谜》的用户评论，看看这个口碑不佳的作品，用户的想法是怎么样的

分析猫眼网站

我们首先进入到猫眼，找到对应的电影，地址为：https://maoyan.com/films/343473

浏览器手机模式

这里可以使用浏览器手机模式，在 Chrome 浏览器下，按 F12 打开开发者工具，再点击下图中的按钮，即可进入到手机模式

此时再重新刷新网页，发现我们已经神奇的进入到了猫眼的 M 站了

现在再拖动网页到最下部，点击查看全部评论，就可以进入到评论页面，查看全部的评论了。

寻找加载评论的接口

接下来我们继续下拉页面，发现评论是动态加载的。此时经验就非常重要了，我们让页面多加载加载评论几次，就能够发现一个“可疑”的请求，如下

它是以 comments 命名的啊，差不多就是它了。

接下来再查看其 response，确实就是评论内容，而且是清爽的 json 数据，很开心！

分析接口参数

我们先来观察下这个接口

http://m.maoyan.com/review/v2/comments.json?movieId=343473&userId=-1&offset=30&limit=15&ts=1567064825883&type=3

movieid 很显然就是电影的 id，不动

我们把该接口信息放到 postman 中，尝试着调用下

查看接口返回数据的最后面，发现一个 paging 字段

1"paging": {
2        "hasMore": true,
3        "limit": 10,
4        "offset": 0,
5        "total": 2838
6    }

已经清楚的告诉了我们，还有更多数据（"hasMore": true），每页限制为10（"limit": 10），当前是第0页（"offset": 0），总共的数据为2838条（"total": 2838）。

最后经过测试，type = 3 会每次都会返回 hotComments 这个字段，而当 type = 2 时，则不会返回该字段，于是我选择使用 type 为2来发送请求，那么最终我决定使用的请求 url 就是如下：

http://m.maoyan.com/review/v2/comments.json?movieId=343473&offset=60&limit=15&type=2

offset 作为变量，循环替换即可。

编写爬虫代码

提取 json 数据

 1def get_json(res):
 2    data_list = []
 3    res_json = json.loads(res)
 4    data = res_json['data']['comments']
 5    for d in data:
 6        content = d['content']
 7        gender = d['gender']
 8        userLevel = d['userLevel']
 9        score = d['score']
10        try:
11            if len(d['tagList']) == 0:
12                ticket = 0
13            elif len(d['tagList']) == 1:
14                if d['tagList'][0]['id'] == 4:
15                    ticket = 1
16                else:
17                    ticket = 0
18            elif len(d['tagList']) == 2:
19                ticket == 1
20        except:
21            ticket = 0
22        tmp = [content, gender, userLevel, score, ticket]
23        data_list.append(tmp)
24    return data_list

解析 json 就比较简单了，只要做好异常处理即可。

因为评论中有很多 emoji 表情，可以使用正则过滤掉

1emoji_pattern = re.compile("["
2        u"\U0001F600-\U0001F64F"  # emoticons
3        u"\U0001F300-\U0001F5FF"  # symbols & pictographs
4        u"\U0001F680-\U0001F6FF"  # transport & map symbols
5        u"\U0001F1E0-\U0001F1FF"  # flags (iOS)
6                           "]+", flags=re.UNICODE)
7emoji_pattern1.sub(r'', str1)

最后保存数据到 csv 文件

最后得到的数据如下：

数据可视化分析

性别分布

我们先来看下评论者的性别分布是怎样的

可以看出，男性观众的比例还是多一些，不过大多数人都没有设置性别，隐私工作做得很不多哦

用户等级

不出所料，大部分都是 level-0的用户，普通大众最普通，天下何止千千万。

评分分布

看到结果之后扎心不，打分数量最多的是0分，不知道如果可以打负分，那么情况会是怎么样

评论词云

最后，我们再来做一个词云，看看评论中的高频词汇都有哪些

老规矩，不对评论做过多点评

不过还是忍不住要说一句，评论里面“好看”这个词出现的频率还是非常高的，看评论里有人说是水军，拿钱了，不知道你怎么看呢

最后给出完整代码

Part1：https://github.com/zhouwei713/douban/tree/master/jackchen

Part2：https://github.com/zhouwei713/data_analysis/tree/master/maoyan

如果你觉得文章还不错，请大家点赞分享下。你的肯定是我最大的鼓励和支持。

仔细阅读下面四篇文章，2小时快速掌握Python基础知识要点。

完整Python基础知识要点

学Python | 聊赚钱

你可能感兴趣的:(Python数说成龙电影 | 数据告诉你，成龙大哥真的老了吗)

python批量替换word内容_python win32com 库批量替换word文件内容 weixin_39657300
前言win32com模块主要为Python提供调用windows底层组件对word、Excel、PPT等进行操作的功能，只能在Windows环境下使用，并且需要安装office相关软件才行(WPS也行)。实例代码下方代码实现批量替换当前路径下word文档的指定文本内容。importwin32com.clientimportosimporttimedefupdate_replace(file):wo
python strip() 编号1993 python python
参考：http://www.jb51.net/article/37287.htm###############################s.strip(del)：在字符串s的开头结尾处，删除del中存在的字符s.lstrip(del)：在字符串s的开头处，删除del中存在的字符s.rstrip(del)：在字符串s的结尾处，删除del中存在的字符s='asdf'#前后均有空格s.strip(
Docker 数据卷与文件挂载 huingymm docker 容器运维
Docker数据卷与文件挂载的区别与管理指南在Docker中，数据卷（Volume）和文件挂载（BindMount）是两种常用的数据持久化方式。它们的主要目的是将容器内的数据保存到主机上，以便在容器重启或删除后数据不会丢失。本文将详细介绍数据卷和文件挂载的区别、使用方法以及管理技巧。目录数据卷与文件挂载的区别数据卷的使用创建数据卷挂载数据卷查看数据卷删除数据卷文件挂载的使用挂载主机目录挂载单个文件
记录一次truncate导致MySQL夯住的故障猿小喵 MySQL #故障诊断与恢复 #备份恢复 mysql 数据库
目录环境信息：故障描述：处理过程：原理分析：showprocesslist结果中的systemlock含义：truncate原理：1.TRUNCATE的执行流程2、TRUNCATE表导致数据库夯住的原因3、TRUNCATE表导致数据库夯住的解决方案4、killTRUNCATE语句失败后，主从数据不一致的原因：5、为什么TRUNCATETABLEusers会影响其他表的SQL6、为什么KILL语句无
Python调用WPS进行文档转换PDF及PDF转图片 IT孔乙己 python 开发语言后端
这里是利用WPS进行转换，要先安装WPS。安装依赖pipinstallpypiwin32代码#!/usr/bin/python#-*-coding:UTF-8-*-importosimportwin32com.clientdefConvertByWps(sourceFile,targetFile):ifnotos.path.exists(sourceFile):print(sourceFile+"
《数字时代的职场暗战：下班后的消息该不该回？》玩转数据库管理工具FOR DBLENS 项目管理数据库大数据数据库开发数据仓库
一、赛博朋克式职场：永不熄灭的手机屏幕凌晨1点，手机屏幕在床头柜上第7次亮起，弹出的消息提示像一把悬在空中的达摩克利斯之剑——市场部总监在项目群@全体成员核对数据，客户发来20条59秒的语音方阵。这种场景已成为当代职场人的集体记忆：某招聘平台数据显示，78%的职场人遭遇过非工作时间工作消息轰炸，其中32%因此产生焦虑症状。当钉钉提示音成为新的"午夜凶铃"，微信对话框化作24小时待命的电子镣铐，我们
《MySQL 入门教程》第 30 篇数据库索引不剪发的Tony老师 MySQL入门教程 mysql 索引 create index drop index
文章目录30.1创建索引30.2查看索引30.3修改索引30.4删除索引数据库索引（Index）就像书籍后面的关键字索引，按照关键字进行排序，并且提供了指向具体内容的页码。索引可以用于提高数据库的查询性能；但是索引需要占用额外的磁盘空间，修改数据时也需要进行索引的维护。了解并适当利用索引对于数据库的优化至关重要，本篇我们介绍MySQL索引的管理。关于B-树索引的原理以及利用索引优化SQL语句的详细
SpringBoot分布式架构下字典表设计与实战应用潘多编程 spring boot 分布式架构
在分布式系统中，字典表作为基础数据的核心载体，其设计合理性直接影响系统的扩展性和维护效率。本文将结合具体代码实例，深入讲解分布式环境下字典表的设计方案与实现细节。一、分布式环境下的字典表挑战数据一致性要求：多服务节点间的字典数据同步高并发访问压力：基础数据的频繁读取需求动态更新需求：业务运行时字典数据的热更新能力多级缓存策略：本地缓存与分布式缓存的协同工作二、技术方案设计架构图：[Client]-
linux+docker安装常见中间件+shell学习笔记芦屋花绘 linux docker 中间件
初始设置下载虚拟机软件：选择适合的虚拟机软件（如VirtualBox或VMware）。下载操作系统ISO映像文件：选择并下载你想安装的Linux发行版（例如Ubuntu、CentOS等）的ISO文件。ISO映像文件：是包含了完整光盘内容的文件，包含引导记录、文件系统、数据文件和目录结构。导入ISO文件到虚拟机，并进行相关配置，如分配内存、硬盘空间等。了解基本linuxLinux常见目录及其用途Li
Vue.js 模板语法全解析：从基础到实战应用予安灵前端 vue.js 前端 javascript vue生命周期 vue指令 vue项目结构 vue插值
引言在Vue.js的开发体系中，模板语法是构建用户界面的核心要素，它让开发者能够高效地将数据与DOM进行绑定，实现动态交互效果。通过对《Vue.js快速入门实战》中关于Vue项目部署章节（实际围绕Vue模板语法展开）的深入研读，我们将全面剖析Vue项目结构、应用程序实例、生命周期、插值、指令以及自定义指令等关键内容，并通过实战案例加深理解。1.Vue项目详解项目目录结构以常见的vite-app项目
Apache大数据旭哥优选大数据选题 Apache大数据旭大数据定制选题 java hadoop spark 开发语言 idea hive 数据库架构
定制旭哥服务，一对一，无中介包安装+答疑+售后态度和技术都很重要定制按需求做要求不高就实惠一点定制需提前沟通好怎么做，这样才能避免不必要的麻烦python、flask、Django、mapreduce、mysqljava、springboot、vue、echarts、hadoop、spark、hive、hbase、flink、SparkStreaming、kafka、flume、sqoop分析+推
C语言动态顺序表的实现しかし118114 数据结构数据库 c语言经验分享数据结构链表
目录（一）静态顺序表（二）动态顺序表顺序表是数据结构的入门，本篇文章将详细介绍动态顺序表的增删改补。我们先了解一下静态顺序表。（一）静态顺序表静态顺序表是顺序表的一种，由于静态顺序表的大小固定，很容易溢出或浪费空间，所以我们一般不用静态顺序表。所有顺序表的实现都是基于数组实现的，其实顺序表是顺序表的pro版，可以装更多的数据。#defineTypedataint//这里定义的顺序表是int类型的/
uniapp 和 webview 之间的通信 DT—— 其他 uni-app
1.背景应用使用了uniapp开发跨端应用，在uniapp中内嵌webview页面实现页面热更新效果，不需要用户单独重新安装软件即可实现页面的版本更新。2.webview通知uniapp在开发过程中我们难会遇到需要uniapp和webview来实现数据通信的场景，接下来介绍一种可行的uniapp和webview的数据通信方案。在webview中我们可以使用当前webview实例的postMessa
青少年编程与数学 02-011 MySQL数据库应用 10课题、记录的操作明月看潮生编程与数学第02阶段数据库青少年编程 mysql 编程与数学
青少年编程与数学02-011MySQL数据库应用10课题、记录的操作一、表的记录表的记录的组成示例插入记录查看记录记录的操作1.插入记录（INSERT）2.更新记录（UPDATE）3.删除记录（DELETE）4.查询记录（SELECT）记录的约束示例：带约束的表总结二、添加记录1.插入单条记录插入单条记录2.插入多条记录插入多条记录3.插入部分字段插入部分字段4.插入查询结果插入查询结果5.插入时
Python strip() 方法详解：用途、应用场景及示例解析（中英双语）阿正的梦工坊 Python python 开发语言
Pythonstrip()方法详解：用途、应用场景及示例解析在Python处理字符串时，经常会遇到字符串前后存在多余的空格或特殊字符的问题。strip()方法就是Python提供的一个强大工具，专门用于去除字符串两端的指定字符。本文将详细介绍strip()的用法、适用场景，并通过多个示例解析其应用。1.strip()方法简介strip()方法用于去除字符串两端的指定字符（默认为空格和换行符）。它的
6.5840 Lab 2: Key/Value Server idMiFeng github go
在这个实验中，你将构建一个单机版的键值服务器，该服务器能够确保每个操作在网络故障的情况下依然能被精确地执行一次，并且这些操作是线性化的。在后续实验中，你将实现类似的服务器以支持服务器崩溃的情况下进行复制。客户端可以向键值服务器发送三种不同的RPC调用：Put(key,value)、Append(key,arg)和Get(key)。服务器维护一个内存中的键值映射，键和值均为字符串：Put(key,v
C++徒手造国密SM算法！码农の头发消失术实录 skyksksksksks C++个人杂记物联网国密算法国密算法密码学 c++开发语言
【开场暴击：程序员的修仙之路】各位在秃头边缘疯狂试探的代码战士！今天我们要挑战史诗级成就——用纯C++手搓国家密码管理局钦定的SM2/SM3/SM4算法！没有现成库！没有外挂！只有头铁和即将离你而去的头发！(ง•̀_•́)ง【SM2加密：和椭圆曲线谈恋爱の玄学】这玩意儿就像追女神——你永远猜不透她的心思！来看加密の奥义三连：SM2加密vs追妹子对比表行为SM2加密流程追妹子流程第一步生成随机数k制
[ Linux 命令基础 ] Linux 命令大全-命令前置知识-系统管理-文件和目录管理-文本处理命令-网络管理命令-权限和用户管理命令-磁盘管理命令 _PowerShell shell脚本入门到精通 Linux 命令大全 linux命令前置知识 linux系统管理 linux文件和目录管理 linux文本处理命令 linux网络管理命令 linux权限和用户管理命令
博主介绍‍博主介绍：大家好，我是_PowerShell，很高兴认识大家~✨主攻领域：【渗透领域】【数据通信】【通讯安全】【web安全】【面试分析】点赞➕评论➕收藏==养成习惯（一键三连）欢迎关注一起学习一起讨论⭐️一起进步文末有彩蛋作者水平有限，欢迎各位大佬指点，相互学习进步！我们搞网络安全需要经常用到linux命令，比用拿到linux的shell，需要使用linux命令。再比如sh脚本，我们经常
使用Python连接SqlServer 带带琪宝工作日记 python sqlserver 开发语言
目录cursor()execute('sqlstr')fetchall()、fetchone()cursor.description属性close()转化为dataframe进行分析使用的是pymssql库，这个库的详细用法参照博客（博客里也有官方文档，英语好的可以直接看）：pythonpymssql—pymssql模块使用指南_夏日白云的博客-CSDN博客我目前的需求只是使用Python连接数据
Python连接SQL SEVER数据库全流程 m0_74823131 数据库 python sql
背景介绍在数据分析领域，经常需要从数据库中获取数据进行分析和处理。而SQLServer是一种常用的关系型数据库管理系统，因此学习如何使用Python连接SQLServer数据库并获取数据是非常有用的。以下是Python使用pymssql连接SQLServer数据库的全流程：安装pymssql库本地账号设置脚本连接数据导入函数实现一、安装pymssqlpymssql是Python连接SQLServe
使用pygame开发一个小游戏 k_e_e_p pygame python 开发语言
学习了pygame，身为一个IKUN所以，做了一个简单的小游戏。游戏规则是，使用键盘的方向键控制坤坤，当坤坤触碰到篮球，就会爆发出音乐”只因你太美“。代码如下：importrandomimportsysimportpygamepygame.init()screen=pygame.display.set_mode((495,299))pygame.display.set_caption("篮球和鸡"
C++ 用ECC算法 Curve为EC_NIST_FP_521写个示例签名和验签。PCI认证小黄人软件经验分享 ssl 学习
以下是一个使用OpenSSL实现ECC(椭圆曲线密码)签名和验签的C++示例，曲线使用secp521r1（即NISTP-521）。这个程序：生成NISTP-521曲线的EC密钥。使用SHA-512进行哈希并签名数据。验证签名的正确性。编译：g++-oecc_signecc_sign.cpp-lssl-lcrypto运行：./ecc_sign你可以试试看，看看签名和验签是否成功！
Redis中的数据类型与适用场景 cooldream2009 数据库 redis 数据库缓存
目录前言1.字符串(String)1.1特点1.2适用场景2.哈希(Hash)2.1特点2.2适用场景3.列表(List)3.1特点3.2适用场景4.集合(Set)4.1特点4.2适用场景5.有序集合(SortedSet)5.1特点5.2适用场景6.Redis数据类型的选型建议结语前言Redis作为一款高性能的内存数据库，以其卓越的速度和丰富的数据类型广泛应用于各类高并发场景。相较于传统的关系型数
StockTV 全球股票、外汇、期货、加密货币 API 接口文档详解 CryptoRzz python 金融数据分析 java websocket
概述StockTV提供了全球范围内的股票、外汇、期货和加密货币的实时数据接口，支持HTTP和WebSocket两种对接方式。本文将详细介绍如何使用StockTV的API接口获取实时数据，并重点介绍印度数据源的使用。接口文档1.获取Key在使用StockTV的API接口之前，您需要先获取一个Key。请通过以下方式联系我们获取Key：联系我们获取Key2.调用API在调用API时，请将获取到的Key添
AI大模型训练教程 Small踢倒coffee_氕氘氚 python自学经验分享笔记
1.引言随着人工智能技术的快速发展，大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。训练一个大模型需要大量的计算资源、数据和专业知识。本教程将带你了解如何从零开始训练一个AI大模型。2.准备工作2.1硬件要求GPU：推荐使用NVIDIA的高性能GPU，如A100、V100等。内存：至少64GBRAM。存储：SSD存储，至少1TB。#2.2软件环境操作系统：Lin
Redis大key 不7夜宵 redis bootstrap 数据库
Redis大key基本概念，影响Redis大key指在Redis中存储了大量数据的键，它会对Redis的性能和内存管理产生影响。大key的定义与value的大小和元素数量有关，但这个定义并不是绝对的，而是相对的，具体取决于系统的使用场景和性能要求。大key通常有以下两种情况：Value存储占用空间大集合类型的Key中元素过多![[Pastedimage20250227151208.png]]造成的
并发安全的sync.Map 不7夜宵基础知识后端
对于并发读写map的情况下，map的数据会被写乱造成panic。Go语言原生map并不是线程安全的，因此对它进行并发读写操作时需要加锁。但是当操作频繁且要求性能的情况下，锁的优化已经无法满足业务需求，考虑到互联网应用通常是读多写少的场景，Golang的标准库提供了一个特殊的并发安全的map实现，为了与原生map区分，人们习惯性称为sync.map。一、sync.map与map的区别1.并发安全sy
编写简单的小程序又熟了 Python入门学习 python flask
编写简单的小程序文章目录编写简单的小程序1.turtle的认识与使用1.1turtle常用的函数1.2用turtle画小蛇1.3begin_fill和end_fill绘制太阳花2.变量2.1变量的创建2.2命名规则2.3保留字及查看方法3.运算符3.1算数运算符3.2关系运算符3.3逻辑运算符4.注释与缩进5.赋值语句6.输出与输入7.数据类型7.1字符串的索引7.2列表8.字符编码8.2乱码问题
后端登录校验(一）——会话技术 develop_lost 服务器运维
一、登录校验1.什么是登录校验登录校验是服务器端对浏览器端（就是客户端）发送的请求进行校验。校验用户的登录情况，如果用户已经登录，则允许进行用户需要的业务操作，反之则禁止用户操作业务操作，并返回给用户一个错误的提示，让客户端跳转到的登录页面，进行登录操作。2.如何进行登录校验-先认清http协议：http协议是无状态协议，无状态是客户端的每一次请求都是独立的，这次的请求不会携带上一次的数据，服务器
Java后端开发技术详解小二爱编程· java 开发语言
Java作为一门成熟的编程语言，已广泛应用于后端开发领域。其强大的生态系统和广泛的支持库使得Java成为许多企业和开发者的首选后端开发语言。随着云计算、微服务架构和大数据技术的兴起，Java后端开发的技术栈也不断演进。本文将详细介绍Java后端开发的核心技术，包括Java基础、常见框架、数据库操作、缓存技术、异步编程等。1.Java基础：理解面向对象的编程Java是一种面向对象的编程语言，面向对象
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他