Python中文社区

20秒看懂中国大学10年排行榜变迁

数据科学俱乐部

中国数据科学家社区

♚

作者：苏克，零基础转行python爬虫与数据分析

博客：https://www.makcyun.top

摘要：：最近在朋友圈看到一个很酷炫的动态数据可视化表，介绍了新中国成立后各省GDP的发展历程，非常惊叹竟然还有这种操作，也想试试。于是，照葫芦画瓢虎，在网上爬取了历年中国大学学术排行榜，制作了一个中国大学排名Top20强动态表。

1. 作品介绍

这里先放一下这个动态表是什么样的：

不知道你看完是什么感觉，至少我是挺震惊的，想看看作者是怎么做出来的，于是追到了作者的B站主页，发现了更多有意思的动态视频：

这些作品的作者是：@Jannchie见齐，他的主页：https://space.bilibili.com/1850091/#/video

这些会动的图表是如何做出来的呢？他用到的是一个动态图形显示数据的JavaScript库：D3.js，一种前端技术。难怪不是一般地酷炫。
那么，如果不会D3.js是不是就做不出来了呢？当然不是，Jannchie非常Open地给出了一个手把手的简单教程：
https://www.bilibili.com/video/av28087807

他同时还开放了程序源码，你只需要做2步就能够实现：

到他的Github主页下载源码到本地电脑：
https://github.com/Jannchie/Historical-ranking-data-visualization-based-on-d3.js
打开dist文件夹里面的exampe.csv文件，放进你想要展示的数据，再用浏览器打开bargraph.html网页，就可以实现动态效果了。

下面，我们稍微再说详细一点，实现这种效果的关键点是要有数据。观察一下上面的作品可以看到，横向柱状图中的数据要满足两个条件：一是要有多个对比的对象，二是要在时间上连续。这样才可以做出动态效果来。

看完后我立马就有了一个想法：想看看近十年中国的各个大学排名是个什么情况。下面我们就通过实例来操作下。

2. 案例操作：中国大学Top20强

2.1. 数据来源

世界上最权威的大学排名有4类，分别是：

原上海交通大学的ARWU
http://www.shanghairanking.com/ARWU2018.html
英国教育组织的QS
https://www.topuniversities.com/university-rankings/world-university-rankings/2018
泰晤士的THE
https://www.timeshighereducation.com/world-university-rankings
美国的usnews
https://www.usnews.com/best-colleges/rankings

关于，这四类排名的更多介绍，可以看这个：
https://www.zhihu.com/question/20825030/answer/71336291

这里，我们选取相对比较权威也比较符合国情的第一个ARWU的排名结果。打开官网，可以看到有英文版和中文版排名，这里选取中文版。排名非常齐全，从2003年到最新的2018年都有，非常好。

同时，可以看到这是世界500强的大学排名，而我们需要的是中国（包括港澳台）的大学排名。怎么办呢？当然不能一年年地复制然后再从500条数据里一条条筛选出中国的，这里就要用爬虫来实现了。可以参考不久前的一篇爬取表格的文章：
10行代码爬取全国所有A股/港股/新三板上市公司信息

2.2. 抓取数据

2.2.1. 分析url

首先，分析一下URL:

1http://www.zuihaodaxue.com/ARWU2018.html
2http://www.zuihaodaxue.com/ARWU2017.html
3...
4http://www.zuihaodaxue.com/ARWU2009.html

可以看到，url非常有规律，只有年份数字在变，很简单就能构造出for循环。
格式如下：

1url = 'http://www.zuihaodaxue.com/ARWU%s.html' % (str(year))

下面就可以开始写爬虫了。

2.2.2. 获取网页内容

 1import requests
 2try:
 3    url = 'http://www.zuihaodaxue.com/ARWU%s.html' % (str(year))
 4    response = requests.get(url,headers = headers)
 5    # 2009-2015用'gbk'，2016-2018用'utf-8'
 6    if response.status_code == 200:
 7        # return response.text  # text会乱码，content没有问题
 8        return response.content
 9    return None
10except RequestException:
11print('爬取失败')

上面需要注意的是，不同年份网页采用的编码不同，返回response.test会乱码，返回response.content则不会。关于编码乱码的问题，以后单独写一篇文章。

2.2.3. 解析表格

用read_html函数一行代码来抓取表格，然后输出：

1tb = pd.read_html(html)[0]
2print(tb)

可以看到，很顺利地表格就被抓取了下来：

但是表格需要进行处理，比如删除掉不需要的评分列，增加年份列等，代码实现如下：

 1tb = pd.read_html(html)[0]
 2# 重命名表格列，不需要的列用数字表示
 3tb.columns = ['world rank','university', 2,3, 'score',5,6,7,8,9,10]
 4tb.drop([2,3,5,6,7,8,9,10],axis = 1,inplace = True)
 5# 删除后面不需要的评分列
 6# rank列100名后是区间，需需唯一化，增加一列index作为排名
 7tb['index_rank'] = tb.index
 8tb['index_rank'] = tb['index_rank'].astype(int) + 1
 9
10# 增加一列年份列
11tb['year'] = i
12# read_html没有爬取country，需定义函数单独爬取
13tb['country'] = get_country(html)
14return tb

需要注意的是，国家没有被抓取下来，因为国家是用的图片表示的，定位到国家代码位置：

可以看到美国是用英文的USA表示的，那么我们可以单独提取出src属性，然后用正则提取出国家名称就可以了，代码实现如下：

 1# 提取国家名称
 2def get_country(html):
 3    soup = BeautifulSoup(html,'lxml')
 4    countries = soup.select('td > a > img')
 5    lst = []
 6    for i in countries:
 7        src = i['src']
 8        pattern = re.compile('flag.*/(.*?).png')
 9        country = re.findall(pattern,src)[0]
10        lst.append(country)
11    return lst

然后，我们就可以输出一下结果：

 1    world rank    university  score  index_rank  year      country
 20            1          哈佛大学  100.0           1  2018          USA
 31            2         斯坦福大学   75.6           2  2018          USA
 42            3          剑桥大学   71.8           3  2018           UK
 53            4        麻省理工学院   69.9           4  2018          USA
 64            5      加州大学-伯克利   68.3           5  2018          USA
 75            6        普林斯顿大学   61.0           6  2018          USA
 86            7          牛津大学   60.0           7  2018           UK
 97            8        哥伦比亚大学   58.2           8  2018          USA
108            9        加州理工学院   57.4           9  2018          USA
119           10         芝加哥大学   55.5          10  2018          USA
1210          11      加州大学-洛杉矶   51.2          11  2018          USA
1311          12         康奈尔大学   50.7          12  2018          USA
1412          12          耶鲁大学   50.7          13  2018          USA
1513          14     华盛顿大学-西雅图   50.0          14  2018          USA
1614          15     加州大学-圣地亚哥   47.8          15  2018          USA
1715          16       宾夕法尼亚大学   46.4          16  2018          USA
1816          17        伦敦大学学院   46.1          17  2018           UK
1917          18      约翰霍普金斯大学   45.4          18  2018          USA
2018          19     苏黎世联邦理工学院   43.9          19  2018  Switzerland
2119          20    华盛顿大学-圣路易斯   42.1          20  2018          USA
2220          21      加州大学-旧金山   41.9          21  2018          USA

数据很完美，接下来就可以按照D3.js模板中的example.csv文件的格式作进一步的处理了。

2.3. 数据处理

这里先将数据输出为university.csv文件，结果见下表：

10年一共5011行×6列数据。接着，读入该表作进一步数据处理，代码如下：

 1df = pd.read_csv('university.csv')
 2# 包含港澳台
 3# df = df.query("(country == 'China')|(country == 'China-hk')|(country == 'China-tw')|(country == 'China-HongKong')|(country == 'China-Taiwan')|(country == 'Taiwan,China')|(country == 'HongKong,China')")[['university','year','index_rank']]
 4
 5# 只包括内地
 6df = df.query("(country == 'China')")
 7df['index_rank_score'] = df['index_rank']
 8# 将index_rank列转为整形
 9df['index_rank'] = df['index_rank'].astype(int)
10
11# 美国
12# df = df.query("(country == 'UnitedStates')|(country == 'USA')")
13
14#求topn名
15def topn(df):
16    top = df.sort_values(['year','index_rank'],ascending = True)
17    return top[:20].reset_index()
18df = df.groupby(by =['year']).apply(topn)
19
20# 更改列顺序
21df = df[['university','index_rank_score','index_rank','year']]
22# 重命名列
23df.rename (columns = {'university':'name','index_rank_score':'type','index_rank':'value','year':'date'},inplace = True)
24
25# 输出结果
26df.to_csv('university_ranking.csv',mode ='w',encoding='utf_8_sig', header=True, index=False)
27# index可以设置

上面需要注意两点：

可以提取包含港澳台在内的大中华区所有的大学，也可以只提取内地的大学，还可以提取世界、美国等各种排名。
定义了一个求Topn的函数，能够按年份分别求出各年的前20名大学名单。

打开输出的university_ranking.csv文件：

结果非常好，可以直接作为D3.js的导入文件了。

2.3.1. 完整代码

将代码再稍微完善一下，完整地代码如下所示：

  1import pandas as pd
  2import csv
  3import requests
  4from requests.exceptions import RequestException
  5from bs4 import BeautifulSoup
  6import time
  7import re
  8
  9start_time = time.time()  #计算程序运行时间
 10# 获取网页内容
 11def get_one_page(year):
 12        try:
 13            headers = {
 14                'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.181 Safari/537.36'
 15            }
 16            # 英文版
 17            # url = 'http://www.shanghairanking.com/ARWU%s.html' % (str(year))
 18            # 中文版
 19            url = 'http://www.zuihaodaxue.com/ARWU%s.html' % (str(year))
 20            response = requests.get(url,headers = headers)
 21            # 2009-2015用'gbk'，2016-2018用'utf-8'
 22            if response.status_code == 200:
 23                # return response.text  # text会乱码，content没有问题
 24                # https://stackoverflow.com/questions/17011357/what-is-the-difference-between-content-and-text
 25                return response.content
 26            return None
 27        except RequestException:
 28            print('爬取失败')
 29
 30# 解析表格
 31def parse_one_page(html,i):
 32        tb = pd.read_html(html)[0]
 33        # 重命名表格列，不需要的列用数字表示
 34        tb.columns = ['world rank','university', 2,3, 'score',5,6,7,8,9,10]
 35        tb.drop([2,3,5,6,7,8,9,10],axis = 1,inplace = True)
 36        # 删除后面不需要的评分列
 37
 38        # rank列100名后是区间，需需唯一化，增加一列index作为排名
 39        tb['index_rank'] = tb.index
 40        tb['index_rank'] = tb['index_rank'].astype(int) + 1
 41        # 增加一列年份列
 42        tb['year'] = i
 43        # read_html没有爬取country，需定义函数单独爬取
 44        tb['country'] = get_country(html)
 45        # print(tb) # 测试表格ok
 46        return tb
 47        # print(tb.info()) # 查看表信息
 48        # print(tb.columns.values) # 查看列表名称
 49
 50# 提取国家名称
 51def get_country(html):
 52    soup = BeautifulSoup(html,'lxml')
 53    countries = soup.select('td > a > img')
 54    lst = []
 55    for i in countries:
 56        src = i['src']
 57        pattern = re.compile('flag.*/(.*?).png')
 58        country = re.findall(pattern,src)[0]
 59        lst.append(country)
 60    return lst
 61    # print(lst) # 测试提取国家是否成功ok
 62
 63# 保存表格为csv
 64def save_csv(tb):
 65    tb.to_csv(r'university.csv', mode='a', encoding='utf_8_sig', header=True, index=0)
 66
 67    endtime = time.time()-start_time
 68    # print('程序运行了%.2f秒' %endtime)
 69
 70def analysis():
 71    df = pd.read_csv('university.csv')
 72    # 包含港澳台
 73    # df = df.query("(country == 'China')|(country == 'China-hk')|(country == 'China-tw')|(country == 'China-HongKong')|(country == 'China-Taiwan')|(country == 'Taiwan,China')|(country == 'HongKong,China')")[['university','year','index_rank']]
 74    # 只包括内地
 75    df = df.query("(country == 'China')")
 76
 77    df['index_rank_score'] = df['index_rank']
 78    # 将index_rank列转为整形
 79    df['index_rank'] = df['index_rank'].astype(int)
 80    # 美国
 81        # df = df.query("(country == 'UnitedStates')|(country == 'USA')")
 82    #求topn名
 83    def topn(df):
 84        top = df.sort_values(['year','index_rank'],ascending = True)
 85        return top[:20].reset_index()
 86    df = df.groupby(by =['year']).apply(topn)
 87    # 更改列顺序
 88    df = df[['university','index_rank_score','index_rank','year']]
 89    # 重命名列
 90    df.rename (columns = {'university':'name','index_rank_score':'type','index_rank':'value','year':'date'},inplace = True)
 91
 92    # 输出结果
 93    df.to_csv('university_ranking.csv',mode ='w',encoding='utf_8_sig', header=True, index=False)
 94    # index可以设置
 95
 96def main(year):
 97    # generate_mysql()
 98    for i in range(2009,year):  #抓取10年
 99        # get_one_page(i)
100        html = get_one_page(i)
101        # parse_one_page(html,i)  # 测试表格ok
102        tb = parse_one_page(html,i)
103        save_csv(tb)
104        print(i,'年排名提取完成完成')
105        analysis()
106# # 单进程
107if __name__ == '__main__':
108    main(2019)
109    # 2016-2018采用gb2312编码，2009-2015采用utf-8编码

至此，我们已经有university_ranking.csv基础数据，下面就可以进行可视化呈现了。

2.4. 可视化呈现

首先，到作者的github主页：
https://github.com/Jannchie/Historical-ranking-data-visualization-based-on-d3.js

2.4.1. 克隆仓库文件

如果你平常使用github或者Git软件的话，那么就找个合适文件存放目录，然后直接在 GitBash里分别输入下面3条命令就搭建好环境了：

1# 克隆项目仓库
2git clone https://github.com/Jannchie/Historical-ranking-data-visualization-based-on-d3.js
3# 切换到项目根目录
4cd Historical-ranking-data-visualization-based-on-d3.js
5# 安装依赖
6npm install

如果你此前没有用过上面的软件，你可以直接点击Download Zip下载下来然后解压即可，不过还是强烈建议使用第一种方法，因为后面如果要自定义可视化效果的话，需要修改代码然后执行npm run build命令才能够看到效果。

2.4.2. 效果呈现

好，所有基本准备都已完成，下面就可以试试看效果了。
任意浏览器打开bargraph.html网页，点击选择文件，然后选择前面输出的university_ranking.csv文件，看下效果：

可以看到，有了大致的可视化效果，但还存在很多瑕疵，比如：表顺序颠倒了、字体不合适、配色太花哨等。可不可以修改呢？当然是可以的，只需要分别修改文件夹中这几个文件的参数就可以了：

config.js 全局设置各项功能的开关，比如配色、字体、文字名称、反转图表等等功能；
color.css 修改柱形图的配色；
stylesheet.css 具体修改配色、字体、文字名称等的css样式；
visual.js 更进一步的修改，比如图表的透明度等。

知道在哪里修改了以后，那么，如何修改呢？很简单，只需要简单的几步就可以实现：

打开网页，右键-检查，箭头指向想要修改的元素，然后在右侧的css样式表里，双击各项参数修改参数，修改完元素就会发生变化，可以不断微调，直至满意为止。
把参数复制到四个文件中对应的文件里并保存。
Git Bash运行npm run build，之后刷新网页就可以看到优化后的效果。

最后，再添加一个合适的BGM就可以了。以下是我优化之后的效果：

BGM：ツナ覚醒

如果你不太会调整，没有关系，我会分享优化后的配置文件。

以上，就是实现动态可视化表的步骤。同样地，只要更改数据源可以很方便地做出世界、美国等大学的动态效果，可以看看：
中国（含港澳台）大学排名：
http://pc1lljdwb.bkt.clouddn.com/Greater_China_uni_ranking.mp4
美国大学排名：
http://pc1lljdwb.bkt.clouddn.com/USA_uni_ranking.mp4

文章所有的素材可以到我的github下载：
https://github.com/makcyun/web_scraping_with_python
感兴趣的话就动手试试吧。

Python中文社区作为一个去中心化的全球技术社区，以成为全球20万Python中文开发者的精神部落为愿景，目前覆盖各大主流媒体和协作平台，与阿里、腾讯、百度、微软、亚马逊、开源中国、CSDN等业界知名公司和技术社区建立了广泛的联系，拥有来自十多个国家和地区数万名登记会员，会员来自以公安部、工信部、清华大学、北京大学、北京邮电大学、中国人民银行、中科院、中金、华为、BAT、谷歌、微软等为代表的政府机关、科研单位、金融机构以及海内外知名公司，全平台近20万开发者关注。

Python中文社区公众号底部回复“内推”

获取一周内推技术职位清单

▼ 点击下方阅读原文，免费成为社区会员

2021-12-02 13李柳欣
Unit3Part11，从本单元中我学到的最重要的理念（精读和视听说分别总结）精读:浪漫的故事，不能只看外表视听说:感受到了一些地方的美丽2，我在本片文章／音频／视频中学到的怦然心动的单词（精读和视听说分别总结）精读:单词短语在一块单词短语在一块视听说:单词短语在一块3，在本片文章／音频／视频中我最喜欢的一句话（精读和视听说分别总结）精读:Thetruenatureofaheartisseenin
在家做的手工兼职有什么在家做什么能赚钱氧惠购物达人
有哪些可以在家做的手工兼职呢，在家做什么能赚钱呢，下面小编为大家提供可以在家做的赚钱工作，仅供大家参考，希望大家选择一个好的项目。购物、看电影、点外卖、用氧惠APP！更优惠！氧惠（全网优惠上氧惠）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面，送1:1超级补贴(邀请好友自购多少，你就推广得多少，非常厉害)，欢迎各位团队长体验！也期待你的加入。氧惠邀请码888999
2019-11-11晨间日记麦新
今天是什么日子起床：6:00就寝：23:00天气：晴朗心情：平静纪念日：节日快乐叫我起床的不是闹钟是梦想年度目标及关键点：国考考研本月重要成果：学习今日三只青蛙/番茄钟开营分班处置一天成功日志-记录三五件有收获的事务开营分班处置一天财务检视-12邮费人际的投入链接新朋友开卷有益-学习/读书/听书《被忽视的孩子》健康与饮食今日步数：10000+好习惯打卡早晚打卡阅读打卡听书打卡社群打卡
与雨轩的对话（基于名次下降的对话，之前的对话用焦点讨论进行分析）子浩竣
师：我看到你的现在的班级位次是116名，你学期初的位次是：生：105（事实性问题：名次下降）师：是什么原因导致下降了呢？生：不用心师：还有呢？生：不勤奋（感觉绕开了反应性层面，直接回归到解释性层面，自己为什么下意识的绕开呢？反思：在教练式对话中，突然感觉自己对感受层面的问题没怎么共鸣点，是不是暴露出自己的情商需要改善？生活中感觉确实有这点）师：不勤奋，不用心，我感觉你自己也不着急。生：都急死了师：
未来可期2022-06-11 九九聊
清晨，马路上非常清新，许是昨天的雨把所有的阴霾都扫去了吧？走着路上的脚步变得非常轻快。回忆这四个月来的晨读，有过退缩的想法，有过放弃的想法，但最终一直坚持下来，没事落下一堂课，虽然没有把所学知识及时落下去，但一直在做，一直在进步。因为不是科班出身，所以系统性的执行有些不足，虽然学习了时间管理，但时间管理的精髓还没有真正落地。后面的路还有很长要走。但是我发现自己的潜能正在慢慢的激发出来，接下来我将梳
镇魂街：天生为王怎么玩才厉害？教你如何当托申请内部号。会飞滴鱼儿
今天我告诉大家一个可以申请内部号的平台，直接比返利号牛逼10倍不止，最近几年出现特别多的手游平台。每个平台的福利的各不相同，但是本质是一样的，就给点礼包，首充什么的。感觉毫无卵用就在上个月，经一个游戏行业的朋友介绍，了解到了一个平台“游人特权站”，特别NB。这个平台给的是内部号，什么是内部号？说白了就是托号。进服就会给300-500的充值扶持，v7-12的vlp等级扶持，另外内部号充值100能得到
榴莲什么时候吃是应季？榴莲不能和什么一起吃？金钱保卫科长
榴莲应季食用指南榴莲作为热带水果之王，其最佳食用时期集中在每年的7月至9月。在这段时间内，榴莲经历了充足的阳光照射和适宜的温度，使得果肉饱满、糖分含量高、口感醇厚，品质达到了一年中的巅峰状态。因此，如果你热爱榴莲的独特风味，那么在7-9月间品尝，将更能享受到榴莲的绝佳风味和营养价值。【独家福利】主流网购平台无门槛红包+大额优惠券入口https://www.chaojiyouhui榴莲不宜搭配的食物
2018-06-03 佟色青青
*公交*小记——佟色青青今年的夏天，又一如继往地颠簸在公交车上。途经菜市场就上来几位乘客，涮卡器连续地报数着:老年卡……可最后者却报成“余额不足”。只听得公交车师机低声地说:您投一元吧，卡没费了！“谁说没费，昨天去观音庙还有的，国家给我们老年人办卡就是为了，不花钱乘车见，他妈的……”这无理不饶人的粗语，惊得四座都投去了诧异的目光。师机无奈地重申道:不是说公交卡办了就可以无偿乘一辈子公交，里面的费刷
2019-11-26 f27835563ce4
构建和谐校园蓝天和白云的心一样,希望白鸽自由翱翔.老师和父母的心一样,希望我们健康成长.花开的日子我们走进校园这个快乐的地方,在平安校园愉快歌唱;花开的日子我们愿意用心情的音符,去谱写和谐校园的欢乐章.和谐是我国传统文化中具有代表性的观念,实现和谐,是古往今来人类孜孜以求的美好理想和愿望.而调动一切积极因素构建和谐文明的校园环境也将是一个永恒的主题.构建和谐校园需建立和谐师生关系.是老师给我们文化
鸡飞狗跳的日常2 岁岁ya
女生应该都喜欢事事有回应件件有着落去年过生日王洁他们没有发手机，王洁没有给我说一声生日快乐我有点不开心（当然我也知道他也肯定心里想着我的）昨天我过生日前天晚上他们发手机的时候他跟我说要等我生日到了跟我说一声生日快乐再睡觉后来因为手机查的太严没能玩昨天晚上也没有发手机我就等了他一天晚上10点多的时候我就瞌睡的不行了后来我又觉得他肯定会想办法玩手机找我的我就把手机声音开了然后我就睡觉了昨天晚上11点半
2023-05-07 田间识字翁_cc0f
晚归王玉孚吉林朝出日初起，晚归鸟歇啼。我本耕耘者，日落而自栖。风尘数十年，已成老面黧。气暖正宜播，每每事田畦。入村闻香至，邻曲煮藿藜。园圃逢时节，蔬蔌亦萋萋。樱花初看落，阶草始欲齐。是非了不问，佳句还自题。深知无所能，讵令富贵迷。堪笑邻家妇，羞作翁子妻。
474天，日精进，只为目标达成找方法！吕You
大家好，我是英丽今天是我的日精进行动第474天，和大家分享我今天的进步，我们互相勉励，携手前行。每天进步一点点，距离成功便不远。2018年经营模式升级，为您的企业打造三个统一：统一形象（广告视觉产品）统一符号（企业形象设计）统一思想（文化标准建设）1、比学习:准备互助会的过程里，学习统筹的运作的重要性，作为主管人员的安排与协调能力很有必要，全局观念让我们感受到不同的人放在不同的位置上，会更有价值，
简单的力量，穿越复杂正确做事曹玲_3ad8
简单的力量多年来，“简单”从来没有表扬之意。“头脑简单”的意义完全是负面的，它的意思是你笨、容易被骗或低能。难怪人们害怕简单。耶鲁大学人类关系学院的心理学家约翰·科勒德描述了七种常见的恐惧：对失败的恐惧对性的恐惧对自卫的恐惧对信任他人的恐惧对思考的恐惧对演讲的恐惧对独处的恐惧看起来，不简单或不寻求简单解决方案，源于“对思考的恐惧”。问题是我们不自己考虑问题，却在依赖他人的思考，这就是全球管理咨询业
认识时间教学反思真真_3e13
认识时间教学反思今天是认识时间，这个单元坚持一周的日子，从上周五到今天整整一周的时间在学习二年级上册认识时、分、几时几分和简单的解决问题。在今天下午的测试中，通过孩子们的共同错误的，我有一下几点反思：共同错误点：看到时针指向几就是几时错误示例有时候眼睛看到的不一定是真相。上面这个题看着时针指向9，就误认为是九时多，其实这是错误的，在一年级认识钟表中就学习了，当分针在12的左边时是会几时了，所以打通
2007. 从双倍数组中还原原数组
【算法题解析】还原双倍数组—从打乱的数组恢复原数组题目描述给定一个整数数组changed，该数组是通过对一个原始数组original的每个元素乘以2并打乱顺序后得到的。你的任务是判断给定的changed是否为某个original数组的双倍数组，并返回该原数组。具体来说，存在一个数组original，使得对original中的每个元素x，changed中都包含x和2*x两个元素（顺序可能被打乱）。如
倒计时一天曲晓彤
开工作室摄影在齐河新家。或者买个别的房子或者嘉和馨园挑战一下自己多学习^^一年半时间瘦到150140生祥云
Redis Desktop Manager 0.8.8.384 安装教程（下载安装+快捷方式设置+包含安装包） IDOlaoluo redis 数据库缓存
1.下载安装包先去官网或者靠谱的下载站找到这个版本的安装包（文件名就是redis-desktop-manager-0.8.8.384.exe），双击它开始安装。提供安装包下载：https://pan.quark.cn/s/6d1054394b3d2.开始安装向导双击后弹出一个安装界面，直接点“Next”（下一步）就行。3.同意协议会看到一个用户协议，勾选“Iaccepttheagreement”（
盘点好物分享，薅羊毛好用的软件，2024受欢迎的好物分享赚钱软件日常购物技巧呀
如今，越来越多的人通过好物分享来赚取一份额外的收入。好物分享不仅能满足消费者的购物需求，还能为分享者带来丰厚的利润，薅羊毛群，0元撸纸巾，捡漏群等，本文将介绍几款优秀的赚钱好物分享软件，并深入探讨高省app的返利优势，为您提供赚钱好物分享的指南。赚钱好物分享软件的兴起随着社交媒体的普及和购物需求的增加，越来越多的人开始利用好物分享赚钱。好物分享软件应运而生，为用户提供了一个展示、分享和推广自己喜爱
齐秦为何错过了王祖贤素颜出镜
1987年7月，王祖贤拍摄《芳草碧连天》时，遇到男主角齐秦。不过那时候两个人，互相看对方不顺眼。齐秦当时已经在歌坛有一定名气和地位，身边漂亮的女孩子前仆后继，他根本用不着讨好谁，也用不着给谁好脸色，那些女孩都愿意停留在他的身边。而王祖贤和齐秦认识的所有女孩都不一样，她在娱乐圈见过太多的男人，有用心追求她的，有真心喜欢她的，所以她根本就没有把花花公子一样的齐秦看到眼里。导演特意给两个人创造认识的机会
摘：剽悍一只猫《2020破局分享暨新书发布会》----“日拱一卒，实力不俗” a阿铠
听完剽悍一只猫分享其中一句话“日拱一卒，实力不俗”印象最深了，会下象棋的都知道“卒”也“兵”也，未过界河之前只能向前走不能向后或左右行走，表现出一个“卒”的一往无前的本能，过了界河之后就可以横着走了，但也不能退后，表现出一个“卒”的变通，但还是没有丢勇往直前的势头，卒行走只能一步一步来，表现出稳扎稳打步步为营，一个小“卒”也能捉“将”的，这也体现出卒虽小也不能做大事。卒虽小可以给当炮的垫脚石，充分
C++内存管理
1.C/C++内存分布我们先来看这样的一道题：intglobalVar=1;staticintstaticGlobalVar=1;voidTest(){staticintstaticVar=1;intlocalVar=1;intnum1[10]={1,2,3,4};charchar2[]="abcd";constchar*pChar3="abcd";int*ptr1=(int*)malloc(si
前端性能优化“核武器”：新一代图片格式(AVIF/WebP)与自动化优化流程实战
前端性能优化“核武器”：新一代图片格式(AVIF/WebP)与自动化优化流程实战当你的页面加载时间超过3秒时，用户的跳出率会飙升到40%以上。而在所有的前端性能优化手段中，图片优化无疑是投入产出比最高的一环。一张未经优化的巨大图片，就足以让你的所有努力付诸东流。然而，很多开发者对图片优化的理解还停留在“压缩一下JPG”的阶段。实际上，我们已经进入了一个由WebP和AVIF主导的新时代。这两种新一代
你知道哪些淘宝优惠券返利 App 拥有最高的返利率吗？值得推荐的淘宝优惠券返利 App 排行榜！浮沉导师
返利App是一个比较新的应用类型，通过这些手机应用程序，你可以在购物时获得额外的折扣和奖励，进而达到省钱的目的。这些应用通常在网上商店中可以免费下载，并与不同的在线零售商界面相集成，以更好的服务用户。如果你是一位淘宝党，那么使用淘宝优惠券返利App真的非常值得推荐。在过去几年中，越来越多的淘宝返利应用程序已经被制作，并在各大应用商店上贴出来。一份返利App排行榜可供参考，不仅可以帮助你较快、更方便
人，总是在路上蓝橙插画
人，总是在路上。不管是身体，还是梦想这一辈子，总要走过许多路有的时候，或许是一个人孤独漫步也或许是一群朋友寸步不离有的时候，脚下的路畅通无阻而有的时候，却是荆棘挡道不迈出这一步，你永远不知道下一刻的风景会是什么环境的变迁，时光的流逝总会让人稚嫩的心变得坚韧你脚下的路终将正道坦途不管现在的你驶向何方不要忘记的是，享受这一刻的美好，将不好的情绪抛于车后你在车里看世界世界在车外看着你图片发自App写在后
副业赚钱的路子有哪些？10个在家就能赚钱的副业推荐（建议收藏）日常购物技巧呀
增加收入的来源，提升家庭幸福的指数，越来越多的人开始做副业，有的跑滴滴，有的送快递，有的带货，但是发现都不赚钱，现在盘点一下赚钱的副业，适合所有人做的兼职副业！今天小编给大家推荐永远不过时的副业，前两款权重比较高的平台，网购永远不过时，带货永远不过时，优惠劵导购平台，零投资创业，多种变现方式，不管是白领，宝妈，学生党都可以实现赚钱的平台！第一款应用商店下载“高省”登录邀请码887766高省app，
可转债市场观察（2020-03-31） pierre_9910
市场回顾3月31日，A股今日迎来一季度收官战，三大指数表现波澜不惊，最终集体小幅收涨。市场成交量继续萎缩，两市合计成交5617亿元，行业板块涨跌互现，农业与食品板块大涨。具体来看，沪指收盘上涨0.11%，收报2750.30点；深成指上涨0.58%，收报9962.30点；创业板指上涨0.61%，收报1871.92点。可转债市场表现中规中矩，中证可转债指数微跌0.05%，可转债等权指数（可转债平均价格
2022年5月19日可转债晨报小智爱投资
今日可申购新债：杭氧转债：正股杭氧股份，发行规模11.37亿元，公司评级AA+，初始转股价格28.69元/股，当前转股价值96.514元，积极申购。今日上市新债：无强赎期内的转债：无。晚间公告汇总：1、垒知集团：发布公告，垒知转债5月20日上市，发行规模仅3.96亿，预估上市首日价格150元以上。2、精工钢构：发布公告，精工转债5月23日上市，发行规模20亿，当前转股价值88.4元，预估上市首日价
2018-01-23 Amybubu
“脱单不脱皮，脱贫不脱水，脱脂不脱色”，凡士林吾皇限量版礼盒简直是讲出了我的心声。神马前任的渣男，都不及吾皇带给妾身“一本正经的闭月羞花”！心动的美妞们，还不趁着汪年优惠的脚步，随Amy一同去最靠谱的凡士林天猫旗舰店剁手拔草666！~
分手都是这么突然的吗，异地恋真的很难熬吗一位不知名的女大学生
就在昨天晚上，小编我突然分手了，原因非常离谱……就来跟大家说说我的故事吧。我和他是经过一个在外地上大学的好朋友认识的，也算网恋加异地，刚开始在一起处于热恋期，不管遇到什么事儿都是小问题，我这个恋爱小白以为遇到了自己的真命天子，百分百投入，每天干什么事儿都会跟他说，他白天要忙（都是大学生也不知道忙什么，且因为疫情也出不去）就只能每天晚上拉着我打电话，一打就是很晚才睡，我本来就不是个喜欢熬夜的人，因为
中原焦点团队中级第二十六期李月苗坚持分享第164天 aa6d9fcc1298
2021.7.16约练了十几场咨询，大多数咨询师的大致思路：先找方向。聊大致的状况，需要解决的问题。明确目标；询问重要他人的观点，以便激发当事人解决问题的动力。；也可以用奇迹问句，为当事人勾画愿景，明确目标。用例外问句，找以前的成功经验。什么时候这件事不发生或者较少发生，让当事人多说一些这些例外是如何发生的。并鼓励当事人思考例外发生时的细节。最后反馈时，让当事人尝试多做例外经验，以促使当事人发生改
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod