哈士奇说喵

豆瓣电影分析报告：大陆和港台到底差(cha)在哪里？

Python 2.7
IDE Pycharm 5.0.3
PyExcelerator 0.6.4a
可视化 Plotly

图片要是挂了

请看这里此文备份链接

前言

在上次爬完豆瓣的东西后，感觉锻(zhuang)炼(yi)能(xia)力(bi)之外，貌似并没有实际用处，说实话，我宁可去网页一页页浏览电影也不愿意面对这苍白的文字。所以，分析一下比较好。

目的

根据豆瓣所有的电影，分析各国各地区各类别时间年份评分数量等各个参数之间的联系，大体上进行分析。我会说谎，但是数据不会。

豆瓣的电影世界

这次爬取的电影总共6323部，因为豆瓣没有全部电影的列表，所以爬取的时候按照每类进行爬取，之后整合，去重，所剩参评影片4007部。(算法略简陋，最后列表大概有十部左右未爬取，但是综合各类别包含关系，误差会变得很小)

简单介绍下情况后，根据所需要的对比数据再进行再分割的处理，这个具体代码片段详见后半部分。好了，接下来轮到plotly大显身手的时候了。

今天要分析什么？

主要比较世界电影和中国，以及中国大陆和中国港台电影之间的差别，分析各参数之间是否存在关联性及对评分产生的影响；数据来源于豆瓣，我对评分不做主观表现，我只对数据进行分析展示，能力偏弱，但图像不弱。

能从年份&评分中看出点什么？

首先放上一张堪忧的世界电影好评趋势图

世界电影的评分均值趋势

世界电影的评分Box箱线图趋势

可以看出的是，豆瓣世界电影(简称世界电影)，近些年的好评的趋势在逐年下降，特别是近两年！也就是说，在豆瓣里，近些年的低分评价越来越多，从评分均值上看，一直处于下滑状态，而且下滑曲线越来越陡，大量的烂片充斥着电影世界，导致平均分被严重拉低。另一方面，观察箱线图(箱线图的是什么意思？)，从箱线图的第三四分位数(等于该样本中所有数值由小到大排列后第75%的数字)越来越低，可见，有75%的数据评分都在(约)7.3分之下；而第二四分位数，也就是中位数线也逐年向低分线靠近，对最近世界电影略微感到堪忧，难怪好片越来越少，垃圾片纵横。。。

补充箱线图概念：(@ZhangHongju–箱线图（数据分布）分析 )

世界电影趋势这样，那么中国呢？

中国电影评分均值图趋势，红色线为均值线

中国评分均值和全世界之间的比较
这零零散散的数据也真是少的可怜，上架豆瓣的中国电影数据量略微有点少，参评数目大概为662部左右，其中中国大陆电影为295部，中国港台为367部，趋势和世界电影的趋势差不多，也是颓废状态，但是分数更加低，大概中位数在6分以下，那么喜欢电影的朋友肯定知道大陆和港台电影风格还是有很大区别的，至于他们趋势分别是怎样的呢。。。

接下来看下大陆和港台的电影趋势

豆瓣中国大陆港台的box图趋势
整体趋势图大概是这样的，对比图形如上所示，大致维持在一个对等的水平，港台电影几乎稳定发挥，有好有坏，而大陆电影在有些年份的评分却差距非常大，为了方便，截取1980年之后的数据，使用均值线来看一下效果；

豆瓣中国大陆港台的评分均值图趋势
注：这里大于2是指取均值时候分母大于二，不然就是单个样本了，没办法，稍微协调一下，不然会抖动太明显。

把时间轴推移到二十世纪八十年代

豆瓣中国大陆港台的box图趋势放大图1980-2000

豆瓣中国大陆港台的均值线趋势放大图1980-2000
值得惊讶的是，在我的印象中，港台的电影应该会好于大陆，但是出乎我的意料，那时候的中国大陆电影评分都非常好，93，94年更是出彩，除了1989年那一年，其余的都要好于港台的水平，那时候的中国电影啊，感觉才是最繁盛的时候。

把时间轴推移到近十余年

豆瓣中国大陆港台评分均值图趋势放大图2002-2016
大陆电影在2009年之后，很稳定的下滑，而港台方面则是挣扎下滑，2006年大陆方面达到一个小巅峰，但之后有严重下滑，虽然09年略有起势，但之后又开始下滑，一蹶不振的那种下滑

豆瓣中国大陆港台的box图趋势放大图2002-2016

豆瓣中国大陆港台的box图趋势放大图2002-2016
在观察完均值之后，对箱线图进行观察：在2012年之前，港台和大陆电影都能保持一个比较稳定的水平，评分不算太高，但是也不低，两位并驾齐驱，虽然最高分在07年之后一直由港台电影占据，但是大陆的最高分也紧追其后。在2014年到达高峰之后，大陆和港台电影都陷入了低分的颓势当中，中位数急剧下滑，各个指数评分都下滑严重，下限也不断被刷新，这点从2014年的下限就可以看出一股烂片趋势，而在15和16年达到整体电影向烂片迁徙的状态，中位数纷纷跌破6分，而最高评分也止步于8分；我的分析能力并不是很强，但我仍然可以看出近些年来的确没有让人眼前一亮的片子了，不止是中国，全世界范围内也是大抵如此。

对比近十余年同期世界电影

世界电影与中国电影均值箱线图2002-2016
虽然全世界电影都有颓废芝士，但是在14年之前，最低评分一直由国外保持着(08除外)，但是在14年之后，最低分一直由我国负责刷新，而且第三四分位数几乎一直保持在世界平均水平之下，这点也值得我们思考。虽然世界电影有颓废趋势，但是高分电影仍然可以到达9分以上的分数，相比较于中国高分低分一块下降的局势。。。。。。

再来看一下上世纪八十年代世界其他电影进展

上世纪八十年代同期对比

一句话概括这段时期：均值分始终低于世界平均水平，不好意思，我们扯着世界的蛋了。。。。

影评数和年份又有什么关系呢？

全世界和中国电影影评数对比
注意：这里我选取了每年电影必须大于5部的年份进行比较，不然曲线会变得太陡峭。比如橙色这根线，我没有做过处理，在1980年之后，参评电影远超5部之多，所以两线重合，但是在1980年之前，参评数目少于5部，被我切了。。
可以看出，中文的影评数在1980年一直追平世界平均水平，而在2004年之后呈上升趋势，一方面中国电影在此时刻开始数量不断上升，近两年成爆炸方式上升(难怪烂片也增加超多，评分就被相应拉低)，来看看近些年电影产量：

中港电影产量对比:我说，国内的大导演们，能消停点拍点好片么，这两年拍的都是什么玩意啊，数量是上去了，质量呢？港台电影虽然数量没有上升，但是不骄不躁稳扎稳打啊，你看看吊车尾一溜的中国大陆。。。。。

评分倒数几位：几乎都是15-16年拍的，全部是大陆拍的，厉害了word哥(手动再见)

所以回到上一个话题，就是电影评论数和年份的关系，一个原因就是拍的片多了，评论会相应上升，但是，这些求得都是均值，所以数量而言并不是非常重要，我！觉！得！是！烂片太多！吐槽也越发严重！！！！！但看着烂片吐槽我赶脚着还是很有意思的哈哈

补充一张图：类型和评论数的关系

大家看西部电影评论数为什么那么高呢？我们来看下中国都有哪些西部电影

让子弹飞，无人区。。。。。哎，我还是太年轻了

脑洞1：年份和时长有没有关系呢？

还是看数据说话

中国大陆电影时长

这个就有点意思了哈，我一直以为会保持在一个稳定的值，没想到浮动还有点剧烈(虽然也只有20分钟上下浮动)但是可以看出，时长的总体趋势是越来越长了，近些年最低的时长也超过100分钟，而且竟然有点周期性波动的意思，导演，这个是什么套路？

港台和大陆时长对比：难道玩的是同个套路？

吓得我把世界电影时长拿出来看一下

中国与世界电影时长对比：可以看出，国外电影时长普遍偏高，大家从电影院上映的大片也可以看出，随随便便就上120分钟了，国内的话还在追赶或者说拼凑时长来比肩世界水平，这个时候我真的想把美国的数据也拿出来，大片估计时长都会上120.。。。。

中国与世界电影时长对比近五年：2014年之后连续两年下降趋势，导演你又在弄啥捏~

脑洞2：时长不会和评分有关吧？

时长和评分

可以看出一点的是，时长很长的电影，都不会太烂，最容易踩雷区的是那种80-120分钟的，话又说回来，时间很短的电影看来分数还是会挺高的呢，低于80分钟的电影，评分竟然都高于8分，不管中国还是全世界，都是这个趋势，所以，导演们，要么浓缩精华，把电影拍精致了，或者就是用内容来填充时间，饱含内容的电影或许包罗万象，那么我们来看看，时间比较长的电影都是什么内容呢。

时长和类型探索

可以看出，几乎所有类型，中国电影的时长都在世界电影时长平均线以下，情色电影超长因为样本只有一个，没有什么好对比的，其余的都短于平均水平。BTW中国没有黑色电影。。。
全世界电影时长可以看出的是，历史，战争，传记，西部，灾难片类型占据时长的前五名，那这时长前五的电影评分怎么样呢，是不是有内在关联呢？

类型&评分分析

全世界类型及评分

可以看出，儿童类型电影不仅时间很短而且评分很好呢，我们来看下什么电影贴了儿童标签

超级八Super8,6.4,27856,科幻/悬疑/惊悚/儿童,美国,英语,2011/6/10,112

所以，这个标签是不是乱贴的呢，还是主演是孩子就是儿童电影呢，当然不是啦，反正我是没搞懂儿童电影和动画电影实质区别，动画电影有些并不适合儿童呢(脑补)；

世界电影时长&类型&评分探索–最长时长

时长排名前五的类型：这里比较明显，时长越长，评分基本能达到很高的地步，时长排名前四的电影，评分都在8分以上，所以这几个类型可以拍的时间长一点，叙述事情可以比较清晰，细节方面可以安排较多，而灾难类型电影，不建议时长拉伸，观众们对于灾难片的认识多于特效和紧凑的剧情，所以时长的拉伸容易让观众产生疲劳，观众只是为了寻求现实生活中不会体会到的灾难刺激而去看片。压缩灾难片时长可以把成本放在特效上比较有报答率。

大陆和港台的时长&评分及类型分布–最长时长

相比较而言，港台的趋势与世界趋势更加接近一些，大陆我估计点错时长树了。上面刚分析过，灾难片的时长需要控制一下不要太长，你刚拍就踩这个雷区，你说你分数低出了怪特效，怪演员，怪导演，怪编剧，怪龙套，怪我没给你早分析你还能怪谁！学学港台啊，把历史，传记往长了拍！喜欢看这类的估计都很耐得住性子的，他们要的是内涵！

大陆和港台的时长&评分及类型分布–时长最短

这个就有点有趣了，时长最低的几乎都是动画和儿童，全世界和中国的局势几乎一致，大家都认为，儿童类型电影没必要排那么多时间，把一个故事讲清楚了就可以了，而且你说儿童会有多大耐心去看一部两个多小时的电影呢。所以，这点分析出来还是挺符合现实的。

中国大陆和中国港台类型和时长

空白的为无此类型电影，就像大陆没有情色电影，港台没有歌舞电影一个道理。
可以看出的是，大陆评分前五的是西部，歌舞，音乐，儿童和动画，而港台的前几名依次是战争，传记和家庭。差距较大的电影就是大家熟悉的港台动作，惊悚，爱情都比大陆高出很多，要知道的是，这是平均分！大陆能胜于港台很少，灾难科幻，额。。。。。

时长&年份&评分炫酷看下

中国大陆时长&评分&年份三维分布

中国港台时长&评分&年份三维分布

我看不出啥，看着头晕，但是挺炫酷，就挂上了。不服可以过来打我啊哈哈哈

脑洞3：标签数目大家都是怎样的呢？

这个大家可能没注意，但是经过我分析(凑巧)发现，中国和世界的标签数目都是不一样的呢，差别还挺大的呢，还特么会影响评分呢！！(科幻/恐怖这样算两个标签)

全世界的类别标签数目比例

OK，两个标签最多，三个标签其次

中国的类型标签数目比例

貌似和世界的差不多呢，排序一致，那我们来看看美国这个电影大国是怎样的

美国的类型标签数目比例

哇塞，是不是被震惊到了，竟然三个标签的占了第一名而且差距还那么大，别看这大概没什么影响，再给你看一幅图

类别和词频

这里能看出的是，美国的电影相比较于世界而言，平均每部电影所占标签数要高于全世界平均水平和远高于大陆水平，这能不能从另一个侧面反映出美国电影受欢迎的原因呢，如果说一部电影只能阐述一方面也就是一个类别，这样会不会使电影显得太单调乏味呢，而美国大片，一般电影元素中都会包含好几个主题相互映衬，并且主线依旧保持不乱，内容丰富又不缺乏主旨性，我想这点大陆电影真的可以学学。话说回来，港台电影和世界电影保持同一水平，而大陆电影却远离这条基准线，我想这和受欢迎程度应该还算有点轨迹可寻。

标签数和评分的关系

结论是，没啥关系，标签数越多最低分越高，但是标签数那么多的电影量太少，所以并不能作为评判标准，比如我们来看一下标签数目为8的电影的是什么奇葩玩意

末世纪爆潮 95年的科幻片，有空我得去看看集成科幻动作悬疑惊悚犯罪音乐奇幻的电影到底是个啥

接下来要分析什么？

时间间隔有点长，我脑子差不多糊了，还有什么想知道的，相分析的请留言，可能会得出很有意思结论呢，搞不好还能被大导演看到然后走上人生巅峰赢取白富美呢

福利环节

最后奉上豆瓣评分9分以上并且评论超过25万的不看就浪费生命系列电影。

还有豆瓣评分6分以下并且有25k人忍着被侮辱的心灵写下影评，看了就浪费生命系列电影。

BTW-祖国总算为我们挣了口气呢~话说我赶脚独立日还是挺好看的啊0.0

好了，接下来就是程序员世界了

程序实现部分

douban_Crawl_Parts codes

代码贴了太长，需要的请下载源码下载
注意：原始代码我基本不怎么用，但是能用；对于类别的连续爬取，其实写个循环就可以了，我再爬电视剧的事后才想到，然后在之后的写入txt也好，写入excel也好，都是用了批量处理的代码，这样就不用查岗了，要知道，一个类别460部电影，即使用静态爬也爬了我25分钟，我还得看着它，爬完一类爬下一类。

内容格式：

殿下，这是利息！殿、利息でござる！  7.2  579  喜剧  日本  日语  2016-05-14  129

代码格式爬取形式：

相较于以前版本，这次是爬名字类型评分等非动态元素，所以采用了静态方式爬取，速度加快很多。当然在页面类型的时候采用selenium的模拟点击也就是动态的爬取，这次是动态+静态的双重爬取，分工不同，请选择不同的爬取方式。

数据清洗过程

* -去重：*因为我爬十六个种类全部爬完，然后再聚合起来，其中肯定有重合部分，所以使用set函数去重，当然，你会发现，set函数也无法完全去重，因为爬的时候，评论数目还在变化，只要有一项不同，set就无法去重，结果还是excel直接去重。

- 格式规范化：因为使用plotly展现图形，所以最好的方式就是将其写成excel的，至于怎么写，我下面有代码。

* - 缺失数据处理：*对于此类型数据，我的方法是剔除，当然我用的是最暴力的方法，剔除之后肯定不会对分析有点影响，但是这样的电影很少。比如说各种这样的电影，只要主要信息都在，我还是会爬取的，主要信息是指殿下，这是利息！殿、利息でござる！ 7.2 579 喜剧日本日语 2016-05-14 129名字，评分，评论数，类型，国家，语言，时间，时长八个参数。

放上一个标准页面：

douban_Analysis_Parts codes

清洗函数
计算标签所占比例代码片

#计算总标签数，以及各类所占比例
import re
dicttype = {}
def TypeCount(line):
    line = re.sub("\t",",",line)
    line = line.split(",")
    typeline = line[3]
    typelines = typeline.split("/")

    for i in typelines:
        if i not in dicttype:dicttype[i]=0
        dicttype[i] +=1
    return dicttype

#测试的line格式，中间是tab键隔开的，制表符
#line = "诺斯费拉图Nosferatu/eineSymphoniedesGrauens 8.3 4202    恐怖/科幻   德国  德语  1922/3/4    94"
f = open("C:\\Users\\MrLevo\\PycharmProjects\\test\\M&TCleanData\\ALLMovie.txt")
fr = open("C:\\Users\\MrLevo\\PycharmProjects\\test\\M&TCleanData\\ALLMovie_typenum.txt","a")
k=0
lines = f.readlines()
for line in lines:
    k +=1
    dicttype = TypeCount(line)

x=0
for j in dicttype.values():
    x +=j
print "参评影片总数:%s;所有标签总数:%s"%(k,x)
for i in dicttype:
    print "%s:%s;类型所占比例：%.2f;标签词频比例:%.2f"%(i,dicttype[i],(dicttype[i])/(k*0.01),(dicttype[i])/(x*0.01))
    fr.write("%s,%s,%.2f,%.2f"%(i,dicttype[i],(dicttype[i])/(k*0.01),(dicttype[i])/(x*0.01)))
    fr.write('\n')

最后得出如下记录，存入txt或者excel中就可以后续绘图处理了：

获取各类电影及分割存储码片

# 获取各个种类电影及存储分割，这里是对全部电影的切割，单独国家电影种类切割同理
def Write2txt(line,txtname):
    fr = open(txtname,"a")
    if line :
        fr.write(line)
        fr.write("\n")
        fr.close()
readpath = "C:\\Users\\MrLevo\\PycharmProjects\\test\\M&TCleanData\\ALLMovie.txt"
writepath = "C:\\Users\\MrLevo\\PycharmProjects\\test\\M&TCleanData\\%s.txt"
typelist = ["犯罪","动作","歌舞","家庭","鬼怪","剧情","音乐","武侠","运动","战争","黑色电影","传记","历史","情色","儿童","悬疑","灾难","爱情","冒险","奇幻","科幻","古装","惊悚","恐怖","喜剧","动画","同性","西部"]
f = open(readpath)
lines = f.readlines()
for line in lines:
    line = line.strip() # 记得去除空格,不然输出存在空格行
    lineSplit = line.split("\t")
    for type1 in typelist:
        if type1 in lineSplit[3]:# 列表第四个为种类
            lineCsv = line.replace("\t",",").strip()
            Write2txt(lineCsv,writepath%(type1.decode('utf-8')))

注意：读取的txt格式必须是utf-8格式的！保存时候需要为utf-8格式，ANSI格式的会失效！

上述的式子只需要略微修改参数即可用于分类各个国家的各电影种类并单独存储，接下来是将存储在txt中的数据批量转化存储在excel中（有人会说为啥不一次性写入excel中，因为我懒啊，哈哈，其实，模块化我感觉挺好用，要不是为了能在plotly上用，我才懒得存excel）

# 以"中国大陆爱情.txt"的txt文件为例，其中存在txt中的格式为：苏州河,7.8,80931,剧情/爱情,中国大陆,汉语普通话,2000,83
from pyExcelerator import *
readpath = "C:\\Users\\MrLevo\\PycharmProjects\\test\\M&TCleanData\\%s.txt"
writepath = "C:\\Users\\MrLevo\\PycharmProjects\\test\\M&TCleanData\\%s.xls"
typelist = ["犯罪","动作","歌舞","家庭","鬼怪","剧情","音乐","武侠","运动","战争","黑色电影","传记","历史","情色","儿童","悬疑","灾难","爱情","冒险","奇幻","科幻","古装","惊悚","恐怖","喜剧","动画","同性","西部"]
for type1 in typelist:
    try:
        f = open(readpath%(u"中国大陆"+type1.decode('utf-8')))
        lines = f.readlines()
        w = Workbook()
        sheet1 = w.add_sheet("Sheet1")
        i = 0
        for line in lines:
            linesplist = line.split(",")
            j = 0
            for linesp in linesplist:
                sheet1.write(i,j,linesp.strip().decode('utf-8')) # 需要转化成unicode才能存储
                j += 1
            i +=1
        w.save(writepath%(u"中国大陆"+type1.decode('utf-8')+u"xls")) # 解码成unicode码
    except:
        print "No type: %s"%type1

分割月份单独存储码片
分析评分或者类型是否与月份有关，那就有必要把月份单独提出出来了，随便修改个程序，同样批处理。

# 分割月份单独存储
def Write2txt(line,txtname):
    fr = open(txtname,"a")
    if line :
        fr.write(line)
        fr.write("\n")
        fr.close()
readpath = "C:\\Users\\MrLevo\\PycharmProjects\\test\\M&TCleanData\\AllOverTheWorld_alltype_splite\\%s.txt"
writepath = "C:\\Users\\MrLevo\\PycharmProjects\\test\\M&TCleanData\\AllOverTheWorld_alltype_splite\\%s.txt"
typelist = ["犯罪","动作","歌舞","家庭","鬼怪","剧情","音乐","武侠","运动","战争","黑色电影","传记","历史","情色","儿童","悬疑","灾难","爱情","冒险","奇幻","科幻","古装","惊悚","恐怖","喜剧","动画","同性","西部"]
    for typelist1 in typelist:
        try:
            f = open(readpath%(u"港台"+typelist1.decode('utf-8')))
            lines = f.readlines()
            for line in lines:
                line = line.strip() # 记得去除空格,不然输出存在空格行
                lineSplit = line.split(",")
                try:
                    newline ="%s,%s,%s,%s,%s,%s"%(lineSplit[1],lineSplit[2],lineSplit[4],lineSplit[5],lineSplit[6].split("/")[1],lineSplit[7])
                    Write2txt(newline,writepath%(u"港台"+typelist1.decode('utf-8')+u"OnlyMonth"))
                except:
                    print "Only year No month:%s"%lineSplit[0]
        except:
            print "No Type :%s"%typelist1

对照一下，粗略看一下有没有处理正确，ok，没什么错误。

计算评分，评论数，时长等均值并存储excel的代码片段

# 计算不同年份的评分，评论数，时长平均值并存储excel
from pyExcelerator import *
def Write2txt(line,txtname):
    fr = open(txtname,"a")
    if line :
        fr.write(line)
        fr.write("\n")
        fr.close()
def txt2excel():
        try:
            f = open("C:\\Users\\MrLevo\\PycharmProjects\\test\\M&TCleanData\\ChinaAllmovieOnlyYearWithAverage.txt")
            lines = f.readlines()
            w = Workbook()
            sheet1 = w.add_sheet("Sheet1")
            i = 0
            for line in lines:
                linesplist = line.split(",")
                j = 0
                for linesp in linesplist:
                    sheet1.write(i,j,linesp.strip().decode('utf-8')) # 需要转化成unicode才能存储
                    j += 1
                i +=1
            w.save("C:\\Users\\MrLevo\\PycharmProjects\\test\\M&TCleanData\\ChinaAllmovieOnlyYearWithAverage.xls") # 解码成unicode码
        except:
            print "Something wrong"
path = "C:\\Users\\MrLevo\\PycharmProjects\\test\\M&TCleanData\\ChinaAllmovieOnlyYear.txt"

lines = open(path).readlines()
for years in range(1900,2017):
    TotalStar,TotalComment,TotalTime,i = 0.0,0.0,0.0,0.0
    for line in lines:
        lineSplit = line.split("\t")
        if lineSplit[6] == str(years):
            TotalStar +=float(lineSplit[1])
            TotalComment +=float(lineSplit[2])
            TotalTime +=float(lineSplit[7])
            i +=1
    try:
        if i>4: # 设置影片数目阈值
            print "%s:Average star %s"%(years,TotalStar/i)
            print "%s:Average comment %s"%(years,TotalComment/i)
            print "%s:Average time %s"%(years,TotalTime/i)
            print "%s: movieNum %s"%(years,i)
            writeline = "%s,%s,%s,%s,%s"%(years,i,TotalStar/i,TotalComment/i,TotalTime/i)
            Write2txt(writeline,"C:\\Users\\MrLevo\\PycharmProjects\\test\\M&TCleanData\\ChinaAllmovieOnlyYearWithAverage.txt")
            txt2excel()
    except:
        print "No movie this year %s"%years

之后效果应该是这样的

1981:Average star 7.6125
1981:Average comment 2312.25
1981:Average time 97.0
1981:movieNum 8.0
...

最后

总结这一次的小项目，经历了数据的收集爬取-数据的清洗规范-数据存储-数据可视化-数据分析，虽然对大神来说非常浅显而没有太多价值，但这也是我这种菜鸡必须需要经历的一步，完完整整，虽有各种波折，所幸全部解决，从中也学到很多，以后编代码思考也会成熟，共勉各位。

撰写记录

2016.10.2-19:49-第一次撰写
2016.10.4-21:12-第二次撰写
2016.10.5-11:21-第三次撰写
2016.10.7-22:21-第四次撰写
2016.10.10-18:10-第五次撰写

备用链接

防止辛辛苦苦做的50多张图片挂了，这里是备用链接(大)数据分析：豆瓣电影分析报告【1】

致谢

python对excel的读取操作
@MrLevo520–Python自定义豆瓣电影种类，排行，点评的爬取与存储（基础）
@MrLevo520–Python自定义豆瓣电影种类，排行，点评的爬取与存储（初级）
@MrLevo520–Python自定义豆瓣电影种类，排行，点评的爬取与存储（进阶上）
@MrLevo520–Python自定义豆瓣电影种类，排行，点评的爬取与存储（进阶下）
@MrLevo520–Python自定义豆瓣电影种类，排行，点评的爬取与存储（高阶上）

你可能感兴趣的:(Python,for,Data,Analysis,用Python做些有趣的事情,豆瓣数据爬取与分析,python,豆瓣,数据分析,可视化,plotpy)

5-1 使用ECharts将MySQL数据库中的数据可视化上课的牛马实训大数据
方法一：使用PythonFlask框架搭建API对于技术小白来说，使用ECharts将MySQL数据库中的数据可视化需要分步骤完成。以下是详细的实现流程：一、技术架构‌后端服务‌：使用PythonFlask框架搭建API（简单易学，适合新手）数据库连接‌：通过Python的pymysql库连接MySQL前端可视化‌：HTML+JavaScript+ECharts数据流向‌：MySQL数据库→Pyt
图论：以二维数组表示的连通图/树应如何表示？leetcode1042.不邻接种花坠金技术面算法图论算法 leetcode
1042.不邻接植花-力扣（LeetCode）容器在这道题中输入类似[[1,2],[3,4]]，这意味着花园1连通了花园2，花园3连通了花园4。那么该怎么根据这个输入，获取一个方便后面算法的表示呢？我们通常管这种存放邻居的数据格式叫做：邻接表通常我的思路是使用下列容器作为邻接表：哈希表，key就是花园i，value是与花园i接壤的其他所有花园。二维数组，第i个数组中的元素是与花园i接壤的其他所有花
JVM垃圾回收器全面解析：从核心概念到选型指南 Debug Your Career 面试 jvm java
一、引言在Java应用运行过程中，垃圾回收（GarbageCollection,GC）是内存管理的核心机制，直接影响程序性能。JVM提供了多种垃圾回收器，适用于不同场景。本文将系统梳理主流垃圾回收器的工作原理、适用场景及选型策略。二、GC核心概念分代收集：堆内存分为新生代（YoungGeneration）和老年代（OldGeneration），采用不同回收策略。STW（Stop-The-World
基础算法高精度运算 #大数加法旧物有情基础算法算法高精度加法
文章目录题目链接题目解读完整代码参考题目链接题目解读题目描述输入两个正整数a,b，输出a+b的值。输入格式两行，第一行a，第二行b。a和b的长度均小于1000位。输出格式一行，a+b的值。完整代码#includeusingnamespacestd;vectoradd(vectora,vectorb){vectorres;intt=0;intsize=max(a.size(),b.size());f
Java运行jar包需要读取arguments配置文件好人静 Java java 配置argument
在项目中有时候要把一些代码打包成jar，只要运行jar就可以执行。同时为了方便设置代码执行的一些外部参数，通常会配置arguments。1、Intelidea配置arguments在菜单栏找到Run－>EditConfiguration弹出的窗口中选择配置文件所在的路径即可。2、Eclipse配置arguments在main函数，右击，在弹出的菜单中选择EditConfiguration，在弹出的
绕过 reCAPTCHA V2/V3：Python、Selenium 指南 qq_33253945 python selenium javascript 网络爬虫爬虫算法
前言验证码（CAPTCHA）技术已经存在许多年，尽管它的有效性一直备受争议，但许多网站仍然依赖它来保护资源。尤其是Google推出的reCAPTCHA系列，一直是验证码领域的佼佼者。本文将详细介绍如何绕过reCAPTCHAV2和V3，并提供实用的代码示例。详情请见：解决验证码recaptcha、cloudflare、incapsula1.什么是reCAPTCHA？reCAPTCHA是Google推
指令系统（2017统考真题）海大超级无敌暴龙战士计算机组成原理学习方法
指令系统（2017统考真题）原始C语言函数为intf1(unsignedn){intsum=1,power=1;for(unsignedi=0;i
计算机毕业设计JavaBS景区票务管理系统设计与实现(源码+系统+mysql数据库+lw文档）毅铭科技数据库
计算机毕业设计JavaBS景区票务管理系统设计与实现(源码+系统+mysql数据库+lw文档）计算机毕业设计JavaBS景区票务管理系统设计与实现(源码+系统+mysql数据库+lw文档）本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Win10、JDK1.8数据库：
进制转换（2互转8/16）（1293. 二进制转换八进制、1294. 二进制转十六进制、1359. 八进制转换二进制、1306. 十六进制转二进制、1295. 十六进制转换）是帅帅的少年东方博宜OJ题库解析 c++
题单地址：题单中心-东方博宜OJ2进制转换8/16进制使用方法是分组法：因为3位2进制数最大是7，4位2进制最大是15，分别满足8进制与16进制的性质，所以3位2进制数=1位8进制数；4位2进制数=1位16进制数。8/16进制转换2进制使用方法是展开法：上面提到3位2进制数=1位8进制数；4位2进制数=1位16进制数，所以每1位的8/16进制数都可以展开为对应的2进制位数。1293.二进制转换八进
图论——Prim算法水代码的程序猿力扣算法图论数据结构
53.寻宝（第七期模拟笔试）题目描述在世界的某个区域，有一些分散的神秘岛屿，每个岛屿上都有一种珍稀的资源或者宝藏。国王打算在这些岛屿上建公路，方便运输。不同岛屿之间，路途距离不同，国王希望你可以规划建公路的方案，如何可以以最短的总公路距离将所有岛屿联通起来（注意：这是一个无向图）。给定一张地图，其中包括了所有的岛屿，以及它们之间的距离。以最小化公路建设长度，确保可以链接到所有岛屿。输入描述第一行包
【DNN量化工具】QKeras 工具简介 kanhao100 笔记 dnn 人工智能神经网络
QKeras工具简介QKeras是一个用于量化深度学习模型的Keras扩展库，旨在使深度学习模型的量化（即将模型的浮点权重转换为低精度格式）变得简单而高效。QKeras主要目标是优化模型的存储和推理速度，特别适用于需要在资源受限的设备（如移动设备和嵌入式系统）上运行深度学习模型的场景。QKeras的主要特点量化支持：QKeras提供了对不同类型量化的支持，包括权重量化和激活量化。用户可以根据需求选
Eclipse运行带参数的java程序（转） frank1998819 java 开发工具
N年不用了，再用有点忘记了运行的方法是，右键——》runas——》runconfiguration——》Arguments——》programarguments输入62145698910即每一个参数用空格分开。
CSP-J备考冲刺必刷题（C++） | AcWing 11 背包问题求方案数热爱编程的通信人 c++算法开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】AcWing：11.背包问题求方案数-AcWi
DeepSeek来袭！低代码+AI竟让程序员摸鱼接私单月入5W！工业甲酰苯胺低代码人工智能
目录一、引言：开启低代码+AI新时代二、DeepSeek与低代码、AI的关联（一）DeepSeek简介（二）低代码开发概述（三）AI赋能低代码三、低代码+AI开启私单赚钱大门（一）成功案例剖析（二）私单项目类型（三）赚钱模式解析四、实战：利用DeepSeek接私单（一）工具准备与环境搭建（二）需求分析与项目规划（三）低代码开发实战（四）AI技术融合应用（五）项目测试与交付五、挑战与应对策略（一）技
亿级分布式系统架构演进实战（七）- 横向扩展（安全防护设计） power-辰南 java技术架构师成长专栏 spring boot 分布式架构设计高并发安全防护
亿级分布式系统架构演进实战（一）-总体概要亿级分布式系统架构演进实战（二）-横向扩展（服务无状态化）亿级分布式系统架构演进实战（三）-横向扩展（数据库读写分离）亿级分布式系统架构演进实战（四）-横向扩展（负载均衡与弹性伸缩）亿级分布式系统架构演进实战（五）-横向扩展（缓存策略设计）亿级分布式系统架构演进实战（六）-横向扩展（监控与日志体系）核心目标保障系统免受攻击，确保数据安全一、安全防护设计1.
亿级分布式系统架构演进实战（一）- 总体概要 power-辰南 java技术架构师成长专栏高并发分布式系统微服务架构设计 springcloud
前言不说废话，这次分享是某500强企业真实亿级流量业务中台技术架构演进过程实战。核心目标构建一个兼具高性能、高可用、强一致性的分布式系统，支撑亿级流量场景下的稳定运行。演进路线大纲阶段一：横向扩展（应对万级QPS）核心目标：突破单机性能瓶颈，建立弹性基础[Nginx]/|\[App1][App2][App3]←无状态服务集群\|/[DBProxy]←读写分离中间件/\[Master]←写节点[Sl
亿级分布式系统架构演进实战（三）- 横向扩展（数据库读写分离） power-辰南 java技术架构师成长专栏数据库 mysql 分布式系统 springcloud 架构设计
亿级分布式系统架构演进实战（一）-总体概要亿级分布式系统架构演进实战（二）-横向扩展（服务无状态化）核心目标分散数据库压力，提升读性能1.数据库架构设计数据库由原理的单实例变成主从模式，主主要负责写，从负责读。1.1主从角色定义节点类型数据流向核心职责主库读写（Write）处理事务性写操作（INSERT/UPDATE/DELETE）/部分读从库只读（Read）承担查询请求（SELECT），支持水平
[软件工程] 数据字典枪枪枪 Software Engineering
======================================================================= 学习过程中很容易忘记绘图的符号、图的定义，为避免重新翻书查定义，还是整理整理放博客上，方便查看吧。基本上都是书上的内容，在这里集合一下。参考资料：软件工程（张海藩、吕云翔）=========================================
【nnUnetv2】Code复现是Winky啊 #项目nnUnet 人工智能深度学习
作者提出一种nnUNet（no-new-Net）框架，基于原始的UNet（很小的修改），不去采用哪些新的结构，如相残差连接、dense连接、注意力机制等花里胡哨的东西。相反的，把重心放在：预处理（resampling和normalization）、训练（loss，optimizer设置、数据增广）、推理（patch-based策略、test-time-augmentations集成和模型集成等）、
3分钟带你了解Vue3的nextTick() 嫣嫣细语 vue.js 前端 javascript vue.js javascript 前端
前言Vue实现响应式并不是数据发生变化之后DOM立即变化，而是按一定的策略进行DOM的更新。简单来说，Vue在修改数据后，视图不会立刻更新，而是等同一事件循环中的所有数据变化完成之后，再统一进行视图更新，nextTick()方法就会在这样的DOM更新循环结束后调用指定的函数。概念在Vue3中nextTick()方法的行为和Vue2中基本相似，但它进行了一些优化，以提高性能和稳定性。nextTick
时间序列分析的军火库：AutoTS、Darts、Kats、PaddleTS、tfts 和 FancyTS解析赛卡大数据人工智能深度学习 python 概率论数学建模
引言：时间序列分析的现代挑战时间序列分析在多个领域中扮演着关键角色，包括工程、金融、气象、工业预测等。随着开源工具的快速发展，开发者可以通过多种库快速实现时间序列预测与分析。本文将对AutoTS、Darts、Kats、PaddleTS、tfts和FancyTS六大主流库进行详细解析，并提供代码示例，帮助你根据实际需求选择最佳工具。核心库技术解析与场景化实践1.AutoTS：自动化时间序列预测技术亮
备忘录二数组模拟邻接表 AugustineDiane c++图论算法
constintN=1010,M=1010;inth[N],e[M],w[M],nxt[M],eidx;voidadd(intu,intv,intweight)//添加有向边u->v,权重为weight{e[eidx]=v;//记录边的终点w[eidx]=weight;//记录边的权重nxt[eidx]=h[u];//将下一条边指向结点u此时的第一条边h[u]=eidx;//将结点u的第一条边的编
图的存储-邻接表（数组模拟） Roy__Mustang 链表数据结构图论 c++
先放模板假设图中N个节点，M条边（标号均从1开始）//初始化for(inti=1;i<=N;i++){h[i]=-1;}for(int
自动驾驶中间件技术辨析：ROS、Apex.Grace、DDS、AutoSAR和AutoSAR Adaptive 赛卡自动驾驶中间件人工智能
在自动驾驶技术的演进中，中间件作为连接硬件、操作系统与应用软件的核心枢纽，其安全性、实时性和可扩展性至关重要。当前市场上主流的中间件技术包括ROS/ROS2、Apex.Grace（Apex.OS）、DDS、AutoSAR（经典平台CP）和AutoSARAdaptive（自适应平台AP）。这些技术各有特点，但也存在交叉与互补。本文将从功能定位、技术架构、安全认证和应用场景等方面，深入分析它们的联系与
【Q&A】Qt中直接渲染和离屏渲染效率哪个高？浅慕Antonio Q&A qt 信息可视化开发语言
直接渲染和离屏渲染的效率取决于具体场景和实现方式，以下是详细对比分析：一、直接渲染（On-screenRendering）原理直接将图形数据绘制到屏幕缓冲区（BackBuffer），完成后通过交换缓冲区显示到屏幕。通常在paintEvent等事件中通过QPainter直接绘制。优势减少数据复制：无需额外的缓冲区传输，直接写入屏幕缓冲区。实时性高：适合需要快速更新的场景（如动画、实时数据可视化）。简
网页编辑器能否满足Word公式与图片的直接复制粘贴？ 2501_90699800 编辑器 word umeditor粘贴word ueditor粘贴word ueditor复制word ueditor上传word图片 ueditor导入word
要求：开源，免费，技术支持编辑器：百度ueditor前端：vue2,vue3,vue-cli,react,html5用户体验：Ctrl+V快捷键操作功能：导入Word,导入Excel,导入PPT(PowerPoint),导入PDF,复制粘贴word,导入微信公众号内容,web截屏平台：Windows,macOS,Linux,RedHat,CentOS,Ubuntu,中标麒麟,银河麒麟,统信UOS,
【hot100】刷题记录(46)-下一个排列捞鱼哲学家算法数据结构 leetcode python
题目描述：整数数组的一个排列就是将其所有成员以序列或线性顺序排列。例如，arr=[1,2,3]，以下这些都可以视作arr的排列：[1,2,3]、[1,3,2]、[3,1,2]、[2,3,1]。整数数组的下一个排列是指其整数的下一个字典序更大的排列。更正式地，如果数组的所有排列根据其字典顺序从小到大排列在一个容器中，那么数组的下一个排列就是在这个有序容器中排在它后面的那个排列。如果不存在下一个更大的
python数据可视化绘制图表（直方图，饼图圆环图，散点或气泡图，误差棒图） 2224070304 信息可视化 python 数据分析
一，直方图#先导入模块importnumpyasnp importmatplotlib.pyplotasplt#准备50个随机的数据scores=np.random.randint(0,100,50)#绘制直方图plt.hist(scores,bins=8,histtype='stepfilled')plt.show()其中，scores为数组（可为单个或多个的数列)bins=8,表示矩形的条数为
数组模拟邻接表 #图论旧物有情数据结构图论数据结构
文章目录为什么要用数组来模拟邻接表存储思路遍历思路树是特殊的图，因此邻接表可以存储图和树两种数据结构。为什么要用数组来模拟邻接表在算法设计当中，利用数组来代替结构体模拟各种数据结构会更加简单。存储思路给定如下数据,我们可以构造如下的一个邻接表请看代码/**idx:索引,代表数组哪个位置,是否连续不重要,因为我们的存储是链式的。h[idx]:顶点表,下标idx代表是哪个顶点,初始值全部为-1,代表没
软件工程：数据字典愚戏师软件工程软件工程数据库
一、数据字典的核心作用定位：数据字典是数据流图（DFD）的补充说明文档，与DFD共同构成系统的逻辑模型。核心价值：消除二义性：明确数据流、存储、元素的定义，避免理解偏差。设计依据：为数据库设计、代码开发提供数据规范。团队协作：作为开发团队的共享词汇表，确保术语一致性。二、数据字典的四大组成要素1.数据流（DataFlow）定义：数据在系统中的流动路径。描述内容：来源与去向：起点（外部实体/处理）、
JAVA中的Enum 周凡杨 java enum 枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。在实际问题中，有些变量的取值被限定在一个有限的范围内。例如，一个星期内只有七天我们通常这样实现上面的定义： public String monday; public String tuesday; public String wensday; public String thursday
赶集网mysql开发36条军规 Bill_chen mysql 业务架构设计 mysql调优 mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层； (2)控制单表数据量 int型不超过1000w，含char则不超过500w；合理分表；限制单库表数量在300以内； (3)控制列数量字段少而精，字段数建议在20以内
Shell test命令 daizj shell 字符串 test 数字文件比较
Shell test命令 Shell中的 test 命令用于检查某个条件是否成立，它可以进行数值、字符和文件三个方面的测试。数值测试参数说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真实例演示： num1=100 num2=100if test $[num1]
XFire框架实现WebService(二) 周凡杨 java webservice
有了XFire框架实现WebService(一)，就可以继续开发WebService的简单应用。 Webservice的服务端(WEB工程)：两个java bean类： Course.java package cn.com.bean; public class Course { private
重绘之画图板朱辉辉33 画图板
上次博客讲的五子棋重绘比较简单，因为只要在重写系统重绘方法paint（）时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。画图板重绘难在需要重绘的类型很多，比如说里面有矩形，园，直线之类的，所以我们要想办法将里面的图形加入一个队列中，这样在重绘时就
Java的IO流西蜀石兰 java
刚学Java的IO流时，被各种inputStream流弄的很迷糊，看老罗视频时说想象成插在文件上的一根管道，当初听时觉得自己很明白，可到自己用时，有不知道怎么代码了。。。每当遇到这种问题时，我习惯性的从头开始理逻辑，会问自己一些很简单的问题，把这些简单的问题想明白了，再看代码时才不会迷糊。 IO流作用是什么？答：实现对文件的读写，这里的文件是广义的； Java如何实现程序到文件
No matching PlatformTransactionManager bean found for qualifier 'add' - neither 林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match! 网上找了好多的资料没能解决，后来发现：项目中使用的是xml配置的方式配置事务，但是
Row size too large (> 8126). Changing some columns to TEXT or BLOB aigo column
原文：http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large 异常信息： Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
JS 格式化时间 alxw4616 JavaScript
/** * 格式化时间 2013/6/13 by 半仙 [email protected] * 需要 pad 函数 * 接收可用的时间值. * 返回替换时间占位符后的字符串 * * 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数 * 如 YYYY 4占4位 YY 占2位<p></p> * MM DD hh mm
队列中数据的移除问题百合不是茶队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下; // package com.Thread0715.com; import java.util.ArrayList; public class Threa
Runnable接口使用实例 bijian1013 java thread Runnable java多线程
Runnable接口 a. 该接口只有一个方法：public void run(); b. 实现该接口的类必须覆盖该run方法 c. 实现了Runnable接口的类并不具有任何天
oracle里的extend详解 bijian1013 oracle 数据库 extend
扩展已知的数组空间，例： DECLARE TYPE CourseList IS TABLE OF VARCHAR2(10); courses CourseList; BEGIN -- 初始化数组元素，大小为3 courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 '); --
【httpclient】httpclient发送表单POST请求 bit1129 httpclient
浏览器Form Post请求浏览器可以通过提交表单的方式向服务器发起POST请求，这种形式的POST请求不同于一般的POST请求 1. 一般的POST请求，将请求数据放置于请求体中，服务器端以二进制流的方式读取数据，HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求，比如请求数据是字符串或者是二进制数据 2. Form
【Hive十三】Hive读写Avro格式的数据 bit1129 hive
1. 原始数据 hive> select * from word; OK 1 MSN 10 QQ 100 Gtalk 1000 Skype 2. 创建avro格式的数据表 hive> CREATE TABLE avro_table(age INT, name STRING)STORE
nginx+lua+redis自动识别封解禁频繁访问IP ronin47
在站点遇到攻击且无明显攻击特征，造成站点访问慢，nginx不断返回502等错误时，可利用nginx+lua+redis实现在指定的时间段内，若单IP的请求量达到指定的数量后对该IP进行封禁，nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在指定的封禁时间后实行自动解封的目的。一、安装环境： CentOS x64 release 6.4(Fin
java-二叉树的遍历-先序、中序、后序（递归和非递归）、层次遍历 bylijinnan java
import java.util.LinkedList; import java.util.List; import java.util.Stack; public class BinTreeTraverse { //private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 }; private int[] array={ 10,6,
Spring源码学习-XML 配置方式的IoC容器启动过程分析 bylijinnan java spring IOC
以FileSystemXmlApplicationContext为例，把Spring IoC容器的初始化流程走一遍： ApplicationContext context = new FileSystemXmlApplicationContext ("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
[科研与项目]民营企业请慎重参与军事科技工程 comsci 企业
军事科研工程和项目并非要用最先进，最时髦的技术，而是要做到“万无一失” 而民营科技企业在搞科技创新工程的时候，往往考虑的是技术的先进性，而对先进技术带来的风险考虑得不够，在今天提倡军民融合发展的大环境下，这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前，对
spring 定时器-两种方式 cuityang spring quartz 定时器
方式一：间隔一定时间运行 <bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" /> <bean id="updateSessionIdSchedule
简述一下关于BroadView站点的相关设计 damoqiongqiu view
终于弄上线了，累趴，戳这里http://www.broadview.com.cn 简述一下相关的技术点前端：jQuery+BootStrap3.2+HandleBars，全站Ajax（貌似对SEO的影响很大啊！怎么破？），用Grunt对全部JS做了压缩处理，对部分JS和CSS做了合并（模块间存在很多依赖，全部合并比较繁琐，待完善）。后端：U
运维 PHP问题汇总 dcj3sjt126com windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页解决方法：后台>系统>系统基本参数>核心设置>关键字替换（是/否），这里选择“是”。后台>系统>系统基本参数>其他选项>自动提取关键字，这里选择“是”。 2、解决PHP168超级管理员上传图片提示你的空间不足网站是用PHP168做的，反映使用管理员在后台无法
mac 下安装php扩展 - mcrypt dcj3sjt126com PHP
MCrypt是一个功能强大的加密算法扩展库，它包括有22种算法，phpMyAdmin依赖这个PHP扩展，具体如下：下载并解压libmcrypt-2.5.8.tar.gz。在终端执行如下命令： tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
MongoDB更新文档 [四] eksliang mongodb Mongodb更新文档
MongoDB更新文档转载请出自出处：http://eksliang.iteye.com/blog/2174104 MongoDB对文档的CURD，前面的博客简单介绍了，但是对文档更新篇幅比较大，所以这里单独拿出来。语法结构如下： db.collection.update( criteria, objNew, upsert, multi) 参数含义参数
Linux下的解压，移除，复制，查看tomcat命令 y806839048 tomcat
重复myeclipse生成webservice有问题删除以前的，干净 1、先切换到：cd usr/local/tomcat5/logs 2、tail -f catalina.out 3、这样运行时就可以实时查看运行日志了 Ctrl+c 是退出tail命令。有问题不明的先注掉 cp /opt/tomcat-6.0.44/webapps/g
Spring之使用事务缘由(3-XML实现) ihuning spring
用事务通知声明式地管理事务事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理，可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知，为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后，就需要将它与切入点关联起来。由于事务通知是在 <aop:
GCD使用经验与技巧浅谈啸笑天 GC
前言 GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”，本文就总结一些有关使用GCD的经验与技巧。 dispatch_once_t必须是全局或static变量这一条算是“老生常谈”了，但我认为还是有必要强调一次，毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug，正确的如下： 1
linux（Ubuntu）下常用命令备忘录1 macroli linux 工作 ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表：ls ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容，但这样直接运行所得到的信息也是比较少的，通常它可以结合以下这些参数运行以查询更多的信息： ls / 显示/.下的所有文件和目录 ls -l 给出文件或者文件夹的详细信息 ls -a 显示所有文件，包括隐藏文
nodejs同步操作mysql qiaolevip 学习永无止境每天进步一点点 mysql nodejs
// db-util.js var mysql = require('mysql'); var pool = mysql.createPool({ connectionLimit : 10, host: 'localhost', user: 'root', password: '', database: 'test', port: 3306 });
一起学Hive系列文章 superlxw1234 hive Hive入门
[一起学Hive]系列文章目录贴，入门Hive，持续更新中。 [一起学Hive]之一—Hive概述，Hive是什么 [一起学Hive]之二—Hive函数大全-完整版 [一起学Hive]之三—Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和分区 [一起学Hive
Spring开发利器：Spring Tool Suite 3.7.0 发布 wiselyman spring
Spring Tool Suite(简称STS)是基于Eclipse，专门针对Spring开发者提供大量的便捷功能的优秀开发工具。在3.7.0版本主要做了如下的更新：将eclipse版本更新至Eclipse Mars 4.5 GA Spring Boot(JavaEE开发的颠覆者集大成者，推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示，