伤水者王

Python小白逆袭大神:Day5-大作业（含具体实现代码、停用词表和做作业过程中遇到的问题）

文章目录

引言
第一步：评论数据的爬取。
第二步：词频统计并可视化展示
1. 数据预处理：
2. 中文分词
3. 去除停用词
4. 统计top10高频词
第四步：结合PaddleHub，对评论进行内容审核，找出一些带有色情含义的评论。
最终的run代码
结果展示：
遇到的问题：

引言

好了经过了前面4天对python基础语法、python网络爬虫、python数据分析和paddleHub的学习，今天呢发布了本次7天集训营的大作业。本次作业综合了前面几天所学，其实还加了一点NLP的内容。具体要求见下图。

话不多说，赶紧开始做我们的作业吧.

第一步：评论数据的爬取。

这一步涉及到第一天爬虫相关内容，python爬虫其实就是和web开发者斗智斗勇的过程，要学会去F12里找到我们想要的资源，然后想办法爬下来。这里的评论数据大概用到了异步请求吧，页面默认只展示了10条评论，需要我们不断发出请求。经过观察发现，评论数据的链接存在规律，即通过改变lastId来获取新的评论数据，那么我们就好办了，代码如下。

#请求爱奇艺评论接口，返回response信息
def getMovieinfo(url):
    '''
    请求爱奇艺评论接口，返回response信息
    参数  url: 评论的url
    :return: response信息
    '''
    headers = { 
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'
    }

    session = requests.Session()
    response = session.get(url, headers=headers)
    if response.status_code == 200:
        return response.text
    return False


    return 

#解析json数据，获取评论
def saveMovieInfoToFile(lastId,arr):
    '''
    解析json数据，获取评论
    参数  lastId:最后一条评论ID  arr:存放文本的list
    :return: 新的lastId
    '''
    url = 'https://sns-comment.iqiyi.com/v3/comment/get_comments.action?agent_type=118&agent_version=9.11.5\
    &authcookie=41H2bDqLkn6dsGrn2m3VcI6m1Ibwa1l5y1OcyuwuCvhzm2k93j3HeMtEysjyPHKoe3opK58&business_type=17&content_id=15068699100&hot_size=0&last_id='
    url +=str(lastId)
    responseTxt = getMovieinfo(url)
    responseJson = json.loads(responseTxt)
    comments = responseJson['data']['comments']
    for val in comments:
        if 'content' in val.keys():
            # print(val['content'])
            arr.append(val['content'])
        lastId = str(val['id'])
    # print(lastId)
    return lastId

第二步：词频统计并可视化展示

这一步的工作量还是挺大的，主要涉及到的其实还是对文档的处理。主要包括以下5步

1. 数据预处理：

清理清洗评论中特殊字符（如：@#￥%、emoji表情符）,清洗后结果存储为txt文档。这块是对正则表达式的使用，具体规则也不用太了解，网上找找就好了。

#去除文本中特殊字符
def clear_special_char(content):
    '''
    正则处理特殊字符
    参数 content:原文本
    return: 清除后的文本
    '''
    s = re.sub(r"| |\t|\r", '', content)
    s = re.sub(r"\n", ' ', s)
    s = re.sub(r'\*','\\*',s) 
    s = re.sub('[^\u4e00-\u9fa5^a-z^A-Z^0-9]', '', s)
    s = re.sub('[a-zA-Z]', '', s)  
    return s

2. 中文分词

这里我们添加新增词（如：青你、奥利给、冲鸭）还有选手的名字。

def fenci(text):
    '''
    利用jieba进行分词
    参数 text:需要分词的句子或文本
    return：分词结果
    '''
    jieba.load_userdict('add_words.txt')  #自定义分词词典
    seg = jieba.lcut(text, cut_all=False)
    return seg

3. 去除停用词

分完词后有一些完全没作用的词（如：哦、因此、不然、也好、但是），我们也给它去掉。我用到的停用词表会放在资源里，供大家下载。

def stopwordslist(file_path):
    '''
    创建停用词表
    参数 file_path:停用词文本路径
    return：停用词list
    '''
    stopwords = [line.strip() for line in open(file_path, encoding='UTF-8').readlines()]
    return stopwords

4. 统计top10高频词

def movestopwords(sentence, stopwords, counts):
    '''
    去除停用词,统计词频
    参数 file_path:停用词文本路径 stopwords:停用词list counts: 词频统计结果
    return：None
    '''
    out = []
    for word in sentence:
        if word not in stopwords:
            if len(word) != 1:
                counts[word] = counts.get(word,0) + 1
    return None

可视化展示高频词

def drawcounts(count, num):
    '''
    绘制词频统计表
    参数 counts: 词频统计结果 num:绘制topN
    return：none
    '''
    x = []
    y = []
    sorted_list = sorted(count.items(),key=lambda d:d[1],reverse=True) #降序排序
    for c in sorted_list[:num]:
        x.append(c[0])
        y.append(c[1])
    # 设置显示中文
    matplotlib.rcParams['font.family'] = ['SimHei'] # 指定默认字体
    matplotlib.rcParams['axes.unicode_minus'] = False
    plt.bar(x, y)
    plt.title('词频统计结果')
    plt.show()

第三步：绘制词云
根据得到的词频统计来绘制词云图，并添加背景图。

def drawcloud(word_f):
    '''
    根据词频绘制词云图
    参数 word_f:统计出的词频结果
    return：none
    '''
    #加载背景图片
    cloud_mask = np.array(Image.open('cloud.png'))
    #忽略显示的词
    st = set(['东西','这是'])
    #生成worldcloud对象
    wc = WordCloud(background_color='white',
    mask = cloud_mask,
    max_words = 150,
    font_path='simhei.ttf',
    min_font_size = 10,
    max_font_size = 100,
    width = 400,
    relative_scaling = 0.3,
    stopwords=st)
    wc.fit_words(word_f)
    plt.imshow(wc)
    wc.to_file('pic.png')
# drawcloud(word_count)

第四步：结合PaddleHub，对评论进行内容审核，找出一些带有色情含义的评论。

def text_detection(test_text, file_path):
    '''
    使用hub对评论进行内容分析
    return：分析结果

    '''
    porn_detection_lstm = hub.Module(name='porn_detection_lstm')
    
    f = open(file_path, 'r', encoding='UTF-8')
    for line in f:
        if len(line.strip()) == 1:
            continue
        else:
            test_text.append(line)
    f.close()
    input_dict = {"text": test_text}
    results = porn_detection_lstm.detection(data=input_dict, use_gpu=True, batch_size=1)
    # print(results)
    for index, item in enumerate(results):
        if item['porn_detection_key'] == 'porn':
            print(item['text'], ':', item['porn_probs'])
    

# text_detection()

最终的run代码

#评论是多分页的，得多次请求爱奇艺的评论接口才能获取多页评论,有些评论含有表情、特殊字符之类的
#num 是页数，一页10条评论，假如爬取1000条评论，设置num=100
if __name__ == "__main__":
    num = 50
    lastId = 0
    arr = []
    with open ('aqy.txt', 'a', encoding="utf-8") as f:
        for i in range(num):
            lastId = saveMovieInfoToFile(lastId, arr)
            time.sleep(0.5)
        for item in arr:
            Item = clear_special_char(item)
            if Item.strip() != '':
                try:
                    f.write(Item+'\n')
                except Exception as e:
                    print('含有特殊字符')
    print('共获取评论数：', len(arr))
    f = open('aqy.txt', 'r', encoding='UTF-8')
    counts = {}
    for line in f:
        words = fenci(line)
        stopwords = stopwordslist('stopwords.txt')
        movestopwords(words, stopwords, counts)
    drawcounts(counts,20)
    drawcloud(counts)

    f.close()

    file_path = 'aqy.txt'
    test_text = []
    text_detection(test_text, file_path)

结果展示：

自己跑的和这个差不多，老师的ppt排版的更好看，就借用啦嘿嘿。

遇到的问题：

1.字体安装问题。~~好迷，昨天这行代码还下载不了字体，刚刚试了一下又可以了。~~ !wget https://mydueros.cdn.bcebos.com/font/simhei.ttf # 下载中文字体。
昨天的话呢，下载不了字体，我们首先从本地的C:\Windows\Fonts 目录下找到微软雅黑字体，上传到平台的根目录，然后在执行这三行代码就好啦。

如果不放心的话，当查看系统已安装的字体出现以下内容，就说明安装好了。

2.安装好啦字体，可是词频统计图还是乱码的问题。
首先可以尝试重启，主要每次重启都得安装字体。如果还不行的话可以看看话词频统计图的代码有没有设置中文字体环境。

3.话词云图的时候我们明明上传的图片背景，为啥没有显示。
词云图的绘制必须是白色背景的图片，这样应该就不会错。而且不加背景图的话还会出现就显示几个词的尴尬局面。这里给大家提供一张图片吧。

OK，以上就是本次大作业的全部内容了，如果你觉得写的还不错的话，求点赞求关注。

你可能感兴趣的:(Python小白逆袭大神:Day5-大作业（含具体实现代码、停用词表和做作业过程中遇到的问题）)

pip设置国内源 pip设置国内镜像程序员leon Linux系列 pip python
以下是配置pip国内镜像源的完整方法及注意事项，综合主流配置方案和常见问题解决方案：一、临时使用国内源（单次有效）安装时通过-i参数指定镜像源：pipinstall包名-ihttps://pypi.tuna.tsinghua.edu.cn/simple--trusted-hostpypi.tuna.tsinghua.edu.cn-推荐源地址*：清华大学：https://pypi.tuna.tsin
C++ XML文件和解析 RangoLei_Lzs C++前端服务器 xml c++
XML（可扩展标记语言）是一种用于存储和传输数据的标记语言。它具有自描述性和平台无关性的特点。XML文档的格式主要由一组嵌套的元素和属性构成，结构清晰，易于理解和解析。XML文档的基本格式一个XML文档通常包括以下部分：XML声明：标识文档和版本信息。根元素：整个XML文档只能有一个根元素，所有其他元素必须嵌套在根元素内。元素：具有开始标签和结束标签，可以嵌套其他元素。属性：为元素提供额外的信息。
第十五章:模板参数推导_《C++ Templates》notes 郭涤生 c/c++c++windows 开发语言
模板参数推导第十五章核心知识点概览多选题设计题测试用例总结第十五章核心知识点概览模板参数推导基础引用折叠与完美转发SFINAE原则C++17类模板参数推导auto和decltype(auto)的推导规则模板参数推导基础知识点：函数模板参数通过调用时的实参类型推导数组/函数类型退化为指针引用类型不触发退化默认参数不参与推导代码示例：#include#includetemplatevoiddeduce
如何使用LangChain流式处理工具事件 fgayif langchain java 前端 python
在AI开发中，实时处理和监听事件是一项关键能力，特别是在处理复杂的模型和工具链时。本文将向您展示如何使用LangChain框架流式处理自定义工具中的事件，以便更好地监控和调试模型的内部状态。技术背景介绍LangChain是一个用于构建和操作语言模型的工具库，其中astream_events()方法能帮助我们监听和处理来自模型的事件流。了解如何正确地配置这些事件对于调试和高级应用至关重要，尤其是在运
【XML协议】轻松掌握使用C++ XML解析库——pugixml XYY_CN C++入坑 xml c++
文章介绍了xml协议的组成以及C++xml解析库pugixml的常用操作。源于开发中每次遇到xml操作时，都要回过头查看pugixml库常用操作时什么样的，能不能有个更深刻和清晰的认识呢？其实搞清楚xml结构和pugixml组织结构的对照关系，以及pugixml中节点、属性的增删改查逻辑，可以帮助我们快速回忆起这些东西。遂，本文留作查询使用。XML协议XML(ExtensibleMarkupLan
2025年首个！又一家智驾供应链企业成功上市，踩准感知红利风口高工智能汽车人工智能汽车
3月18日，弘景光电在深交所创业板正式挂牌上市，成为了2025年开年首家成功上市的智能汽车供应链企业。弘景光电作为一家专业从事光学镜头及摄像模组产品的研发、设计、生产和销售的高新技术企业，已深耕行业十多年，目前其产品应用领域主要包括智能汽车汽车及新兴消费两大领域，其中车载光学镜头产品主要应用于智能座舱和智能驾驶系统。在过去的几年中，弘景光电抓住车载光学镜头和新兴消费电子市场的巨大增长机会，业绩实现
一年狂揽270亿新订单，德赛西威开启「狂飙」模式高工智能汽车人工智能
德赛西威在汽车智能网联产业的龙头地位还在进一步稳固，这从其刚刚公布的2024年年报中可见一斑。2024年，德赛西威实现营业收入276.18亿元，同比增长26.06%，归属于上市公司股东的净利润20.05亿元，同比增长29.62%。综合来看，德赛西威的多项核心业务在2024年均显示了强劲的增长势头，尤其是智能座舱和智能驾驶业务凭借产品迭代升级，在客户新增与市场渗透率方面持续攀升，此外海外业务成长为新
高速NOA要爆！一年「1000万辆」市场红利，谁是最大赢家？高工智能汽车人工智能大数据
只有更低，没有最低。从7万元价位到5万元价位，2025的“智驾平权”之战开局已是火拼。有消息披露，奇瑞计划在小蚂蚁等入门级产品上全系标配基于高通8620平台的智能驾驶系统，可实现高速NOA和记忆泊车功能。2025款奇瑞小蚂蚁的起售价是5.99万元，按照这个价格区间，相当于高速NOA智驾方案进一步下探到5万级别水平。对比比亚迪将高速NOA智驾首次带入7万级车型市场，奇瑞这一动作无疑进一步加剧今年高阶
「智驾普及」引发需求井喷，这一上游细分供应链严重缺货！高工智能汽车人工智能自动驾驶
2025年，车载CIS市场无疑将是智驾供应链市场最火的赛道之一。今年开年的一场智驾普及运动，不仅带来了车载摄像头市场的爆发，同时还引发摄像头模组核心元器件—车用CMOS图像传感器（CIS）芯片需求出现井喷。高工智能汽车研究院监测数据显示，2024年1-12月，中国市场(不含进出口)乘用车前装标配（含免费选装促销）NOA交付197.47万辆，同比增长162.31%。上车方案基本上都是采用多摄像头模组
使用Python和Django构建支持多语言的博客网站程序员～小强 python django sqlite
随着互联网的发展,博客已经成为人们获取信息和分享想法的重要平台。但是不同国家和地区的用户语言各异,这给博客的国际化带来了挑战。本文将介绍如何使用Python和Django这两个强大的Web开发框架,来构建一个支持多语言的博客网站。Django框架概述Django是一个开源的Web应用框架,由Python写成。它鼓励快速开发和干净的设计。通过提供大量常用组件,Django可以更快地构建高质量的Web
阿里云+华为云双活架构：头部企业的云端生存法则云上的阿七阿里云华为云架构
如何在云端构建高可用、高可靠的业务架构，依然是企业IT决策者面临的挑战。面对单一云厂商可能带来的故障风险，越来越多的头部企业开始采用“阿里云+华为云”双活架构，以提升业务连续性，实现跨云容灾，打造更稳健的云端生存法则。什么是双活架构？双活架构（Active-ActiveArchitecture）指的是企业在两个云平台（如阿里云和华为云）上同时运行核心业务，实现数据同步和业务负载均衡。一旦某一云平台
探寻制造型企业MES管理系统：功能、架构与应用全解析深蓝易网数字工厂制造架构人工智能 1024程序员节大数据运维
在当今制造业蓬勃发展的背景下，制造执行MES系统对于制造型企业的高效运营起着举足轻重的作用。MES管理系统作为连接企业上层管理与底层生产的关键桥梁，其功能模块设计、架构搭建、系统集成以及实际应用都对企业的生产效能和竞争力有着深远影响。一、MES管理系统功能模块设计MES系统具备一系列功能强大的模块，以满足企业复杂的生产管理需求。计划管理模块：此模块主要负责生产计划的编制、下达和灵活调度。它依据订单
【Golang】defer与recover的组合使用星星点点洲 Go golang 开发语言后端
在Go语言中，defer和recover是两个关键特性，通常结合使用以处理资源管理和异常恢复。以下是它们的核心应用场景及使用示例：1.defer的应用场景defer用于延迟执行函数调用，确保在函数退出前执行特定操作。主要用途包括：资源释放文件操作：确保文件句柄关闭。funcreadFile(filenamestring)error{file,err:=os.Open(filename)iferr!
python pip及常用国内镜像源 sunny05296 python python pip 开发语言
pip常用国内镜像源pip默认从国外的python下载会很慢，建议使用一些国内的镜像源，常用的国内镜像源如下：#清华镜像源https://pypi.tuna.tsinghua.edu.cn/simple#中科大镜像源https://pypi.mirrors.ustc.edu.cn/simple#阿里云镜像源https://mirrors.aliyun.com/pypi/simplepip安装组件时
【go】如何处理可选配置还没入门的大菜狗 go golang 开发语言
问题背景：在设计API时，如何处理可选配置？1.配置结构体好处：解决兼容性，但问题是0值，和可读性差如何解决0值？——使用指针，将nil和类型0值做区分但是入参包含结构体，可读性差无法解决2.生成器模式生成器模式介绍生成器模式（BuilderPattern）是一种创建型设计模式，用于构建复杂对象。该模式将对象的构造过程与其表示分离，使同样的构建过程可以创建不同的表示。从您提供的代码中，我们可以看到
零基础上手Python数据分析 (7)：Python 面向对象编程初步 kakaZhui python 数据分析 excel
写在前面回顾一下，我们已经学习了Python的基本语法、数据类型、常用数据结构和文件操作、异常处理等。到目前为止，我们主要采用的是面向过程(ProceduralProgramming)的编程方式，即按照步骤一步一步地编写代码，解决问题。这种方式对于简单的任务已经足够，但当程序变得越来越复杂，代码量越来越大时，面向过程编程可能会显得力不从心，代码难以组织、复用和维护。代码复杂性带来的挑战：面向过程v
使用AI识别语音和B站视频并通过GPT生成思维导图思维导图gpt-4
AI脑图除了对文本、网页链接和文件生成思维导图外，现在也支持了对语音和B站视频的内容识别，并自动生成思维导图。语音生成思维导图直接发送语音：对AI脑图公众号直接发送语音（如使用语音说厦门三天两夜的旅行攻略），AI脑图会自动识别语音内容然后根据内容要求生成思维导图上传语音文件：支持多种音频格式，上传完成后AI脑图会识别音频内容，然后提炼内容关键信息、结构化梳理，并生成思维导图，同时也可以下载识别好的
使用AI识别语音和B站视频并通过GPT生成思维导图思维导图gpt-4
AI脑图除了对文本、网页链接和文件生成思维导图外，现在也支持了对语音和B站视频的内容识别，并自动生成思维导图。语音生成思维导图直接发送语音：对AI脑图公众号直接发送语音（如使用语音说厦门三天两夜的旅行攻略），AI脑图会自动识别语音内容然后根据内容要求生成思维导图上传语音文件：支持多种音频格式，上传完成后AI脑图会识别音频内容，然后提炼内容关键信息、结构化梳理，并生成思维导图，同时也可以下载识别好的
Nginx + CertBot 配置HTTPS泛域名证书(Rocky Linux 9.4)
#安装nginx此步省略，以nginx安装在'/usr/local/nginx-1.23.3'目录为例#1.安装certbot#更新包列表sudodnfupdate#安装EPEL仓库：EPEL仓库提供了许多有用的软件包，包括certbotsudodnfinstall-yepel-release#安装Certbot和Nginx插件。dnfinstall-ycertbotpython3-certbot
OCR提取+识别方案 ocr
1.内容提取通过YOLO提取需要识别的区域1.1安装ultralytics创建虚拟环境(可选)#创建虚拟环境python-mvenv.venv#激活虚拟环境###激活虚拟环境将更改shell的提示以显示您正在使用的虚拟环境，并修改环境，以便运行时python可以获得特定版本和安装的Python。例如：source.venv/bin/activate#显示虚拟环境中安装的所有软件包：python-m
OpenAI Agents SDK 中文文档中文教程（7） wtsolutions openai agents sdk python openai sdk 中文文档
英文文档原文详见OpenAIAgentsSDKhttps://openai.github.io/openai-agents-python/本文是OpenAI-agents-sdk-python使用翻译软件翻译后的中文文档/教程。分多个帖子发布，帖子的目录如下：(1)OpenAI代理SDK，介绍及快速入门(2)OpenAIagentssdk,agents，运行agents，结果，流，工具，交接(3)
Windows端口转发命令 windows
命令介绍Windows从Windows2000开始就提供了最基本的端口转发功能，是基于Windows的IPHelper服务的，不仅可以提供端口转发功能，还可以通过将IPv4和IPv6的不同地址的数据进行转发，但是只可以转发TCP协议，暂不支持UDP协议，使用netshinterfaceportproxy命令即可开启。添加端口转发netshinterfaceportproxyaddv4tov4lis
万字总结（含理解）：git reset、revert、checkout --file、stash、rebase、merge 周里奥 git git 学习
结尾附基本常用命令gitcommit--amend改写提交gitreset回滚代码仓库gitcheckout--file放弃暂存区的修改gitreset测试过程gitrevert测试过程reset和revert区别gitstash测试过程merge对比rebase模拟冲突产生情况git常用命令gitcommit--amend改写提交重写上一次的提交信息，不会生成新的版本号执行了一次提交，提交信息是
oracle 时间格式化 to——datetime,精通 Oracle+Python，第 2 部分：处理时间和日期照月鱼yoyi oracle 时间格式化 to——datetime
作者：PrzemyslawPiotrowskiOracle和Python的日期处理介绍2007年9月发布从Python2.4版开始，cx_Oracle自身可以处理DATE和TIMESTAMP数据类型，将这些列的值映射到Python的datetime模块的datetime对象中。因为datetime对象支持原位的运算操作，这可以带来某些优势。内置的时区支持和若干专用模块使Python成为一台实时机器
位宽512bit显卡_6144 CUDA/512bit位宽 Maxwell架构曝光李涛PS 位宽512bit显卡
【IT168资讯】NVIDIA目前一代的显卡有GK104和GK110两大分支，它们的侧重点不同，但都是基于Kepler(开普勒，天文学家)架构的，下一代架构名为Maxwell(麦克斯韦尔，物理学家)，根据之前的传闻Maxwell最快将在明年Q1季度问世，制程有可能继续使用TSMC的28nm工艺。现在网上又流传开Maxwell的架构设计了，旗舰GM100将有6144个CUDA核心，512bit位宽显
正则表达式思考的橙子后端正则表达式
概念:正则表达式定义了字符串组成的规则定义:1.直接量:注意不要加引号varreg=/^lw{6,12}$/;创建RegExp对象varreg=newRegExp("^lw{6,12}$");方法:test(str):判断指定字符串是否符合规则，返回true或false语法:^:表示开始$:表示结束[]:代表某个范围内的单个字符，比如:[0-9]单个数字字符.:代表任意单个字符，除了换行和行结束符
SourceTree安装与使用缘来的精彩 sourceTree git
一、简介：一个用于Windows和Mac的免费Git客户端。Sourcetree简化了如何与Git存储库进行交互，这样您就可以集中精力编写代码。通过Sourcetree的简单GitGUI可视化和管理存储库。官网下载地址：Sourcetree|FreeGitGUIforMacandWindowsSourceTree下载-SourceTree最新版下载V3.4.22-阔思亮本文介绍的版本为source
Spring Bean 的生命周期是怎样的？冰糖心书房 Spring Framework 2025 Java面试系列 java spring
SpringBean的生命周期是指从Bean的创建到销毁的整个过程，这个过程由SpringIoC容器管理。理解Bean的生命周期可以帮助我们在控制Bean的初始化和销毁行为，以及在Bean生命周期的不同阶段执行自定义逻辑。以下是SpringBean的完整生命周期，包括各个阶段以及可以介入的方法：1.实例化(Instantiation):Bean定义加载：Spring容器读取Bean定义（XML配置
显卡（Graphics Processing Unit，GPU）架构详细解读 m0_74824112 面试学习路线阿里巴巴架构大数据网络
显卡架构主要分为两大类：GPU核心架构（也称为图形处理单元架构）和显卡的其他组件（如内存、控制器、输出接口等）。本篇文章将对显卡架构进行详细分析，重点介绍GPU核心架构、显卡计算单元、显存结构、显卡管线、以及显卡与主机系统的协同工作等。1.显卡架构的基本组成显卡架构可以分为以下几个主要部分：1.1GPU核心（计算单元）GPU核心是显卡的核心部分，负责执行图形渲染和计算任务。GPU核心通常由多个流处
unique_ptr 在异常安全方面怎样？ unique-ptr
std::unique_ptr在异常安全方面表现出色，主要得益于其基于RAII（ResourceAcquisitionIsInitialization，资源获取即初始化）的设计理念。以下是它在异常安全方面的具体表现和优势：自动资源管理std::unique_ptr在构造时接管资源，并在析构时自动释放资源。这意味着即使在异常抛出时，只要std::unique_ptr的析构函数被调用，它所管理的资源就
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他