Python统计词频并绘制图片(附完整代码)

效果

1 实现代码

读取txt文件：

def readText(text_file_path):
    with open(text_file_path, encoding='gbk') as f: #
        content = f.read()
    return content

得到文章的词频：

def getRecommondArticleKeyword(text_content,  key_word_need_num = 10, custom_words = [], stop_words =[], query_pattern = 'searchEngine'):
    '''
    :param text_content: 文本字符串
    :param key_word_need_num: 需要的关键词数量
    :param custom_words: 自定义关键词
    :param stop_words: 不查询关键词
    :param query_pattern:
    precision:精确模式————试图将句子最精确地切开，适合文本分析；
    entire：全模式————把句子中所有的可以成词的词语都扫描出来, 速度非常快，但是不能解决歧义；
    searchEngine:搜索引擎模式————在精确模式的基础上，对长词再次切分，提高召回率，适合用于搜索引擎分词；
    paddle模式————利用PaddlePaddle深度学习框架，训练序列标注（双向GRU）网络模型实现分词。同时支持词性标注。
    :return:
    '''
    # jieba.enable_paddle()
    # paddle.fluid.install_check.run_check()
    if not isinstance(text_content, str):
        raise ValueError('文本字符串类型错误！')
    if not isinstance(key_word_need_num, int):
        raise ValueError('关键词个数类型错误！')
    if not isinstance(custom_words, list):
        raise ValueError('自定义关键词类型错误！')
    if not isinstance(stop_words, list):
        raise ValueError('屏蔽关键词类型错误！')
    if not isinstance(query_pattern, str):
        raise ValueError('查询模式类型错误！')

    # 添加自定义关键词
    for word in custom_words:
        jieba.add_word(word)

    if query_pattern == 'searchEngine':
        key_words = jieba.cut_for_search(text_content)
    elif query_pattern == 'entire':
        key_words = jieba.cut(text_content, cut_all=True, use_paddle=True)
    elif query_pattern == 'precision':
        key_words = jieba.cut(text_content, cut_all=False, use_paddle=True)
    else:
        return []

    # print("拆分后的词: %s" % " ".join(key_words))

    # 过滤后的关键词
    stop_words = set(stop_words)
    word_count = Counter()
    for word in key_words:
        if len(word) > 1 and word not in stop_words:
            word_count[word] += 1

    # res_words = list()
    # for data in word_count.most_common(key_word_need_num):
    #     res_words.append(data[0])
    # return res_words

    return word_count

绘制图片：

def drawWordsCloud(word_count, save_img_filePath='', img_mask_filePath=''):
    # print(word_count)
    # print(type(word_count))

    if len(img_mask_filePath) != 0:
        img_mask = np.array(Image.open(img_mask_filePath)) #打开遮罩图片,将图片转换为数组
        wc = wordcloud.WordCloud(font_path='/Library/Fonts/Arial Unicode.ttf',# 设置中文字体，词云默认字体是“DroidSansMono.ttf字体库”，不支持中文
                                 background_color="white",  # 设置背景颜色
                                 max_words=200,  # 设置最大显示的字数
                                 max_font_size=50,  # 设置字体最大值
                                 random_state=30,  # 设置有多少种随机生成状态，即有多少种配色方案
                                 width=400,
                                 height=200,
                                 mask=img_mask
                                 )
    else:
        wc = wordcloud.WordCloud(font_path='/Library/Fonts/Arial Unicode.ttf',# 设置中文字体，词云默认字体是“DroidSansMono.ttf字体库”，不支持中文
                                 background_color="white",  # 设置背景颜色
                                 max_words=200,  # 设置最大显示的字数
                                 max_font_size=50,  # 设置字体最大值
                                 random_state=30,  # 设置有多少种随机生成状态，即有多少种配色方案
                                 width=400,
                                 height=200
                                 )
    # 绘图
    wc.generate_from_frequencies(word_count)   #从字典生成词云
    plt.imshow(wc)      #显示词云
    plt.axis('off')     #关闭坐标轴
    plt.show()          #显示图像

    # 保存图片
    if len(save_img_filePath) != 0:
        wc.to_file(save_img_filePath)
    else:
        pass

2 完整代码

#-*- coding : utf-8-*-
import jieba
from collections import Counter
import paddle

import wordcloud    #词云展示库
import matplotlib.pyplot as plt     #图像展示库

import time

from PIL import Image
import numpy as np

def timer(func):
    def calculateTime(*args, **kwargs):
        t = time.perf_counter()
        result = func(*args, **kwargs)
        print(f'func {func.__name__} coast time:{time.perf_counter() - t:.8f} s')
        return result
    return calculateTime

def readText(text_file_path):
    with open(text_file_path, encoding='gbk') as f: #
        content = f.read()
    return content

@timer
def getRecommondArticleKeyword(text_content,  key_word_need_num = 10, custom_words = [], stop_words =[], query_pattern = 'searchEngine'):
    '''
    :param text_content: 文本字符串
    :param key_word_need_num: 需要的关键词数量
    :param custom_words: 自定义关键词
    :param stop_words: 不查询关键词
    :param query_pattern:
    precision:精确模式————试图将句子最精确地切开，适合文本分析；
    entire：全模式————把句子中所有的可以成词的词语都扫描出来, 速度非常快，但是不能解决歧义；
    searchEngine:搜索引擎模式————在精确模式的基础上，对长词再次切分，提高召回率，适合用于搜索引擎分词；
    paddle模式————利用PaddlePaddle深度学习框架，训练序列标注（双向GRU）网络模型实现分词。同时支持词性标注。
    :return:
    '''
    # jieba.enable_paddle()
    # paddle.fluid.install_check.run_check()
    if not isinstance(text_content, str):
        raise ValueError('文本字符串类型错误！')
    if not isinstance(key_word_need_num, int):
        raise ValueError('关键词个数类型错误！')
    if not isinstance(custom_words, list):
        raise ValueError('自定义关键词类型错误！')
    if not isinstance(stop_words, list):
        raise ValueError('屏蔽关键词类型错误！')
    if not isinstance(query_pattern, str):
        raise ValueError('查询模式类型错误！')

    # 添加自定义关键词
    for word in custom_words:
        jieba.add_word(word)

    if query_pattern == 'searchEngine':
        key_words = jieba.cut_for_search(text_content)
    elif query_pattern == 'entire':
        key_words = jieba.cut(text_content, cut_all=True, use_paddle=True)
    elif query_pattern == 'precision':
        key_words = jieba.cut(text_content, cut_all=False, use_paddle=True)
    else:
        return []

    # print("拆分后的词: %s" % " ".join(key_words))

    # 过滤后的关键词
    stop_words = set(stop_words)
    word_count = Counter()
    for word in key_words:
        if len(word) > 1 and word not in stop_words:
            word_count[word] += 1

    # res_words = list()
    # for data in word_count.most_common(key_word_need_num):
    #     res_words.append(data[0])
    # return res_words

    return word_count

def drawWordsCloud(word_count, save_img_filePath='', img_mask_filePath=''):
    # print(word_count)
    # print(type(word_count))

    if len(img_mask_filePath) != 0:
        img_mask = np.array(Image.open(img_mask_filePath)) #打开遮罩图片,将图片转换为数组
        wc = wordcloud.WordCloud(font_path='/Library/Fonts/Arial Unicode.ttf',# 设置中文字体，词云默认字体是“DroidSansMono.ttf字体库”，不支持中文
                                 background_color="white",  # 设置背景颜色
                                 max_words=200,  # 设置最大显示的字数
                                 max_font_size=50,  # 设置字体最大值
                                 random_state=30,  # 设置有多少种随机生成状态，即有多少种配色方案
                                 width=400,
                                 height=200,
                                 mask=img_mask
                                 )
    else:
        wc = wordcloud.WordCloud(font_path='/Library/Fonts/Arial Unicode.ttf',# 设置中文字体，词云默认字体是“DroidSansMono.ttf字体库”，不支持中文
                                 background_color="white",  # 设置背景颜色
                                 max_words=200,  # 设置最大显示的字数
                                 max_font_size=50,  # 设置字体最大值
                                 random_state=30,  # 设置有多少种随机生成状态，即有多少种配色方案
                                 width=400,
                                 height=200
                                 )
    # 绘图
    wc.generate_from_frequencies(word_count)   #从字典生成词云
    plt.imshow(wc)      #显示词云
    plt.axis('off')     #关闭坐标轴
    plt.show()          #显示图像

    # 保存图片
    if len(save_img_filePath) != 0:
        wc.to_file(save_img_filePath)
    else:
        pass



if __name__ == '__main__':
    pass
    # /Users/mac/Downloads/work/retailSoftware/公司项目/test.txt
    text_file_path = "/Users/mac/Downloads/电子书/编程思想/相约星期二/相约星期二.txt"
    # text_file_path = "/Users/mac/Downloads/work/retailSoftware/公司项目/test3.txt"
    text_content = readText(text_file_path)
    # print(text_content)
    # print(JNI_API_getRecommondArticleKeyword(text_content))
    img_mask_filePath = '/Users/mac/Desktop/截屏2021-08-20 下午4.02.10.png'
    img_save_filePath = '/Users/mac/Downloads/test9.png'
    drawWordsCloud(getRecommondArticleKeyword(text_content), img_save_filePath, img_mask_filePath)

到此这篇关于Python统计词频并绘制图片(附完整代码)的文章就介绍到这了,更多相关Python统计词频绘制图片内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

惊人的贵！DeepSeek-R1 本地部署成本不同方案大对比，成本优化建议也一并奉上！你能部署的起吗？涛涛讲AI 大模型大模型
关于DeepSeek-R1本地部署的成本信息，费用范围因部署方案和硬件配置差异较大，具体可分为以下三类情况：一、企业级满血版部署（671B参数）硬件采购成本服务器集群：含8张NVIDIAA100/H100显卡的服务器，市场价格约80-120万元配套设备：液冷系统、冗余电源等附加成本约15-25万元运维成本电费：满载功耗约6000W，年电费约5-8万元（按工业电价1.2元/度计算）维护：专业工程师团
【Agent】OpenManus-Agent-实现具体的智能体非晓为骁 AI agent agi ai openManus Manus 架构
所有实例Agent都是继承ToolCallAgent，所以只列出额外的参数字段，继承的见ToolCallAgent1.Manus（通用Agent）概述Manus是一个多功能通用Agent，使用多种工具解决各种任务，提供了包括Python执行、网络浏览、文件操作和信息检索等功能。参数属性名默认值nameManusdescriptionAversatileagentthatcansolvevariou
力扣--数组6.Z字形变换 gotoc丶 leetcode 算法 c++c语言数据结构
思路分析处理特殊情况：如果numRows为1，那么字符排列与原字符串相同，无需进行转换，直接返回原字符串。定义和初始化变量：n：字符串长度。k：一个完整的“V”字形周期长度，计算公式为2*numRows-2。a：一个包含numRows个字符串的向量，用于存储每一行的字符。遍历字符串并填充每行字符：遍历字符串中的每个字符，通过计算确定字符属于哪一行，然后将该字符添加到对应的行。行的计算方式为min(
力扣215. 数组中的第K个最大元素 hyssop2019 算法 leetcode 算法排序算法
题目描述给定整数数组nums和整数k，请返回数组中第k个最大的元素。请注意，你需要找的是数组排序后的第k个最大的元素，而不是第k个不同的元素。你必须设计并实现时间复杂度为O(n)的算法解决此问题。示例1:输入:[3,2,1,5,6,4],k=2输出:5示例2:输入:[3,2,3,1,2,4,5,5,6],k=4输出:4提示：1cursor){returnpartition(nums,cursor+
leetcode:206.反转链表 uncle_ll 编程练习-Leetcode leetcode 链表反转递归迭代算法训练营
206.反转链表来源：力扣（LeetCode）链接:https://leetcode.cn/problems/reverse-linked-list给你单链表的头节点head，请你反转链表，并返回反转后的链表。示例1：输入：head=[1,2,3,4,5]输出：[5,4,3,2,1]示例2：输入：head=[1,2]输出：[2,1]示例3：输入：head=[]
linux操作速查程序员小软 linux 运维 linux 服务器运维
功能创建新用户并赋予root权限切记在root身份下操作查看用户列表cat/etc/passwd创建新用户useradd为账户设置密码passwd赋予root权限编辑/etc/sudoers文件添加一行ALL=(ALL)ALL验证sudo-l#查看当前用户可使用的命令，仅限root用户可用sudo-i#命令切换到root权限问题处理处理端口被占用：netstat-ano|find“80”//列出端
uniapp移动端图片比较器组件，仿英伟达官网rtx光追图片比较器功能独断万古的伊莉雅 uni-app javascript 前端组件
组件下载地址：https://ext.dcloud.net.cn/plugin?id=22609已测试h5和微信小程序，理论支持全平台亮点：简单易用使用js计算而不是resize属性，定制化程度更高组件挂在后可播放指示线动画，提示用户可以拖拽比较图片左右下角可配置文字，且指引线距离文字过近时文字会变透明使用示例RTXOFF效果示例：
006 python-if条件梅洪 python python 服务器开发语言
Pythonif条件教学设计一、教学目标了解if语句的基本结构和执行逻辑。掌握if-else和if-elif-else语句的使用方法。能够运用条件判断解决实际问题，如分数判断、用户登录等。理解if语句中的比较运算符和逻辑运算符的作用。二、教学重点if语句的基本语法if-else语句if-elif-else语句逻辑运算符and、or、not在if语句中的应用三、教学难点多重if-elif-else结
答题卡图像识别需求分析、市场分析和技术实现 weixin_34037977 人工智能开发工具 json
答题卡图像识别需求分析、市场分析和技术实现一、需求分析一、以接口的方式开发此需求：1：接收图片以上传的方式把图片发送到接口。2：识别图片接口接收到图片后，进行图像识别。3：返回数据返回识别后的JSON格式数据。二、答题卡图片识别的具体要求：图片是通过手机、相机、扫描仪等设备拍照而来，其中手机、相机拍出的照片会出现像素低、图像不正、聚焦不清楚等问题；1：图片只要是人眼能看清楚的即可完成识别；2：80
神经网络模型压缩&实例教程—非结构化剪枝程序先锋《python深度学习》笔记神经网络剪枝深度学习
目录1.导包&定义一个简单的网络2.获取网络需要剪枝的模块3.模块剪枝（核心）3.1随机剪枝weight3.2L1范数剪枝bias4.总结最先进的深度学习技术依赖于难以部署的过度参数化模型。相反，已知生物神经网络使用高效的稀疏连接。为了在不牺牲准确性的情况下减少内存、电池和硬件消耗，通过减少模型中的参数数量来确定压缩模型的最佳技术是很重要的。这反过来又允许您在设备上部署轻量级模型，并通过设备上的私
【python双目标定轮椅】基于python的双目标定迟钝皮纳德 python opencv 计算机视觉
代码部分话不多说直接上代码：新建文件getdata.pyimportcv2importosid_image=0#图片的IDcamera=cv2.VideoCapture(1)#找到棋盘格的标准criteria=(cv2.TERM_CRITERIA_EPS+cv2.TERM_CRITERIA_MAX_ITER,30,0.001)camera.set(cv2.CAP_PROP_FRAME_WIDTH,
Python 中的离线语音转文本无水先生语音编程人工智能综合 python 开发语言
Python中的离线语音转文本一、说明写作、编码、写博客、办公室工作、文档、报告都需要一个人在键盘上打字。这会导致健康问题，如腕管综合症、手和手指疼痛等。我非常了解这种痛苦。这是用于创建自己的离线运行的听写程序的Python代码。只需对着耳机的麦克风说话，它就会将您的话转换为文本并将其保存在文本文件中。二、安装您将需要安装Python库—vosk、pyaudio。 Vosk是一个语音识别
深度学习模型压缩：非结构化剪枝与结构化剪枝的定义与对比从零开始学习人工智能深度学习剪枝人工智能
****在深度学习中，模型压缩是优化模型性能、降低存储和计算成本的重要技术之一。其中，剪枝（Pruning）是最常用的方法之一。根据剪枝的粒度和目标，剪枝可以分为非结构化剪枝（UnstructuredPruning）和结构化剪枝（StructuredPruning）。本文将详细介绍这两种剪枝方法的定义，并通过对比帮助读者更好地理解它们的差异。1.非结构化剪枝（UnstructuredPruning
最方便的离线python实时中文语音识别！迟钝皮纳德 python 语音识别
废话不多说，直接上代码，先安装环境需要安装的包：jsonpyaudionumpyvosk新建一个py文件写入：importjsonimportpyaudioimportnumpyasnpfromvoskimportModel,KaldiRecognizer,SetLogLeveldefSaveWave(model):#设置音频参数FORMAT=pyaudio.paInt16#音频流的格式RATE=
python插入排序算法编程小白gogogo python python 排序算法算法
defi_sort(arr):#从第二个元素开始遍历整个数组foriinrange(1,len(arr)):key=arr[i]#当前要插入的元素j=i-1#指向当前元素的前一个元素#将大于key的元素都向右移动一位whilej>=0andkey
python 创建子图_在python中以绘图方式创建子图 weixin_39899691 python 创建子图
Iamfairlynewtopythonandploty(<3monthsofactualcodingatthispoint).Iamtryingtocreatesubplotsinplotly.Ihavecreatedgraphsinplotlyusingthecodebelow(codesnippetsattachedbelowaswell),butIcan'tseemtogetthemtow
pythonsubplot_python matplotlib中的subplot函数使用详解郝志鹄 pythonsubplot
python里面的matplotlib.pylot是大家比较常用的，功能也还不错的一个包。基本框架比较简单，但是做一个功能完善且比较好看整洁的图，免不了要网上查找一些函数。于是，为了节省时间，可以一劳永逸。我把常用函数作了一个总结，最后写了一个例子，以后基本不用怎么改了。一、作图流程：1.准备数据，，3作图，4定制，5保存，6显示1.数据可以是numpy数组，也可以是list2创建画布：impor
Java中的受检异常 weixin_34132768 java runtime
Java中的受检异常Java提供了三种异常类型，受检异常(checkedexception)、运行时异常(runtimeexception)、错误(error)。那么这受检异常在实际开发中又有什么最佳实践呢？受检异常如果抛出的异常是可恢复的，同时我们也期望API的调用者捕获异常进行恢复处理，那么我们应该使用受检异常。受检异常会强迫API的使用者截获异常并恢复处理，或者进行声明继续抛出。图1.IDE
基于关键词的文本知识的挖掘系统的设计与实现赵谨言论文毕业设计经验分享
标题:基于关键词的文本知识的挖掘系统的设计与实现内容:1.摘要随着信息时代的发展，文本数据呈爆炸式增长，如何从海量文本中高效挖掘有价值的知识成为重要问题。本文旨在设计并实现一个基于关键词的文本知识挖掘系统。方法上，该系统先对输入的文本进行预处理，包括分词、去除停用词等操作，然后基于关键词匹配算法从文本中提取相关信息，最后将提取的知识进行整理和存储。通过实际测试，该系统能够在平均3秒内对一篇5000
python 替换字符串 Aa123456789_55 pandas python 数据库开发语言
在Python中，替换字符串可以通过多种方式实现，具体取决于您的需求和上下文。以下是几种常见的方法：1.使用str.replace()方法str.replace(old,new[,count])是最常用的字符串替换方法。它会将字符串中的所有匹配项替换为新的字符串。old:要被替换的子字符串。new:用来替换的新字符串。count(可选):替换的最大次数。如果未指定，则替换所有匹配项。示例代码：or
高级箱型图 Aa123456789_55 图形展示 python
一个点展示多个数据在箱形图（boxplot）中，如果你想在一个点上展示多组数据，可以通过在同一位置绘制多个箱形图来实现。这通常用于比较不同组在相同特征上的分布情况假设我们有三组数据，每组数据包含多个子组，每个子组在同一个x轴位置上。importmatplotlib.pyplotaspltimportnumpyasnp#示例数据data1=[np.random.normal(0,1,100),np.
python数据可视化玩转Matplotlib subplot子图操作，四个子图（一包四），三个子图，子图拉伸_python subplot 2401_83817843 程序员 python 信息可视化 matplotlib
大锤爱编程的博客_CSDN博客-大数据,Go,数据分析领域博主Matplotlib是一个流行的Python可视化库，它提供了许多功能来创建各种类型的图表。其中一个功能是子图，它允许您在单个图表中绘制多个图。一、创建子图要创建子图，请使用plt.subplots()函数。该函数接受三个参数：行数、列数和子图编号。以下是一个简单的示例：importmatplotlib.pyplotaspltfig,a
MySQL探秘之旅：总体架构介绍互联网全栈架构 mysql 架构数据库
欢迎关注微信公众号：互联网全栈架构自从《吃透Redis系列》阅读量屡创新高之后，更加坚定了创作技术系列文章的决心，从而让朋友们获得更加体系化的知识。当然，这是一件非常不容易的事情，让每篇文章都能单独成篇且质量上乘，同时，把它们连起来以后又能构成一个体系，着实困难。但不管如何，我觉得这样的方向和做法没有问题，应该会受到大家的欢迎，那就迎难而上。上次做了一个统计，相对来说，大家对于MySQL的文章比较
python subplot函数应用 - 创建多个子图 Aa123456789_55 图形展示代码学习 python 开发语言
subplot语法：plt.subplot是Matplotlib库中的一个非常有用的函数，用于在一个图形窗口中创建多个子图plt.subplot函数用于在当前图形窗口中创建并激活一个子图。其基本语法如下：plt.subplot(nrows,ncols,index)参数详解：nrows:子图的行数。这是指整个图形窗口将被分成多少行子图。ncols:子图的列数。这是指整个图形窗口将被分成多少列表子图。
数据结构与算法：洪水填充 WBluuue c++算法 leetcode 数据结构深度优先剪枝图论
前言洪水填充是一种用在图上的搜索算法，其过程就像洪水或病毒一样逐渐蔓延整个区域，继而达到遍历和统计相同属性的连通区域的功能，中间也可以通过每走过一个节点就设置路径信息的方法来达到剪枝的效果。一、岛屿数量——洪水填充方法classSolution{public:intnumIslands(vector>&grid){returnsolve2(grid);}//洪水填充方法intsolve2(vect
图像分割基础：使用Python和scikit-image库 0dayNu1L 机器学习项目实战 python 人工智能机器学习
大家好，今天我们将一起探讨图像分割的基础知识，并使用Python编程语言以及scikit-image库来实现一个简单的图像分割示例。图像分割是图像处理中的一项重要技术，它允许我们将图像划分为多个部分或对象，这对于图像分析和计算机视觉任务至关重要。0dayNu1L-CSDN博客目录一、环境准备二、图像分割示例1.导入必要的库2.读取并显示图像3.创建标签数组并进行阈值分割4.使用颜色表示标签三、结果
SwiftUI（二十二）- SwiftUI 实现多页面应用 TabView和自定义底部导航胖虎1 SwiftUI入门基础 swiftui ios swift 自定义TabBar TabView
引言大多数现代移动应用通常是多页面应用，用户通过底部导航栏（TabBar）或者侧边菜单在不同页面之间切换。在传统的UIKit中，这种布局的实现相对简单，通常使用UITabbarController来管理底部导航栏，并通过导航控制器来管理页面的跳转。然而，随着SwiftUI的推出，苹果提供了一个全新的声明式框架，使得应用的布局和导航方式有了更加灵活和简洁的选择。虽然SwiftUI本身没有传统的UIT
pythoneasyinstall安装第三方库_【Python使用】Python安装第三方包（easy_install和pip工具）... 不死鹰阿江
本文是对python的第三方包/模块的安装的说明，官方下载第三方包的地址为：https://pypi.org/。1.工具安装部署1.1setuptools安装部署(easy_install)easy_install是由PEAK(PythonEnterpriseApplicationKit)开发的setuptools包里带的一个命令，它用来自动地从http://pypi.python.org/sim
Python库 - skimage 司南锤 PYTHON库 python 开发语言
skimage是scikit-image的缩写，是一个用于图像处理的Python库。提供了丰富的图像处理功能，包括图像滤波、边缘检测、形态学操作、特征提取、图像分割等。skimage是基于NumPy数组构建的，因此可以与NumPy和其他科学计算库（如scipy和matplotlib）无缝集成。安装可以使用pip来安装skimage：pipinstallscikit-image主要模块skimage
scikit-image（Scikit-image 是用于图像处理的 Python 包，使用原生的 NumPy 数组作为图像对象） Clark-dj 图像处理 python numpy
Scikitimage中文开发手册-开发者手册-腾讯云开发者社区-腾讯云昨天搜索一个函数时无意间发现这个网站，今天来学习一下，仅作学习笔记。measureskimage.measure.approximate_polygon（coords，...）近似具有指定公差的多边形链。skimage.measure.block_reduce（image，block_size）通过对局部块应用函数来下采样图像
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他

Python统计词频并绘制图片(附完整代码)

效果

1 实现代码

2 完整代码

你可能感兴趣的:(Python统计词频并绘制图片(附完整代码))