感谢地心引力

【Python】词云之wordcloud参数全解析

有用的话，欢迎姗莲✨✨✨✨✨✨✨✨✨✨✨✨✨

一基础用法
二、WordCloud类形参说明
- 2.1 常用参数
- - 2.11 字体 font_path
  - 2.12 画布尺寸 width、hight
  - 2.13 比例（缩放）scale
  - 2.14 颜色(表) colormap
  - 2.15 颜色函数 color_func
  - 2.16 词语组合频率collocations
  - 2.17 遮罩（蒙版）mask
  - 2.18 轮廓宽度和颜色 contour_width、contour_color
- 2.2~2.3 不常用参数
- - 2.21 词云边界 margin
  - 2.22 词语水平排版频率 prefer_horizontal
  - 2.23 显示词语的最大个数 max_words
  - 2.24 最小、最大字体大小 min_font_size 、max_font_size
  - 2.25 字体步长 font_step
  - 2.26 停用（屏蔽）词 stopwords
  - 2.27 背景色 background_color
  - 2.28 色彩模式 mode
  - 2.29 词语数量很少时重复 repeat
  - 2.30词语最短长度 min_word_length
  - 2.31 是否包含数字 include_numbers
  - 2.32 正则表达式 regexp
  - 2.33 单词搭配(词组) 出现最低频率 collocation_threshold
  - 2.34 单词复数转为单数 normalize_plurals
  - 2.35 词语相对大小 relative_scaling
  - 2.36 是否仅显示高频词 ranks_only
  - 2.37 随机生成器种子参数 random_state
三、常用方法
- 3.1 词云生成相关
- - 3.11 根据词频字典生成 fit_words()
  - 3.12 常用 generate()
  - 3.13 根据词频字典生成 generate_from_frequencies()
  - 3.14 根据文本生成generate_from_text()
  - 3.15 词频统计 process_text()
  - 3.16 单词重新上色 recolor()
- 3.2 文件保存相关
- - 3.21 保存为数组 to_array
  - 3.22 保存为文件 to_file
  - 3.23 转换为PIL图像 to_image
  - 3.24 转换为SVG图像 to_svg
四、关于词云背景图片
五、完整demo

以该视频的弹幕文件为例，我已保存为txt文件。

【4K60FPS】周杰伦《暗号》神级现场！The one演唱会live

一基础用法

其中,self.Read_txt()是我的txt文本文件。

wd_0 = WordCloud(font_path='simhei.ttf',
                         # background_color='white',
                         colormap='autumn',
                         width=800,height=400,
                         collocations=True,
                         scale=4,
                         mask=mask_img).generate(self.Read_txt())
plt.imshow(wd_0,interpolation='bilinear')
plt.axis('off')
plt.show()

上面的代码已经可以生成一个清晰、有效的词云图像了。若要优化其他细节，可以参考下面的参数说明。

二、WordCloud类形参说明

通过参数可以指定词云图像的字体、大小、配色等。

WordCloud这个类的全部参数如下：

WordCloud(font_path=None, width=400, height=200, margin=2, ranks_only=None, prefer_horizontal=0.9, mask=None, scale=1, color_func=None, max_words=200, min_font_size=4, stopwords=None, random_state=None, background_color=‘black’, max_font_size=None, font_step=1, mode=‘RGB’, relative_scaling=‘auto’, regexp=None, collocations=True, colormap=None, normalize_plurals=True, contour_width=0, contour_color=‘black’, repeat=False, include_numbers=False, min_word_length=0, collocation_threshold=30)

一般来说设置字体、尺寸、配色、缩放等少量几个参数就足够了。本文对WordCloud所有的形参进行说明。

2.1 常用参数

2.11 字体 font_path

 |  font_path : string
 |      Font path to the font that will be used (OTF or TTF).
 |      Defaults to DroidSansMono path on a Linux machine. If you are on
 |      another OS or don't have this font, you need to adjust this path.

设置示例：

font_path='simhei.ttf'

默认值：Linux的DroidSansMono 路径，一般windows是没有的，需要设置。

否则词云可能无法正确显示文字内容（类似于乱码），一般字体文件名为 name.ttf这种格式。
查看本机全部字体可以在：C:\Windows\Fonts路径下查看，或者从控制面板>外观和个性化>字体打开。

字体名称并不是仿宋、楷体这种，而是要在对应的字体上右键>属性，来查看其名称，如华文彩云这个字体的名称是：STCAIYUN.TTF

2.12 画布尺寸 width、hight

 |  width : int (default=400)
 |      Width of the canvas.
 |  
 |  height : int (default=200)
 |      Height of the canvas.

默认是400x200，单位：像素。

2.13 比例（缩放）scale

 |  scale : float (default=1)
 |      Scaling between computation and drawing. For large word-cloud images,
 |      using scale instead of larger canvas size is significantly faster, but
 |      might lead to a coarser fit for the words.

若画布设置为 400x200，若scale = 5，则词云图像的尺寸变成 2000x1000（像素）。

建议设置较小的画布尺寸，然后缩放成目标大小当然缩放系数要适当，太大也不合适

若直接将画布尺寸设置成2000x1000，虽然尺寸是一样的，但加载时间会比设置scale=5长很多.

词云的像素尺寸越大，越清晰，词频较低的字号很小的词语也能看清了。

2.14 颜色(表) colormap

 |  colormap : string or matplotlib colormap, default="viridis"
 |      Matplotlib colormap to randomly draw colors from for each word.
 |      Ignored if "color_func" is specified.
 |  
 |      .. versionadded: 2.0

colormap 是一个预定义的 Matplotlib colormap**。

默认值是：viridis。

一般我们使用matplotlib的colormap即可：

Matplotlib 提供了多种预定义的 colormap，如 viridis、 jet、 winter、 summer、 spring、
autumn、 cool、 hot、 gray 等

格式：

colormap = 'spring'

注：如果设置了color_func参数，则这一项失效。

2.15 颜色函数 color_func

 |  color_func : callable, default=None
 |      Callable with parameters word, font_size, position, orientation,
 |      font_path, random_state that returns a PIL color for each word.
 |      Overwrites "colormap".
 |      See colormap for specifying a matplotlib colormap instead.
 |      To create a word cloud with a single color, use
 |      ``color_func=lambda *args, **kwargs: "white"``.
 |      The single color can also be specified using RGB code. For example
 |      ``color_func=lambda *args, **kwargs: (255,0,0)`` sets color to red.

color_func 可以是一个预定义的函数，或者是一个自定义函数，用来确定每个词的颜色。

一般我们使用colormap这个参数就够了。

color_func示例：
设置词云颜色为白色：

color_func=lambda *args, **kwargs: "white"

2.16 词语组合频率collocations

 |  collocations : bool, default=True
 |      Whether to include collocations (bigrams) of two words. Ignored if using
 |      generate_from_frequencies.

collocations 是一个用来控制词云图像中词语组合频率的参数。当 collocations 被设置为 True 时，wordcloud 将会考虑两个词之间的关系来计算它们的频率。

建议设置为False。

对比如下：

1. collocations=True

2.collocations=False

2.17 遮罩（蒙版）mask

 |  mask : nd-array or None (default=None)
 |      If not None, gives a binary mask on where to draw words. If mask is not
 |      None, width and height will be ignored and the shape of mask will be
 |      used instead. All white (#FF or #FFFFFF) entries will be considerd
 |      "masked out" while other entries will be free to draw on. [This
 |      changed in the most recent version!]

常常用来设置词云图像的形状，如果设置了mask，将由遮罩图像的尺寸来定义词云图像的尺寸。

mask的值是一个图像的二进制数据（矩阵），可用ndarray表示。

常常与2.18中的轮廓参数结合使用。

2.18 轮廓宽度和颜色 contour_width、contour_color

 |  contour_width: float (default=0)
 |      If mask is not None and contour_width > 0, draw the mask contour.
 |  
 |  contour_color: color value (default="black")
 |      Mask contour color.

遮罩（蒙版）图像的轮廓宽度和颜色。
如：

mask=mask_img,
contour_width= 10.0,
contour_color='blue',

2.2~2.3 不常用参数

2.21 词云边界 margin

默认值是2（像素）。

即词语显示区域距离整个图像边界的距离。

如果原始尺寸是 800x400，设置margin = 20，那么词云实际显示的区域大小为：760x360，图像大小不变，只是多了一个空白的边框。

这个参数再GUI相关的应用中基本都有，比如Android、微信小程序、前端、tkinter等等。

2.22 词语水平排版频率 prefer_horizontal

 |  prefer_horizontal : float (default=0.90)
 |      The ratio of times to try horizontal fitting as opposed to vertical.
 |      If prefer_horizontal < 1, the algorithm will try rotating the word
 |      if it doesn't fit. (There is currently no built-in way to get only
 |      vertical words.)

词语水平方向排版出现的频率，默认 0.9 ，这不用解释了吧。

2.23 显示词语的最大个数 max_words

 |  max_words : number (default=200)
 |      The maximum number of words.

这个参数有时候也会根据实际需求设置的。默认不超过200个。

2.24 最小、最大字体大小 min_font_size 、max_font_size

 |  min_font_size : int (default=4)
 |      Smallest font size to use. Will stop when there is no more room in this
 |      size.

 |  max_font_size : int or None (default=None)
 |      Maximum font size for the largest word. If None, height of the image is
 |      used.

一般不需要设置，最多设置一下最小字号。

2.25 字体步长 font_step

 |  font_step : int (default=1)
 |      Step size for the font. font_step > 1 might speed up computation but
 |      give a worse fit.

默认值即可。

2.26 停用（屏蔽）词 stopwords

 |  stopwords : set of strings or None
 |      The words that will be eliminated. If None, the build-in STOPWORDS
 |      list will be used. Ignored if using generate_from_frequencies.

要屏蔽的词，不设置则为内部默认的STOPWORDS。

2.27 背景色 background_color

 |  background_color : color value (default="black")
 |      Background color for the word cloud image.

图像背景色，十六进制或者英文名都可。

background_color='#450073',
# 或者
background_color='black',

2.28 色彩模式 mode

 |  mode : string (default="RGB")
 |      Transparent background will be generated when mode is "RGBA" and
 |      background_color is None.

默认是RGB色彩，如果设置为RGBA，并且背景色设置为None时，背景为透明。
即：

mode='RGBA',
background_color=None,

2.29 词语数量很少时重复 repeat

 |  repeat : bool, default=False
 |      Whether to repeat words and phrases until max_words or min_font_size
 |      is reached.

比如默认显示200个词语，但我的文本只有50个词，是否选择重复显示这些词语，知道数量达到200。默认不开启。

2.30词语最短长度 min_word_length

 |  min_word_length : int, default=0
 |      Minimum number of letters a word must have to be included.

2.31 是否包含数字 include_numbers

 |  include_numbers : bool, default=False
 |      Whether to include numbers as phrases or not.

2.32 正则表达式 regexp

 |  regexp : string or None (optional)
 |      Regular expression to split the input text into tokens in process_text.
 |      If None is specified, ``r"\w[\w']+"`` is used. Ignored if using
 |      generate_from_frequencies.

可以用来过滤用于生成词云的单词，只允许那些符合模式的单词包括在内。例如，您可以使用正则表达式只包括以某个字母开头或包含特定字符序列的单词。这样，您可以专注于您想要在词云中强调的特定单词或短语，或排除某些不想包括的单词。正则表达式在词云中的具体实现将取决于使用的特定库或工具。

该参数，在一些特定应用中还是有用的。

2.33 单词搭配(词组) 出现最低频率 collocation_threshold

 |  collocation_threshold: int, default=30
 |      Bigrams must have a Dunning likelihood collocation score greater than this
 |      parameter to be counted as bigrams. Default of 30 is arbitrary.

搭配是一组经常一起出现在文本中的单词。collocation_threshold参数控制单词对一起出现的最小次数，以便被视为搭配。如果一对单词的频率低于collocation_threshold，则不会被视为搭配，并且不会包括在词云中。这个参数允许您关注文本中最频繁出现的搭配，并排除较不常见的搭配。

2.34 单词复数转为单数 normalize_plurals

 |  normalize_plurals : bool, default=True
 |      Whether to remove trailing 's' from words. If True and a word
 |      appears with and without a trailing 's', the one with trailing 's'
 |      is removed and its counts are added to the version without
 |      trailing 's' -- unless the word ends with 'ss'. Ignored if using
 |      generate_from_frequencies.

normalize_plurals参数是用于将复数单词规范化为单数形式的参数。当该参数设置为True时，词云生成工具会将所有出现的复数单词转换为单数形式，以便在词云中统计词频。例如，如果"dogs"和"dog"都出现在文本中，那么在normalize_plurals设置为True时，它们将被视为同一个单词"dog"，并在词云中统计词频。这样可以减少不必要的单词数量，并使统计结果更具意义。

默认就开启这项功能的。

2.35 词语相对大小 relative_scaling

 |  relative_scaling : float (default='auto')
 |      Importance of relative word frequencies for font-size.  With
 |      relative_scaling=0, only word-ranks are considered.  With
 |      relative_scaling=1, a word that is twice as frequent will have twice
 |      the size.  If you want to consider the word frequencies and not only
 |      their rank, relative_scaling around .5 often looks good.
 |      If 'auto' it will be set to 0.5 unless repeat is true, in which
 |      case it will be set to 0.

用于控制词云中词语的相对大小的参数。这个参数的值越大，词语越大，反之越小。当relative_scaling设置为0时，所有单词的大小都相同，而当relative_scaling设置为1时，单词的大小与它们在文本中出现的频率成正比。该参数可以通过调整来更好地展示词云中词语的相对重要性。

2.36 是否仅显示高频词 ranks_only

用于控制是否仅在词云中显示高频词的参数。当这个参数设置为True时，仅会在词云中显示高频词，而不会显示低频词。这样可以使词云更简洁，并且更容易看出文本中最重要的单词。当这个参数设置为False时，所有词都会被显示在词云中。

2.37 随机生成器种子参数 random_state

 |      random_state : RandomState, int, or None, default=None
 |          If not None, a fixed random state is used. If an int is given, this
 |          is used as seed for a random.Random state.

random_state参数是用于控制词云生成过程中随机数生成器种子的参数。这个参数可以用来确保词云在每次生成时都是相同的，这样可以在多次执行相同的词云生成代码时得到相同的结果。这对于评估不同的参数或算法的效果非常有用。如果未指定random_state，每次生成的词云都会有所不同。

如：

from wordcloud import WordCloud

text = "This is a sample text for generating a word cloud"
wc = WordCloud(random_state=42).generate(text)

三、常用方法

3.1 词云生成相关

通常使用generate()方法就能生成词云了。这里还有其他几种生成词云的方式。

3.11 根据词频字典生成 fit_words()

fit_words() 方法是在 WordCloud 类中的一个函数，它的作用是根据给定的词频字典来生成词云。词频字典是一个键值对的字典，其中键是单词，值是该单词的频率。

举例：

    frequencies = {'word1': 10, 'word2': 20, 'word3': 5}
    from wordcloud import WordCloud
    wordcloud = WordCloud(font_path='simhei.ttf').fit_words(frequencies)
    plt.imshow(wordcloud, interpolation='bilinear')
    plt.axis("off")
    plt.show()

3.12 常用 generate()

常用的词云生成方式。

3.13 根据词频字典生成 generate_from_frequencies()

它的作用是根据给定的词频字典来生成词云。词频字典是一个键值对的字典，其中键是单词，值是该单词的频率。与 fit_words() 方法类似，但是 generate_from_frequencies() 方法是在生成词云之前预先配置词云的一个方法。

如：

frequencies = {'word1': 10, 'word2': 20, 'word3': 5}
from wordcloud import WordCloud
wordcloud = WordCloud().generate_from_frequencies(frequencies)

3.14 根据文本生成generate_from_text()

它的作用是根据给定的文本来生成词云。该文本可以是一个字符串或文件，它会先分析文本中的词汇并统计词频，然后根据词频生成词云。

如：

from wordcloud import WordCloud

with open('text.txt') as f:
    text = f.read()

wordcloud = WordCloud().generate_from_text(text)

或者直接使用字符串：

wordcloud = WordCloud().generate_from_text("This is a sample text for generating a wordcloud")

3.15 词频统计 process_text()

将文本分析成词频字典。该文本可以是一个字符串或文件，它会先分析文本中的词汇并统计词频。

如：

frequencies = WordCloud().process_text("This is a sample text for generating a wordcloud")
print(frequencies)

将输出：

{‘sample’: 1, ‘text’: 1, ‘generating’: 1, ‘wordcloud’: 1}

自动过滤了This 、a这些单词。

这个方法主要用来统计词语出现的频数。

3.16 单词重新上色 recolor()

  recolor(self, random_state=None, color_func=None, colormap=None)

不常用。

3.2 文件保存相关

3.21 保存为数组 to_array

 |  to_array(self)
 |      Convert to numpy array.
 |      
 |      Returns
 |      -------
 |      image : nd-array size (width, height, 3)
 |          Word cloud image as numpy matrix.

将WordCloud对象转换成一个numpy 数组。该数组表示 WordCloud 中每个词的大小和位置。

如：

wordcloud_array = wordcloud.to_array()

wordcloud_array 数组将包含所有词的位置和大小信息。

你可以使用numpy的shape属性来确认这个wordcloud_array的维度。

可以使用 matplotlib.pyplot.imshow() 来显示这个数组。

3.22 保存为文件 to_file

 |  to_file(self, filename)
 |      Export to image file.
 |      
 |      Parameters
 |      ----------
 |      filename : string
 |          Location to write to.
 |      
 |      Returns
 |      -------
 |      self

将 WordCloud 对象保存到一个文件中。它接受一个文件名作为参数，并将 WordCloud 图像保存到该文件中。默认情况下，图像将保存为 PNG 格式，但是也可以指定其他格式，如 JPEG 或 BMP。

如：

wd.to_file(f'2.PNG')

3.23 转换为PIL图像 to_image

 to_image(self)

将 WordCloud 对象转换为 PIL 图像。这意味着它会返回一个 PIL 图像对象, 而不是保存到文件中.

如：

image = wd.to_image()
image.show()

3.24 转换为SVG图像 to_svg

 |  to_svg(self, embed_font=False, optimize_embedded_font=True, embed_image=False)
 |      Export to SVG.

将 WordCloud 对象转换为 SVG (Scalable Vector Graphics) 格式。SVG 是一种矢量图形格式，可以在浏览器中显示并且可以缩放而不失真。
如：

    svg = wd.to_svg()
    with open("wordcloud.svg", "wb") as f:
        f.write(svg.encode())

即可生成SVG图像，双击即可在浏览器打开：

四、关于词云背景图片

五、完整demo

txt等文件放在github了。

Addr：https://github.com/CQUPTLei/chatGPT_based

你可能感兴趣的:(Python数据分析,python,开发语言)

python正则匹配11个数字_python正则表达式re.match()匹配多个字符方法的实现小馬锅 python正则匹配11个数字
1.*表示匹配任意多个字符\d*表示匹配任意多个数字字符importretext="123h1elloworld"text1="123Helloworld456"text2="helloworld"res=re.match("\d*",text)res1=re.match("\d*",text1)res2=re.match("\d*",text2)print(res.group())print(r
基于MATLAB的资源优化与工期固定-资源均衡分析方法研究【附代码】拉勾科研工作室 matlab 开发语言
算法与建模领域的探索者|专注数据分析与智能模型设计✨擅长算法、建模、数据分析matlab、python、仿真✅具体问题可以私信或查看文章底部二维码✅感恩科研路上每一位志同道合的伙伴！（1）资源均衡优化相关理论与问题分类在现代工程项目中，资源的合理分配和使用是确保项目按时完成、成本可控的关键因素。资源均衡优化作为项目管理中的核心环节，旨在通过调整资源的使用方案，使资源消耗在整个工期内尽可能平稳，避免
医学图像增强的层级化模糊与虚拟仪器无参考质量评价研究【附代码】拉勾科研工作室计算机视觉图像处理人工智能
算法与建模领域的探索者|专注数据分析与智能模型设计✨擅长算法、建模、数据分析matlab、python、仿真✅具体问题可以私信或查看文章底部二维码✅感恩科研路上每一位志同道合的伙伴！（1）层级模糊隶属度的X光医学图像增强算法针对X光医学图像普遍存在的对比度差、细节模糊等问题，本算法提出了一种基于层级模糊隶属度的增强方法。该方法的核心思想在于利用拉普拉斯金字塔分解图像，并在多尺度下分层计算模糊隶属度
【半夜爬起来学python】零基础学习Pygame|第一期|知识点+小球反弹游戏案例奈樱. python(pygame)pygame 学习游戏 pip
一.安装PygamePygame是跨平台Python模块，很多编译器不会向用户提供该模块，需要我们自己安装。安装步骤：打开Pygame官网：www.pygame.org点击PYGAME2.6.0-25JUN,2024下载好之后，解压压缩包，安装路径最好放在c盘里Administrator文件里在菜单栏点击搜索，输入cmd，找到“命令提示符”输入命令pipinstallpygame运行的时候会发现命
【Python】Pygame从零开始学习宅男很神经 python 开发语言
模块一：Pygame入门与核心基础本模块将引导您完成Pygame的安装，并深入理解Pygame应用程序的基石——游戏循环、事件处理、Surface与Rect对象、显示控制以及颜色管理。第一章：Pygame概览与环境搭建1.1什么是Pygame？Pygame是一组专为编写视频游戏而设计的Python模块。它构建在优秀的SDL(SimpleDirectMediaLayer)库之上，允许您使用Pytho
【python】判断值是否为NaN MoFe1 python 开发语言
importmathdefis_nan(value):returnisinstance(value,float)andmath.isnan(value)#测试print(is_nan(float('nan')))#输出：Trueprint(is_nan(None))#输出：Falseprint(is_nan('abc'))#输出：False
print(3 or 5)的结果是什么？为什么？ Lauren_Lu python
print(3or5)的结果是：3原因：在Python中，or是一个逻辑运算符，但当它作用于非布尔类型（比如整数）时，它的行为是：返回第一个为真的值；如果第一个值为假，则返回第二个值。具体分析：3是一个非零整数，在布尔上下文中被视为True所以3or5就是：如果3是True，就返回3；否则返回5由于3是True，所以返回的是3。类似例子：print(0or5)#输出5，因为0被视为Falsepri
深度学习实战：基于嵌入模型的AI应用开发 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络人工智能深度学习 ai
深度学习实战：基于嵌入模型的AI应用开发关键词：嵌入模型（EmbeddingModel）、深度学习、向量空间、语义表示、AI应用开发、相似性搜索、迁移学习摘要：本文将带你从0到1掌握基于嵌入模型的AI应用开发全流程。我们会用“翻译机”“数字身份证”等生活比喻拆解嵌入模型的核心原理，结合Python代码实战（BERT/CLIP模型）演示如何将文本、图像转化为可计算的语义向量，并通过“智能客服问答”“
[python系列] 创建虚拟环境 venv en-route python virtualenv
虚拟环境定义Python中的虚拟环境是一个隔离的运行环境，旨在为每个Python项目提供独立的执行空间，支持在不同的项目中分别管理依赖关系，而不会影响到其他项目或系统的原始Python安装。可以将虚拟环境视为每个Python项目的“独立容器”，每个容器具备以下特点：拥有独立的Python解释器拥有各自独立的包管理和安装的软件包与其他虚拟环境相互隔离允许同一包存在不同版本使用虚拟环境的重要性体现在以
Python代理池的构建与应用：实现高效爬虫与防封禁策略程序员威哥 python 爬虫开发语言
在进行大规模网络数据抓取时，IP封禁是最常见的反爬虫手段之一。为了应对这一挑战，代理池成为了一个重要工具。通过构建代理池，爬虫程序可以随机切换代理IP，避免同一IP被频繁访问而导致封禁，确保数据抓取任务的稳定性和持续性。本文将详细介绍如何使用Python构建一个高效的代理池，并结合实际应用场景，讲解如何使用代理池提升爬虫的抓取能力和防封禁策略。一、代理池的工作原理代理池的基本工作原理是，爬虫请求时
Python爬虫实战：用Tushare和Baostock爬取股票历史数据及K线图与技术指标计算
在金融数据分析和量化交易中，股票历史数据的获取是进行技术分析、回测和策略研究的第一步。传统上，投资者需要依赖付费数据服务，然而如今，借助Python强大的爬虫工具和开源数据接口，我们能够轻松地爬取免费的历史股票数据，并结合K线图与技术指标来进行深入分析。Tushare和Baostock是两个非常流行的开源金融数据接口。Tushare提供了丰富的国内外金融数据，特别是A股市场的历史数据和实时数据，而
Python_计算两个省市之间的直线距离_2506 夏天里的肥宅水 PYTHON python spring 开发语言
更新代码上一版链接importpandasaspdimporttimeimportpickleimportosimportsysfromgeopy.geocodersimportNominatimfromgeopy.distanceimportgeodesicfromtqdmimporttqdm#ConfigurationINPUT_FILE=r"距离.xlsx"#输入文件路径OUTPUT_FIL
python中的*args 和 **kwargs Hi_kenyon python python
简单来说，它们允许一个函数接收不定数量的参数。这在我们预先不知道会传递多少个参数给函数时非常有用。*args(任意数量的位置参数)*args用于在一个函数中接收任意数量的位置参数(positionalarguments)。当你在函数定义中使用*args时，Python会将所有传入的多余的位置参数收集到一个元组(tuple)中。这个名字args只是一个约定俗成的惯例(arguments的缩写)，你也
用 Python 开发文字冒险游戏：从零开始的教程晓天天天向上 python microsoft 开发语言
文字冒险游戏(Text-basedAdventureGame)是一种经典的游戏类型，玩家通过输入文字指令与游戏世界互动。这种游戏不依赖复杂的图形界面，非常适合初学者学习编程逻辑和用户交互。在本篇博客中，我们将用Python开发一个简单的文字冒险游戏，体验游戏开发的乐趣。1.游戏设计思路游戏背景玩家醒来发现自己身处一个神秘的地下城，需要探索房间、收集物品、战胜敌人并找到出口。核心机制房间导航：玩家可
从零开始理解零样本学习：AI人工智能必学技术 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战 ai
从零开始理解零样本学习：AI人工智能必学技术关键词：零样本学习、人工智能、机器学习、知识迁移、语义嵌入摘要：本文旨在全面深入地介绍零样本学习这一在人工智能领域具有重要意义的技术。首先阐述零样本学习的背景和基本概念，通过详细的解释和直观的示意图让读者建立起对零样本学习的初步认识。接着深入剖析其核心算法原理，结合Python代码进行详细说明，同时引入相关数学模型和公式并举例阐释。通过项目实战部分，带领
Python训练营打卡——DAY16（2025.5.5） cosine2025 Python训练营打卡 python 开发语言机器学习
目录一、NumPy数组基础笔记1.理解数组的维度(Dimensions)2.NumPy数组与深度学习Tensor的关系3.一维数组(1DArray)4.二维数组(2DArray)5.数组的创建5.1数组的简单创建5.2数组的随机化创建5.3数组的遍历5.4数组的运算6.数组的索引6.1一维数组索引6.2二维数组索引6.3三维数组索引二、SHAP值的深入理解三、总结1.NumPy数组基础总结2.SH
Python的一点基础教程------文件读写卡提西亚 python 开发语言
最近在看大佬写的Python教程自学,但是感觉有点头痛,因为大佬讲了一些底层的结构和原理,但是又没那么详细,然后作为一个初学者自学的情况下,看的很费劲.看完就有感而发,想写一篇更基础的教程,教会大家怎么去用它,尽量少的去讲原理.但是当然,你也需要有一定的编程语言基础,了解基本的语法和函数等功能.正所谓师傅领进门,修行在个人,有时候我们学了一个东西,如果觉得很有趣,自然就会去了解关于它的更多信息,但
1.2 Python 的特点与优势 Utopia Reverie python python 开发语言
1.语法简洁易读Python以简洁的语法著称，代码可读性强，减少了不必要的符号和冗余代码。例如，使用缩进来表示代码块，而非传统的大括号。这使得代码更易于理解和维护，尤其适合初学者。示例：python运行【#计算斐波那契数列的前10项n=10a,b=0,1for_inrange(n);print(a,end='')a,b=b,a+b#输出:0112358132134】2.开源与社区支持Python是
动手学Python：从零开始构建一个“文字冒险游戏” network爬虫 python python 开发语言
动手学Python：从零开始构建一个“文字冒险游戏”大家好，我是你的技术向导。今天，我们不聊高深的框架，也不谈复杂的算法，我们来做一点“复古”又极具趣味性的事情——用Python亲手打造一个属于自己的文字冒险游戏（TextAdventureGame）。你是否还记得那些在早期计算机上，通过一行行文字描述和简单指令来探索未知世界的日子？这种游戏的魅力在于它能激发我们最原始的想象力。而对于我们程序员来说
鸿蒙仓颉开发语言实战教程：页面跳转和传参湖北穷逼首席代表 harmonyos 开发语言华为
合集-仓颉教程(25)1.详解鸿蒙仓颉开发语言中的日志打印问题05-212.鸿蒙仓颉开发语言实战教程：实现商城应用首页05-223.鸿蒙仓颉开发语言实战教程：页面跳转和传参05-254.鸿蒙仓颉语言开发教程：页面和组件的生命周期05-285.鸿蒙仓颉语言开发实战教程：购物车页面06-036.鸿蒙仓颉语言开发实战教程：商城登录页06-047.鸿蒙仓颉语言开发实战教程：商城搜索页06-058.鸿蒙仓颉
鸿蒙仓颉语言开发实战教程：购物车页面王家那谁 harmonyos 华为
合集-仓颉教程(25)1.详解鸿蒙仓颉开发语言中的日志打印问题05-212.鸿蒙仓颉开发语言实战教程：实现商城应用首页05-223.鸿蒙仓颉开发语言实战教程：页面跳转和传参05-254.鸿蒙仓颉语言开发教程：页面和组件的生命周期05-285.鸿蒙仓颉语言开发实战教程：购物车页面06-036.鸿蒙仓颉语言开发实战教程：商城登录页06-047.鸿蒙仓颉语言开发实战教程：商城搜索页06-058.鸿蒙仓颉
python 脚本遍历目录，并把目录下的非utf-8文件改成utf8 还债大湿兄 python 开发语言数据库
从网上下载的qt项目我本地编译里面经常包含中文，提示编译不过，实际上以前经常手动转，发觉还是用脚本不，毕竟这次下的有点大，我只改.h.cpp#pythonD:\python\filetoUtf.pyE:\EasyCanvas-master\EasyCanvas-masterimportosimportcodecsimportargparseimportsysdefconvert_to_utf8_b
树莓派中 Python+opencv打开摄像头 68lizi 光电设计 python
树莓派中Python+opencv打开摄像头注意不要使用cap=cv2.VideoCapture(0,cv2.CAP_DSHOW)，我在树莓派使用这个的时候会报错，在windows不会报错，具体原因不清楚cap=cv2.VideoCapture(0)#使用cap=cv2.VideoCapture(0,cv2.CAP_DSHOW)会报错whileTrue:status,img=cap.read()i
python实现读取文件的指定某行内容 Fitz1318 Python3学习 python
python实现读取文件的指定某行内容最近有一个需求就是读取一个文件中的指定某行的内容，现将方法记录如下importlinecache#这里填写你自己的文件位置和行号text=linecache.getline("../TestFile/test_C1.json",2)print(text)
HarmonyOS NEXT仓颉开发语言实战案例：简约音乐播放页幽蓝计划开发语言 harmonyos
偶然间看到一个非常漂亮的音乐播放器设计图，忍不住想拿仓颉语言来练练手，当漂亮的设计图遇到优美的开发语言，简直是天作之合。看到这个页面，我们先做一个简单的分析。整个页面分为上中下三个部分，顶部为导航栏，底部是歌词工具栏，剩下的就是中间的歌曲信息和控制按钮部分。它们的部分方式是比较简单的纵向布局。页面大致结构代码如下：Column{//导航栏Stack{Text('NowPlaying').fontS
[Python] 使用 dataclass 简化数据结构：定义、功能与实战踏雪无痕老爷子 Python python 开发语言
在经典面向对象编程中，为了保存和操作数据往往需要定义多个类，手写__init__()、__repr__()、__eq__()等方法。Python3.7引入了@dataclass装饰器，它能自动生成这些常见方法，大幅减少样板代码。本文将介绍dataclass的定义与参数、比较与普通类的差别、实战示例，以及常见注意事项。一、什么是dataclass@dataclass是一种类装饰器，它通过类成员的类型
[Python]-基础篇1- 从零开始的Python入门指南踏雪无痕老爷子 Python python 开发语言
无论你是尚未接触编程的新手，还是想从其他语言转向Python的开发者，这篇文章都是你的入门课。一、Python是什么？Python是一种解释型、高级、通用型编程语言，以简洁明了、简单易用着称。它可以应用于网站开发、自动化脚本、数据分析、人工智能、系统操作等多种场景。二、如何安装Python步骤：访问Python官方网站选择目前最新的Python3.x版本下载Windows用户请务必勾选“AddPy
算法竞赛备考冲刺必刷题（C++） | 洛谷 P8814 解密热爱编程的通信人算法 c++开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】洛谷：P8814[CSP-J2022]解密-洛
程序化交易系统中如何精准获取MACD、KDJ、BOLL等基础指标的值？股票程序化交易接口量化交易股票API接口 Python股票量化交易程序化交易系统 macd指标 kdj指标 boll指标股票量化接口股票API接口
Python股票接口实现查询账户，提交订单，自动交易（1）Python股票程序交易接口查账，提交订单，自动交易（2）股票量化，Python炒股，CSDN交流社区>>>基础指标在程序化交易系统中的重要性基础指标对交易决策的指导意义MACD、KDJ、BOLL等基础指标在程序化交易系统中扮演着重要角色。MACD可以帮助判断市场的趋势和买卖信号，通过分析其快线和慢线的交叉情况，能为投资者提供入场和出场的参
股票程序化交易软件如何选择？这些要点你知道吗股票程序化交易接口量化交易股票API接口 Python股票量化交易区块链股票程序化交易软件功能特性稳定性成本股票量化接口股票API接口
Python股票接口实现查询账户，提交订单，自动交易（1）Python股票程序交易接口查账，提交订单，自动交易（2）股票量化，Python炒股，CSDN交流社区>>>了解软件功能特性基础交易功能基础交易功能是股票程序化交易软件的核心。它应具备快速下单、撤单等基础操作能力。比如在行情快速变化时，能让投资者迅速抓住机会下单，或者及时撤单避免损失。软件的交易界面要简洁明了，方便投资者操作。还应支持多种交
Spring4.1新特性——综述 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Schema与数据类型优化 annan211 数据结构 mysql
目前商城的数据库设计真是一塌糊涂，表堆叠让人不忍直视，无脑的架构师，说了也不听。在数据库设计之初，就应该仔细揣摩可能会有哪些查询，有没有更复杂的查询，而不是仅仅突出很表面的业务需求，这样做会让你的数据库性能成倍提高，当然，丑陋的架构师是不会这样去考虑问题的。选择优化的数据类型 1 更小的通常更好更小的数据类型通常更快，因为他们占用更少的磁盘、内存和cpu缓存，
第一节 HTML概要学习 chenke html Web css
第一节 HTML概要学习 1. 什么是HTML HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写，它规定了自己的语法规则，用来表示比“文本”更丰富的意义，比如图片，表格，链接等。浏览器（IE,FireFox等）软件知道HTML语言的语法，可以用来查看HTML文档。目前互联网上的绝大部分网页都是使用HTML编写的。打开记事本输入一下内
MyEclipse里部分习惯的更改 Array_06 eclipse
继续补充中---------------------- 1.更改自己合适快捷键windows-->prefences-->java-->editor-->Content Assist--> Activation triggers for java的右侧“.”就可以改变常用的快捷键选中 Text
近一个月的面试总结 cugfy 面试
本文是在学习中的总结，欢迎转载但请注明出处：http://blog.csdn.net/pistolove/article/details/46753275 前言打算换个工作，近一个月面试了不少的公司，下面将一些面试经验和思考分享给大家。另外校招也快要开始了，为在校的学生提供一些经验供参考，希望都能找到满意的工作。
HTML5一个小迷宫游戏 357029540 html5
通过《HTML5游戏开发》摘抄了一个小迷宫游戏，感觉还不错，可以画画，写字，把摘抄的代码放上来分享下，喜欢的同学可以拿来玩玩！ <html> <head> <title>创建运行迷宫</title> <script type="text/javascript"
10步教你上传githib数据张亚雄 git
官方的教学还有其他博客里教的都是给懂的人说得，对已我们这样对我大菜鸟只能这么来锻炼，下面先不玩什么深奥的，先暂时用着10步干净利索。等玩顺溜了再用其他的方法。操作过程（查看本目录下有哪些文件NO.1）ls （跳转到子目录NO.2）cd+空格+目录（继续NO.3）ls （匹配到子目录NO.4）cd+ 目录首写字母+tab键+（首写字母“直到你所用文件根就不再按TAB键了”）（查看文件
MongoDB常用操作命令大全 adminjun mongodb 操作命令
成功启动MongoDB后，再打开一个命令行窗口输入mongo，就可以进行数据库的一些操作。输入help可以看到基本操作命令，只是MongoDB没有创建数据库的命令，但有类似的命令如：如果你想创建一个“myTest”的数据库，先运行use myTest命令，之后就做一些操作（如：db.createCollection('user')）,这样就可以创建一个名叫“myTest”的数据库。一
bat调用jar包并传入多个参数 aijuans
下面的主程序是通过eclipse写的： 1.在Main函数接收bat文件传递的参数（String[] args）如： String ip =args[0]; String user=args[1]; &nbs
Java中对类的主动引用和被动引用 ayaoxinchao java 主动引用对类的引用被动引用类初始化
在Java代码中，有些类看上去初始化了，但其实没有。例如定义一定长度某一类型的数组，看上去数组中所有的元素已经被初始化，实际上一个都没有。对于类的初始化，虚拟机规范严格规定了只有对该类进行主动引用时，才会触发。而除此之外的所有引用方式称之为对类的被动引用，不会触发类的初始化。虚拟机规范严格地规定了有且仅有四种情况是对类的主动引用，即必须立即对类进行初始化。四种情况如下：1.遇到ne
导出数据库提示 outfile disabled BigBird2012 mysql
在windows控制台下，登陆mysql，备份数据库： mysql>mysqldump -u root -p test test > D:\test.sql 使用命令 mysqldump 格式如下： mysqldump -u root -p *** DBNAME > E:\\test.sql。注意：执行该命令的时候不要进入mysql的控制台再使用，这样会报
Javascript 中的 && 和 || bijian1013 JavaScript &&||
准备两个对象用于下面的讨论 var alice = { name: "alice", toString: function () { return this.name; } } var smith = { name: "smith",
[Zookeeper学习笔记之四]Zookeeper Client Library会话重建 bit1129 zookeeper
为了说明问题，先来看个简单的示例代码： package com.tom.zookeeper.book; import com.tom.Host; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.ZooKeeper; import org.apache.zookeeper.Wat
【Scala十一】Scala核心五：case模式匹配 bit1129 scala
package spark.examples.scala.grammars.caseclasses object CaseClass_Test00 { def simpleMatch(arg: Any) = arg match { case v: Int => "This is an Int" case v: (Int, String)
运维的一些面试题 yuxianhua linux
1、Linux挂载Winodws共享文件夹 mount -t cifs //1.1.1.254/ok /var/tmp/share/ -o username=administrator,password=yourpass 或 mount -t cifs -o username=xxx,password=xxxx //1.1.1.1/a /win
Java lang包-Boolean BrokenDreams boolean
Boolean类是Java中基本类型boolean的包装类。这个类比较简单，直接看源代码吧。 public final class Boolean implements java.io.Serializable,
读《研磨设计模式》-代码笔记-命令模式-Command bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.List; /** * GOF 在《设计模式》一书中阐述命令模式的意图：“将一个请求封装
matlab下GPU编程笔记 cherishLC matlab
不多说，直接上代码 gpuDevice % 查看系统中的gpu,,其中的DeviceSupported会给出matlab支持的GPU个数。 g=gpuDevice(1); %会清空 GPU 1中的所有数据,,将GPU1 设为当前GPU reset(g) %也可以清空GPU中数据。 a=1; a=gpuArray(a); %将a从CPU移到GPU中 onGP
SVN安装过程 crabdave SVN
SVN安装过程 subversion-1.6.12 ./configure --prefix=/usr/local/subversion --with-apxs=/usr/local/apache2/bin/apxs --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr --with-openssl=/
sql　行列转换 daizj sql 行列转换行转列列转行
行转列的思想是通过case when 来实现列转行的思想是通过union all 来实现下面具体例子：假设有张学生成绩表(tb)如下: Name Subject Result 张三语文　　74 张三数学　　83 张三物理　　93 李四语文　　74 李四数学　　84 李四物理　　94 */ /* 想变成姓名 &
MySQL--主从配置 dcj3sjt126com mysql
linux下的mysql主从配置：说明：由于MySQL不同版本之间的(二进制日志)binlog格式可能会不一样，因此最好的搭配组合是Master的MySQL版本和Slave的版本相同或者更低， Master的版本肯定不能高于Slave版本。（版本向下兼容） mysql1 : 192.168.100.1 //master mysq
关于yii 数据库添加新字段之后model类的修改 dcj3sjt126com Model
rules: array('新字段','safe','on'=>'search') 1、array('新字段', 'safe')//这个如果是要用户输入的话，要加一下， 2、array('新字段', 'numerical'),//如果是数字的话 3、array('新字段', 'length', 'max'=>100),//如果是文本 1、2、3适当的最少要加一条，新字段才会被
sublime text3 中文乱码解决 dyy_gusi Sublime Text
sublime text3中文乱码解决原因：缺少转换为UTF-8的插件目的：安装ConvertToUTF8插件包第一步：安装能自动安装插件的插件，百度“Codecs33”，然后按照步骤可以得到以下一段代码： import urllib.request,os,hashlib; h = 'eb2297e1a458f27d836c04bb0cbaf282' + 'd0e7a30980927
概念了解：CGI，FastCGI，PHP-CGI与PHP-FPM geeksun PHP
CGI CGI全称是“公共网关接口”(Common Gateway Interface)，HTTP服务器与你的或其它机器上的程序进行“交谈”的一种工具，其程序须运行在网络服务器上。 CGI可以用任何一种语言编写，只要这种语言具有标准输入、输出和环境变量。如php,perl,tcl等。 FastCGI FastCGI像是一个常驻(long-live)型的CGI，它可以一直执行着，只要激活后，不
Git push 报错 "error: failed to push some refs to " 解决 hongtoushizi git
Git push 报错 "error: failed to push some refs to " . 此问题出现的原因是：由于远程仓库中代码版本与本地不一致冲突导致的。由于我在第一次git pull --rebase 代码后，准备push的时候，有别人往线上又提交了代码。所以出现此问题。解决方案： 1： git pull 2：
第四章 Lua模块开发 jinnianshilongnian nginx lua
在实际开发中，不可能把所有代码写到一个大而全的lua文件中，需要进行分模块开发；而且模块化是高性能Lua应用的关键。使用require第一次导入模块后，所有Nginx 进程全局共享模块的数据和代码，每个Worker进程需要时会得到此模块的一个副本（Copy-On-Write），即模块可以认为是每Worker进程共享而不是每Nginx Server共享；另外注意之前我们使用init_by_lua中初
java.lang.reflect.Proxy liyonghui160com
1.简介 Proxy 提供用于创建动态代理类和实例的静态方法（1）动态代理类的属性代理类是公共的、最终的，而不是抽象的未指定代理类的非限定名称。但是，以字符串 "$Proxy" 开头的类名空间应该为代理类保留代理类扩展 java.lang.reflect.Proxy 代理类会按同一顺序准确地实现其创建时指定的接口
Java中getResourceAsStream的用法 pda158 java
1.Java中的getResourceAsStream有以下几种： 1. Class.getResourceAsStream(String path) ： path 不以’/'开头时默认是从此类所在的包下取资源，以’/'开头则是从ClassPath根下获取。其只是通过path构造一个绝对路径，最终还是由ClassLoader获取资源。　　2. Class.getClassLoader.get
spring 包官方下载地址（非maven） sinnk spring
SPRING官方网站改版后，建议都是通过 Maven和Gradle下载，对不使用Maven和Gradle开发项目的，下载就非常麻烦，下给出Spring Framework jar官方直接下载路径: http://repo.springsource.org/libs-release-local/org/springframework/spring/ s
Oracle学习笔记(7) 开发PLSQL子程序和包 vipbooks oracle sql 编程
哈哈，清明节放假回去了一下，真是太好了，回家的感觉真好啊！现在又开始出差之旅了，又好久没有来了，今天继续Oracle的学习！这是第七章的学习笔记，学习完第六章的动态SQL之后，开始要学习子程序和包的使用了……，希望大家能多给俺一些支持啊！编程时使用的工具是PLSQL