kimboyang

NumPy基础知识（三）

数据类型
数组创建
使用NumPy进行I / O
- 使用导入数据 genfromtxt
  - 定义输入
  - 将行拆分为列
  - 跳过行并选择列
  - 选择数据类型
  - 设置名称
  - 调整转换
  - 快捷功能
索引编制
广播
字节交换
结构化数组
编写自定义数组容器
子数组ndarray

使用导入数据 `genfromtxt`

NumPy提供了几种从表格数据创建数组的功能。我们在这里专注于genfromtxt功能。

简而言之，genfromtxt运行两个主循环。第一个循环以字符串序列转换文件的每一行。第二个循环将每个字符串转换为适当的数据类型。此机制比单循环慢，但具有更大的灵活性。特别genfromtxt是，在其他更快，更简单的功能（如loadtxt不能）时，能够考虑丢失的数据。

注意

在给出示例时，我们将使用以下约定：

>>>

>>> import numpy as np
>>> from io import StringIO

定义输入

的唯一必选参数genfromtxt是数据源。它可以是字符串，字符串列表，生成器或带有read方法的打开的类似文件的对象，例如文件或 io.StringIO对象。如果提供单个字符串，则假定它是本地或远程文件的名称。如果提供了字符串列表或返回字符串的生成器，则将每个字符串视为文件中的一行。传递远程文件的URL后，该文件将自动下载到当前目录并打开。

公认的文件类型是文本文件和存档。当前，该功能可以识别gzip和bz2（bzip2）存档。存档的类型由文件的扩展名决定：如果文件名以结尾'.gz'，则需要一个gzip存档；如果结尾为 'bz2'，bzip2则假定为存档。

将行拆分为列

该`delimiter`参数

定义文件并打开以供读取后，genfromtxt 将每条非空行拆分为一系列字符串。空行或注释行仅被跳过。该delimiter关键字用来定义分割应该如何发生。

通常，单个字符标记列之间的分隔。例如，逗号分隔文件（CSV）使用逗号（,）或分号（;）作为分隔符：

>>>

>>> data = u"1, 2, 3\n4, 5, 6"
>>> np.genfromtxt(StringIO(data), delimiter=",")
array([[ 1.,  2.,  3.],
       [ 4.,  5.,  6.]])

另一个常见的分隔符是"\t"制表符。但是，我们不仅限于单个字符，任何字符串都可以。默认情况下， genfromtxt假定delimiter=None为，表示该行沿空白（包括制表符）分隔，并且连续的空白被视为单个空白。

或者，我们可能正在处理一个固定宽度的文件，其中将列定义为给定数量的字符。在这种情况下，我们需要设置 delimiter为单个整数（如果所有列的大小都相同）或整数序列（如果列的大小可以不同）：

>>>

>>> data = u"  1  2  3\n  4  5 67\n890123  4"
>>> np.genfromtxt(StringIO(data), delimiter=3)
array([[   1.,    2.,    3.],
       [   4.,    5.,   67.],
       [ 890.,  123.,    4.]])
>>> data = u"123456789\n   4  7 9\n   4567 9"
>>> np.genfromtxt(StringIO(data), delimiter=(4, 3, 2))
array([[ 1234.,   567.,    89.],
       [    4.,     7.,     9.],
       [    4.,   567.,     9.]])

该`autostrip`参数

默认情况下，当将一行分解为一系列字符串时，不会删除各个条目的前导或尾随空格。通过将可选参数autostrip设置为值，可以覆盖此行为 True：

>>>

>>> data = u"1, abc , 2\n 3, xxx, 4"
>>> # Without autostrip
>>> np.genfromtxt(StringIO(data), delimiter=",", dtype="|U5")
array([['1', ' abc ', ' 2'],
       ['3', ' xxx', ' 4']], dtype='
>>> # With autostrip
>>> np.genfromtxt(StringIO(data), delimiter=",", dtype="|U5", autostrip=True)
array([['1', 'abc', '2'],
       ['3', 'xxx', '4']], dtype='

该`comments`参数

可选参数comments用于定义标记注释开始的字符串。默认情况下， genfromtxt假设comments='#'。注释标记可以出现在行中的任何位置。注释标记后的任何字符都将被忽略：

>>>

>>> data = u"""#
... # Skip me !
... # Skip me too !
... 1, 2
... 3, 4
... 5, 6 #This is the third line of the data
... 7, 8
... # And here comes the last line
... 9, 0
... """
>>> np.genfromtxt(StringIO(data), comments="#", delimiter=",")
array([[1., 2.],
       [3., 4.],
       [5., 6.],
       [7., 8.],
       [9., 0.]])

在1.7.0版本的新功能：当comments设置为None，没有行被视为注释。

注意

此行为有一个明显的例外：如果是可选参数 names=True，则将检查第一条注释行的名称。

跳过行并选择列

在`skip_header`和`skip_footer`参数

文件中标头的存在会阻碍数据处理。在这种情况下，我们需要使用skip_header可选参数。此参数的值必须是整数，该整数与执行任何其他操作之前在文件开头要跳过的行数相对应。同样，我们可以n通过使用skip_footer属性并将其值设置为来跳过文件的最后几行n：

>>>

>>> data = u"\n".join(str(i) for i in range(10))
>>> np.genfromtxt(StringIO(data),)
array([ 0.,  1.,  2.,  3.,  4.,  5.,  6.,  7.,  8.,  9.])
>>> np.genfromtxt(StringIO(data),
...               skip_header=3, skip_footer=5)
array([ 3.,  4.])

默认情况下，skip_header=0和skip_footer=0，表示不跳过任何行。

该`usecols`参数

在某些情况下，我们对数据的所有列都不感兴趣，但仅对其中的一些感兴趣。我们可以选择使用usecols参数导入的列。此参数接受与要导入的列的索引相对应的单个整数或整数序列。请记住，按照惯例，第一列的索引为0。负整数的行为与常规Python负索引相同。

例如，如果我们只想导入第一列和最后一列，则可以使用：usecols=(0, -1)

>>>

>>> data = u"1 2 3\n4 5 6"
>>> np.genfromtxt(StringIO(data), usecols=(0, -1))
array([[ 1.,  3.],
       [ 4.,  6.]])

如果这些列具有名称，我们还可以通过将其名称作为usecols参数以字符串序列或逗号分隔的字符串作为参数来选择要导入的列：

>>>

>>> data = u"1 2 3\n4 5 6"
>>> np.genfromtxt(StringIO(data),
...               names="a, b, c", usecols=("a", "c"))
array([(1.0, 3.0), (4.0, 6.0)],
      dtype=[('a', '
>>> np.genfromtxt(StringIO(data),
...               names="a, b, c", usecols=("a, c"))
    array([(1.0, 3.0), (4.0, 6.0)],
          dtype=[('a', '

选择数据类型

控制从文件中读取的字符串序列如何转换为其他类型的主要方法是设置dtype参数。此参数可接受的值为：

单一类型，例如dtype=float。输出将是具有给定dtype的2D，除非使用names参数将名称与每个列相关联（请参见下文）。请注意，这dtype=float是的默认设置 genfromtxt。
类型序列，例如。dtype=(int, float, float)
逗号分隔的字符串，例如dtype="i4,f8,|U3"。
有两个键'names'和的字典'formats'。
一组元组，如。(name, type)dtype=[('A', int), ('B', float)]
现有numpy.dtype对象。
特殊价值None。在这种情况下，列的类型将由数据本身确定（请参见下文）。

在除第一种情况以外的所有情况下，输出都是具有结构化dtype的一维数组。此dtype的字段与序列中的项目一样多。字段名称使用names关键字定义。

如果为dtype=None，则根据其数据迭代确定每个列的类型。我们首先检查字符串是否可以转换为布尔值（也就是说，如果字符串匹配true或false小写）；然后是否可以将其转换为整数，然后转换为浮点数，然后转换为复数，最后转换为字符串。通过修改类的默认映射器，可以更改此行为 StringConverter。

dtype=None提供该选项是为了方便。但是，它比显式设置dtype慢得多。

设置名称

该`names`参数

处理表格数据时，一种自然的方法是为每个列分配一个名称。如前所述，第一种可能性是使用显式结构化dtype：

>>>

>>> data = StringIO("1 2 3\n 4 5 6")
>>> np.genfromtxt(data, dtype=[(_, int) for _ in "abc"])
array([(1, 2, 3), (4, 5, 6)],
      dtype=[('a', '

另一个更简单的可能性是将names关键字与字符串序列或逗号分隔的字符串一起使用：

>>>

>>> data = StringIO("1 2 3\n 4 5 6")
>>> np.genfromtxt(data, names="A, B, C")
array([(1.0, 2.0, 3.0), (4.0, 5.0, 6.0)],
      dtype=[('A', '

在上面的示例中，我们使用了默认情况下的事实dtype=float。通过提供一系列名称，我们将输出强制为结构化dtype。

有时我们可能需要根据数据本身定义列名称。在这种情况下，我们必须使用names值为的关键字 True。skip_header即使从第一行中删除了注释，也将从第一行中读取名称：

>>>

>>> data = StringIO("So it goes\n#a b c\n1 2 3\n 4 5 6")
>>> np.genfromtxt(data, skip_header=1, names=True)
array([(1.0, 2.0, 3.0), (4.0, 5.0, 6.0)],
      dtype=[('a', '

默认值names是None。如果我们给关键字赋予其他任何值，则新名称将覆盖我们可能已经用dtype定义的字段名称：

>>>

>>> data = StringIO("1 2 3\n 4 5 6")
>>> ndtype=[('a',int), ('b', float), ('c', int)]
>>> names = ["A", "B", "C"]
>>> np.genfromtxt(data, names=names, dtype=ndtype)
array([(1, 2.0, 3), (4, 5.0, 6)],
      dtype=[('A', '

该`defaultfmt`参数

如果names=None只需要结构化dtype，则使用标准NumPy默认值定义"f%i"名称，产生类似的名称f0， f1依此类推：

>>>

>>> data = StringIO("1 2 3\n 4 5 6")
>>> np.genfromtxt(data, dtype=(int, float, int))
array([(1, 2.0, 3), (4, 5.0, 6)],
      dtype=[('f0', '

同样，如果我们没有提供足够的名称来匹配dtype的长度，则会使用此默认模板来定义缺少的名称：

>>>

>>> data = StringIO("1 2 3\n 4 5 6")
>>> np.genfromtxt(data, dtype=(int, float, int), names="a")
array([(1, 2.0, 3), (4, 5.0, 6)],
      dtype=[('a', '

我们可以使用defaultfmt任何格式字符串的参数覆盖此默认值：

>>>

>>> data = StringIO("1 2 3\n 4 5 6")
>>> np.genfromtxt(data, dtype=(int, float, int), defaultfmt="var_%02i")
array([(1, 2.0, 3), (4, 5.0, 6)],
      dtype=[('var_00', '

注意

我们需要记住，defaultfmt仅当需要某些名称但未定义某些名称时才使用该名称。

验证名称

具有结构化dtype的NumPy数组也可以视为recarray，在其中可以像对待属性一样访问字段。因此，我们可能需要确保字段名称不包含任何空格或无效字符，或者它不对应于标准属性的名称（如size或 shape），这会使解释器感到困惑。 genfromtxt 接受三个可选参数，它们对名称提供了更好的控制：

deletechars

给出一个字符串，其中包含必须从名称中删除的所有字符。默认情况下，无效字符为。~!@#$%^&*()-=+~\|]}[{';: /?.>,<

excludelist

给人的名字排除，如列表return，file， print...如果输入的名称之一是这份名单的一部分，一个下划线字符（'_'）将追加到它。

case_sensitive

名称是否区分大小写（case_sensitive=True），转换为大写（case_sensitive=False或 case_sensitive='upper'）还是小写（case_sensitive='lower'）。

调整转换

该`converters`参数

通常，定义dtype足以定义必须如何转换字符串序列。但是，有时可能需要一些其他控制。例如，我们可能要确保将格式中的日期 YYYY/MM/DD转换为datetime对象，或者将类似的字符串xx%正确转换为0到1之间的浮点数。在这种情况下，我们应该使用converters 参数定义转换函数。

该参数的值通常是一个字典，其中以列索引或列名作为键，而转换函数作为值。这些转换函数可以是实际函数，也可以是lambda函数。无论如何，它们都应仅接受字符串作为输入，并仅输出所需类型的单个元素。

在下面的示例中，第二列从表示百分比的字符串转换为0到1之间的浮点数

>>>

>>> convertfunc = lambda x: float(x.strip(b"%"))/100.
>>> data = u"1, 2.3%, 45.\n6, 78.9%, 0"
>>> names = ("i", "p", "n")
>>> # General case .....
>>> np.genfromtxt(StringIO(data), delimiter=",", names=names)
array([(1., nan, 45.), (6., nan, 0.)],
      dtype=[('i', '

我们需要记住默认情况下dtype=float。因此，第二列应该有浮点数。但是，不能将字符串和转换为浮点数，而最终得到了。现在让我们使用一个转换器：' 2.3%'' 78.9%'np.nan

>>>

>>> # Converted case ...
>>> np.genfromtxt(StringIO(data), delimiter=",", names=names,
...               converters={1: convertfunc})
array([(1.0, 0.023, 45.0), (6.0, 0.78900000000000003, 0.0)],
      dtype=[('i', '

通过将第二列的名称（"p"）用作键而不是其索引（1），可以获得相同的结果：

>>>

>>> # Using a name for the converter ...
>>> np.genfromtxt(StringIO(data), delimiter=",", names=names,
...               converters={"p": convertfunc})
array([(1.0, 0.023, 45.0), (6.0, 0.78900000000000003, 0.0)],
      dtype=[('i', '

转换器还可以用于为缺少的条目提供默认值。在下面的示例中，转换器convert将剥离后的字符串转换为相应的float，如果字符串为空，则转换为-999。我们需要显式地从空格中删除字符串，因为默认情况下不这样做：

>>>

>>> data = u"1, , 3\n 4, 5, 6"
>>> convert = lambda x: float(x.strip() or -999)
>>> np.genfromtxt(StringIO(data), delimiter=",",
...               converters={1: convert})
array([[   1., -999.,    3.],
       [   4.,    5.,    6.]])

使用缺失值和填充值

我们尝试导入的数据集中可能缺少一些条目。在前面的示例中，我们使用了转换器将空字符串转换为浮点型。但是，用户定义的转换器可能很快变得难以管理。

该genfromtxt函数提供了另外两种补充机制：missing_values参数用于识别丢失的数据，第二个参数filling_values用来处理这些丢失的数据。

`missing_values`

默认情况下，任何空字符串都标记为丢失。我们还可以考虑使用更复杂的字符串，例如"N/A"或"???"表示丢失或无效的数据。该missing_values参数接受三种值：

字符串或逗号分隔的字符串

该字符串将用作所有列缺少数据的标记

字符串序列

在这种情况下，每个项目都按顺序关联到一列。

一本字典

字典的值是字符串或字符串序列。相应的键可以是列索引（整数）或列名称（字符串）。此外，特殊键None可用于定义适用于所有列的默认值。

`filling_values`

我们知道如何识别丢失的数据，但是我们仍然需要为这些丢失的条目提供一个值。默认情况下，此值是根据下表根据预期dtype确定的：

预期类型	默认
`bool`	`False`
`int`	`-1`
`float`	`np.nan`
`complex`	`np.nan+0j`
`string`	`'???'`

使用filling_values可选参数，我们可以更好地控制缺失值的转换。像一样 missing_values，此参数接受不同类型的值：

单一价值

这将是所有列的默认值

一系列值

每个条目将是对应列的默认条目

一本字典

每个键可以是列索引或列名，并且对应的值应该是单个对象。我们可以使用特殊键None为所有列定义默认值。

在下面的示例中，我们假设缺少的值"N/A"在第一列和"???"第三列中用标记。如果这些缺失值出现在第一和第二列中，我们希望将它们转换为0，如果它们出现在最后一列中则转换为-999：

>>>

>>> data = u"N/A, 2, 3\n4, ,???"
>>> kwargs = dict(delimiter=",",
...               dtype=int,
...               names="a,b,c",
...               missing_values={0:"N/A", 'b':" ", 2:"???"},
...               filling_values={0:0, 'b':0, 2:-999})
>>> np.genfromtxt(StringIO(data), **kwargs)
array([(0, 2, 3), (4, 0, -999)],
      dtype=[('a', '

`usemask`

我们可能还想通过构造一个布尔掩码来跟踪丢失数据的发生，True其中包含数据丢失的条目以及False其他条目。为此，我们只需将可选参数设置usemask为True（默认值为False）。然后，输出数组将为MaskedArray。

快捷功能

此外genfromtxt，该numpy.lib.io模块还提供了一些衍生自的便捷功能 genfromtxt。这些功能与原始功能相同，但是具有不同的默认值。

recfromtxt

返回一个标准numpy.recarray（if usemask=False）或一个 MaskedRecords数组（if usemaske=True）。默认dtype为dtype=None，这意味着将自动确定每列的类型。

recfromcsv

喜欢recfromtxt，但具有默认值delimiter=","。

你可能感兴趣的:(技术学习,python,numpy)

Python程序中对文件名后缀为.pickle 的文件认识、创建和读取介绍和程序举例 qq_18937049 Python python pickle
Python程序中对文件名后缀为.pickle的文件认识、创建和读取介绍和程序举例目录Python程序中对文件名后缀为.pickle的文件认识、创建和读取介绍和程序举例1..pickle文件概述2..pickle文件的特点2.1序列化对象2.2二进制格式2.3兼容性3.创建和读取.pickle文件3.1创建.pickle文件——pickle.dump()3.2从.pickle文件读取——pickl
PyWakeOnLan：Python 实现的轻量级 Wake-on-LAN 工具郁虹宝Lucille
PyWakeOnLan：Python实现的轻量级Wake-on-LAN工具pywakeonlanAsmallpythonmoduleforwakeonlan.项目地址:https://gitcode.com/gh_mirrors/py/pywakeonlan项目基础介绍与编程语言PyWakeOnLan是一个由RemcoHaszing开发的小巧且易于使用的Python模块，专门用于实现Wake-on
3D U-Net CNN医学图像分割项目教程尤辰城Agatha
3DU-NetCNN医学图像分割项目教程3DUnetCNNPytorch3DU-NetConvolutionNeuralNetwork(CNN)designedformedicalimagesegmentation项目地址:https://gitcode.com/gh_mirrors/3d/3DUnetCNN1.项目介绍3DU-NetCNN是由Ellisdg开发的Python实现，专门用于医学图像
开源项目PyWakeOnLan常见问题解答李申山
开源项目PyWakeOnLan常见问题解答pywakeonlanAsmallpythonmoduleforwakeonlan.项目地址:https://gitcode.com/gh_mirrors/py/pywakeonlan项目基础介绍PyWakeOnLan是一个轻量级的Python模块，用于实现Wake-on-LAN（WOL）功能。通过这个工具，开发者可以方便地发送魔包信号来远程唤醒支持WOL
华为OD机试E卷 - 机器人活动区域（Java & Python& JS & C++ & C ）算法大师最新华为OD机试 java 华为od 机器人 c语言 javascript python 华为OD机试E卷
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述现有一个机器人，可放置于M×N的网格中任意位置，每个网格包含一个非负整数编号，当相邻网格的数字编号差值的绝对值小于等于1时，机器人可以在网格间移动。问题：求机器人可活动的最大范围对应的网格点数目。说明：网格左上角坐标为(0,0),右下角坐标为(m−1,n−1)，机器人只能在相邻网格间上下左右移动输入描述第1行输入为M和
Python基础03（循环与选择结构） XYX的Blog Python python 数据结构开发语言
Python循环与选择结构1.条件表达式绝大部分合法的Python表达式都可以作为条件表达式。在python中除了False，0，0.0，0j，None，空列表，空元组，空集合，空字典，空字符串，空range对象，其余的都与True等价函数，生成器对象都等价于True2.选择结构Python的分支控制语句，即根据表达式的判断结果，为True还是为False，选择运行程序的其中一个分支。Python
Python学习笔记 | 类与对象 MUYUN友逹 Python学习笔记类与对象
基于Python3版本的学习。初识概念：类(class)与对象(object)生活中我们所说的类，是物以类聚的类，是分门别类的类，是多个类似事物组成的群体的统称。而在Python中我们所遇到的类（class），比如整数、字符串、浮点数等，不同的数据类型就属于不同的类。准确来说，它们的全名是整数类、字符串类、浮点数类。每一个类之下都包含无数相似的不同个例。在Python的术语里，我们把类的个例就叫做
如何使用JavaScript开发AR(增强现实)移动应用 (一)
Python中的class体内定义方法时，如果没有显式地包含self参数，有时候依然可以被调用。这是一个非常有趣的话题，因为它涉及到对Python中类与对象之间关系的更深理解。要理解为什么这种情况下方法依然能够被调用，我们需要逐步拆解Python类的构造方式以及方法绑定的原理。
Python语言的数据类型疯狂小小小码农包罗万象 golang 开发语言后端
Python中的数据类型详解Python是一种多用途的编程语言，以其简单易学的语法受到广泛欢迎。为了有效地处理和表示不同类型的数据，Python为程序员提供了多种数据类型。本文将深入探讨Python中的基本数据类型、复合数据类型、标准库中的数据类型以及各类型之间的转换。一、基本数据类型1.整数（int）整数（int）是Python中的一种基本数据类型，表示没有小数部分的整数。Python中的整数可
Python语言的计算机基础疯狂小小小码农包罗万象 golang 开发语言后端
Python语言的计算机基础绪论在当今信息技术飞速发展的时代，编程已经成为了一种必备技能。Python凭借其简洁、易读和强大的功能，逐渐成为初学者学习编程的首选语言。本文将以Python语言为基础，探讨计算机科学的基本概念，并帮助读者更好地理解计算机的工作原理以及如何利用Python进行编程。一、Python简介Python是一种高级编程语言，由荷兰人GuidovanRossum于1991年首次发
Windows 11安装DeepSpeed报错（Unable to pre-compile async_io）问题解决 happy coding windows gpt
Windows11安装DeepSpeed报错（Unabletopre-compileasync_io）问题解决报错如下Preparingmetadata(setup.py)...errorerror:subprocess-exited-with-error×pythonsetup.pyegg_infodidnotrunsuccessfully.│exitcode:1╰─>[17linesofout
用Python做一个网页我是学习编程的人多多照顾我吧求你 python
要用Python做一个网页，你可以使用Flask或Django这样的Web框架。这里以Flask为例，给出一个简单的示例：1.首先，确保你已经安装了Flask。如果没有，可以使用以下命令安装：```bashpipinstallflask```2.创建一个名为`app.py`的文件，并在其中编写以下代码：```pythonfromflaskimportFlask,render_templateapp
3DUnet实现3D医学影像的有效分割 Andrew_Xzw python 深度学习 github opencv 计算机视觉分割
最近涉及到了3D医学影像的分割，网络上相关的实现比较少，因此进行实现记录。3DUnet实现3D医学影像的有效分割1.配置代码环境2.配置数据集以及模型文件3.训练4.预测1.配置代码环境这里介绍一个很好的开源项目，git为：https://github.com/ellisdg/3DUnetCNN.git。安装环境为：nibabel>=4.0.1numpy>=1.23.0#torch>=1.12.0
华为OD机试E卷 --堆栈中的剩余数字--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 java 华为od javascript python js c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码题目描述向一个空栈中依次存入正整数，假设入栈元素n(1<=n<=2^31-1)按顺序依次为nx…n4、n3、n2、n1,每当元素入栈时，如果n1=n2+…+ny(y的范围[2,x]，1<=x<=1000)，则n1~ny全部元素出栈，重新入栈新元素m(m=2n1)。如：依次向栈存入6、1、2、3,当
华为OD机试E卷 --机器人活动区域--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od 机器人 java javascript python js
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述现有一个机器人，可放置于M×N的网格Q中任意位置，每个网格包含一个非负整数编号。当相邻网格的数字编号差值的绝对值小于等于1时，机器人可在网格间移动问题:求机器人可活动的最大范围对应的网格点数目。说明:1)网格左上角坐标为(0,0)，右下角坐标为(m-1,n-1)2）机器人只能
Python 爬虫实战案例 - 获取社交平台事件热度并进行影响分析西攻城狮北 Python实用案例 python 爬虫事件热度影响分析
目录一、引言二、数据爬取三、数据分析四、可视化展示五、总结一、引言在当今信息爆炸的时代，社交平台成为了各类事件发酵和传播的重要场所。了解社交平台上事件的热度以及其潜在影响，对于舆情监测、市场营销、社会趋势分析等领域具有重要意义。本文将通过一个实际案例，展示如何使用Python爬虫技术获取社交平台上特定事件的相关数据，并对其热度和影响进行深入分析。在本篇博客中，我们将学习如何使用Python编写一个
Python编程与在线医疗平台数据挖掘与数据应用交互性研究 Allen_LVyingbo 数智化医院2025 python 数据挖掘
一、引言1.1研究背景与意义在互联网技术飞速发展的当下，在线医疗平台如雨后春笋般涌现，为人们的就医方式带来了重大变革。这些平台打破了传统医疗服务在时间和空间上的限制，使患者能够更加便捷地获取医疗资源。据相关报告显示，中国基于互联网的医疗保健行业已进入新的发展阶段，2023年中国在线医疗服务增长显著，高质量医院和在线医疗平台取得了长足进步，在线医疗的用户规模也在持续扩大，其中在线咨询服务的用户占比较
OpenCV基础学习 yzx991013 OpenCV基础全集学习
5.1开运算完整代码：importcv2importnumpyasnpdefcir():try:image=cv2.imread("./image/xingtai/cirrec.jpg")kernel=cv2.getStructuringElement(cv2.MORPH_ELLIPSE,(11,11))src=cv2.morphologyEx(image,cv2.MORPH_OPEN,kerne
OpenCV实例应用 yzx991013 OpenCV基础全集 opencv 人工智能计算机视觉
5.0图像的腐蚀应用完整代码：importcv2importnumpyasnpdeferode():img=cv2.imread('./image/dige.png')kernel=np.ones((3,3),np.uint8)erosion=cv2.erode(img,kernel,iterations=1)erosion1=cv2.erode(img,kernel,iterations=2)r
opencv图像基础学习 yzx991013 OpenCV基础全集 opencv 人工智能计算机视觉
2.3图像的加密解密源码如下：importcv2importnumpyasnpimportmatplotlib.pyplotaspltdefpassImg():img=cv2.imread('./image/cat.jpg',0)h,w=img.shape#生成一个密码，加密key_img=np.random.randint(0,256,size=(h,w),dtype=np.uint8)img_
python封装程序Failed to execute script pyi_rth_multiprocessing错误星烨无痕 pyinstaller封装程序机器学习人工智能 python
我的python程序编写环境为win10、python3.8.6，打包成exe文件后，在win10中能正常打开，没有任何问题。将程序拷贝到另一台电脑，电脑使用的是win7系统，运行程序出现Failedtoexecutescriptpyi_rth_multiprocessing错误，错误显示如下：Traceback(mostrecentcalllast):File"C:\Users\wuhen\Ap
PyTorch机器学习与深度学习技术方法 Teacher.chenchong 机器学习 python 开发语言
近年来，随着AlphaGo、无人驾驶汽车、医学影像智慧辅助诊疗、ImageNet竞赛等热点事件的发生，人工智能迎来了新一轮的发展浪潮。尤其是深度学习技术，在许多行业都取得了颠覆性的成果。另外，近年来，Pytorch深度学习框架受到越来越多科研人员的关注和喜爱。Python基础知识串讲1、Python环境搭建（Python软件下载、安装与版本选择；PyCharm下载、安装；Python之HelloW
深度学习模块C2f代码详解你是狒狒吗目标检测人工智能计算机视觉 pytorch YOLO 神经网络
C2f是一个用于构建卷积神经网络（CNN）的模块，特别是在YOLOv5和YOLOv8等目标检测模型中。这个模块是一个改进的CSP（CrossStagePartial）Bottleneck结构，旨在提高计算效率和特征提取能力。下面是对C2f类的详细解释：类定义和初始化Python复制classC2f(nn.Module):“”“FasterImplementationofCSPBottleneckw
python多线程锁_python:线程，多线程锁，多线程递归锁八亿中产 python多线程锁
#!usr/bin/envpython#-*-coding:utf-8-*-__author__="Samson"importthreading,timedefrun(n):print("task",n)time.sleep(2)print("currentthread:",threading.current_thread())#当前线程t_obj=[]#存线程实例start_time=time.
python线条加粗_python 加粗 weixin_39765057 python线条加粗
广告关闭腾讯云11.11云上盛惠，精选热门产品助力上云，云服务器首年88元起，买的越多返的越多，最高返5000元！背景知识：docx文件的结构分为三层，1、docment对象表示整个文档；2、docment包含了paragraph对象的列表，每个paragraph对象用来表示文档中的一个段落；3、一个paragraph对象包含run对象的列表，一个run对象就是style相同的一段文本。问题描述：
python读取word指定内容_Python-docx 读取word.docx内容 weixin_39636176
第一次写博客，也不知道要写点儿什么好，所以就把我在学习Python的过程中遇到的问题记录下来，以便之后查看，本人小白，写的不好，如有错误，还请大家批评指正！中文编码问题总是让人头疼，想要用Python读取word中的内容，用open()经常报错，上网一搜结果发现了Python有专门读取.docx的模块python_docx（只能读取.docx文件，不能读取.doc文件），用起来很方便。安装pyth
day39——多线程实例、多线程锁 weixin_33953384 java python
python的锁可以独立提取出来1mutex=threading.Lock()2#锁的使用3#创建锁4mutex=threading.Lock()5#锁定6mutex.acquire([timeout])7#释放8mutex.release()概念资源加锁其实并不是给资源加锁,而是用锁去锁定资源，你可以定义多个锁,像下面的代码,当你需要独占某一资源时，任何一个锁都可以锁这个资源就好比你用不同的锁都
python多线程锁实战_Python多线程锁 7Nut7 python多线程锁实战
在多线程程序执行过程中，为什么需要给一些线程加锁以及如何加锁，下面就来说一说。1.给线程加锁的原因我们知道，不同进程之间的内存空间数据是不能够共享的，试想一下，如果可以随意共享，谈何安全？但是一个进程中的多个线程是可以共享这个进程的内存空间中的数据的，比如多个线程可以同时调用某一内存空间中的某些数据(只是调用，没有做修改)。试想一下，在某一进程中，内存空间中存有一个变量对象的值为num=8，假如某
PyInstaller 构建的 Windows EXE 因多处理而失败潮易 windows
PyInstaller构建的WindowsEXE因多处理而失败PyInstaller是Python一个用于将Python脚本打包成可执行的exe文件的工具，但是它并不支持所有Python库，尤其是那些依赖于C扩展或使用PythonCAPI的库。如果你的程序在使用某些不支持的库时失败了，那么你可能需要寻找其他的解决方案，如使用其他的打包工具或者修改你的代码以适应这些库。以下是一个详细的步骤，说明如何
python：Failed to execute script ‘pyi_rth_win32comgenpy‘ due to unhandled exception! sinat_21963041 Appium自动化测试 python java android
使用pyinstaller打包exe程序后，出现如下错误：Failedtoexecutescript‘pyi_rth_win32comgenpy’duetounhandledexception!解决方法:https://blog.csdn.net/abcdefg5_555/article/details/128636706pythonsubprocessFileNotFoundError:[Win
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文

NumPy基础知识（三）

NumPy基础知识（三）

​​​​​​​使用导入数据 genfromtxt

定义输入

将行拆分为列

该delimiter参数

该autostrip参数

该comments参数

跳过行并选择列

在skip_header和skip_footer参数

该usecols参数

选择数据类型

设置名称

该names参数

该defaultfmt参数

验证名称

调整转换

该converters参数

使用缺失值和填充值

missing_values

filling_values

usemask

快捷功能

你可能感兴趣的:(技术学习,python,numpy)

使用导入数据 `genfromtxt`

该`delimiter`参数

该`autostrip`参数

该`comments`参数

在`skip_header`和`skip_footer`参数

该`usecols`参数

该`names`参数

该`defaultfmt`参数

该`converters`参数

`missing_values`

`filling_values`

`usemask`