u013805817

Numpy 基础

Numpy 是广泛应用于学术，工业的python数值计算库，其底层源码由C，Fortran写成。

由于python语言灵活，简洁，而且在数值计算中有numpy，scipy，sympy这类数值计算库的依托，使得快速开发

数值算法十分简便。所以python在数值计算中应用十分广泛，而numpy更是python数值计算中的基石。

本文主要介绍array操作和Numpy常用函数，这是数值计算的基础。

一·基础的基础 numpy arrays

python数值计算领域，numpy是其他数值计算库的基础。

安装其他函数库的时候，经常看到安装条件是已安装numpy。

而在numpy中，ndarray正是numpy的基础。

In [1]: import numpy as np

In [2]: a = np.zeros(3)    #生成一个三维零向量

In [3]: a
Out[3]: array([ 0.,  0.,  0.])

In [4]: type(a)
Out[4]: numpy.ndarray

numpy的arrays有点像python的list，但是又有一些不同：

1.array中所有元素必须为同一类型

2.而这数据类型必须是Numpy提供的数据类型(dtypes)之一

numpy提供的最重要数据类型有：

1.float64 64位浮点数

2.float32 32位浮点数

3.int64 64位整数

4.int32 32位整数

5.bool 8位 True 或者 False

还有其他一些数据类型包括：无符号整数，复数

可以测试一下自己的numpy默认的数据类型是什么

In [7]: a = np.zeros(3)

In [8]: type(a[0])
Out[8]: numpy.float64 #64位浮点数

当然，如果你要想要整数值组成的零向量也可以,

这时候需要改变默认参数的dtype=int

In [9]: a = np.zeros(3, dtype=int)

In [10]: type(a[0])
Out[10]: numpy.int32

二·数组维度

进行如下命令:

In [11]: z = np.zeros(10)

这时候z既不是行向量也不是列向量。可以叫它没有维度的‘flat’array(with no dimension )

z的维度(dimension )被记录在shape属性中，也就是z.shape ,它是一个tuple

In [12]: z.shape
Out[12]: (10,)  # 元组中只有一个元素的时候要加逗号。

这时候，z.shape中只有一个元素，仅仅表示z的长度而已，你可千万别多想。

如果使z具有维度的话，那么就先从改变z.shape做起吧。

In [13]: z.shape = (10, 1) #10代表行数，1代表列数。只有1列，当然，这是一个列向量

In [14]: z
Out[14]:
array([[ 0.],
       [ 0.],
       [ 0.],
       [ 0.],
       [ 0.],
       [ 0.],
       [ 0.],
       [ 0.],
       [ 0.],
       [ 0.]])

In [15]: z = np.zeros(4)

In [16]: z.shape = (2, 2) #2行2列的零矩阵

In [17]: z
Out[17]:
array([[ 0.,  0.],
       [ 0.,  0.]])

要创建两行两列的零阵，这样做也太麻烦了，直接穿递元组(2,2)到np.zeros()就可以了。

z = np.zeros((2, 2))

三·创建数组

我们知道用np.zeros()就可以创建零元素组成的数组。同样，我们可以创建全部由1组成的数组。

z = np.ones((2, 2))#2行2列数组，数组元素都为1

我们还可以创建空数组 np.empty()，以便以后传入参数进去。

In [18]: z = np.empty(3)

In [19]: z
Out[19]: array([  8.90030222e-307,   4.94944794e+173,   4.04144187e-262])

np.empty(3)在内存中连续开辟出可以存放3个float64元素的地址。得到的z，其中的元素都是随机的，没有意义。

要创建某个区间的连续多个数值组成的数组，可以用np.linspace(a,b,num)

代表在区间[a,b]上去num个均匀分隔这个区间的点。

In [20]: z = np.linspace(2, 4, 5)  # From 2 to 4, with 5 elements

array([ 2. ,  2.5,  3. ,  3.5,  4. ])

创建单位矩阵可以使用np.identity(),np.eye()

In [21]: z = np.identity(2)

In [22]: z
Out[22]:
array([[ 1.,  0.],
       [ 0.,  1.]])

另外，array可以利用np.array()直接通过python的list直接创建。

In [23]: z = np.array([10, 20])                 # ndarray from Python list

In [24]: z
Out[24]: array([10, 20])

In [25]: type(z)
Out[25]: numpy.ndarray

In [26]: z = np.array((10, 20), dtype=float)    # Here 'float' is equivalent to 'np.float64'

In [27]: z
Out[27]: array([ 10.,  20.])

In [28]: z = np.array([[1, 2], [3, 4]])         # 2D array from a list of lists

In [29]: z
Out[29]:
array([[1, 2],
       [3, 4]])

还有一个类似的函数np.asarray().它与 np.array()有一些不同，np.asarray()并不是复制原有对象，而是引用原有对象。

而np.array()是创建一个新的np.narray对象。

In [11]: na = np.linspace(10, 20, 2)

In [12]: na is np.asarray(na)   # Does not copy NumPy arrays
Out[12]: True

In [13]: na is np.array(na)     # Does make a new copy --- perhaps unnecessarily
Out[13]: False

四·载入和写入txt文件

np.loadtxt() 文件的每行数据必须有相同数目的数值

>>> from StringIO import StringIO   # StringIO behaves like a file object
>>> c = StringIO("0 1\n2 3")
>>> np.loadtxt(c)
array([[ 0.,  1.],
       [ 2.,  3.]])

同样，还可以载入字符串数据

>>> d = StringIO("M 21 72\nF 35 58")
>>> np.loadtxt(d, dtype={'names': ('gender', 'age', 'weight'),  
...                      'formats': ('S1', 'i4', 'f4')})       #'name' 表示数据各列的名称。'format'表式格式。

array([('M', 21, 72.0), ('F', 35, 58.0)],
      dtype=[('gender', '|S1'), ('age', '<i4'), ('weight', '<f4')])

更加高级的使用形式，如载入csv文件：

>>> c = StringIO("1,0,2\n3,0,4")
>>> x, y = np.loadtxt(c, delimiter=',', usecols=(0, 2), unpack=True)
>>> x
array([ 1.,  3.])
>>> y
array([ 2.,  4.])

delimiter 表示分隔符为逗号，usecols表示载入文件中的哪列数据。本文中是第0,2列。unpack参数

表示的是分裂，用x引用第0列，用y引用第2列。unpack的默认值为False，如果要使用x,y = np.loadtxt(something)

一定不要忘记修改unpack的默认值。

使用更高级的np.genfromtxt()载入文本数据。genfromtxt可以处理缺失值。

>>> s = StringIO("1,1.3,abcde")
>>> data = np.genfromtxt(s, dtype=[('myint','i8'),('myfloat','f8'),
... ('mystring','S5')], delimiter=",")
>>> data
array((1, 1.3, 'abcde'),
      dtype=[('myint', '<i8'), ('myfloat', '<f8'), ('mystring', '|S5')])

>>> s.seek(0) # needed for StringIO example only
>>> data = np.genfromtxt(s, dtype=None,
... names = ['myint','myfloat','mystring'], delimiter=",")
>>> data
array((1, 1.3, 'abcde'),
      dtype=[('myint', '<i8'), ('myfloat', '<f8'), ('mystring', '|S5')])

>>> s.seek(0)
>>> data = np.genfromtxt(s, dtype="i8,f8,S5",
... names=['myint','myfloat','mystring'], delimiter=",")
>>> data
array((1, 1.3, 'abcde'),
      dtype=[('myint', '<i8'), ('myfloat', '<f8'), ('mystring', '|S5')])

使用固定宽度分割每行数据，delimiter=[1,3,5]各列固定宽度分别为1,3,5

>>> s = StringIO("11.3abcde")
>>> data = np.genfromtxt(s, dtype=None, names=['intvar','fltvar','strvar'],
...     delimiter=[1,3,5])
>>> data
array((1, 1.3, 'abcde'),
      dtype=[('intvar', '<i8'), ('fltvar', '<f8'), ('strvar', '|S5')])

五·数组索引

对于1维数组来讲，索引与python中序列的索引没有区别。

In [30]: z = np.linspace(1, 2, 5)

In [31]: z
Out[31]: array([ 1.  ,  1.25,  1.5 ,  1.75,  2.  ])

In [32]: z[0]
Out[32]: 1.0

In [33]: z[0:2]  # Slice numbering is left closed, right open
Out[33]: array([ 1.  ,  1.25])

In [34]: z[-1]
Out[34]: 2.0

对于二维数组来讲，索引与数学上的矩阵索引没有区别。唯一不同在于，在此矩阵索引下标从0开始。

In [35]: z = np.array([[1, 2], [3, 4]])

In [36]: z
Out[36]:
array([[1, 2],
       [3, 4]])

In [37]: z[0, 0]
Out[37]: 1

In [38]: z[0, 1]
Out[38]: 2

切片功能则是矩阵索引与python切片的结合。

In [39]: z[0,:]        #第0行
Out[39]: array([1, 2])

In [40]: z[:,1]        #第1列
Out[40]: array([2, 4])

用numpy数组索引：

In [41]: z = np.linspace(2, 4, 5)

In [42]: z
Out[42]: array([ 2. ,  2.5,  3. ,  3.5,  4. ])

In [43]: indices = np.array((0, 2, 3))

In [44]: z[indices]
Out[44]: array([ 2. ,  3. ,  3.5])

这仅仅是第一种形式，indices包含的仅仅是所需元素的位置。

indices还可以为仅仅指明每个元素是否可留，留下来为True，不需要的为False，这是另一种方法：

In [45]: z
Out[45]: array([ 2. ,  2.5,  3. ,  3.5,  4. ])
In [46]: d = np.array([0, 1, 1, 0, 0], dtype=bool) #注意datype是bool，1代表True，0代表False

In [47]: d
Out[47]: array([False,  True,  True, False, False], dtype=bool)

In [48]: z[d]
Out[48]: array([ 2.5,  3. ])

索引全部使用z[:]

In [49]: z = np.empty(3)

In [50]: z
Out[50]: array([ -1.25236750e-041,   0.00000000e+000,   5.45693855e-313])

In [51]: z[:] = 42

In [52]: z
Out[52]: array([ 42.,  42.,  42.])

六·数组方法

以下所有方法都被高度优化。

In [53]: A = np.array((4, 3, 2, 1))

In [54]: A
Out[54]: array([4, 3, 2, 1])

In [55]: A.sort()                                 # 升序排序，无返回值

In [56]: A
Out[56]: array([1, 2, 3, 4])

In [57]: A.sum()               # 求和
Out[57]: 10

In [58]: A.mean()      # 平均值
Out[58]: 2.5

In [59]: A.max()               # 最大值
Out[59]: 4

In [60]: A.argmax()            # 最大值所在位置
Out[60]: 3

In [61]: A.cumsum()                                       # 累积和
Out[61]: array([ 1,  3,  6, 10])

In [62]: A.cumprod()                                   # 累积积
Out[62]: array([ 1,  2,  6, 24])

In [63]: A.var()                                              # 方差
Out[63]: 1.25

In [64]: A.std()                                         # 标准差
Out[64]: 1.1180339887498949

In [65]: A.shape = (2, 2)

In [66]: A.T                    # 转置 与 A.transpose() 作用相同
Out[66]:
array([[1, 3],
       [2, 4]])

z.searchsorted(a) 首先要求z是非降序数组，其作用是返回z中第一个出现的比a大的元素的索引值。

In [67]: z = np.linspace(2, 4, 5)

In [68]: z
Out[68]: array([ 2. ,  2.5,  3. ,  3.5,  4. ])

In [69]: z.searchsorted(2.2)
Out[69]: 1

In [70]: z.searchsorted(2.5)
Out[70]: 1

In [71]: z.searchsorted(2.6)
Out[71]: 2

当然，上文所介绍的array方法，还可以直接作用于python的基本序列结构：

In [72]: a = np.array((4, 3, 2, 1))

In [73]: np.sum(a)
Out[73]: 10

In [74]: np.mean(a)
Out[74]: 2.5

七·数组运算

代数运算：+，-，*，/，**

这些运算的对象都是array中的每个元素，与向量运算一样

In [75]: a = np.array([1, 2, 3, 4])

In [76]: b = np.array([5, 6, 7, 8])

In [77]: a + b                      #每个元素相加
Out[77]: array([ 6,  8, 10, 12])

In [78]: a * b                      #每个元素相乘，这可不是向量的内积运算！
Out[78]: array([ 5, 12, 21, 32])

array与标量运算。

In [79]: a + 10
Out[79]: array([11, 12, 13, 14])

In [81]: a = np.array([1, 2, 3, 4])

In [82]: a * 10
Out[82]: array([10, 20, 30, 40])

多维数组也是如此

In [86]: A = np.ones((2, 2))

In [87]: B = np.ones((2, 2))

In [88]: A + B
Out[88]:
array([[ 2.,  2.],
       [ 2.,  2.]])

In [89]: A + 10
Out[89]:
array([[ 11.,  11.],
       [ 11.,  11.]])

In [90]: A * B
Out[90]:
array([[ 1.,  1.],
       [ 1.,  1.]])

向量与矩阵乘法

numpy中向量与矩阵的乘法由dot()函数完成。

In [91]: A = np.array([1, 2])

In [92]: B = np.array([10, 20])

In [93]: np.dot(A, B)   # Returns a scalar in this case
Out[93]: 50

In [137]: A = np.ones((2, 2))

In [138]: B = np.ones((2, 2))

In [139]: np.dot(A, B)
Out[139]:
array([[ 2.,  2.],
       [ 2.,  2.]])

实际上，我们可以直接利用np.dot()对python序列进行计算。当然，这里的序列可不是字符串

In [94]: A = np.empty((2, 2))

In [95]: A
Out[95]:
array([[  3.48091887e-262,   1.14802984e-263],
       [  3.61513512e-313,  -1.25232371e-041]])

In [96]: np.dot(A, (0, 1))
Out[96]: array([  1.14802984e-263,  -1.25232371e-041])

这里(0,1)被认为是一个列向量

八·比较操作

比较操作，比较的是两个array上相对应位置的元素的值,返回的是元素类型为bool的array

In [97]: z = np.array([2, 3])

In [98]: y = np.array([2, 3])

In [99]: z == y
Out[99]: array([ True,  True], dtype=bool)

In [100]: y[0] = 5

In [101]: z == y
Out[101]: array([False,  True], dtype=bool)

In [102]: z != y
Out[102]: array([ True, False], dtype=bool)

比较符号依然是，>,<,==,!=,>=,<=

array可以直接与标量比较

In [103]: z = np.linspace(0, 10, 5)

In [104]: z
Out[104]: array([  0. ,   2.5,   5. ,   7.5,  10. ])

In [105]: z > 3
Out[105]: array([False, False,  True,  True,  True], dtype=bool)

比较操作经常用于条件索引：

In [106]: b = z > 3

In [107]: b
Out[107]: array([False, False,  True,  True,  True], dtype=bool)

In [108]: <span style="color:#ff0000;">z[b]</span>
Out[108]: array([  5. ,   7.5,  10. ])

更加直接的比较索引如下：

In [109]:<span style="color:#ff0000;"> z[z > 3]</span>
Out[109]: array([  5. ,   7.5,  10. ])

九·函数的向量化

numpy中还有一些其他函数可以直接处理array数据。如np.sin()，np.cos(),np.exp(),np.log()

In [110]: z = np.array([1, 2, 3])

In [111]: np.sin(z)
Out[111]: array([ 0.84147098,  0.90929743,  0.14112001])

In [112]: z
Out[112]: array([1, 2, 3])

In [113]: (1 / np.sqrt(2 * np.pi)) * np.exp(- 0.5 * z**2)
Out[113]: array([ 0.24197072,  0.05399097,  0.00443185])

In [114]: import numpy as np

In [115]: x = np.random.randn(4)  

In [116]: x
Out[116]: array([-0.25521782,  0.38285891, -0.98037787, -0.083662  ])

In [117]: np.where(x > 0, 1, 0)  # Insert 1 if x > 0 true, otherwise 0
Out[117]: array([0, 1, 0, 0])

np.where(x>0,1,0) 十分像C语言中的唯一三元运算符 a>b? 1:0

一个对标量数据进行处理的函数，如何才能用于处理向量呢？

当然可以直接重新写一个，但是比较费时费力，numpy给我们提供了另一个思路:

在原有标量函数的基础上，将标量函数向量化，得到的新函数可以直接处理向量数据：

In [118]: def f(x): return 1 if x > 0 else 0

In [119]: f = np.vectorize(f)

In [120]: f(x)                # Passing same vector x as previous example
Out[120]: array([0, 1, 0, 0])

十·其他函数

In [131]: A = np.array([[1, 2], [3, 4]])

In [132]: np.linalg.det(A)           # 行列式
Out[132]: -2.0000000000000004

In [133]: np.linalg.inv(A)           # 求逆矩阵
Out[133]:
array([[-2. ,  1. ],
       [ 1.5, -0.5]])

In [134]: Z = np.random.randn(10000)  # 生成正态分布

In [135]: y = np.random.binomial(10, 0.5, size=1000)    # 生成伯努利分布

In [136]: y.mean()
Out[136]: 5.0369999999999999

SpringBoot电商项目实战：从零搭建百万级架构
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot电商项目实战：从
Python Amazon Web Services编程库之boto3使用详解 Rocky006 python 开发语言人工智能
概要boto3是AmazonWebServices(AWS)的官方Python软件开发工具包(SDK)，为开发者提供了从Python应用程序访问和管理AWS服务的简单方式。作为AWS生态系统的重要组成部分，boto3提供了对AmazonS3、EC2、DynamoDB等几乎所有AWS服务的编程访问。该库采用面向对象的API设计，不仅使基本操作变得直观，还支持高级功能如资源抽象、数据分页和并发操作。安
Python中使用Graphviz绘制决策树图解黃昱儒
本文还有配套的精品资源，点击获取简介：Graphviz是一款用于数据可视化和算法流程展示的图形绘制软件，特别适用于Python中绘制决策树和其他图形类型。本安装包包含Graphviz安装程序和配置指南，以及如何在Python中利用pydot库等第三方库进行图形绘制的详细步骤。通过配置环境变量和利用DOT语言，用户可以将决策树模型转换为可视化图形，加深对机器学习模型的理解和调试。1.Graphviz
Python工程师面试题集木鱼时刻软件开发 python 开发语言
文章目录一、Python基础二、关键Python库三、Web开发四、并发与性能五、系统设计答案区一、Python基础Python的可变与不可变数据类型有哪些？底层实现原理？Python2与Python3的主要区别解释GIL全局解释器锁及其对多线程的影响装饰器Decorator的作用与实现原理二、关键Python库Pandas的核心作用及数据结构常用Pandas操作与缺失值处理百万级数据优化技巧Nu
Python内置函数--reversed()
它将一个序列作为输入，并返回另一个序列，其中元素的顺序与给定输入序列的顺序相反。它不会对原始序列产生任何影响。也就是在原列表的基础上返回一个新的反向列表。粗略的看看classreversed(Iterator[_T],Generic[_T]):@overloaddef__init__(self,__sequence:Reversible[_T])->None:...@overloaddef__in
NumPy-核心函数np.matmul()深入解析 GG不是gg numpy numpy
NumPy-核心函数np.matmul深入解析一、矩阵乘法的本质与`np.matmul()`的设计目标1.数学定义：从二维到多维的扩展2.设计目标二、`np.matmul()`核心语法与参数解析函数签名核心特性三、多维场景下的核心运算逻辑1.二维矩阵乘法：基础用法2.一维向量与二维矩阵相乘3.高维数组：批次矩阵乘法4.广播机制下的形状匹配四、与`np.dot()`和`*`运算符的核心区别1.对比`
python内置函数reversed_python必备内置函数- reversed(seq) weixin_39923599
python必备内置函数-abs()https://developer.aliyun.com/ask/280547python必备内置函数-all()https://developer.aliyun.com/ask/280560python必备内置函数-any()https://developer.aliyun.com/ask/280561python必备内置函数-ascii()https://d
win10python2.7安装_Win10下python 2.7.13 安装配置方法图文教程 weixin_39569051
本文记录了Windows10安装Python2.7的详细步骤，分享给大家。一、下载软件Python的官方地址点击Downloads找到进行下载点击进行下载、有18M左右下载地址：链接地址二、安装软件下载之后点击安装勾选第一项点击下一步点击下一步点击下一步等几分钟就好了。安装完成、点击Finish。三、配置环境安装后之后需要把Python的路径添加到环境变量中去、右键单击【计算机】，选择菜单属性命令
python模拟内置函数reversed_Python内置函数reversed weixin_39594895
{"moduleinfo":{"card_count":[{"count_phone":1,"count":1}],"search_count":[{"count_phone":4,"count":4}]},"card":[{"des":"阿里技术人对外发布原创技术内容的最大平台；社区覆盖了云计算、大数据、人工智能、IoT、云原生、数据库、微服务、安全、开发与运维9大技术领域。","link1":
python2.7下载哪个_Python2.7.13下载安装全过程（Windows版） weixin_39615984 python2.7下载哪个
前提：我下载的Python是windows版本的，演示过程是在win1064位操作系统上安装的。1、下载进入官网https://www.python.org/，找到Dowdloads，根据所需下载对应版本，如下图所示：这是我下载的版本：下载完成之后，双击exe文件，即可开始安装。2、安装安装操作非常简单，基本就是点击下一步，直到完成即可。如下图所示：3、环境变量的配置我们需要找到系统环境变量Pat
Agno（一）
一、基本功能介绍Agno是一个python框架，用于构建具有共享内存、知识和推理的多代理系统。工程师和研究人员使用Agno构建：1级：带有工具和说明的代理2级：具有知识和存储的代理3级：具有记忆和推理能力的代理4级：可以推理和协作的代理团队5级：具有状态和确定性的代理工作流例：使用YFinanceAPI回答问题的1级推理代理：fromagno.agentimportAgentfromagno.mo
python内置函数reversed_Python3内置函数——reversed() = 翻转我的世界大龙说学区
v.颠倒(reverse的过去式和过去分词)；翻转help(reversed)Helponclassreversedinmodulebuiltins:classreversed(object)|reversed(sequence)->reverseiteratorovervaluesofthesequence||Returnareverseiterator||Methodsdefinedhere:
python2.7.13安装keras记录呜哇哈哈嗝～ Python基础 keras tensorflow python
keras给出的版本大多对应的是python3.x版本，但有时一些项目需要用到python2.x的环境，版本找起来很麻烦。故喇宝准备写此篇来记录以及总结一下自己的安装过程（也为了防止下次自己又要重新装的时候各种百度不到）！python版本2.7.13condacreate--namepython27python=2.7.13在anaconda中使用命令新建一个名为python27的虚拟环境，新环境
HoloViews数据管道技术详解：构建动态数据处理与可视化流程方玉蜜United
HoloViews数据管道技术详解：构建动态数据处理与可视化流程holoviewsWithHoloviews,yourdatavisualizesitself.项目地址:https://gitcode.com/gh_mirrors/ho/holoviews引言在现代数据分析和可视化工作中，构建高效的数据处理管道至关重要。HoloViews作为一款强大的Python可视化库，提供了灵活的数据管道机制
CCSDSPy项目解析：CCSDS空间数据包协议详解方玉蜜United
CCSDSPy项目解析：CCSDS空间数据包协议详解ccsdspyI/OinterfaceandutilitiesforCCSDSbinaryspacecraftdatainPython.LibraryusedinflightmissionsatNASA,NOAA,andSWRI项目地址:https://gitcode.com/gh_mirrors/cc/ccsdspy概述CCSDS（空间数据系统
Python 的内置函数 repr IMPYLH python 笔记
Python内建函数列表>Python的内置函数reprPython的内置函数repr()是一个非常重要的对象字符串表示函数，其主要功能是返回一个对象的"官方"字符串表示形式（通常称为"representation"）。这个字符串通常能够被Python解释器读取，并尽可能准确地重建该对象。详细特性：可重建性原则：repr()返回的字符串理论上应该能够通过eval()函数重新构造出原对象与str()
Python 2.7.13安装与配置教程金融先生-Frank
本文还有配套的精品资源，点击获取简介：Python2.7.13是Python2.x系列的最后一个版本，虽然不再维护，但许多遗留系统仍在使用。本教程详细介绍了Python2.7.13在Windows系统上的安装流程，并提供了环境变量配置、安装验证以及如何开始使用Python的方法。同时强调了Python3.x的迁移重要性，并提供了学习资源和第三方库安装的指导。1.Python2.7.13重要性与现状
Python 爬虫实战：保险公司产品条款现代技术高效爬取 Python核芯 Python爬虫实战项目 python 爬虫开发语言保险
一、引言在当今数字化时代，保险行业作为金融领域的重要组成部分，其产品条款信息的获取对于消费者、研究人员以及行业从业者都具有重要意义。然而，面对海量的保险产品条款数据，如何高效、准确地爬取这些信息成为了一个亟待解决的问题。本文将详细介绍如何利用现代Python爬虫技术，针对保险公司产品条款进行高效爬取，旨在为相关领域的研究和应用提供有力的技术支持。二、爬取目标与需求分析（一）爬取目标本次爬取的目标是
Python——turtle库宅男很神经开发语言 python
前言：海龟绘图的起源与PythonTurtle库的哲学在计算机图形学的浩瀚世界中，Python的turtle（海龟绘图）库以其独特的魅力，为初学者打开了一扇通往可视化编程的奇妙大门。然而，其深度远不止于简单的入门，它蕴含着事件驱动、状态机、坐标几何以及与底层GUI库（Tkinter）交互的精妙机制。本指南将带您从最底层的逻辑开始，逐步向上，全面、无死角地剖析turtle库的每一个细节，揭示其内部运
【数据挖掘】支持向量机（SVM）大雨淅淅大数据数据挖掘支持向量机算法大数据回归
目录一、支持向量机（SVM）算法概述二、支持向量机（SVM）算法优缺点和改进2.1支持向量机（SVM）算法优点2.2支持向量机（SVM）算法缺点2.3支持向量机（SVM）算法改进三、支持向量机（SVM）算法实现3.1支持向量机（SVM）算法C语言实现3.2支持向量机（SVM）算法JAVA实现3.3支持向量机（SVM）算法python实现四、支持向量机（SVM）算法应用五、支持向量机（SVM）算法发
Python爬虫：Scrapy报错：ModuleNotFoundError: No module named ‘scrapy.contrib‘ 濯一一 #爬虫 bug scrapy python 爬虫
项目场景：今天，又开始自学Python爬虫Scrapy框架辽，爬爬爬于是又导包报错辽，，，问题描述：提示：第一行导入scrapy.contrib时报错了。原因分析：百度：找到类似的问题和解决方式：#bug：fromscrapytest.NewsItemsimportNewsItem#改为#debug：fromscrapytest.scrapytest.itemsimportNewsItem思考：重
【Python】typing_extensions 库：提供对 Python 类型注解的扩展支持彬彬侠 Python基础 python typing_extensio 类型注解
typing_extensions是一个Python库，提供对Python类型注解的扩展支持，包含在较新Python版本中引入的类型功能（如Literal、TypedDict、Protocol），并将其回溯到旧版本。它是typing标准库的补充，广泛用于需要高级类型注解的场景，如静态类型检查（使用mypy、pyright）、IDE类型提示和现代Python项目。以下是对typing_extensi
华为OD 机试 2025 B卷 - 相同数字组成图形的周长 (C++ & Python & JAVA & JS & GO) 无限码力华为od 华为OD2025B卷华为OD机试2025B卷华为OD机试华为OD机考2025B卷
相同数字组成图形的周长华为OD机试真题目录点击查看:华为OD机试2025B卷真题题库目录｜机考题库+算法考点详解华为OD机试2025B卷200分题型题目描述有一个64×64的矩阵，每个元素的默认值为0，现在向里面填充数字，相同的数字组成一个实心图形，如下图所示是矩阵的局部（空白表示填充0）：数字1组成了蓝色边框的实心图形，数字2组成了红色边框的实心图形。单元格的边长规定为1个单位。请根据输入，计算
Cursor黑科技：AI编程实战
引言AI编程工具的崛起与Cursor的定位Cursor的核心功能概述（代码生成、补全、对话式调试等）目标读者：开发者、技术团队、AI工具探索者核心功能解析智能代码生成基于自然语言描述生成代码（如“实现一个Python快速排序”）多语言支持（Python、JavaScript、Go等）示例对比代码补全与优化实时上下文感知补全（比传统IDE更精准）代码重构建议（如性能优化、冗余删除）对话式交互调试通过
解决Python包安装报错 “error: externally-managed-environment“
在使用pip安装Python包时，有时会遇到"error:externally-managed-environment"的报错，这是因为当前的Python环境是由外部管理的，而不是通过pip进行管理。这篇博客将介绍如何解决这个问题，并说明使用--break-system-packages选项的作用。问题描述当我们尝试使用pip安装Python包时，可能会遇到以下报错信息：error:externa
Python网络数据采集的方法蚂蚁ai Python零基础 Python python 开发语言
听说还有很多小伙伴还不知道网络数据采集的方法，让我来看看都有谁，不说话我就点名了。我把教程分享在下面了，需要的小伙伴自己领取。（https://jq.qq.com/?_wv=1027&k=kYtMeTfp）一般情况下以下四种方式都是可以匹配到结果的，只是复杂程度不一致，根据情况进行选择。◾正则re的使用◾bs4的使用◾xpath◾PyQuery①Re（RegularExpression正则表达式）
yolo11官方ONNXRuntime部署推理的脚本测试，包括检测模型和分割模型的部署推理 Revao YOLO python
一、检测模型1.脚本路径：D:/ultralytics-main/examples/YOLOv8-ONNXRuntime/main.py2.使用案例下载好onnx模型保存至D:/ultralytics-main/models目录下，没有该目录则新建打开终端，进入虚拟环境以yolov8n.onnx模型为例，输入以下指令即可pythonD:/ultralytics-main/examples/YOLO
pythonocc-core 的项目扩展与二次开发白娥林
pythonocc-core的项目扩展与二次开发pythonocc-coretpaviot/pythonocc-core:是一个基于Python的OpenCASCADE(OCCT)几何内核库，提供了三维几何形状的创建、分析和渲染等功能。适合对3D建模、CAD、CAE以及Python有兴趣的开发者。项目地址:https://gitcode.com/gh_mirrors/py/pythonocc-co
PythonOCC【快速入门】
目录简单介绍环境小例子简单介绍pythonOCC也就是opencascade的python封装版本，是由tpaviot制作并发行的。pythonOCC是python语言构架的3DCAD/CAE/PLM开发框架，它提供了如下功能：复杂曲面的操作，信息转换（STEP,IGES,STL格式），用户界面可视化（基于wxpython库或者qt库），jupyternootbook生成等。环境https://a
探索Python OCC核心：高效3D建模与CAD编程的利器邢郁勇Alda
探索PythonOCC核心：高效3D建模与CAD编程的利器项目地址:https://gitcode.com/gh_mirrors/py/pythonocc-core项目简介pythonocc-core是一个开源项目，它是OpenCASCADETechnology（OCC）的Python绑定，提供了一套强大的3D建模和计算机辅助设计（CAD）工具。利用Python的易用性和OCC的强大功能，此项目旨
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &