天海一直在AI

机器学习技术（二）——Python科学运算模块（Numpy、Pandas）

文章目录

机器学习技术（二）——Python科学运算模块（Numpy、Pandas）
- 一、Numpy
- - 1、介绍、安装与导入
  - 2、Numpy常用操作
- 二、Pandas
- - - 1.导入相关依赖库
    - 2.创建Series
    - 3.创建DataFrame
    - 4.查看DataFrame中的数据
    - 5.DataFrame数据的操作
    - 6.Pandas中缺失数据的操作
- 三、总结

机器学习技术（二）——Python科学运算模块（Numpy、Pandas）_第1张图片

一、Numpy

1、介绍、安装与导入

使用NumPy库中的函数实现对数组的基本操作。对一些数据处理方法有所了解，在以后对机器学习实验中与处理数据以及底层代码实现打下基础。

首先使用“pip install 包名”的方式安装实验所需要的库：

pip install numpy

也可以下载相关包的源码文件进行安装。如果实验环境中已存在所需要的库

（使用pip list可查看已安装的库）则跳过此步骤

（Python中一些库在安装时需要事先安装一些依赖环境，如果使用pip命令安装失败，可以尝试安装依赖的库后再进行安装，或者使用源码安装）

2、Numpy常用操作

导入numpy，使用NumPy库中的方法生成数组，并查看数组的属性。

import numpy as np # 导入库时可以使用as来为为库起别名

np.zeros(shape, dtype=float, order='C')

创建一个形状为shape的全零数组。dtype为数据类型。order=C代表与c语言类似，行优先;order=F代表列优先

n = np.zeros([2,2])	# 创建一个2*2的全0数组
print(n)
''' 输出[[0. 0.]
 		[0. 0.]] '''

np.ones(shape, dtype=None, order='C')

创建一个全1数组，和np.zeros()类

m = np.ones([2,2]) # 创建一个2*2的全1数组
print(m)
'''输出[[1. 1.]
		[1. 1.]]'''

np.eye(N, M=None, k=0, dtype=float, order='C')

生成一个对角矩阵，N为行数；M为列数，默认和N一样；k为对角线的索引，0代表主对角线。

e = np.eye(2) # 创建一个2X2的对角矩阵
print(e)
'''输出[[1. 0.]
 [0. 1.]]'''s

numpy.empty(shape, dtype=float, order='C')

生成一个未初始化的数组。

print(np.empty([3,3]))
''' 输出[[0.00000000e+000 0.00000000e+000 0.00000000e+000]
 [0.00000000e+000 0.00000000e+000 1.54148482e-321]
 [8.34448956e-308 1.42404727e-306 1.44629801e-307]] '''

numpy.full(shape, fill_value, dtype=None, order='C')

二、Pandas

在Python中对数据进行处理时，经常会使用到Pandas这个库，它提供了诸多的数据处理方法和时间序列的操作方法，是当下最重要的Python 科学运算模块之一，也是提供高性能易用数据类型和分析工具。

1.导入相关依赖库

import pandas as pd
import numpy as np

2.创建Series

Series是Pandas中数据结构之一，它是一种类似于一维数组的对象，由一组数据以及一组与之相关的数据标签（即索引）组成。

pandas生成Series

pandas.Series(data=None, index=None, dtype=None, name=None, copy=False, fastpath=False)生成一个Series数据。data为数据可以是数组和字典等；index为索引值，要求与数据长度相同，dtype为数据类型。

s = pd.Series([1,3,5,np.nan,6,8])			# nan  缺失值
print(s)

输出：

0    1.0
1    3.0
2    5.0
3    NaN
4    6.0
5    8.0
dtype: float64

通过ndarray创建一个Series

x data = np.array(['a','b','c','d'])s = pd.Series(data)print(s)

输出：

0    a
1    b
2    c
3    d
dtype: object

通过字典创建一个Series

字典（dict）可以作为输入传递，如果没有指定索引，则按排序顺序取得字典键以构造索引。如果传递了索引，索引中与标签对应的数据中的值将被取出。

data1 = {'a' : 0., 'b' : 1., 'c' : 2.}
s = pd.Series(data1)
print(s)

输出：

a    0.0
b    1.0
c    2.0
dtype: float64

3.创建DataFrame

DataFrame 是Pandas中最常用的数据结构，类似于数据库中的表，不过DataFrame不仅仅限制于2维，可以创建多维数据表。DataFrame既有行索引，也有列索引，可以看做是Series组成的字典，每个Series看做DataFrame的一个列。

pandas.date_range（start = None，end = None，periods = None，freq = "D"，tz = None，normalize = False，name = None，closed = None，**kwargs ）

生成一个时间序列的索引DatetimeIndex。start为日期起点，end为日期终点，periods为个数，freq表示间隔（D表示以日为间隔）,tz表示时区。

pandas.DataFrame(data=None, index=None, columns=None,dtype=None,copy=False)

生成一个DataFraem数据。data是数据，index是索引，columns是列名。

dates = pd.date_range('20230703', periods=7)# 生成作为行索引的时间序列
print(dates)
print("--"*16)
df = pd.DataFrame(np.random.randn(7,4), index=dates, columns=list('ABCD'))
print(df)

结果：

DatetimeIndex(['2023-07-03', '2023-07-04', '2023-07-05', '2023-07-06',
               '2023-07-07', '2023-07-08', '2023-07-09'],
              dtype='datetime64[ns]', freq='D')
--------------------------------
                   A         B         C         D
2023-07-03  0.363595  0.296730 -1.701725 -0.323202
2023-07-04  0.337387  1.545662 -0.598071  0.399948
2023-07-05  0.561122 -0.244265  1.874373 -0.500115
2023-07-06 -0.045536 -0.440416  0.679049 -0.343199
2023-07-07 -1.767418  0.141762 -3.015787  1.072641
2023-07-08 -1.085728  0.034458 -0.180272 -0.870009
2023-07-09  0.993971  0.589281 -1.142692  1.395541

使用字典形式创建DataFrame

输入：

df1 = pd.DataFrame({ 'A' : 1.,
                     'B' : pd.Timestamp('20190610'), # Timestamp 方法生成时间戳
                     'C' : pd.Series(1,index=list(range(4)),dtype='float32'),
                     'D' : np.array([3] * 4,dtype='int32'),
                    # Categoricals 是 pandas 的一种数据类型，对应着被统计的变量，
                    # categorical 类型的数据可以具有特定的顺序，这个顺序是创建时手工设定的，是静态的
                     'E' : pd.Categorical(["test","train","test","train"]),
                     'F' : 'foo' })
print(df1)

输出：

     A          B    C  D      E    F
0  1.0 2023-07-03  1.0  3   test  foo
1  1.0 2023-07-03  1.0  3  train  foo
2  1.0 2023-07-03  1.0  3   test  foo
3  1.0 2023-07-03  1.0  3  train  foo

4.查看DataFrame中的数据

查看顶部和底部的数据

接收一个用户输入的分数，然后判断用户所输入的分数属于什么级别。使用Python中的if语句可以完成此功能。

输入：

data2 = np.arange(30).reshape(6,5)		# 生成一个维度（6,5）的数组
df2 = pd.DataFrame(data2,index=['a','b','c','d' ,'e' , 'f'] , columns = ['A', 'B', 'C','D','E'])							# 创建DataFrame
print(df2)
print("--" * 10)
# DataFrame.head(n=5)：显示前n条数据。n表示显示的数据量。
print(df2.head())
print("--" * 10)
# DataFrame.tail(n=5)：显示底部数据，和head的参数一样
print(df2.tail(3))

输出：

    A   B   C   D   E
a   0   1   2   3   4
b   5   6   7   8   9
c  10  11  12  13  14
d  15  16  17  18  19
e  20  21  22  23  24
f  25  26  27  28  29
--------------------
    A   B   C   D   E
a   0   1   2   3   4
b   5   6   7   8   9
c  10  11  12  13  14
d  15  16  17  18  19
e  20  21  22  23  24
--------------------
    A   B   C   D   E
d  15  16  17  18  19
e  20  21  22  23  24
f  25  26  27  28  29

显示索引，列和数据

输入：

print("index is :" )		
print(df2.index)					# 输出行索引
print("columns is :" )
print(df2.columns)					# 输出列索引
print("values is :" )
print(df2.values)					# 输出数据

输出：

index is :
Index(['a', 'b', 'c', 'd', 'e', 'f'], dtype='object')
columns is :
Index(['A', 'B', 'C', 'D', 'E'], dtype='object')
values is :
[[ 0  1  2  3  4]
 [ 5  6  7  8  9]
 [10 11 12 13 14]
 [15 16 17 18 19]
 [20 21 22 23 24]
 [25 26 27 28 29]]

使用loc方法，根据列名对相关索引进行切片，得到想要访问的数据。

# DataFrame.loc：按标签或布尔数组访问一组行和列
print(df2.loc['a':'f':2,'A'])		# 获取A列，索引为a到f（包括f）中的数据，步长为2

输出：

a     0
c    10
e    20
Name: A, dtype: int64

查看数据的详细信息

DataFrame.describe(percentiles=None, include=None, exclude=None)

生成描述性统计数据，总结数据集分布的集中趋势，分散和形状，不包括 NaN值。

print(df2.describe()) # describe描述了数据的详细信息

输出：

            A          B          C          D          E
count   6.000000   6.000000   6.000000   6.000000   6.000000
mean   12.500000  13.500000  14.500000  15.500000  16.500000
std     9.354143   9.354143   9.354143   9.354143   9.354143
min     0.000000   1.000000   2.000000   3.000000   4.000000
25%     6.250000   7.250000   8.250000   9.250000  10.250000
50%    12.500000  13.500000  14.500000  15.500000  16.500000
75%    18.750000  19.750000  20.750000  21.750000  22.750000
max    25.000000  26.000000  27.000000  28.000000  29.000000

5.DataFrame数据的操作

使用drop方法删除不需要的列或行

DataFrame.drop（labels = None，axis = 0，index = None，columns = None，level = None，inplace = False，errors ='raise' ）

通过指定标签名称和相应的轴，或直接指定索引或列名称来删除行或列。labels标签名，axis选择行或列（0表示行，1表示列），index 直接指定要删除的行，columns 直接指定要删除的列，inplace=False，默认该删除操作不改变原数据，而是返回一个执行删除操作后的新DataFrame。

data3 = np.arange(30).reshape(6,5)
df3 = pd.DataFrame(data3,index=['a','b','c','d','e', 'f'] , columns = ['A', 'B', 'C', 'D', 'E'])
a = df3.drop(['a'], axis=0)				# axis=0时 删除指定的行
b = df3.drop(['A'], axis=1)				# axis=1时，删除指定的列
print('-------原始数据df-----')
print(df3)
print('-------删除行---------')
print(a)
print('-------删除列---------')
print(b)

输出：

-------原始数据df-----
    A   B   C   D   E
a   0   1   2   3   4
b   5   6   7   8   9
c  10  11  12  13  14
d  15  16  17  18  19
e  20  21  22  23  24
f  25  26  27  28  29
-------删除行---------
    A   B   C   D   E
b   5   6   7   8   9
c  10  11  12  13  14
d  15  16  17  18  19
e  20  21  22  23  24
f  25  26  27  28  29
-------删除列---------
    B   C   D   E
a   1   2   3   4
b   6   7   8   9
c  11  12  13  14
d  16  17  18  19
e  21  22  23  24
f  26  27  28  29

使用append方法合并两个DataFrame

DataFrame.append（other，ignore_index = False，verify_integrity = False，sort = None ）

将其他行附加到调用者的末尾，返回一个新对象。other为要追加的数据。

c = b.append(a,sort=True)	
print(b)
print('------合并后产生的新数据------')
print(c)

输出：

    B   C   D   E
a   1   2   3   4
b   6   7   8   9
c  11  12  13  14
d  16  17  18  19
e  21  22  23  24
f  26  27  28  29
------合并后产生的新数据------
      A   B   C   D   E
a   NaN   1   2   3   4
b   NaN   6   7   8   9
c   NaN  11  12  13  14
d   NaN  16  17  18  19
e   NaN  21  22  23  24
f   NaN  26  27  28  29
b   5.0   6   7   8   9
c  10.0  11  12  13  14
d  15.0  16  17  18  19
e  20.0  21  22  23  24
f  25.0  26  27  28  29

使用reset_index方法还原索引，让索引变为数据中的一列

DataFrame.reset_index（level = None，drop = False，inplace = False，col_level = 0，col_fill ='' ）

重置索引：level默认为None仅从索引中删除给定的级别，默认情况下删除所有级别。drop表示是否将索引添加至数据成为一列。

b.reset_index(inplace=True)# inplace为true时会修改原始数据，为False会产生新的数据

6.Pandas中缺失数据的操作

Pandas中缺少的数据默认使用NaN填充

df6 = pd.DataFrame(np.random.randn(5, 3), index=['a', 'c', 'e', 'f',
'h'],columns=['one', 'two', 'three'])
# 使用reindex方法设置新的索引，多出的索引对应的数据使用NaN填充
df6 = df6.reindex(['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h'])
print(df6)

输出：

      one       two     three
a -1.301964 -0.073759 -0.008598
b       NaN       NaN       NaN
c -0.410554 -0.226690  0.508727
d       NaN       NaN       NaN
e -0.420417  0.264073 -0.232839
f  0.273617  1.037572  0.623791
g       NaN       NaN       NaN
h -0.136863 -0.964579 -0.173560

检查是否存在缺失

df7 = pd.DataFrame(np.random.randn(5, 3), index=['a', 'c', 'e', 'f',
'h'],columns=['one', 'two', 'three'])
df7 = df7.reindex(['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h'])
# reindex方法可以重置索引，多余的索引会被填充NaN
print(df7['one'].isnull())	# isnull方法可以检查数据中是否有空值

输出：

a    False
b     True
c    False
d     True
e    False
f    False
g     True
h    False
Name: one, dtype: bool

缺失数据的计算

求和数据时，NaN将被视为0，如果数据全部是NaN，那么结果将是NaN。

df8 = pd.DataFrame(np.random.randn(5, 3), index=['a', 'c', 'e', 'f',
'h'],columns=['one', 'two', 'three'])
df8 = df8.reindex(['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h'])
print(df8)
print(df8['one'].sum())

输出：

       one       two     three
a  2.027398  0.056812  0.472538
b       NaN       NaN       NaN
c  1.569014 -0.449907  2.184448
d       NaN       NaN       NaN
e  0.178915 -0.259276 -0.350310
f -0.880906  0.132635  0.255886
g       NaN       NaN       NaN
h -0.313819  0.464704  1.117843
2.580602384482807

用标量替换NaN

DataFrame.fillna（value = None，method = None，axis = None，inplace = False，limit = None，downcast = None，** kwargs ）

使用指定的方法和数据填充NA / NaN值。Value表示填充数据，method表示填充方法（‘backfill’，‘bfill’，‘pad’，‘ffill’，None）

df9 = pd.DataFrame(np.random.randn(3, 3), index=['a', 'c', 'e'],columns=['one',
'two', 'three'])
df9 = df9.reindex(['a', 'b', 'c'])
print(df9)
print("NaN replaced with '0':")
print(df9.fillna(0))	# fillna方法可以使用指定数据来填充NaN

输出：

     one       two     three
a -2.171272 -1.143815 -2.022801
b       NaN       NaN       NaN
c  1.041079  0.523148  0.079901
NaN replaced with '0':
        one       two     three
a -2.171272 -1.143815 -2.022801
b  0.000000  0.000000  0.000000
c  1.041079  0.523148  0.079901

删除带有NaN的数据

DataFrame.dropna（axis = 0，how ='any'，thresh = None，subset = None，inplace = False ）

删除缺失值。How表示删除的方式（any：删除存在NA值的行或列；all：删除全部为NA的列或行）

df10 = pd.DataFrame(np.random.randn(5, 3), index=['a', 'c', 'e', 'f','h'],columns=['one', 'two', 'three'])
df10 = df10.reindex(['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h'])
print(df10)
print("---"*10)
print(df10.dropna())# 丢弃全部值为NaN的行，可以设置参数how=all来删除所有存在NaN值的行

输出：

       one       two     three
a  0.314272  0.359712 -0.384114
b       NaN       NaN       NaN
c  1.105737  1.290604  2.356330
d       NaN       NaN       NaN
e  0.995182  0.150164  1.460220
f  1.691751  2.155625  0.143025
g       NaN       NaN       NaN
h  1.859988 -1.575294  0.063176
------------------------------
        one       two     three
a  0.314272  0.359712 -0.384114
c  1.105737  1.290604  2.356330
e  0.995182  0.150164  1.460220
f  1.691751  2.155625  0.143025
h  1.859988 -1.575294  0.063176

三、总结

系统性地介绍了

1、python科学计算的第三方库NumPy的相关操作。其中包含numpy的导入，numpy中的数据类型，以及numpy中一些简单运算函数的使用等知识。

2、python第三方库Pandas一些基本命令，它提供了诸多的数据处理方法和时间序列的操作方法，也是提供高性能易用数据类型和分析工具。在实验中介绍了DataFrame，Series两种数据结构的常用操作以及关于缺失值的处理。为后期机器学习打基础。

python内置函数 V 棠越精进 python python 开发语言
python内置函数VPython解释器内置了很多函数和类型，任何时候都能使用。V名称描述vars返回当前局部符号表的字典。vars()vars(object)返回模块、类、实例或任何其它具有__dict__属性的对象的__dict__属性。模块和实例这样的对象具有可更新的__dict__属性；但是，其它对象的__dict__属性可能会设为限制写入（例如，类会使用types.MappingProx
Python--struct模块 aspenstars python 结构 struct python 数据
当Python处理二进制数据时（存取文件、socket操作）可以使用python的struct模块来完成.struct类似于C语言中的结构体.struct模块中最重要的三个函数是pack(),unpack(),calcsize()pack(fmt,v1,v2,...)按照给定的格式(fmt)，把数据封装成字符串(实际上是类似于c结构体的字节流)unpack(fmt,string)按照给定的格式(f
2025 年最值得收听的 AI 播客推荐！助你轻松掌握人工智能前沿动态！真智AI 人工智能开发语言机器学习
如今，几乎每个人都被告知需要提升技能，而当前许多组织最看重的技能之一就是人工智能（AI）。学习AI相关技能通常涉及数学、统计学和机器学习，但除此之外，你还需要了解行业趋势、业内人士的观点以及各大公司的动态。然而，学习并不意味着时刻都要埋头苦读！有时候，你需要给大脑一个喘息的机会，同时依然能获取有价值的信息。而收听AI相关的播客，就是一个轻松高效的方式。以下是2025年你必须关注的AI播客！1.Th
2025.3.14python-基础语法总结（容器） De_Yh python 开发语言
一、列表（List）文档描述：可变序列，支持增删改查元素可以是任意类型支持索引、切片、拼接、重复等操作核心操作：python#创建与修改L=[1,2,3]L.append(4)#尾部添加L.insert(1,"a")#插入元素L.extend([5,6])#合并列表L[0]="changed"#直接修改delL[1]#删除元素文档强调特性：有序（依赖索引访问）支持重复元素内存连续存储（适合高频修改
人工智能概念 zhangpeng455547940 计算机人工智能
机器学习、深度学习、大模型机器学习提供框架，使得系统可以从数据中学习算法：线性回归、逻辑回归、支持向量机、决策树、随机森林、K近邻算法深度学习是实现这一目标的工具，模仿人脑，使用多层神经网络进行学习算法：多层感知器、卷积神经网络、循环神经网络、长短期记忆网络大模型指参数量巨大的深度学习模型人工智能应用：自然语言处理、图像识别与生成、语音识别、政务与企业服务...
python脚本使用Bash指令的一种方式 xz1308579340 python
print(name)print(read_content(name))infos.append(read_content(name))xml=os.path.join(dir,name)new_xml=new_dir+'/'+str(count)+'.xml'img=xml.replace('xml','png')new_img=new_dir+'/'+str(count)+'.png'wd='
HMML——3D AI Coding的基础语言 AIGC5D-Longan 人工智能
编程语言（如Python、Java、C++等），作为2D编程的语言，也是AI开发的主力工具。2D编程语言内容呈现和交互，与3D世界、物理世界的高维复杂性之间的割裂日益凸显。HMML（超多元空间标记语言HyperMultspaceMarkupLanguage），是新的3D编程语言，也是3DAICoding的基础语言。3DAICoding的诞生，标志编程语言首次实现与人类多维认知的深度对齐。通过HMM
机器学习(二) 本文(2.5万字) | KNN算法原理及Python复现 | 小酒馆燃着灯机器学习算法 k近邻算法
文章目录一KNN算法原理二KNN三要素三机器学习中标准化四KNN分类预测规则五KNN回归预测规则六KNN算法实现方式七KDTree7.1构造KDtree7.2KDtree查找最近邻八KNN特点九KNN算法实现案例一案例二1.机器学习2.深度学习与目标检测3.YOLOv54.YOLOv5改进5.YOLOv8及其改进6.Python与PyTorch7.工具8.小知识点9.杂记一KNN算法原理K近邻分类
python执行bash命令 weixin_44594953 python Python os.system bash命令脚本执行参数传递
1、执行bash命令importosos.system('ls-al')2、执行bash脚本os.system('sh./test.sh')3、脚本中带参数arg1='111'arg2='222'os.system('sh./test.sh'+arg1+''+arg2)//参数前后要有空格
python脚本内运行bash命令房默笙 python
可以这样操作：在os的模块中有这样的一个函数：os.system()将命令打在引号中就可了。。。nice…!!!
python bash_如何python脚本中运行bash命令？ weixin_39655049 python bash
InabashscriptIamtryingtorunpythonandbashcommandboth.InsomewhereIwanttoexecutesomebashcommandinsideapythonloop.#!/bin/bashpython<
如何测试是否正确安装了自定义的Exepthook？潮易 python 开发语言
如何测试是否正确安装了自定义的Exepthook？在Python中，我们可以通过设置一个自定义的`sys.excepthook`来处理程序中的异常。这个钩子会在程序发生未捕获异常时被调用，我们可以在这个钩子中打印出错误信息或者发送错误报告给开发者等。要测试是否正确安装了自定义的Exepthook，我们可以编写一个简单的Python脚本，在脚本中使用`sys.excepthook`来捕获和处理一个异
存储和访问节点属性 python networkx 潮易 python 开发语言
存储和访问节点属性pythonnetworkx在Python中，我们可以使用NetworkX库来创建和管理图数据结构。在NetworkX中，节点可以有属性，例如标签、颜色或价值等。以下是如何存储和访问节点的属性的步骤：1.首先，我们需要导入NetworkX库并创建一个图形对象。然后，我们可以给节点添加属性。```pythonimportnetworkxasnx#创建一个图形对象G=nx.Graph
SQLMesh 系列教程：解锁SQLMesh的宏与变量魔法梦想画家 #python 数据分析工程 sqlmesh 数据工程分析工程
在数据库流水线开发中，代码复用与动态配置是提升效率的核心诉求。SQLMesh以其独特的宏系统与用户定义变量机制，重新定义了SQL生成的灵活性。与传统模板引擎不同，SQLMesh的宏并非简单的字符串替换，而是基于语义理解的智能代码重构——通过sqlglot库解析SQL结构，结合Python逻辑处理能力，让用户能够以声明式语法实现复杂查询的动态组装。引言无论是全局配置、网关级参数还是模型内局部变量，S
Python学习日志3-复合类型可惜还不下雨学习
python支持多种复合类型，可以将不同的值组合在一起一、列表列表（list）是用方括号标注、逗号隔开的一组值，可以包含不同类型的元素（但最好不要这么做），列表有以下特点：列表内的顺序有先后顺序列表的值可变1.创建列表列表有两种创建方式，一是直接用方括号把表达式括起来，而是用构造函数list()表达式list1=[]#创建了一个空列表list2=["a","b","c"]#创建了一个字符串列表li
（十一）人工智能 - Python 教程 - Python元组星星学霸人工智能 -Python系列教程 python 搜索引擎开发语言
更多系列教程，每天更新更多教程关注：xxxueba.com星星学霸1元组（Tuple）元组是有序且不可更改的集合。在Python中，元组是用圆括号编写的。实例创建元组：thistuple=("apple","banana","cherry")print(thistuple)("apple","banana","cherry")2访问元组元素可以通过引用方括号内的索引号来访问元组元素：实例打印元组中
院士领衔、IEEE Fellow 坐镇，清华、上交大、复旦、同济等专家齐聚 2025 全球机器学习技术大会 CSDN资讯机器学习人工智能
随着Manus出圈，OpenManus、OWL迅速开源，OpenAI推出智能体开发工具，全球AI生态正经历新一轮智能体革命。大模型如何协同学习？大模型如何自我进化？新型强化学习技术如何赋能智能体？围绕这些关键问题，由CSDN&Boolan联合举办的「2025全球机器学习技术大会」将于4月18-19日在上海隆重举行。大会云集院士、10所高校科研工作者、近30家一线科技企业技术实战专家组成的超50位重
0基础学Python第八天 RUIOU_ python 机器学习 0基础开发语言
1.程序报错：程序在哪一行报错之后，后面的程序都不会被执行。（1）异常类型：IndexError——索引错误，ZeroDivisionError——除零错误FileNotFoundError——找不到文件错误，TypeError——类型错误等2.捕捉异常：格式——try，except语句：try:可能会产生报错的代码except你想捕捉错误的名字（异常类型）：错误发生后你想相应执行的操作excep
神经网络中常用语言特性（python）（待完善）邪恶的贝利亚 python 开发语言
1.元类在Python中，abc模块（AbstractBaseClasses，抽象基类）提供了创建抽象基类的机制，这些抽象基类可以用来定义接口，强制子类实现特定的方法，有助于实现多态性和代码的可维护性。下面从多个方面详细介绍abc元类相关内容。ABCMeta是abc模块中的元类，ABC类实际上就是使用ABCMeta作为元类创建的。你也可以直接使用ABCMeta来创建抽象基类。classShape(
2025年渗透测试面试题总结-安恒（题目+回答）独行soc 2025年渗透测试面试指南面试职场和发展安全 web安全红蓝攻防
网络安全领域各种资源，学习文档，以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具，欢迎关注。目录安恒1.sqlmap爆出当前数据库库名的参数是什么？2.nmap探测系统类型的参数是？3.nmap的小写-o和-A是做啥的？4.布尔盲注的具体语句是啥？5.宽字节原理6.Python是否存在反序列化漏洞？7.GET与POST传参的区别8.HTTP请求方式9.如何判断C
再添殊荣！移远通信工业智能品牌宝维塔™斩获AI创新应用奖移远通信算力人工智能工业智能
12月24日，2024中国物联网产业大会暨第21届慧聪品牌盛会在深圳圆满落幕。会上，移远通信凭借其工业智能品牌宝维塔™在推动AI技术落地与应用创新方面的卓越贡献，获颁“AI创新应用奖”。作为科技发展的前沿力量，AI技术正深刻改变着各行各业的生产模式和效率，尤其在工业领域，展现出了巨大潜力。宝维塔™是移远通信精心打造的工业智能品牌，专注于将人工智能、边缘计算、机器视觉、深度学习、软件算法平台等前沿技
【vLLM 学习】使用 TPU 安装 HyperAI超神经 vLLM 学习人工智能 vLLM 深度学习 TPU 机器学习教程
vLLM是一款专为大语言模型推理加速而设计的框架，实现了KV缓存内存几乎零浪费，解决了内存管理瓶颈问题。更多vLLM中文文档及教程可访问→https://vllm.hyper.ai/vLLM使用PyTorchXLA支持GoogleCloudTPU。依赖环境GoogleCloudTPUVM（单主机和多主机）TPU版本:v5e、v5p、v4Python:3.10安装选项：href=“https://v
「机器人」扑翼飞行器通过总气动力控制四自由度运动方法 Robot_Starscream 「机器人学」机器人人工智能算法
一、前言在扑翼飞行中，总气动力（TotalAerodynamicForce）是指扑翼在运动过程中受到的所有空气动力作用的合力。它是由以下两种主要力的合成结果：1.升力（Lift,）：垂直于空气流方向的力，用于支持飞行器（或生物）的重量。2.阻力（Drag,）：平行于空气流方向的力，用于抵抗前进的运动。二、总气动力的物理意义总气动力F_{uk}的物理意义在于描述了扑翼在不同运动状态下所受到的气动力合
python笔记：进程和线程—分布式进程 zyckhuntoria python foundation
一、分布式进程Process可以分布到多台机器上，而Thread最多只能分布到同一台机器的多个CPU上。Python的multiprocessing模块不但支持多进程，其中managers子模块还支持把多进程分布到多台机器上。一个服务进程可以作为调度者，将任务分布到其他多个进程中，依靠网络通信。由于managers模块封装很好，不必了解网络通信的细节，就可以很容易地编写分布式多进程程序。二、举例实
手写机器学习算法系列——K-Means聚类算法(一) 木有鱼丸223 手写机器学习算法系列机器学习算法聚类
代码仓库(数字空间项目，GN可上)不想看的话，我也将代码上传到本博客中。1.聚类算法简介在数据科学和机器学习领域，聚类(Clustering)算法是一种无监督学习方法，它将相似的对象分到同一个组，而不同的对象则被分到不同的组。这种算法的主要目标是根据数据的特征进行分组，以此找出数据的内在结构。聚类算法的一个核心特点就是它并不需要预先知道数据的类别，而是通过算法自动进行分组。在实际应用中，我们常见的
Websoft9：为开发者打造的高效 Linux 服务器面板 linuxlinux运维运维
Websoft9作为一款以开源应用部署与管理为核心的服务器面板，其平台设计与运行环境深度耦合，形成了“环境即服务”的独特模式。这种关系体现在环境标准化、自动化配置、安全融合及资源管理等多个维度。以下从四个核心层面详细阐述二者的协同机制：一、运行环境标准化：平台能力的基石Websoft9的运行环境并非孤立存在，而是平台功能实现的底层支撑。多语言与框架的预集成•平台内置PHP、Python、Java、
python进程和线程之间通信_python进程和线程通信 weixin_39718890 python进程和线程之间通信
1，线程(Thread)使用多线程可以有效的利用CPU资源(Python例外)。然而多线程所带来的程序的复杂度也不可避免，尤其是对竞争资源的同步问题。然而在python中由于使用了全局解释锁(GIL)的原因，代码并不能同时在多核上并发的运行，也就是说，Python的多线程不能并发，使用多线程来改进自己的Python代码后，程序的运行效率却下降了。实际上使用多线程的编程模型是很困难的，程序员很容易犯
python进程与线程_python进程和线程 weixin_39543758 python进程与线程
python进程和线程概念GIL:全局解释锁，解决了不同线程同时访问统一资源时，数据保护问题。python虽然是多线程，但是因为GIL,实际上是是单线程，由CPU轮询，假线程。(一个线程运行一段时间后会释放GIL,另一个线程获取GIL便会执行，然后再释放)进程：是具有一定独立功能的程序关于某个数据集合上的一次运行活动。进程是系统进行资源分配和调度的一个独立单位。(进程间通信方式：套接字，信号，管道
python任务调度平台界面_分布式任务调度平台XXL-JOB weixin_39572764 python任务调度平台界面
以前带我的人说过，最好的学习就是看官方文档，个人也有4个T的学习视频，但是会发现讲的都是入门，有的也比较浅。官方文档比较官方，也比较权威，打开xxl-job的官网，写的贼详细，有些人喜欢收博客，不喜欢看官网，因此就直接复制过来了，过段时间会参考文档，自己来一遍。一、简介1.1概述XXL-JOB是一个分布式任务调度平台，其核心设计目标是开发迅速、学习简单、轻量级、易扩展。现已开放源代码并接入多家公司
用Python开发一个简单的“记忆翻牌”小游戏风亦辰739 Python小游戏 python pygame 开发语言
“记忆翻牌”是一款经典的益智小游戏，玩家需要通过记忆卡片的位置配对相同的图案。今天我们将使用pygame库实现一个简单版本的记忆翻牌游戏。一、游戏规则游戏开始时，卡片会随机排列并翻面。玩家一次可以翻两张卡片：如果图案相同，卡片保持翻开状态。如果图案不同，卡片会短暂显示后翻回去。游戏目标是用最少的步数找到所有配对。二、开发环境开发工具：任意Python编辑器（如PyCharm、VSCode）。依赖库
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。

机器学习技术（二）——Python科学运算模块（Numpy、Pandas）

机器学习技术（二）——Python科学运算模块（Numpy、Pandas）

文章目录

一、Numpy

1、介绍、安装与导入

2、Numpy常用操作

二、Pandas

1.导入相关依赖库

2.创建Series

3.创建DataFrame

4.查看DataFrame中的数据

5.DataFrame数据的操作

6.Pandas中缺失数据的操作

三、总结

你可能感兴趣的:(机器学习技术,机器学习,python,numpy,pandas)