Schanappi

【学习笔记】《深入浅出Pandas》第5章：Pandas高级操作

文章目录

5.1 复杂查询
- 5.1.1 逻辑运算
- 5.1.2 逻辑筛选数据
- 5.1.3 函数筛选
- 5.1.4 比较函数
- 5.1.5 查询df.query()
- 5.1.6 筛选df.filter()
- 5.1.7 按数据类型查询
5.2 数据类型转换
- 5.2.1 推断类型
- 5.2.2 指定类型
- 5.2.3 类型转换astype()
- 5.2.4 转为时间类型
5.3 数据排序
- 5.3.1 索引排序
- 5.3.2 数值排序
- 5.3.3 混合排序
- 5.3.4 按值大小排序
5.4 添加修改
- 5.4.1 修改数值
- 5.4.2 替换数据
- 5.4.3 填充空值
- 5.4.4 修改索引名
- 5.4.5 增加列
- 5.4.6 插入列df.insert()
- 5.4.7 指定列df.assign()
- 5.4.8 执行表达式df.eval()
- 5.4.9 增加行
- 5.4.10 追加合并
- 5.4.11 删除
- 5.4.12 删除空值
5.5 高级过滤
- 5.5.1 df.where()
- 5.5.5 np.where()
- 5.5.3 df.mask()
- 5.5.4 df.lookup()
- 5.5.5 小结
5.6 数据迭代
- 5.6.1 迭代Series
- 5.6.2 df.iterrows()
- 5.6.3 df.itertuples()
- 5.6.4 df.items()
- 5.6.5 按列迭代
- 5.6.6 小结
5.7 函数应用
- 5.7.1 pipe()
- 5.7.2 apply()
- 5.7.3 applymap()
- 5.7.4 map()
- 5.7.5 agg（）
- 5.7.6 transform()
- 5.7.7 copy()
5.7.8 小结
5.8本章小结

5.1 复杂查询

5.1.1 逻辑运算

（1）对DataFrame其中一列进行逻辑计算，会产生一个对应的由布尔值组成的Series，真假值由此位上的数据是否满足逻辑表达式决定。
（2）针对索引的逻辑表达式会产生一个array类型数组，该数组由布尔值组成：

df.index == 1
# 只有索引为1的值为True，其余均为False

（3）除了逻辑运算，还支持组合条件的Python位运算。

5.1.2 逻辑筛选数据

（1）切片、.loc和.iloc均支持逻辑表达式。
（2）逻辑表达式输出的结果必须是一个布尔序列或者符合其格式要求的数据形式。
（3）进行或（|）、与（&）、非（~）运算时，各个独立逻辑表达式需要用括号。
（4）any和all对逻辑运算后的布尔序列再进行判断，序列中所有值都是True时all才返回True，序列中只要有一个值为True时any就返回True。还可以传入参数axis，用于指定判断的方向，默认0为列方向，1为行方向。

5.1.3 函数筛选

在表达式处使用lambda函数，默认变量是操作的对象。如果操作对象是DataFrame，那么变量就是DataFrame；如果是Series，那么变量就是Series。

5.1.4 比较函数

df.eq() # 等于
df.ne() # 不等于
df.le() # 小于等于
df.lt() # 小于
df.ge() # 大于等于
df.gt() # 大于

isin() 
# 判断数据是否包含指定内容
# 可以传入一个列表，原数据只需要满足其中一个存在即可
# 也可以传入一个字典，键为列名，值为需要匹配的值

5.1.5 查询df.query()

df.query(expr)使用布尔表达式查询DataFrame列，表达式是一个字符串，类似SQL的where从句。

还支持使用@符引入变量：

a = df.Q1.mean()
df.query('Q1 > @a+40')

df.eval()与df.query()类似，也可以用于表达式筛选。

5.1.6 筛选df.filter()

df.filter()可以对行名和列名进行筛选，支持模糊匹配、正则表达式。

df.filter(items=['Q1', 'Q2']) # 选择两列
df.filter(regex='Q', axis=1) # 列名包含Q的列
df.filter(regex='e$', axis=1) # 以e结尾的列
df.filter(like='2', axis=0) # 索引中有2的
df.filter(regex='^2', axis=0).filter(like='Q', axis=1)

5.1.7 按数据类型查询

df.select_dtypes(include=None, exclude=None)
# 指定包含和不包含的数据类型
# 如果只有一个类型，传入字符
# 如果有多个类型，传入列表
# 如果没有满足条件的数据，会返回一个仅有索引的DataFrame

5.2 数据类型转换

# 对所有字段指定统一类型
df = pd.DataFrame(data, dtype='float32')
# 对每个字段分别指定
df = pd.read_excel(data, dtype={'team': 'string', 'Q1':'int32'})

5.2.1 推断类型

df.infer_objects() # 返回一个按推断修改后的DataFrame
df.infer_objects().dtypes # 返回每列的数据类型

# 更推荐，支持string类型
df.convert_dtypes() # 同上
df.convert_dtypes().dtypes

5.2.2 指定类型

pd.to_XXX系统方法可以将数据安全转换，error参数可以实现无法转换则转换为兜底类型：

pd.to_datetime(m) # 转为时间
pd.to_datetime(m, errors='coerce') # 错误处理
pd.to_datetime(m, errors='ignore') # 错误处理
pd.to_datetime(m, errors='coerce').fillna(0) # 兜底填充
pf.to_datetime(df[['year', 'month', 'day']]) # 组合成日期

转换为数字类型时，默认返回的dtype是float64还是int取决于提供的数据。使用downcast参数获得向下转换后的其他类型：

m = ['1', 2, 3]
pd.to_numeric(m, downcast='integer') # 至少为有符号int数据类型
# array([1, 2, 3], dtype=int8)

5.2.3 类型转换astype()

df.astype('int32') # 所有数据类型转换
df.astype({'col1': 'int32'}) # 指定字段转为指定类型
df['name'].astype('object')

# 当数据格式不具备转换为目标类型的条件时，需要先处理数据
# eg： "89.3%" -> 浮点数
data.rate.apply(lambda x: x.replace('%', '')).astype('float')/1000

5.2.4 转为时间类型

pd.to_datetime()
s.astype('datetime64[ns]')

5.3 数据排序

5.3.1 索引排序

# 按索引排序，默认升序，降序：ascending=False
df.sort_index(ascending=True)

# 按列索引名排序（在列索引方向上排序）
df.sort_index(axis=1, ascending=False)

s.sort_index(inplace=True) # 排序后生效，改变原数据
# 索引重新0-（n-1）排，可以得到排序号
s.sort_index(ignore_index=True) 
# 空值在前，'last'表示空值在后
s.sort_index(na_position='first') 
# 如果多层，排一级
s.sort_index(level=1)
# 这层不排序
s.sort_index(level=1, sort_remaining=False)
# 行索引排序，表头排序
df.sort_index(axis=1) # 会把这列按照列名顺序排列

df.reindex() # 指定自己定义顺序的索引，实现行和列的顺序重新定义

5.3.2 数值排序

sort_values() # 数字按大小顺序，字符按字母顺序
# Series和DataFrame都支持
# DataFrame需要传入一个或多个排序的列名
# 默认排序是升序，但是可以指定排序方式
df.sort_values(by=['team', 'name'], ascending=[True, False])

# df按指定字段排序
df.sort_values(by=['team'])
df.sort_values('team')

# 索引重新0-（n-1）排
df.sort_values('team', ignore_index=True)

5.3.3 混合排序

有时候需要用索引和数据值混合排序。

# eg: 先按索引name排名，再按team排名
df.set_index('name', inplace=True)
df.index_names = ['s_name']
df.sort_values(by=['s_name', 'team'])

# 方法二 效果同上，注意顺序
df.set_index('name').sort_values('team').sort_index()

df.reindex() # 给定新的索引方式排名
# eg 
df.name.sort_values().index # 按姓名排序后取出排名的索引列表
df.reindex(df.name.sort_values().index) # 将新的索引应用到数据中

5.3.4 按值大小排序

# 实现数字列的排序，并可指定返回个数
df.nsmallest()
df.nlargest()

5.4 添加修改

5.4.1 修改数值

df.iloc[0, 0] = 'Lily' # 修改值
df[df.Q1 < 60] = 60
# 除了修改内容，还可以传入同样形状的数据来修改

# 对于DataFrame，会按对应的索引位进行修改

5.4.2 替换数据

replace(old, new) # 实现数据的批量替换
# 值可以是数字，也可以是列表、字典..

# 参数method='pad'/'ffill'/'bfill'/None

# 使用正则表达式
df.replace(to_replace=r'^ba.$', value='new', regex=True)

5.4.3 填充空值

df.fillna(0) # 将空值全部修改为0
# {'backfill', 'bfill', 'pad', 'ffill', None} 默认为None
df.fillna(method='ffill') # 将空值都修改为其前一个值
df.fillna(value=values, limit=1) # 只替换第一个

5.4.4 修改索引名

方法：将df.index和df.columns重新赋值为一个类似列表的序列值，这会将其覆盖为指定序列中的名称。
使用df.rename和df.rename_axis对轴名称进行修改。

df.rename(columns={'team': 'class'}) # 修改表头
df.rename(index={0: "x"}) # 修改索引

df.rename(index=str) # 修改类型
df.rename(str.lower, axis='columns') # 传索引类型

# 对索引名进行修改
s.rename_axis("animal")
df.rename_axis("animal") # 默认是列索引
df.rename_axis("limbs", axis="columns") # 指定行索引
# 索引为多层索引时可以将type修改为class
df.rename_axis(index={'type': 'class'})

# 可以用set_axis进行设置修改
s.set_axis(['a', 'b', 'c'], axis=0)
df.set_axis(['i', 'ii'], axis='columns', inplace=True)

5.4.5 增加列

新列可以是一个定值，所有行都是该值，也可以是一个同等长度的序列数据，各行有不同的值。

df['total'] = df.sum(1) # 增加总成绩列
df['foo'] = 100 # 增加一列值全为100的列

5.4.6 插入列df.insert()

df.insert(loc, column, value)
# loc是一个数字，代表新列所在的位置，使用数字索引
# column为新的列名
# value为列的值，一般是Series

df.insert(2, 'total', df.sum(1))

# 如果已经存在相同的数据列会报错
# 可以传入allow_duplicates=True插入同名列
# 如果希望新列位于最后，可以在loc传入len(df.columns)

5.4.7 指定列df.assign()

df.assign(k=v)
# k为新列的列名，v为此列的值
# v必须是一个与原数据同索引的Series
# 该方法不用赋值也可以创建一个临时的列（不会影响原数据）

# 链式方法
df.assign(total=df.sum(1)) # 总成绩
.assign(Q=100) # 满分100
.assign(avg=df.mean(1)) # 平均值
.assign(avg2=lambda d: d.total/4)
# avg2：
# 由于实际上df并没有total这一列，如果需要使用total
# 就需要调用lambda, 变量d是代码执行到本行前的DataFrame内容
# 可以认为是一个虚拟的DataFrame实体

5.4.8 执行表达式df.eval()

df.eval()
# 功能同df.query()
# 以字符的形式传入表达式，增加列数据
# @可引入变量

# eg
df.eval('total=Q1+Q2+Q3+Q4')

5.4.9 增加行

df.loc[]
# 指定索引给出所有列的值来增加一行数据
# 无数据列值为NaN

5.4.10 追加合并

pd.append()	# 追加一个新行

pd.concat([s1, s2])	# 连接两个s或者df
pd.concat([s1, s2], ignore_index=True) # 索引重新编
pd.concat([s1, s2], keys=['s1', 's2'], names=['Series name', 'row ID'])
# 原数索引不变，增加一个一层索引（keys的内容），变成多层索引

# df同理
pd.concat([df1, df2])
pd.concat([df1, df3], sort=False)
pd.concat([df1, df3], join="inner") # 连接相同列
pd.concat([df1, df4], axis=1) # 连接列

5.4.11 删除

# 方法一： pop()
s.pop() # 删除指定索引的数据同时返回这个被删除的值
df.pop() # 删除指定列并返回这个被删除的列

# 方法二：反选法
# 将需要的数据筛选出来赋值给原变量，实现删除

5.4.12 删除空值

df.dropna() # 一行中有一个缺失值就删除
df.dropna(axis='columns') # 只保留全有值的列
df.dropna(how='all') # 行和列全没值才删除
df.dropna(thresh=2) # 至少有两个空值才删除
df.dropna(inplace=True) # 删除并替换生效

5.5 高级过滤

5.5.1 df.where()

df.where()
# 可以传入布尔表达式、布尔值的Series/DataFrame、序列或者可调用的对象
# 然后与原数据相比
# 返回一个行索引与列索引与原数据相同的数据
# 在满足条件的位置上保留原值，在不满足条件的位置填充NaN

df.where(lambda d: d.Q1>50) # 传入可调用对象
df.Q1.where(pd.Series([True]*3)) # 传入布尔值Series 前三个为真，其余为NaN
df.where(df>=60, '不合格') # 可以指定值或者算法来替换NaN

# NaN -> 算法
c = df%2 == 0 # 定义一个数是否为偶数的表达式
df.where(~c, -(df-20)) # 传入c, 为偶数的时候显示原值减去20的相反数

5.5.5 np.where()

# np.where()可以弥补df.where()的不足
# np.where()能够对满足条件的值进行替换
# 返回一个二维array
np.where(df>=60, '合格', '不合格')

# 让df.where()的条件为假，从而应用np.where()的计算结果
df.where(df==999999, np.where(df>=60, '合格', '不合格'))

5.5.3 df.mask()

# df.mask()的功能和df.where()基本相同
# 唯一区别是df.mask()将满足条件的位置填充为NaN
# 同样可以指定值进行填充

# df.mask()和df.where()还可以通过数据筛选返回布尔序列
(df.where((df.team=='A') & (df.Q1>60)) == df).Q1 # 返回布尔序列，符合条件的行值为True 
(df.mask((df.team=='A') & (df.Q1>60)) == df).Q1 # 返回布尔序列，符合条件的行值为False

5.5.4 df.lookup()

df.lookup(行标签, 列标签)
# 返回一个numpy.ndarray 标签必须是一个序列
# 行列相同数量

5.5.5 小结

本节介绍了数据过滤函数。
df.where()和df.mask()都可以按条件筛选数据，df.where()将不满足条件的值替换成NaN，df.mask()将满足条件的值替换成NaN。np.where()在满足和不满足条件的情况下都可以指定填充值。

5.6 数据迭代

Pandas的迭代操作可以将数据按行或者列遍历。

5.6.1 迭代Series

Series本身是一个可迭代的对象，Series df.name.values()返回array结构，数据可用于迭代，不过可直接对Series使用for语句来遍历。
迭代索引和指定的多列，使用Python内置的zip函数将其打包为可迭代的zip对象：

for i, n, q in zip(df.index, df.name, df.Q1):
	print(i, n, q)

5.6.2 df.iterrows()

（1）df.iterrows()生成一个可迭代对象，将DataFrame行作为（索引，行数据）组成的Series数据对进行迭代。
（2）在for语句中需要两个变量来承接数据：一个为索引变量，即使索引在迭代中不会使用（这种情况可以用useless作为变量名）；另一个为数据变量，读取具体列时，可以使用字典的方法和对象属性的方法。

# 迭代，使用name、Q1数据
for index, row in df.iterrows():
	print(index, row['name'], row.Q1)

5.6.3 df.itertuples()

df.itertuples()
# 生成一个namedtuples类型数据，name默认名为Pandas，可以在参数中指定

# 不包含索引数据
for row in df.itertuples(index=False):
	print(row)
# Pandas(name='Liver', team='E', Q1=89, Q2=21, Q3=24, Q4=64)

# 自定义name
for row in df.itertuples(index=False, name='Gairuo'): # namedtuples
	print(row)
# Gairuo(name='Liver', team='E', Q1=89, Q2=21, Q3=24, Q4=64)

# 使用数据
for row in df.itertuples():
	print(row.Index, row.name)

5.6.4 df.items()

# df.items()和df.iteritems()功能相同
# 迭代时返回一个（列名，本列的Series结构数据），实现对列的迭代：
for label, ser in df.items(): # label:表头
	print(label)
	print(ser[:3], end='\n\n')
'''
name
0    Liver
1     Arry
2      Ack
Name: name, dtype: object

team
0    E
1    C
2    A
Name: team, dtype: object

Q1
0    89
1    36
2    57
Name: Q1, dtype: int64

Q2
0    21
1    37
2    60
Name: Q2, dtype: int64

Q3
0    24
1    37
2    18
Name: Q3, dtype: int64

Q4
0    64
1    57
2    84
Name: Q4, dtype: int64
'''

5.6.5 按列迭代

除了df.items()，如需要迭代一个DataFrame的列，可以直接对DataFrame迭代，会循环得到列名：

# 再利用df[列名]的方法迭代列：

# 依次取出每个列
for column in df:
	print(df[column])

# 可对每个列的内容进行迭代
for column in df:
    for i in df[column]:
        print(i) 

# 可以迭代指定列
for i in df.name:
	print(i)

# 只迭代想要的列
l = ['name', 'Q1']
cols = df.columns.intersection(l)
for col in cols:
	print(col)

5.6.6 小结

本节介绍了Pandas各个维度的数据迭代方法，DataFrame和Series本身就是可迭代对象，以上专门的迭代函数为我们提供了十分方便的迭代功能。
与df.iterrows()相比，df.itertuples()运行速度会更快一些，推荐在数据量庞大的情况下优先使用。
迭代的优势是可以把大量重复的事务按规定的逻辑依次处理，处理逻辑部分的也能随心所欲地去发挥，同时它简单清晰。

5.7 函数应用

pipe() # 应用在整个DataFrame或Series上
apply() # 应用在整个DataFrame的行或列中，默认为列
applymap() # 应用在DataFrame的每个元素中
map() # 应用在Series或DataFrame的一列的每个元素中

5.7.1 pipe()

df.pipe(<函数名>, <传给函数的参数列表或字典>)
# pipe管道方法，可以让分析过程标准化、流水线化，达到复用目标
# DataFrame和Series都支持pipe()
# DataFrame和Series作为函数的第一个参数，可以根据需求返回自己定义的任意类型数据

# pipe()可以将复杂的调用简化
# eg:对df多重应用多个函数
f(g(h(df), arg1=a), arg2=b, arg3=c)
# 将它们用pipe连接起来
(df.pipe(h)
   .pipe(g, arg1=a)
   .pipe(f, arg2=b, arg3=c))
# 以下是将'arg2'参数传给函数f，然后作为函数整体接受后面的参数
(df.pipe(h)
   .pipe(g, arg1=a)
   .pipe((f, 'arg2'), arg1=a, arg3=c)

5.7.2 apply()

apply()可以对DataFrame按行和列进行函数处理，也支持Series
如果是Series，逐个传入具体值
如果是DataFrame，逐行或逐列传入

#eg
# 将name全部变为小写
df.name.apply(lambda x: x.lower())

# 去掉一个最高分和一个最低分再算出平均分
def my_mean(s):
	max_min_ser = pd.Series([-s.max(),  -s.min()])
	return s.append(max_min_ser).sum() / (s.count()-2)
# 对数字列应用函数
df.select_dtypes(include='number').apply(my_mean)

# apply()可以应用的函数类型如下
df.apply(fun) # 自定义
df.apply(max) # Python内置函数
df.apply(lambda x: x*2) # lambda
df.apply(np.mean) # Numpy等其他库函数
df.apply(pd.Series.first_valid_index) # Pandas自带的函数

5.7.3 applymap()

applymap()实现元素级函数应用，可以对DataFrame的所有元素（不包含索引）应用函数处理

# 使用lambda时，变量指的是每一个具体的值
def mylen(x):
	return len(str(x))
df.applymap(lambda x:mylen(x))
df.applymap(mylen) # 效果同上

5.7.4 map()

map()根据输入对应关系映射值返回最终数据，用于Series对象或者DataFrame对象的一列
传入的值可以是一个字典，键为原数据值，值为替换后的值
可以传入一个函数（参数为Series的每个值），还可以传入字符格式化表达式来格式化数据内容

# eg: df.team.map({'A': '一班'}) # A -> 一班

5.7.5 agg（）

agg()一般用于使用指定轴上的一项或多项操作进行汇总，
可以传入一个函数或函数的字符
还可以用列表的形式传入多个函数

agg()还支持传入函数的位置参数和关键字参数
支持每个列分别用不同的方法聚合，支持指定轴的方向

5.7.6 transform()

DataFrame和Series自身调用函数并返回一个与自身长度相同的数据

分组后，直接使用计算函数并按分组显示合计数据。
使用transform()调用计算函数，返回的是原数据的结构，但在指定位置上显示聚合计算后的结果，这样方便了我们了解数据所在组的情况。

5.7.7 copy()

df.copy()返回一个新对象，与原对象没有关系
当deep=True时（默认），将创建一个新对象，其中包含调用对象的数据和索引的副本，
对副本数据或索引的修改不会反映在原始对象中；
当deep=False时，将创建一个新对象，不复制调用对象的数据或索引（仅复制对数据和索引的引用），
原始数据的任何更改都将对浅拷贝的副本进行同步更改

5.7.8 小结

本节介绍了一些实用的DataFrame和Series函数，熟练使用函数可以帮助我们抽象问题，复用解决方案，同时大大减少代码量。

5.8本章小结

本章介绍了Pandas的一些高级应用功能。我们可以利用本章介绍的高级筛选技巧对数据进行任意逻辑的查询；利用类型转换功能，将数据转换为方便使用的类型；对数据进行个性化排序，探索数据的变化规律；对数据进行增删修改操作，修正异常数据；以迭代形成编写复杂的数据处理逻辑；利用函数完成重复工作，让代码更高效。

你可能感兴趣的:(pandas,学习,python)

DeepSeek在智慧物流管控中的全场景落地方案猴的哥儿笔记大数据交通物流 python 数据仓库微服务
一、智慧物流核心痛点与DeepSeek解决方案矩阵物流环节行业痛点DeepSeek技术方案价值增益仓储管理库存预测误差率>30%多模态时空预测模型库存周转率↑40%运输调度车辆空驶率35%强化学习动态调度引擎运输成本↓25%路径规划突发路况响应延迟>30分钟实时路况语义理解+自适应规划准时交付率↑18%异常检测50%异常依赖人工发现多传感器融合的异常模式识别异常发现时效↑6倍客户服务50%咨询需人
自动化立体仓库设计步骤：7步 King's King 自动化运维
导语大家好，我是社长，老K。专注分享智能制造和智能仓储物流等内容。完整版文件和更多学习资料，请球友到知识星球【智能仓储物流技术研习社】自行下载这份文件是关于自动化立体仓库设计步骤的详细指南，其核心内容包括以下几个阶段：资料收集与研究：明确用户目标，收集包括工艺过程、物流要求、物料规格、现场条件、系统功能要求等原始资料。确定主要形式和参数：基于收集的资料，计算设计所需的关键参数，如库区出入库总量、货
人工智能技术篇*卷(三) code_stream #人工智能人工智能
接下来，我们在神经网络方面继续展开神经网络多层感知机（MLP）解决问题：多层感知机是一种基本的前馈神经网络，可用于解决分类和回归问题。它通过多个神经元层的非线性变换，能够学习复杂的非线性关系，对数据进行分类或预测连续值。例如，在手写数字识别中，它可以从数字图像的像素数据中学习到特征模式，从而判断该数字是0-9中的哪一个；在房价预测中，根据房屋的面积、房间数量等特征预测房价。案例：以手写数字识别为例
【Agent】OpenManus-Agent-实现具体的智能体非晓为骁 AI agent agi ai openManus Manus 架构
所有实例Agent都是继承ToolCallAgent，所以只列出额外的参数字段，继承的见ToolCallAgent1.Manus（通用Agent）概述Manus是一个多功能通用Agent，使用多种工具解决各种任务，提供了包括Python执行、网络浏览、文件操作和信息检索等功能。参数属性名默认值nameManusdescriptionAversatileagentthatcansolvevariou
Oracle SQL*Loader 与 SQLULDR2 学习指南瑞琪姐 oracle sql 数据库
1.SQL*Loader(sqlldr)1.1概述作用：Oracle官方工具，用于将外部数据文件（如CSV、文本文件）高效加载到数据库表中。特点：支持多种数据格式（定长、变长、CSV）。支持直接路径加载（DirectPathLoad），绕过SQL引擎，提升性能。提供错误记录和丢弃无效数据的功能。1.2核心组件控制文件(ControlFile)：定义数据加载规则，包括数据文件路径、目标表、字段映射等
006 python-if条件梅洪 python python 服务器开发语言
Pythonif条件教学设计一、教学目标了解if语句的基本结构和执行逻辑。掌握if-else和if-elif-else语句的使用方法。能够运用条件判断解决实际问题，如分数判断、用户登录等。理解if语句中的比较运算符和逻辑运算符的作用。二、教学重点if语句的基本语法if-else语句if-elif-else语句逻辑运算符and、or、not在if语句中的应用三、教学难点多重if-elif-else结
神经网络模型压缩&实例教程—非结构化剪枝程序先锋《python深度学习》笔记神经网络剪枝深度学习
目录1.导包&定义一个简单的网络2.获取网络需要剪枝的模块3.模块剪枝（核心）3.1随机剪枝weight3.2L1范数剪枝bias4.总结最先进的深度学习技术依赖于难以部署的过度参数化模型。相反，已知生物神经网络使用高效的稀疏连接。为了在不牺牲准确性的情况下减少内存、电池和硬件消耗，通过减少模型中的参数数量来确定压缩模型的最佳技术是很重要的。这反过来又允许您在设备上部署轻量级模型，并通过设备上的私
【python双目标定轮椅】基于python的双目标定迟钝皮纳德 python opencv 计算机视觉
代码部分话不多说直接上代码：新建文件getdata.pyimportcv2importosid_image=0#图片的IDcamera=cv2.VideoCapture(1)#找到棋盘格的标准criteria=(cv2.TERM_CRITERIA_EPS+cv2.TERM_CRITERIA_MAX_ITER,30,0.001)camera.set(cv2.CAP_PROP_FRAME_WIDTH,
Python 中的离线语音转文本无水先生语音编程人工智能综合 python 开发语言
Python中的离线语音转文本一、说明写作、编码、写博客、办公室工作、文档、报告都需要一个人在键盘上打字。这会导致健康问题，如腕管综合症、手和手指疼痛等。我非常了解这种痛苦。这是用于创建自己的离线运行的听写程序的Python代码。只需对着耳机的麦克风说话，它就会将您的话转换为文本并将其保存在文本文件中。二、安装您将需要安装Python库—vosk、pyaudio。 Vosk是一个语音识别
css3-学习江西谢霆锋 css3 学习前端
css特性选择器基础选择器标签选择器ID选择器类选择器CSS的优先级是什么？!important>内联样式(style=“”)>ID选择器>类选择器=属性选择器=伪类>标签选择器=伪元素选择器。层级选择器foobar后代选择器，元素的后代元素foo>bar子代选择器，元素的子代元素foo+bar相邻同胞选择器foo~bar通用同胞选择器foo,bar并集选择器foo.class交集选择器条件选择器
深度学习模型压缩：非结构化剪枝与结构化剪枝的定义与对比从零开始学习人工智能深度学习剪枝人工智能
****在深度学习中，模型压缩是优化模型性能、降低存储和计算成本的重要技术之一。其中，剪枝（Pruning）是最常用的方法之一。根据剪枝的粒度和目标，剪枝可以分为非结构化剪枝（UnstructuredPruning）和结构化剪枝（StructuredPruning）。本文将详细介绍这两种剪枝方法的定义，并通过对比帮助读者更好地理解它们的差异。1.非结构化剪枝（UnstructuredPruning
最方便的离线python实时中文语音识别！迟钝皮纳德 python 语音识别
废话不多说，直接上代码，先安装环境需要安装的包：jsonpyaudionumpyvosk新建一个py文件写入：importjsonimportpyaudioimportnumpyasnpfromvoskimportModel,KaldiRecognizer,SetLogLeveldefSaveWave(model):#设置音频参数FORMAT=pyaudio.paInt16#音频流的格式RATE=
MySQL数据库架构设计：分片与分区策略实战墨瑾轩一起学学数据库【一】mysql 数据库架构 adb
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣在数据库的魔法森林中，MySQL就像是一位智慧的老树精，而分片（Sharding）与分区（Partitioning）则是它手中的两把神秘钥匙，能够打开数据高效存储与快速检索的大门。今天，我们就一起踏上一场奇幻之旅，探索如何运用这两把钥匙，打造一个既强大又灵活的
python插入排序算法编程小白gogogo python python 排序算法算法
defi_sort(arr):#从第二个元素开始遍历整个数组foriinrange(1,len(arr)):key=arr[i]#当前要插入的元素j=i-1#指向当前元素的前一个元素#将大于key的元素都向右移动一位whilej>=0andkey
python 创建子图_在python中以绘图方式创建子图 weixin_39899691 python 创建子图
Iamfairlynewtopythonandploty(<3monthsofactualcodingatthispoint).Iamtryingtocreatesubplotsinplotly.Ihavecreatedgraphsinplotlyusingthecodebelow(codesnippetsattachedbelowaswell),butIcan'tseemtogetthemtow
pythonsubplot_python matplotlib中的subplot函数使用详解郝志鹄 pythonsubplot
python里面的matplotlib.pylot是大家比较常用的，功能也还不错的一个包。基本框架比较简单，但是做一个功能完善且比较好看整洁的图，免不了要网上查找一些函数。于是，为了节省时间，可以一劳永逸。我把常用函数作了一个总结，最后写了一个例子，以后基本不用怎么改了。一、作图流程：1.准备数据，，3作图，4定制，5保存，6显示1.数据可以是numpy数组，也可以是list2创建画布：impor
python 替换字符串 Aa123456789_55 pandas python 数据库开发语言
在Python中，替换字符串可以通过多种方式实现，具体取决于您的需求和上下文。以下是几种常见的方法：1.使用str.replace()方法str.replace(old,new[,count])是最常用的字符串替换方法。它会将字符串中的所有匹配项替换为新的字符串。old:要被替换的子字符串。new:用来替换的新字符串。count(可选):替换的最大次数。如果未指定，则替换所有匹配项。示例代码：or
pandas 根据给定的条件动态筛选 Aa123456789_55 pandas pandas python
defdynamic_filter(df,conditions):"""根据给定的条件动态筛选DataFrame。:paramdf:pandasDataFrame:paramconditions:字典，键为列名，值为筛选条件（单个值、列表或其他布尔表达式）:return:筛选后的DataFrame"""mask=pd.Series(True,index=df.index)#初始化全True的mas
python数据可视化玩转Matplotlib subplot子图操作，四个子图（一包四），三个子图，子图拉伸_python subplot 2401_83817843 程序员 python 信息可视化 matplotlib
大锤爱编程的博客_CSDN博客-大数据,Go,数据分析领域博主Matplotlib是一个流行的Python可视化库，它提供了许多功能来创建各种类型的图表。其中一个功能是子图，它允许您在单个图表中绘制多个图。一、创建子图要创建子图，请使用plt.subplots()函数。该函数接受三个参数：行数、列数和子图编号。以下是一个简单的示例：importmatplotlib.pyplotaspltfig,a
Go语言 vs Java语言：核心差异与适用场景解析 By北阳 golang java 开发语言
在当今的软件开发领域，Go（Golang）和Java都是备受关注的后端开发语言。尽管二者都能构建高性能服务，但它们在设计哲学、语法特性和应用场景上存在显著差异。本文将从多个维度对比这两种语言，帮助开发者更好地理解它们的优缺点，并为技术选型提供参考。一、设计哲学与语言定位1.Go语言定位：专为高并发、分布式系统设计，强调简洁性和高效性。特点：语法简单，学习曲线平缓。静态编译为单一二进制文件，部署便捷
python subplot函数应用 - 创建多个子图 Aa123456789_55 图形展示代码学习 python 开发语言
subplot语法：plt.subplot是Matplotlib库中的一个非常有用的函数，用于在一个图形窗口中创建多个子图plt.subplot函数用于在当前图形窗口中创建并激活一个子图。其基本语法如下：plt.subplot(nrows,ncols,index)参数详解：nrows:子图的行数。这是指整个图形窗口将被分成多少行子图。ncols:子图的列数。这是指整个图形窗口将被分成多少列表子图。
白话设计模式之（95）：状态模式——优化代码状态管理的利器一杯年华@编程空间白话设计模式设计模式状态模式 ui
白话设计模式之（95）：状态模式——优化代码状态管理的利器大家好！在软件开发的学习过程中，我们都在不断探索如何让代码更加高效、灵活且易于维护。设计模式作为编程领域的重要工具，为我们解决各种复杂问题提供了有效的方案。今天，咱们深入探讨状态模式，它是一种优化代码状态管理的利器，能帮助我们处理对象在不同状态下的复杂行为。希望通过这篇博客，能和大家一起全面掌握状态模式，从基础概念到实际应用，深入理解其原理
图像分割基础：使用Python和scikit-image库 0dayNu1L 机器学习项目实战 python 人工智能机器学习
大家好，今天我们将一起探讨图像分割的基础知识，并使用Python编程语言以及scikit-image库来实现一个简单的图像分割示例。图像分割是图像处理中的一项重要技术，它允许我们将图像划分为多个部分或对象，这对于图像分析和计算机视觉任务至关重要。0dayNu1L-CSDN博客目录一、环境准备二、图像分割示例1.导入必要的库2.读取并显示图像3.创建标签数组并进行阈值分割4.使用颜色表示标签三、结果
pythoneasyinstall安装第三方库_【Python使用】Python安装第三方包（easy_install和pip工具）... 不死鹰阿江
本文是对python的第三方包/模块的安装的说明，官方下载第三方包的地址为：https://pypi.org/。1.工具安装部署1.1setuptools安装部署(easy_install)easy_install是由PEAK(PythonEnterpriseApplicationKit)开发的setuptools包里带的一个命令，它用来自动地从http://pypi.python.org/sim
Python库 - skimage 司南锤 PYTHON库 python 开发语言
skimage是scikit-image的缩写，是一个用于图像处理的Python库。提供了丰富的图像处理功能，包括图像滤波、边缘检测、形态学操作、特征提取、图像分割等。skimage是基于NumPy数组构建的，因此可以与NumPy和其他科学计算库（如scipy和matplotlib）无缝集成。安装可以使用pip来安装skimage：pipinstallscikit-image主要模块skimage
scikit-image（Scikit-image 是用于图像处理的 Python 包，使用原生的 NumPy 数组作为图像对象） Clark-dj 图像处理 python numpy
Scikitimage中文开发手册-开发者手册-腾讯云开发者社区-腾讯云昨天搜索一个函数时无意间发现这个网站，今天来学习一下，仅作学习笔记。measureskimage.measure.approximate_polygon（coords，...）近似具有指定公差的多边形链。skimage.measure.block_reduce（image，block_size）通过对局部块应用函数来下采样图像
python`print`函数中flush参数需要重新演唱 Python python
print函数中flush参数在计算机中，输出通常会被缓冲，这意味着数据不会立即发送到目标位置（如控制台或文件），而是先存储在内存中的一个缓冲区里。这样做的好处是可以提高性能，因为一次性发送大量数据通常比逐个发送数据更高效。然而，在某些情况下，你可能希望立即看到输出，而不是等待缓冲区填满或程序结束。这时就可以使用flush参数来强制刷新缓冲区。flush参数的作用flush参数是一个布尔值，默认是
二叉树非递归遍历算法分析小瓶子36 算法数据结构
以前没有学习过树的相关算法，只是了解一些皮毛，最近开始认真学习它。看视频或者网上查资料，可以知道怎么去遍历一棵树，但是算法为什么是这样的呢？少有讲到。如果有一天，我忘记了这个算法，我需要重新去看视频，看文档，这不是我想要的。我想要的是，知道这个算法是怎么设计出来的。下次我忘记的时候，我需要一支笔，一张纸，重新设计出这个算法，而不是去找资料看视频。我想要知道的是，为什么如此，而不是仅仅知道如此而已。
DeepSeek使用教程 rider189 杂谈 java 职场和发展学习方法创业创新开发语言健康医疗媒体
一、教育行业：个性化学习与智能辅导机会点：智能作业批改：教师上传学生作业，DeepSeek自动识别答案并生成批改报告，节省80%人工时间。虚拟导师：学生输入数学题或编程问题，模型实时生成分步解析，支持追问互动，解决“卡壳”难题。个性化学习路径：根据学生测试结果，自动推荐课程和习题，提升学习效率30%以上。教程亮点：登录DeepSeek官网，进入“问答系统”模块，输入学科问题即可获取答案。上传学生作
python的print函数中file_【Python-1】初解print函数 weixin_39849762
print(*objects,sep='',end='\n',file=sys.stdout,flush=False)Printobjectstothetextstreamfile,separatedbysepandfollowedbyend.sep,end,fileandflush,ifpresent,mustbegivenaskeywordarguments.print函数可将对象以字符串的形
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb