submarineas

pandas总结与思维导图

引言
pandas语法

pandas基础思维导图
broadcasting机制

pandas索引

时间序列索引
DataFrame 多重索引
索引思维导图

数据清洗与预处理

数据清理
数据预处理

数据可视化
总结

引言

本篇博文是对于实验楼里pandas语法的一个实验，叫Pandas 百题大冲关，再加上一些我自己从前遇到过的一些问题，还有很多自己的一些见解，然后在这里做一个总结。

pandas语法

pandas基础思维导图

因为前面的东西比较基础，有些东西太散了，而且比较偏门，我就做了一个思维导图来分析了一下，顺便查阅了很多资料，补充了一些我之前没有去注意到的点：

标记红色部分是我觉得重要的，日常分析中经常用的，而橙色相对次之，稍微比红色用得少些。关于缺失值的处理，这个方法蛮多的，但百题中只有去除和插值。我一般是使用取平均的方式，或者拟合，这里也在上述流程图中补充了我的一些想法，比如说还有三次样条插值，中位数等等，有些还需要是具体情况而定。另外这里有一个机制，叫做broadcasting，下面就来介绍一下。

broadcasting机制

我们常常会看到 python 编译器会提示如下类型的错误：

ValueError: operands could not be broadcast together with shapes (8,4,3) (2,1)

broadcasting机制的功能是为了方便不同shape的array（numpy库的核心数据结构）进行数学运算。

从官网看到的规则翻译成中文则是：

让所有输入数组都向其中shape最长的数组看齐，shape中不足的部分都通过在前面加1补齐

输出数组的shape是输入数组shape的各个轴上的最大值

如果输入数组的某个轴和输出数组的对应轴的长度相同或者其长度为1时，这个数组能够用来计算，否则出错

当输入数组的某个轴的长度为1时，沿着此轴运算时都用此轴上的第一组值

用代码来理解，即是：

>>> a = np.array([1,2,3])
# b = np.array([2,2,2]) --> a*b	# 维度一致，python类列表做法
b = 2	# numpy中的broadcast形式
print(a*b)
array([2，4，6])

而如果维度不一致，那么就会报上面的那个错：

a = np.array([1,2,3])
b = np.array([1,2,3,1,2,3])
a*b

ValueError: operands could not be broadcast together with shapes (3,) (6,)

另外这里需要说的是，关于矩阵与整数的加减乘除法，其实就是矩阵点乘了这个整数，即矩阵内的每个数都与整数进行了运算，而如果是两个数组矩阵，就相当于是按照矩阵乘法的运算：

一维数组置于矩阵乘法的左部，被视为一个行向量；
一维数组置于矩阵乘法的右部，被视为一个列向量；

也就是左行右列的原则。

pandas索引

关于索引，这个还是蛮重要的，不论是在数据库，还是在数据结构，都是无可替代的东西。在打比赛的时候用得也很多，尤其是时间序列索引和DataFrame索引，下面我们就来介绍这两个的索引。

时间序列索引

建立一个以 2018 年每一天为索引，值为随机数的 Series：


>>> dti = pd.date_range(start="2018-01-01",end="2018-12-31",freq="D")
s = pd.Series(np.random.rand(len(dti)),index=dti)
s
--------------------------------------
“”“ 
2018-01-01    0.084896
2018-01-02    0.914417
2018-01-03    0.285811
2018-01-04    0.945080
				......
2018-12-31    0.446219
”“”

统计s 中每一个周三对应值的和：


>>> print(s[s.index.weekday == 2])
>>> s[s.index.weekday == 2].sum() # # 周一从 0 开始
--------------------------------------
“”“ 
2018-01-03    0.892325
2018-01-10    0.917178
2018-01-17    0.051205
				......
2018-12-26    0.403411
dtype: float64
25.810026230589507
”“”

统计s中每个月值的平均值：


>>> s.resample('M').mean()
--------------------------------------
“”“ 
2018-01-31    0.454337
2018-02-28    0.677720
2018-03-31    0.455357
2018-04-30    0.487341
2018-05-31    0.488349
2018-06-30    0.481850
2018-07-31    0.537994
2018-08-31    0.524359
2018-09-30    0.568155
2018-10-31    0.521819
2018-11-30    0.479967
2018-12-31    0.499142
Freq: M, dtype: float64
”“”

将 Series 中的时间进行转换：

s = pd.date_range('today', periods=100, freq='S')

ts = pd.Series(np.random.randint(0, 500, len(s)), index=s)

ts.resample('Min').sum()
--------------------------------------
“”“ 
2018-12-05 11:06:00      715
2018-12-05 11:07:00    16033
2018-12-05 11:08:00     8611
Freq: T, dtype: int64
”“”

DataFrame 多重索引

关于DataFrame的索引，很多都是很重要的，在这里我就列举一部分来分析它的

多重索引求和：

>>> frame = pd.DataFrame(np.arange(12).reshape(6, 2),
                     index=[list('AAABBB'), list('123123')],
                     columns=['hello', 'shiyanlou'])
frame	# 创建一个在0-12之间六行两列的数组，然后加上AAABBB的索引，也就是A、B两类索引

>>>frame.groupby('first').sum()

first	hello	shiyanlou
A	6	9
B	24	27

DataFrame条件查找

>>> data = {'animal': ['cat', 'cat', 'snake', 'dog', 'dog', 'cat', 'snake', 'cat', 'dog', 'dog'],
        'age': [2.5, 3, 0.5, np.nan, 5, 2, 4.5, np.nan, 7, 3],
        'visits': [1, 3, 2, 3, 2, 3, 1, 1, 2, 1],
        'priority': ['yes', 'yes', 'no', 'yes', 'no', 'no', 'no', 'yes', 'no', 'no']}

labels = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j']
df = pd.DataFrame(data, index=labels)

>>>df[df['age'] > 3]

/	animal	age	visits	priority
e	dog	5.0	2	no
g	snake	4.5	1	no
i	dog	7.0	2	no

DataFrame多重条件查询

>>> df = pd.DataFrame(data, index=labels)

df[(df['animal'] == 'cat') & (df['age'] < 3)]

/	animal	age	visits	priority
a	cat	2.5	1	yes
f	cat	2.0	3	no

DataFrame 按关键字查询

>>> df3[df3['animal'].isin(['cat', 'dog'])]

/	animal	age	visits	priority
a	cat	2.5	1	yes
b	cat	3.0	3	yes
d	dog	NaN	3	yes
e	dog	5.0	2	no
f	cat	2.0	3	no
h	cat	NaN	1	yes
i	dog	7.0	2	no
j	dog	3.0	1	no

DataFrame 多条件排序
按照 age 降序，visits 升序排列

>>> df.sort_values(by=['age', 'visits'], ascending=[False, True])

/	animal	age	visits	priority
i	dog	7.0	2	no
e	dog	5.0	2	no
g	snake	4.5	1	no
j	dog	3.0	1	no
b	cat	3.0	3	yes
a	cat	2.5	1	yes
f	cat	2.0	3	no
c	snake	0.5	2	no
h	cat	NaN	1	yes
d	dog	NaN	3	yes

DataFrame 分组求和

>>> df.groupby('animal').sum()

animal	age	visits
cat	7.5	8
dog	15.0	8
snake	5.0	3

DataFrame 多值替换
将 priority 列的 yes 值替换为 True，no 值替换为 False

>>> df['priority'].map({'yes': True, 'no': False})

使用列表拼接多个 DataFrame

temp_df1 = pd.DataFrame(np.random.randn(5, 4))  # 生成由随机数组成的 DataFrame 1
temp_df2 = pd.DataFrame(np.random.randn(5, 4))  # 生成由随机数组成的 DataFrame 2
temp_df3 = pd.DataFrame(np.random.randn(5, 4))  # 生成由随机数组成的 DataFrame 3

print(temp_df1)
print(temp_df2)
print(temp_df3)

pieces = [temp_df1, temp_df2, temp_df3]
pd.concat(pieces)

然后还有找出表中和最小的那一列，每一组中最大的三个数的和等等这些，用得不多，所以总结在下面的这张思维导图里。

索引思维导图

里面介绍了一些上面没有讲到的，然后还是和上面的思维导图一样，红色是我认为重要的，橙色次之。

数据清洗与预处理

数据清理

在FilghtNumber中有数值缺失，其中数值为按 10 增长，补充相应的缺省值使得数据完整，并让数据为 int 类型，这可以算作是一种基本的拟合。

df = pd.DataFrame({'From_To': ['LoNDon_paris', 'MAdrid_miLAN', 'londON_StockhOlm',
                               'Budapest_PaRis', 'Brussels_londOn'],
                   'FlightNumber': [10045, np.nan, 10065, np.nan, 10085],
                   'RecentDelays': [[23, 47], [], [24, 43, 87], [13], [67, 32]],
                   'Airline': ['KLM(!)', ' (12)', '(British Airways. )',
                               '12. Air France', '"Swiss Air"']})
df['FlightNumber'] = df['FlightNumber'].interpolate().astype(int)
df

/	From_To	FlightNumber	RecentDelays	Airline
0	LoNDon_paris	10045	[23, 47]	KLM(!)
1	MAdrid_miLAN	10055	[]	< Air France>(12)
2	londON_StockhOlm	10065	[24, 43, 87]	(British Airways. )
3	Budapest	PaRis	10075	[13]
4	Brussels_londOn	10085	[67, 32]	“Swiss Air”

然后我们可以通过：

数据列拆分，因为其中From_to应该为两独立的两列From和To，将From_to依照_拆分为独立两列建立为一个新表
然后再进行字符标准化，因为注意到地点的名字都不规范（如：londON应该为London）需要对数据进行标准化处理
再将最开始的From_to列删除，加入整理好的From和to列（这一步我感觉就是将一个特征拆成两个吧，感觉适用场景很少，不会有那么凑巧的列名和数据都能直接拆）
最后去除多余字符，如同 airline 列中许多数据有许多其他字符，会对后期的数据分析有较大影响，需要对这类数据进行修正。

“”“数据拆分”“”
temp = df.From_To.str.split('_', expand=True)
temp.columns = ['From', 'To']
# print(temp)

““”字符标准化“””
temp['From'] = temp['From'].str.capitalize()
temp['To'] = temp['To'].str.capitalize()

“”“删除坏数据加入整理好的数据”“”
df = df.drop('From_To', axis=1)
df = df.join(temp)
# print(df)

“”“去除多余字符”“”
df['Airline'] = df['Airline'].str.extract(
    '([a-zA-Z\s]+)', expand=False).str.strip()
print(df)

/	FlightNumber	RecentDelays	Airline	From	To
0	10045	[23, 47]	KLM	London	Paris
1	10055	[]	Air	France	Madrid
2	10065	[24, 43, 87]	British Airways	London	Stockholm
3	10075	[13]	Air France	Budapest	Paris
4	10085	[67, 32]	Swiss Air	Brussels	London

数据预处理

班级一部分同学的数学成绩表：

df=pd.DataFrame({‘name’:[‘Alice’,‘Bob’,‘Candy’,‘Dany’,‘Ella’,‘Frank’,‘Grace’,‘Jenny’],‘grades’:[58,83,79,65,93,45,61,88]})

但我们更加关心的是该同学是否及格，将该数学成绩按照是否>60来进行划分。

df = pd.DataFrame({'name': ['Alice', 'Bob', 'Candy', 'Dany', 'Ella',
                            'Frank', 'Grace', 'Jenny'], 'grades': [58, 83, 79, 65, 93, 45, 61, 88]})


def choice(x):
    if x > 60:
        return 1
    else:
        return 0


df.grades = pd.Series(map(lambda x: choice(x), df.grades))
df

-	name	grades
0	Alice	0
1	Bob	1
2	Candy	1
…	…	…

一个列为A的 DataFrame 数据df = pd.DataFrame({‘A’: [1, 2, 2, 3, 4, 5, 5, 5, 6, 7, 7]})
尝试将 A 列中连续重复的数据清除。

df = pd.DataFrame({'A': [1, 2, 2, 3, 4, 5, 5, 5, 6, 7, 7]})
df.loc[df['A'].shift() != df['A']]

-	A
0	1
1	2
3	3
…	…

有时候，DataFrame 中不同列之间的数据差距太大，需要对其进行归一化处理。其中，Max-Min 归一化是简单而常见的一种方式，公式如下:

$Y=\frac{X-X_{min}}{X_{max}-X_{min}}$

def normalization(df):
    numerator = df.sub(df.min())
    denominator = (df.max()).sub(df.min())
    Y = numerator.div(denominator)
    return Y


df = pd.DataFrame(np.random.random(size=(5, 3)))
print(df)
normalization(df)
------------------------------
“”“
          0         1         2
0  0.470056  0.982399  0.363549
1  0.087079  0.620251  0.194063
2  0.956984  0.261238  0.605419
3  0.001150  0.817922  0.629556
4  0.326190  0.068997  0.505367
Out:
0	1	2
0	0.490572	1.000000	0.389182
1	0.089900	0.603517	0.000000
2	1.000000	0.210467	0.944577
3	0.000000	0.819930	1.000000
4	0.340059	0.000000	0.714832
”“”

数据可视化


# 第一张图：Series 折线图
import matplotlib
df = pd.Series(np.random.randn(100), index=pd.date_range('today', periods=100))
df = ts.cumsum()
df.subplot(2,2,1)
df.plot()

--------------------------------
# 第二张图：DataFrame 折线图
df = pd.DataFrame(np.random.randn(100, 4), index=ts.index,
                  columns=['A', 'B', 'C', 'D'])
df = df.cumsum()
df.subplot(2,2,4)
df.plot()

--------------------------------
# 第三张图：DataFrame 散点图
df = pd.DataFrame({"xs": [1, 5, 2, 8, 1], "ys": [4, 2, 1, 9, 6]})
df = df.cumsum()
df.subplot(2,3,5)
df.plot.scatter("xs", "ys", color='red', marker="*")

--------------------------------
# 第四张图：DataFrame 柱形图
df = pd.DataFrame({"revenue": [57, 68, 63, 71, 72, 90, 80, 62, 59, 51, 47, 52],
                   "advertising": [2.1, 1.9, 2.7, 3.0, 3.6, 3.2, 2.7, 2.4, 1.8, 1.6, 1.3, 1.9],
                   "month": range(12)
                   })

ax = df.plot.bar("month", "revenue", color="yellow")
df.subplot(2,3,8)
df.plot("month", "advertising", secondary_y=True, ax=ax)

总结

这篇博文总共用时两天，第一天把pandas百题大冲关做了2~3遍，然后睡了一觉还是很多不记得，所以今天就开始画思维导图，外加上再一边对照代码一边写博客，印象又加深了许多，其实这些语法也是pandas里面基础的语法，如果配合着其他的比如说sklearn、matplotlib等包一起的话，那么就更加有趣味性和挑战性，这里我也只是比较全面的过一遍pandas先，这篇博文相当于留给自己自备，以防以后忘了然后回过头来看看。

python type函数_Python type（）函数 cunchi4221 python java javascript js php ViewUI
pythontype函数Pythontype（）函数(Pythontype()Function)Pythonhasalotofbuit-infunction.Thetype()functionisusedtogetthetypeofanobject.Python具有很多内置功能。type()函数用于获取对象的类型。Pythontype()functionsyntaxis:Pythontype（）函
Python 网页控制自动化 getEdgeDriver chenchihwen 服务器 mysql 运维
透过python使用edge执行自动化时，原来的代码出现报错了执行报错啦：messageinfo如下显示HTTPSConnectionPool(host='msedgedriver.azureedge.net',port=443):Maxretriesexceededwithurl:/130.0.2849/edgedriver_win64.zip(CausedbyNewConnectionErro
函数与lambda表达式叶清湑学习笔记 python lambda
函数与lambda表达式在Python中，函数分为普通函数与lambda函数。Lambda是一个匿名函数，它是一种简写，表达更快。写法如下:自定义函数名=lambda若干参数:操作表达式deffun1(a,b,c):returna*b*cprint(fun1(3,4,10))fun2=lambdaa,b,c:a*b*c;print(fun2(3,5,10))
Python VS Code报错ModuleNotFoundError: No module named ‘numpy‘以及No module named ‘xxx‘的原因及解决办法猛狗哭泣数据分析 python bug anaconda
ModuleNotFoundError的两种类型及解决方法Nomodulenamed'numpy'Nomodulenamed'xxx'Nomodulenamed‘numpy’有的时候我们想import常用的包比如numpy或者pandas，而且电脑上是有安装这些包并且在Jupyter中可以正常使用的，但在VSCode或者Pycharm中import却会出现如题的错误。发生这种报错的原因是VSCod
【20.5 python中的FastAPI】 wang151038606 python语言入门学习 python fastapi 开发语言
python中的FastAPIFastAPI是一个现代、快速（高性能）的Web框架，用于构建API，基于Python3.6+的类型提示。它利用了Python3.7+的新特性，如类型提示（TypeHints），来自动生成API文档（基于OpenAPI和SwaggerUI），以及进行参数校验和序列化/反序列化。FastAPI旨在简化API开发，同时保持高性能。FastAPI的特点快速：极高的性能，可与
华为OD机试E卷 --游戏分组--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od 游戏 java javascript c++c python
文章目录题目描述输入描述输出描述用例题目解析Js算法源码python算法源码java算法源码c++算法源码c算法源码题目描述部门准备举办一场王者荣耀表演赛，有10名游戏爱好者参与，分为两队，每队5人。每位参与者都有一个评分，代表着他的游戏水平。为了表演赛尽可能精彩，我们需要把10名参赛者分为示例尽量相近的两队。一队的实力可以表示为这一队5名队员的评分总和。现在给你10名参与者的游戏水平评分，请你根
python中报错“ModuleNotFoundError: No module named ‘openpyxl‘” wang151038606 python中bug python中的安装包 python
python中报错“ModuleNotFoundError:Nomodulenamed‘openpyxl’”importopenpyxl时报错“ModuleNotFoundError:Nomodulenamed‘openpyxl’”在Python中遇到ModuleNotFoundError:Nomodulenamed'openpyxl'这个错误，通常意味着你的Python环境中没有安装openpy
实现实时通信：使用Python WebSocket与服务器进行交互清水白石008 Python题库 python python websocket 交互
实现实时通信：使用PythonWebSocket与服务器进行交互在现代网络应用中，实时通信变得越来越重要。无论是在线聊天、股票交易还是游戏，能够即时交换数据是提升用户体验的关键。WebSocket协议作为一种实现双向通信的标准，提供了有效的解决方案。本文将带你深入理解如何使用Python编写一个简单的WebSocket客户端，与服务器进行实时通信。一、WebSocket协议概述1.1WebSock
Python中常见关键字及其用法介绍 xiaoweids 编程语言 Python python 开发语言
这篇文章主要介绍了Python中有哪些关键字及关键字的用法,分享python中常用的关键字，本文结合示例代码给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下Python有哪些关键字Python常用的关键字1and,del,from,not,while,as,elif,global,or,with,assert,else,if,pass,yield,break,e
Python使用QQ邮箱发送邮件提示高质量海王哦 python python
python发送qq邮件htmlimportbase64importsmtplibimporttimefromemail.mime.textimportMIMETextdefsend_QQ_mail_HTML():user='[email protected]'#发送方的邮箱账号passwd='xruuwiyxdcouddjg'#授权码receiver='[email protected]
python无人飞机 python无人驾驶医学芯片 python 开发语言
这是一个简单的无人飞机代码示例：classDrone:def__init__(self):self.flying=Falsedeftakeoff(self):ifnotself.flying:print("无人机起飞")self.flying=Trueelse:print("无人机已在空中")defland(self):ifself.flying:print("无人机降落")self.flying
第三章、python中的对象、变量、标识符、作用域、引用(调用)及地址的概念(3.1-3.2)------内存地址、创建对象、对象的类型及对象的划分问题 thefg Python基础详解教程对象的类型创建对象 in is id 内存地址逻辑地址
第三章、python中的对象、变量、标识符、作用域、引用(调用)及地址的概念本章讲述编程中对象、变量、地址的基本概念及其之间的关系，可迭代对象、可变对象、不可变对象的特点。
基于flask框架高校学生宿舍管理系统 (python+mysql+论文) 真纯Django毕设程序 python flask mysql
本系统（程序+源码）带文档lw万字以上文末可获取本课题的源码和程序系统程序文件列表系统的选题背景和意义选题背景：
Python中global的用法叉选手 python python
global是python中的一个关键字，作用在变量上，该关键字通常放在函数块中，用来声明该变量为全局变量。例如下面变量a，定义在函数外面的是全局变量a，定义在fun函数里面的a是另一个a，是局部变量a，两者没有任何关系。好比这个地区有个叫张三的人，公办室里有个另一个叫张三的人。他们是两个不同的人。a=10deffun():a=2fun()print(a)#输出10如果想要函数里面的那个a就代表外
巨潮PDF年报下载01——python request库圣道寺 python学习笔记 python
目录标题背景代码块背景(70条消息)迅雷API批量下载巨潮年报_无敌的前任的博客-CSDN博客代码块fromwin32com.clientimportDispatch#pipinstallwin32compat#pipinstallpywin32importosimportreimportopenpyxlimportrequestsimporturllib.requestimporttimedef
python中global的用法 Jqlender python python
python变量的作用域：Local局部作用域Enclosing闭包函数外的函数中Global全局作用域查找规则：以Local->Enclosing->Global规则查找，即：同名变量，优先引用的是局部变量，在局部找不到，便会去局部外的局部找（例如闭包），再找不到就会去全局找。global关键字x=5deffun_a():print(x)deffun_b():x=x+1print(x)fun_a
Python 潮流周刊#84：2024 年 Python 的最佳实践（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了12篇文章，12个开源项目，全文2200字。以下是本期摘要：文章&教程①现代Python开发的良好实践②2024年最先进的Python③回顾一年：2024年的Flask④介绍Annotate
Python基于matplotlib-scalebar库绘制比例尺懒大王爱吃狼 python python matplotlib 开发语言自动化 Python基础 opencv
在Python中，你可以使用matplotlib-scalebar库来在图表上绘制比例尺。这个库是matplotlib的一个扩展，专门用于在绘图时添加比例尺。以下是一个简单的示例，展示了如何使用matplotlib-scalebar来绘制带有比例尺的图表。首先，你需要安装matplotlib-scalebar库。如果你还没有安装它，可以使用以下命令来安装：pipinstallmatplotlib-
Python 潮流周刊#77：Python 依赖管理就像垃圾场火灾？（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了12篇文章，12个开源项目，2则热门讨论，全文2200字。以下是本期摘要：文章&教程①Python依赖管理一种垃圾场火灾②Python的膨胀：精细的项目间依赖关系分析③分享我的Django项
Python 潮流周刊#74：创下吉尼斯世界记录的 Python 编程课（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。本期分享了12篇文章，12个开源项目，2则音视频，全文2300字。好消息：即日起至万圣节（12.31），周刊限时99元/年，欢迎订阅！！以下是本期摘要：文章&教程①创下吉尼斯世界记录的Python
Python 潮流周刊#71：PyPI 应该摆脱掉它的赞助依赖（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了12篇文章，12个开源项目，1则音视频，全文2000字。以下是本期摘要：文章&教程①PyPI应该摆脱掉它的赞助依赖②创建不分大小写的Python字符串类③用Tree-sitter&Jedi重
Python 潮流周刊#72：Python 3.13.0 最终版已发布！（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了14篇文章，12个开源项目，4则音视频，全文2300字。以下是本期摘要：文章&教程①Python3.13.0最终版已发布！②关于Python3.13，了解这些信息就够了③Python3.13
Python 潮流周刊#67：uv 的重磅更新（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了12篇文章，12个开源项目，全文2000字。以下是本期摘要：文章&教程①uv：统一的Python打包工具②PyJWT和python-jose在处理JWT令牌时的差异③Kindle+Pytho
Python 潮流周刊#68：2023 年 Python 开发者调查结果（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了12篇文章，12个开源项目，2则热门讨论，全文2100字。以下是本期摘要：文章&教程①2023年Python开发者调查结果②为什么在Docker中我仍然要用Python虚拟环境？③我如何用P
Python WebSocket服务器介绍一只会写程序的猫 Python python websocket 服务器
PythonWebSocket服务器介绍WebSocket是一种在Web浏览器和服务器之间实现全双工通信的协议。它允许服务器主动发送消息到浏览器，而不需要浏览器发起请求。Python提供了许多库和框架来实现WebSocket服务器，本文将介绍如何使用Python构建一个简单的WebSocket服务器。WebSocket协议和工作原理WebSocket协议是通过HTTP协议的升级实现的。在HTTP协
python如何读取csv文件？ gaogsf Python python 开发语言
CSV（CommaSeparatedValues）文件是一种常见的文件格式，它将数据以逗号分隔的形式存储，通常用于存储表格数据。在Python中，我们可以使用多种方法来读取CSV文件，本文将从多个角度分析Python如何读取CSV文件。一、Python内置的csv库Python内置了csv库，可以使用该库中的reader对象来读取CSV文件。下面是一个示例代码：importcsvwithopen(
探索装饰器的奥秘：Python里的超级英雄披风大梦百万秋知识学爆 python 开发语言
引言：每一行代码都可以是一件披风有没有想过，代码写得再帅气，读起来再优雅，它始终是千篇一律的套路？有时候，代码中的函数就像是穿着普通衣服的路人，默默地完成任务。而这时候，你可能会想：“嘿，我要给它们一点魔法，让它们更具超能力！”别担心，Python里的装饰器正是你需要的神秘工具，它能给你的函数加上一件“超级英雄披风”，让它们瞬间拥有更多的功能，且不改变它们原本的外貌。今天我们就来一起揭开装饰器的面
在 Python 中使用 PyPDF2 向 PDF 文件批量添加水印信息科技云课堂 python pdf
目录：使用PyPDF2添加水印到PDF文件批量添加水印到PDF文件所有页PDF文件广泛用于不同的设备和平台上，在某些情况下，可能需要在PDF文件中申明版权，需要将水印、条形码、二维码等添加到PDF中。PyPDF2提供了一种将另一个PDF文件作为水印，添加到PDF文件的方法。在下面的示例中，制作一个PDF水印文档，可以加入文字、二维码，通过合并的方法为PDF文件添加水印。使用PyPDF2添加水印到P
Python 潮流周刊#86：Jupyter Notebook 智能编码助手（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了12篇文章，12个开源项目，全文2000字。以下是本期摘要：文章&教程①介绍JupyterNotebook智能助手②用纯Python写一个“Redis”，速度比原生Redis还快？③30分钟
Python 中最易误解的功能前端
有些功能即使是经验丰富的开发者也会被难住。我也曾被它们绊倒，花数小时挠头苦思，最终才学会如何正确应对。所以，不浪费时间，让我们来探索Python中最易误解的功能，它们为何棘手，以及你如何能最终掌握它们。1.可变默认参数问题：如果你曾写过一个带有默认列表或字典参数的函数，你可能会注意到一些奇怪的现象。它会在函数调用之间“记住”值！defadd_item(item,items=[]):items.ap
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st

/	animal	age	visits	priority
a	cat	2.5	1	yes
b	cat	3.0	3	yes
d	dog	NaN	3	yes
e	dog	5.0	2	no
f	cat	2.0	3	no
h	cat	NaN	1	yes
i	dog	7.0	2	no
j	dog	3.0	1	no

/	animal	age	visits	priority
a	cat	2.5	1	yes
b	cat	3.0	3	yes
d	dog	NaN	3	yes
e	dog	5.0	2	no
f	cat	2.0	3	no
h	cat	NaN	1	yes
i	dog	7.0	2	no
j	dog	3.0	1	no