Thoth_A

PANDAS第一次打卡

第1章 Pandas基础
import pandas as pd
import numpy as np
查看Pandas版本
pd.version
‘1.0.3’
一、文件读取与写入

读取
（a）csv格式
df = pd.read_csv(‘data/table.csv’)
df.head()
School Class ID Gender Address Height Weight Math Physics
0 S_1 C_1 1101 M street_1 173 63 34.0 A+
1 S_1 C_1 1102 F street_2 192 73 32.5 B+
2 S_1 C_1 1103 M street_2 186 82 87.2 B+
3 S_1 C_1 1104 F street_2 167 81 80.4 B-
4 S_1 C_1 1105 F street_4 159 64 84.8 B+
（b）txt格式
df_txt = pd.read_table(‘data/table.txt’) #可设置sep分隔符参数
df_txt
col1 col2 col3 col4
0 2 a 1.4 apple
1 3 b 3.4 banana
2 6 c 2.5 orange
3 5 d 3.2 lemon
（c）xls或xlsx格式
#需要安装xlrd包
df_excel = pd.read_excel(‘data/table.xlsx’)
df_excel.head()
School Class ID Gender Address Height Weight Math Physics
0 S_1 C_1 1101 M street_1 173 63 34.0 A+
1 S_1 C_1 1102 F street_2 192 73 32.5 B+
2 S_1 C_1 1103 M street_2 186 82 87.2 B+
3 S_1 C_1 1104 F street_2 167 81 80.4 B-
4 S_1 C_1 1105 F street_4 159 64 84.8 B+
写入
（a）csv格式
df.to_csv(‘data/new_table.csv’)
#df.to_csv(‘data/new_table.csv’, index=False) #保存时除去行索引
（b）xls或xlsx格式
#需要安装openpyxl
df.to_excel(‘data/new_table2.xlsx’, sheet_name=‘Sheet1’)
二、基本数据结构
Series
（a）创建一个Series
对于一个Series，其中最常用的属性为值（values），索引（index），名字（name），类型（dtype）

（b）访问Series属性

s.values
array([ 0.30299458, 0.57343774, 0.53608608, 0.5132085 , -1.26357851])
s.name
‘这是一个Series’
s.index
Index([‘a’, ‘b’, ‘c’, ‘d’, ‘e’], dtype=‘object’)
s.dtype
dtype(‘float64’)
（c）取出某一个元素
将在第2章详细讨论索引的应用，这里先大致了解
s[‘a’]
0.30299457920628364
（d）调用方法
s.mean()
0.1324296778903958
Series有相当多的方法可以调用：
print([attr for attr in dir(s) if not attr.startswith(’_’)])
[‘T’, ‘a’, ‘abs’, ‘add’, ‘add_prefix’, ‘add_suffix’, ‘agg’, ‘aggregate’, ‘align’, ‘all’, ‘any’, ‘append’, ‘apply’, ‘argmax’, ‘argmin’, ‘argsort’, ‘array’, ‘asfreq’, ‘asof’, ‘astype’, ‘at’, ‘at_time’, ‘attrs’, ‘autocorr’, ‘axes’, ‘b’, ‘between’, ‘between_time’, ‘bfill’, ‘bool’, ‘c’, ‘clip’, ‘combine’, ‘combine_first’, ‘convert_dtypes’, ‘copy’, ‘corr’, ‘count’, ‘cov’, ‘cummax’, ‘cummin’, ‘cumprod’, ‘cumsum’, ‘d’, ‘describe’, ‘diff’, ‘div’, ‘divide’, ‘divmod’, ‘dot’, ‘drop’, ‘drop_duplicates’, ‘droplevel’, ‘dropna’, ‘dtype’, ‘dtypes’, ‘duplicated’, ‘e’, ‘empty’, ‘eq’, ‘equals’, ‘ewm’, ‘expanding’, ‘explode’, ‘factorize’, ‘ffill’, ‘fillna’, ‘filter’, ‘first’, ‘first_valid_index’, ‘floordiv’, ‘ge’, ‘get’, ‘groupby’, ‘gt’, ‘hasnans’, ‘head’, ‘hist’, ‘iat’, ‘idxmax’, ‘idxmin’, ‘iloc’, ‘index’, ‘infer_objects’, ‘interpolate’, ‘is_monotonic’, ‘is_monotonic_decreasing’, ‘is_monotonic_increasing’, ‘is_unique’, ‘isin’, ‘isna’, ‘isnull’, ‘item’, ‘items’, ‘iteritems’, ‘keys’, ‘kurt’, ‘kurtosis’, ‘last’, ‘last_valid_index’, ‘le’, ‘loc’, ‘lt’, ‘mad’, ‘map’, ‘mask’, ‘max’, ‘mean’, ‘median’, ‘memory_usage’, ‘min’, ‘mod’, ‘mode’, ‘mul’, ‘multiply’, ‘name’, ‘nbytes’, ‘ndim’, ‘ne’, ‘nlargest’, ‘notna’, ‘notnull’, ‘nsmallest’, ‘nunique’, ‘pct_change’, ‘pipe’, ‘plot’, ‘pop’, ‘pow’, ‘prod’, ‘product’, ‘quantile’, ‘radd’, ‘rank’, ‘ravel’, ‘rdiv’, ‘rdivmod’, ‘reindex’, ‘reindex_like’, ‘rename’, ‘rename_axis’, ‘reorder_levels’, ‘repeat’, ‘replace’, ‘resample’, ‘reset_index’, ‘rfloordiv’, ‘rmod’, ‘rmul’, ‘rolling’, ‘round’, ‘rpow’, ‘rsub’, ‘rtruediv’, ‘sample’, ‘searchsorted’, ‘sem’, ‘set_axis’, ‘shape’, ‘shift’, ‘size’, ‘skew’, ‘slice_shift’, ‘sort_index’, ‘sort_values’, ‘squeeze’, ‘std’, ‘sub’, ‘subtract’, ‘sum’, ‘swapaxes’, ‘swaplevel’, ‘tail’, ‘take’, ‘to_clipboard’, ‘to_csv’, ‘to_dict’, ‘to_excel’, ‘to_frame’, ‘to_hdf’, ‘to_json’, ‘to_latex’, ‘to_list’, ‘to_markdown’, ‘to_numpy’, ‘to_period’, ‘to_pickle’, ‘to_sql’, ‘to_string’, ‘to_timestamp’, ‘to_xarray’, ‘transform’, ‘transpose’, ‘truediv’, ‘truncate’, ‘tshift’, ‘tz_convert’, ‘tz_localize’, ‘unique’, ‘unstack’, ‘update’, ‘value_counts’, ‘values’, ‘var’, ‘view’, ‘where’, ‘xs’]
2. DataFrame
（a）创建一个DataFrame
df = pd.DataFrame({‘col1’:list(‘abcde’),‘col2’:range(5,10),‘col3’:[1.3,2.5,3.6,4.6,5.8]},
index=list(‘一二三四五’))
df
col1 col2 col3
一 a 5 1.3
二 b 6 2.5
三 c 7 3.6
四 d 8 4.6
五 e 9 5.8
（b）从DataFrame取出一列为Series
df[‘col1’]
一 a
二 b
三 c
四 d
五 e
Name: col1, dtype: object
type(df)
pandas.core.frame.DataFrame
type(df[‘col1’])
pandas.core.series.Series
（c）修改行或列名
df.rename(index={‘一’:‘one’},columns={‘col1’:‘new_col1’})
new_col1 col2 col3
one a 5 1.3
二 b 6 2.5
三 c 7 3.6
四 d 8 4.6
五 e 9 5.8
（d）调用属性和方法
df.index
Index([‘一’, ‘二’, ‘三’, ‘四’, ‘五’], dtype=‘object’)
df.columns
Index([‘col1’, ‘col2’, ‘col3’], dtype=‘object’)
df.values
array([[‘a’, 5, 1.3],
[‘b’, 6, 2.5],
[‘c’, 7, 3.6],
[‘d’, 8, 4.6],
[‘e’, 9, 5.8]], dtype=object)
df.shape
(5, 3)
df.mean() #本质上是一种Aggregation操作，将在第3章详细介绍
col2 7.00
col3 3.56
dtype: float64
（e）索引对齐特性
这是Pandas中非常强大的特性，不理解这一特性有时就会造成一些麻烦
df1 = pd.DataFrame({‘A’:[1,2,3]},index=[1,2,3])
df2 = pd.DataFrame({‘A’:[1,2,3]},index=[3,1,2])
df1-df2 #由于索引对齐，因此结果不是0
A
1 -1
2 -1
3 2
（f）列的删除与添加
对于删除而言，可以使用drop函数或del或pop
df.drop(index=‘五’,columns=‘col1’) #设置inplace=True后会直接在原DataFrame中改动
col2 col3
一 5 1.3
二 6 2.5
三 7 3.6
四 8 4.6
df[‘col1’]=[1,2,3,4,5]
del df[‘col1’]
df
col2 col3
一 5 1.3
二 6 2.5
三 7 3.6
四 8 4.6
五 9 5.8
pop方法直接在原来的DataFrame上操作，且返回被删除的列，与python中的pop函数类似
df[‘col1’]=[1,2,3,4,5]
df.pop(‘col1’)
一 1
二 2
三 3
四 4
五 5
Name: col1, dtype: int64
df
col2 col3
一 5 1.3
二 6 2.5
三 7 3.6
四 8 4.6
五 9 5.8
可以直接增加新的列，也可以使用assign方法
df1[‘B’]=list(‘abc’)
df1
A B
1 1 a
2 2 b
3 3 c
df1.assign(C=pd.Series(list(‘def’)))
A B C
1 1 a e
2 2 b f
3 3 c NaN
但assign方法不会对原DataFrame做修改
df1
A B
1 1 a
2 2 b
3 3 c
（g）根据类型选择列
df.select_dtypes(include=[‘number’]).head()
col2 col3
一 5 1.3
二 6 2.5
三 7 3.6
四 8 4.6
五 9 5.8
df.select_dtypes(include=[‘float’]).head()
col3
一 1.3
二 2.5
三 3.6
四 4.6
五 5.8
（h）将Series转换为DataFrame
s = df.mean()
s.name=‘to_DataFrame’
s
col2 7.00
col3 3.56
Name: to_DataFrame, dtype: float64
s.to_frame()
to_DataFrame
col2 7.00
col3 3.56
使用T符号可以转置
s.to_frame().T
col2 col3
to_DataFrame 7.0 3.56
三、常用基本函数
从下面开始，包括后面所有章节，我们都会用到这份虚拟的数据集
df = pd.read_csv(‘data/table.csv’)

head和tail
df.head()
School Class ID Gender Address Height Weight Math Physics
0 S_1 C_1 1101 M street_1 173 63 34.0 A+
1 S_1 C_1 1102 F street_2 192 73 32.5 B+
2 S_1 C_1 1103 M street_2 186 82 87.2 B+
3 S_1 C_1 1104 F street_2 167 81 80.4 B-
4 S_1 C_1 1105 F street_4 159 64 84.8 B+
df.tail()
School Class ID Gender Address Height Weight Math Physics
30 S_2 C_4 2401 F street_2 192 62 45.3 A
31 S_2 C_4 2402 M street_7 166 82 48.7 B
32 S_2 C_4 2403 F street_6 158 60 59.7 B+
33 S_2 C_4 2404 F street_2 160 84 67.7 B
34 S_2 C_4 2405 F street_6 193 54 47.6 B
可以指定n参数显示多少行
df.head(3)
School Class ID Gender Address Height Weight Math Physics
0 S_1 C_1 1101 M street_1 173 63 34.0 A+
1 S_1 C_1 1102 F street_2 192 73 32.5 B+
2 S_1 C_1 1103 M street_2 186 82 87.2 B+
unique和nunique
nunique显示有多少个唯一值
df[‘Physics’].nunique()
7
unique显示所有的唯一值
df[‘Physics’].unique()
array([‘A+’, ‘B+’, ‘B-’, ‘A-’, ‘B’, ‘A’, ‘C’], dtype=object)
count和value_counts
count返回非缺失值元素个数
df[‘Physics’].count()
35
value_counts返回每个元素有多少个
df[‘Physics’].value_counts()
B+ 9
B 8
B- 6
A 4
A+ 3
A- 3
C 2
Name: Physics, dtype: int64
describe和info
info函数返回有哪些列、有多少非缺失值、每列的类型
df.info()

RangeIndex: 35 entries, 0 to 34
Data columns (total 9 columns):

Column Non-Null Count Dtype

0 School 35 non-null object
1 Class 35 non-null object
2 ID 35 non-null int64
3 Gender 35 non-null object
4 Address 35 non-null object
5 Height 35 non-null int64
6 Weight 35 non-null int64
7 Math 35 non-null float64
8 Physics 35 non-null object
dtypes: float64(1), int64(3), object(5)
memory usage: 2.6+ KB
describe默认统计数值型数据的各个统计量
df.describe()
ID Height Weight Math
count 35.00000 35.000000 35.000000 35.000000
mean 1803.00000 174.142857 74.657143 61.351429
std 536.87741 13.541098 12.895377 19.915164
min 1101.00000 155.000000 53.000000 31.500000
25% 1204.50000 161.000000 63.000000 47.400000
50% 2103.00000 173.000000 74.000000 61.700000
75% 2301.50000 187.500000 82.000000 77.100000
max 2405.00000 195.000000 100.000000 97.000000
可以自行选择分位数
df.describe(percentiles=[.05, .25, .75, .95])
ID Height Weight Math
count 35.00000 35.000000 35.000000 35.000000
mean 1803.00000 174.142857 74.657143 61.351429
std 536.87741 13.541098 12.895377 19.915164
min 1101.00000 155.000000 53.000000 31.500000
5% 1102.70000 157.000000 56.100000 32.640000
25% 1204.50000 161.000000 63.000000 47.400000
50% 2103.00000 173.000000 74.000000 61.700000
75% 2301.50000 187.500000 82.000000 77.100000
95% 2403.30000 193.300000 97.600000 90.040000
max 2405.00000 195.000000 100.000000 97.000000
对于非数值型也可以用describe函数
df[‘Physics’].describe()
count 35
unique 7
top B+
freq 9
Name: Physics, dtype: object
5. idxmax和nlargest
idxmax函数返回最大值，在某些情况下特别适用，idxmin功能类似
df[‘Math’].idxmax()
5
nlargest函数返回前几个大的元素值，nsmallest功能类似
df[‘Math’].nlargest(3)
5 97.0
28 95.5
11 87.7
Name: Math, dtype: float64
6. clip和replace
clip和replace是两类替换函数
clip是对超过或者低于某些值的数进行截断
df[‘Math’].head()
0 34.0
1 32.5
2 87.2
3 80.4
4 84.8
Name: Math, dtype: float64
df[‘Math’].clip(33,80).head()
0 34.0
1 33.0
2 80.0
3 80.0
4 80.0
Name: Math, dtype: float64
df[‘Math’].mad()
16.924244897959188
replace是对某些值进行替换
df[‘Address’].head()
0 street_1
1 street_2
2 street_2
3 street_2
4 street_4
Name: Address, dtype: object
df[‘Address’].replace([‘street_1’,‘street_2’],[‘one’,‘two’]).head()
0 one
1 two
2 two
3 two
4 street_4
Name: Address, dtype: object
通过字典，可以直接在表中修改
df.replace({‘Address’:{‘street_1’:‘one’,‘street_2’:‘two’}}).head()
School Class ID Gender Address Height Weight Math Physics
0 S_1 C_1 1101 M one 173 63 34.0 A+
1 S_1 C_1 1102 F two 192 73 32.5 B+
2 S_1 C_1 1103 M two 186 82 87.2 B+
3 S_1 C_1 1104 F two 167 81 80.4 B-
4 S_1 C_1 1105 F street_4 159 64 84.8 B+
7. apply函数
apply是一个自由度很高的函数，在第3章我们还要提到
对于Series，它可以迭代每一列的值操作：
df[‘Math’].apply(lambda x:str(x)+’!’).head() #可以使用lambda表达式，也可以使用函数
0 34.0!
1 32.5!
2 87.2!
3 80.4!
4 84.8!
Name: Math, dtype: object
对于DataFrame，它可以迭代每一个列操作：
df.apply(lambda x:x.apply(lambda x:str(x)+’!’)).head() #这是一个稍显复杂的例子，有利于理解apply的功能
School Class ID Gender Address Height Weight Math Physics
0 S_1! C_1! 1101! M! street_1! 173! 63! 34.0! A+!
1 S_1! C_1! 1102! F! street_2! 192! 73! 32.5! B+!
2 S_1! C_1! 1103! M! street_2! 186! 82! 87.2! B+!
3 S_1! C_1! 1104! F! street_2! 167! 81! 80.4! B-!
4 S_1! C_1! 1105! F! street_4! 159! 64! 84.8! B+!
四、排序

索引排序
df.set_index(‘Math’).head() #set_index函数可以设置索引，将在下一章详细介绍
School Class ID Gender Address Height Weight Physics
Math
34.0 S_1 C_1 1101 M street_1 173 63 A+
32.5 S_1 C_1 1102 F street_2 192 73 B+
87.2 S_1 C_1 1103 M street_2 186 82 B+
80.4 S_1 C_1 1104 F street_2 167 81 B-
84.8 S_1 C_1 1105 F street_4 159 64 B+
df.set_index(‘Math’).sort_index().head() #可以设置ascending参数，默认为升序，True
School Class ID Gender Address Height Weight Physics
Math
31.5 S_1 C_3 1301 M street_4 161 68 B+
32.5 S_1 C_1 1102 F street_2 192 73 B+
32.7 S_2 C_3 2302 M street_5 171 88 A
33.8 S_1 C_2 1204 F street_5 162 63 B
34.0 S_1 C_1 1101 M street_1 173 63 A+
值排序
df.sort_values(by=‘Class’).head()
School Class ID Gender Address Height Weight Math Physics
0 S_1 C_1 1101 M street_1 173 63 34.0 A+
19 S_2 C_1 2105 M street_4 170 81 34.2 A
18 S_2 C_1 2104 F street_5 159 97 72.2 B+
16 S_2 C_1 2102 F street_6 161 61 50.6 B+
15 S_2 C_1 2101 M street_7 174 84 83.3 C
多个值排序，即先对第一层排，在第一层相同的情况下对第二层排序
df.sort_values(by=[‘Address’,‘Height’]).head()
School Class ID Gender Address Height Weight Math Physics
0 S_1 C_1 1101 M street_1 173 63 34.0 A+
11 S_1 C_3 1302 F street_1 175 57 87.7 A-
23 S_2 C_2 2204 M street_1 175 74 47.2 B-
33 S_2 C_4 2404 F street_2 160 84 67.7 B
3 S_1 C_1 1104 F street_2 167 81 80.4 B-

jvm虚拟机详解（一）-----jvm概述 Mir Su JVM由浅至深 jvm java
写在前面本篇文章是再下人生中的第一次发布关于技术相关的文章。从事开发工作这么多年来，也算是对自己过往的工作的一个总结，对人生的一次重装再出发。从jvm谈起，然后是关于mysql、redis、消息中间件、微服务等最后在归纳一些常见的java面试方面的高频问题。这是开始我的一个写博计划，希望感兴趣的朋友加个关注一起探讨，有什么不做的地方也请欢迎指教。为什么要先说jvm呢？因为jvm是java程序蜕变的
图论篇--代码随想录算法训练营第五十七天打卡| 最小生成树问题無量空所 leetcode 算法图论数据结构 c++学习
题目链接：53.寻宝（第七期模拟笔试）题目描述：在世界的某个区域，有一些分散的神秘岛屿，每个岛屿上都有一种珍稀的资源或者宝藏。国王打算在这些岛屿上建公路，方便运输。不同岛屿之间，路途距离不同，国王希望你可以规划建公路的方案，如何可以以最短的总公路距离将所有岛屿联通起来（注意：这是一个无向图）。给定一张地图，其中包括了所有的岛屿，以及它们之间的距离。以最小化公路建设长度，确保可以链接到所有岛屿。解题
uni-app adb安卓wifi无线调试景影随形 uni-app 网络错误
方法一adbconnect连接调试前提条件：电脑已安装adb工具手机和电脑连接的同一个WIFICMD进入到adb工具所在目录，可以使用HBuilder自带adb，如：D:\Tools\HBuilderX\plugins\launcher\tools\adbs，也可以使用AndroidSDK的adb。注意，第一次连接需要执行第一步和第二步，让手机监听5555端口，后续手机会自动监听5555端口，不需
利用Beautiful Soup和Pandas进行网页数据抓取与清洗处理实战傻啦嘿哟 pandas
目录一、准备工作二、抓取网页数据三、数据清洗四、数据处理五、保存数据六、完整代码示例七、总结在数据分析和机器学习的项目中，数据的获取、清洗和处理是非常关键的步骤。今天，我们将通过一个实战案例，演示如何利用Python中的BeautifulSoup库进行网页数据抓取，并使用Pandas库进行数据清洗和处理。这个案例不仅适合初学者，也能帮助有一定经验的朋友快速掌握这两个强大的工具。一、准备工作在开始之
mac下docker搭建nginx+php+mysql,并实现nginx负载均衡自娱自乐22 macos docker nginx 负载均衡 php
一环境系统：macOSSonoma14.3芯片：AppleM3Prodocker版本：25.0.5二软件OrbStack[推荐，一款轻量化的docker管理软件，还是docker的命令]item2三步骤拉取nginx镜像dockerpullnginx新建一个nginx容器dockerrun--namenginx5-d-p80:80nginx确认nginx内部的目录[第一次一定要确认下目录]-配置目
Python:数据从Excel表格链接到Word文档更新Excel即可自动更新Word 一个花生米生花 python excel word
要使用Python来创建或更新一个Word文档，并将数据从Excel表格链接到Word文档中，你可以使用python-docx库来操作Word文档和openpyxl或pandas库来读取Excel文件。不过，需要注意的是，python-docx库并不支持将外部文件链接到Word文档的功能。你可以在Word文档中插入Excel数据的快照，但它们不会自动更新。如果你想要在Word文档中插入Excel数
Redis架构之主从复制云雨殇 Redis redis 架构 java
Redis主从架构主从集群，实现读写分离主从数据同步主从同步流程slave节点向master节点发送replicaof命令建立连接，随后发送psync{repID}{offset}指令，repID表示主节点唯一标识，offset为复制偏移量。如果是第一次同步，那么repID是?，offset是-1。即psync?-1master节点收到了psync命令后，会响应slave节点并发送fullresy
ES6模块化(对比commonjs模块化) zvapour javascript
ES6模块化common.js对比CommonJS运行时加载–>只有运行时才能得到这个对象(module.exports的对象)在第一次加载之后会被缓存，引入的是缓存中的值//若需要动态更新，使用gettercount=1;module.exports={getcount(){returncount;},plusCoun
python panda下载_pandas python下载|Pandas for python v0.25.0官方版 v0.25.0官方版 - 哩咯下载站... weixin_39647458 python panda下载
Pandas是python的数据分析包，最初被作为金融数据分析工具而开发出来，提供pandas.whl包下载，有需要的赶快下载吧！软件介绍Pandas是python的一个数据分析包，最初由AQRCapitalManagement于2008年4月开发，并于2009年底开源出来，目前由专注于Python数据包开发的PyData开发team继续开发和维护，属于PyData项目的一部分。Pandas最初被
3. Python的变量 bai666ai Python语言入门 python 开发语言后端人工智能
《Python编程的术与道：Python语言入门》视频课程《Python编程的术与道：Python语言入门》视频课程链接：https://edu.csdn.net/course/detail/27845变量（Variable）变量用于存储数据值。与其它编程语言不同，Python没有用于声明变量的命令。变量是在第一次为其赋值时创建的。变量赋值变量赋值有三部分构成。#变量名赋值符号变量值message
python获取金融数据_使用Python获取金融数据 weixin_39545102 python获取金融数据
俗话说，“巧媳妇难为无米之炊”。做金融数据研究，首先要有可用的数据源。Python下，pandas_datareader模块可以用于获取研究数据。例子如下：>>>frompandas_datareader.dataimportDataReader>>>>>>datas=DataReader(name='AAPL',data_source='yahoo',start='2018-01-01')>>>
C++中memset函数的用法 MatthewMao C++使用积累 C语言使用积累 C++memset函数初始化字符串或
//复习数组的时候，第一次见到了memset，学之。memset：char型初始化函数头文件：或函数原型：void*memset(void*s,intch,size_tn)memset(结构体/数组名,用于替换的ASCII码对应字符,前n个字符);memset(结构体/数组名,"用于替换的字符“,前n个字符);函数解释：将s中的前n个字节用ch替换并且返回s函数作用：在一段内存块中填充某一个给定的
Python爬虫实战：获取笔趣阁图书信息，并做数据分析 ylfhpy 爬虫 python 爬虫数据分析
注意：以下内容仅供技术研究，请遵守目标网站的robots.txt规定，控制请求频率避免对目标服务器造成过大压力！1.环境准备与反爬策略pythonimportrequestsfrombs4importBeautifulSoupimportpandasaspdimportreimporttimeimportrandomfromfake_useragentimportUserAgent#需安装：pip
python文件操作相关（csv） Colin♛ python python 开发语言学习笔记
python文件操作相关（csv）1.csv模块读取CSV文件读取CSV文件并转换为字典写入CSV文件写入CSV文件并使用字典2.pandas库读取CSV文件读取特定列写入CSV文件写入CSV文件并指定分隔符3.其他高级功能处理大文件读取数据数据清洗参考资料在Python中，操作CSV文件通常使用csv模块和pandas库，这两个工具提供了丰富的功能，可以方便地读取、写入和处理CSV文件1.csv
Python在实际工作中的运用-拆分Excel表格老胖闲聊 Python excel python
每次遇到表格按地区、按行数进行拆分都特别麻烦，每次都搞的头昏眼花，还容易出错，现在有了Python实在是各位“表哥”们的福音，下面我们就按行数和sheet两种场景来说明吧。首先需要安装openpyxl和pandaspipinstallopenpyxlpandas按行数拆分.pyimportopenpyxlimportosxlsfile="E:/表格目录/带拆分表格.xlsx"#加载现有的Excel
python csv文件写入（推荐） lxin_ooo python csv python
python将数据写入到.csv文件里importjsonimportosimportcsvclassSaveCSV(object):defsave(self,keyword_list,path,item):try:#第一次打开文件时，第一行写入表头ifnotos.path.exists(path):withopen(path,"w",newline='',encoding='utf-8')asc
Java程序员面临抉择：激烈竞争下，转行大模型或是新出路，非常详细收藏我这一篇就够了！大模型教程大模型学习学习大模型语言模型人工智能程序员转行
Java程序员转行大模型领域，可以依据以下详细路线进行学习和职业转换：第1阶段：基础知识巩固数学基础：线性代数：矩阵运算、向量空间等。概率论与统计：概率分布、统计推断等。微积分：导数、积分、多变量函数等。Python编程：Python基础：数据类型、控制结构、函数等。Python进阶：面向对象编程、装饰器、生成器等。数据处理：NumPy、Pandas、Matplotlib。第2阶段：机器学习与深度
python高效使用16---sort_values排序需要万分警惕的问题云金杞 python高效使用方法 python 开发语言
sort_values函数需要万分警惕的问题背景今天在优化empyrical模块的时候，发现在win11上测试通过的测试用例，在ubuntu18.04上测试失败了，通过定位发现是sort_values惹得祸。在使用pandas.sort_values(by=“value1”)的时候，value1如果有相同值，在默认排序算法下，排序后的结果在windows上和ubuntu上结果可能不一样。例子git
r720换固态硬盘后如何重装系统_联想拯救者 R720 换装三星 960PRO 512G固态硬盘、重做系统与测试... weixin_39583222
联想拯救者R720换装三星960PRO512G固态硬盘、重做系统与测试2017-07-2410:00:0031点赞156收藏86评论R屏、SSD、机械键盘乃近10年以来用过了就再也用不回去的三项败家科技.....用的第一块固态硬盘是英睿达M550120G，当时是换到笔记本里面的，第一次用的时候，爽呆了！感觉整个世界都起飞了！后来给台式机装了850Pro256G，又装了一块英睿达MX200250G，
c++中std::thread构造函数的注意事项阳洞洞 c++开发语言
目录一、问题引出二、示例代码及输出结果三、详细解释1.关键点解析1.1第一次拷贝构造：临时对象（mData=101）1.2第二次拷贝构造：线程内部存储对象（mData=102）1.3第三次拷贝构造：线程函数参数p4（mData=103）2.析构顺序验证3.结论4.验证构造和析构发生在哪个线程5.看给Foo添加移动构造函数后的效果一、问题引出函数原型详见https://en.cppreference
【Pandas】pandas Series isin liuweidong0802 Pandas Series pandas python
Pandas2.2SeriesComputationsdescriptivestats方法描述Series.align(other[,join,axis,level,…])用于将两个Series对齐，使其具有相同的索引Series.case_when(caselist)用于根据条件列表对Series中的元素进行条件判断并返回相应的值Series.drop([labels,axis,index,co
从Pandas DataFrame中删除一列李星星BruceL 问题集 pandas python
在Pandas中执行此操作的最佳方式是使用drop：df=df.drop('column_name',axis=1)其中1是轴编号（0表示行，1表示列）。或者，drop()方法接受index/columns关键字作为指定轴的替代方法。因此，我们现在可以只做：df=df.drop(columns=['column_nameA','column_nameB'])要删除列而不必重新分配df，可以执行以下
编程小白冲Kaggle每日打卡（8）--kaggle学堂：＜Python＞列表 AZmax01 编程小白冲Kaggle每日打卡 python windows 开发语言
Kaggle课程官方链接：Lists本专栏旨在Kaggle官方课程的汉化，让大家更方便地看懂。Lists¶列表以及你可以用它们做的事情。包括索引、切片和变异Python中的列表表示值的有序序列。以下是一个如何创建它们的示例：primes=[2,3,5,7]我们可以把其他类型的东西放在列表中：planets=['Mercury','Venus','Earth','Mars','Jupiter','S
javascript 常见设计模式 smiley121 javascript 设计模式
什么是设计模式?在软件开发中，设计模式是解决特定问题的经验总结和可复用的解决方案。设计模式可以提高代码的复用性、可维护性和可读性，是提高开发效率的重要手段。单例模式1.概念单例模式（SingletonPattern），保证一个类只有一个实例，并提供一个访问它的全局访问点。也就是说，第二次使用同一个类创建新对象的时候，应该得到与第一次创建的对象完全相同的对象。2.代码实现classSingleton
PMP知识点综合测试：150道易错习题和知识点汇总快乐骑行^_^ PMP项目管理软考高级信息系统项目管理师考试 PMP知识点综合测试百道易错习题和知识点汇总
PMP知识点综合测试：150道易错习题和知识点汇总1.项目建设过程中需要进行多次采购。现在，项目团队已经完成第一次采购。团队成员希望总结第一次采购中的经验和问题，以便改进以后的采购工作。项目经理应该如何指导团队成员的行动？A:要求团队在完成至少3次采购后再来一起总结B:要求团队立即开展审计C:要求团队把所发现的问题记录在问题日志中D:要求团队立即更新组织过程资产答案解析：采购审计是甲方或乙方对自己
使用Python编写你的第一个算法交易程序盼达思文体科创 Python量化金融 python 算法 numpy conda pandas 金融
背景Background最近想学习一下量化金融，总算在盈透投资者教育（IBKRCampus）板块找到一篇比较好的算法交易入门教程。我在记录实践过程后，翻译成中文写成此csdn博客，分享给大家。如果你的英语好可以直接看原文。原文在数据准备阶段，采用了pandas_datareader.data读取网络数据，实际中出现了很多问题，我换成了yfinance。可以参考文末完整代码。参考资料：https:/
机器学习基本库之Pandas 莫名其妙 pandas 机器学习 python 数据分析
Pandas是机器学习中专门用于数据处理的库，遇到很多数据时首先要使用Pandas进行预处理得到我们想要的信息，下面让我们来看一下Pandas中有哪些操作importpandasfood_info=pandas.read_csv("food_info.csv")#将csv文件中的数据进行读取print(type(food_info))#pandas中的核心结构叫做DATAFRAMEprint(fo
AI大模型学习之白话笔记（一）-- GPT和LLM Langchain 人工智能学习笔记 langchain python 机器人大模型
前言2022年底第一次听说chatGPT,从最初的对话，到如今的文生视频Sora，带来的效果，越来越超出我们的想象。在2023年，我尝试去了解GPT可以干什么，有什么作用，该怎么用，不过变化太快，最终也没有找到一个好的方式干进去。为什么变化这么快，说到底，是AI大模型带来的巨变。现在很多大厂都在降薪裁员，也有不少公司在AllinAI，我们都有一个预感，要变天了。你想想，如果有一天，一款游戏的所有美
深度揭秘：我们是如何设计一个每天同步万亿数据的神器 - SeaTunnel架构解密数据库
"设计一个能支撑万亿级数据同步的系统挑战有多大？来告诉你一个从0到1的故事..."一个深夜的求助2021年的一个深夜，正准备关电脑休息，一个运维电话打了进来："救命！整个数据同步系统都崩溃了，3000多张表的同步全部积压，业务系统已经开始报警了..."电话那头是业务线技术负责人，声音中带着焦虑。这不是数据平台第一次接到类似求助，但这次的规模确实让人吃惊：数据规模：每天新增100TB+同步需求：30
python_excel批量插入图片 ramsey17 python excel
提取excel的指定列的值的后4位（数值），在其它列名的单元格中，批量嵌入与该数值匹配的图片（未实现居中），每间隔4行处理一次（合并过单元格）。importpandasaspdfromopenpyxlimportload_workbookfromopenpyxl.drawing.imageimportImagefromopenpyxl.utilsimportget_column_letterimp
html 周华华 html
js 1，数组的排列 var arr=[1,4,234,43,52,]; for(var x=0;x<arr.length;x++){ for(var y=x-1;y<arr.length;y++){ if(arr[x]<arr[y]){ &
【Struts2 四】Struts2拦截器 bit1129 struts2拦截器
Struts2框架是基于拦截器实现的，可以对某个Action进行拦截，然后某些逻辑处理，拦截器相当于AOP里面的环绕通知，即在Action方法的执行之前和之后根据需要添加相应的逻辑。事实上，即使struts.xml没有任何关于拦截器的配置，Struts2也会为我们添加一组默认的拦截器，最常见的是，请求参数自动绑定到Action对应的字段上。 Struts2中自定义拦截器的步骤是：
make:cc 命令未找到解决方法 daizj linux 命令未知 make cc
安装rz sz程序时，报下面错误： [root@slave2 src]# make posix cc -O -DPOSIX -DMD=2 rz.c -o rz make: cc：命令未找到 make: *** [posix] 错误 127 系统：centos 6.6 环境：虚拟机错误原因：系统未安装gcc，这个是由于在安
Oracle之Job应用周凡杨 oracle job
最近写服务，服务上线后，需要写一个定时执行的SQL脚本，清理并更新数据库表里的数据，应用到了Oracle 的 Job的相关知识。在此总结一下。一：查看相关job信息 1、相关视图 dba_jobs all_jobs user_jobs dba_jobs_running 包含正在运行
多线程机制朱辉辉33 多线程
转至http://blog.csdn.net/lj70024/archive/2010/04/06/5455790.aspx 程序、进程和线程：程序是一段静态的代码，它是应用程序执行的蓝本。进程是程序的一次动态执行过程，它对应了从代码加载、执行至执行完毕的一个完整过程，这个过程也是进程本身从产生、发展至消亡的过程。线程是比进程更小的单位，一个进程执行过程中可以产生多个线程，每个线程有自身的
web报表工具FineReport使用中遇到的常见报错及解决办法（一）老A不折腾 web报表 finereport java报表报表工具
FineReport使用中遇到的常见报错及解决办法（一）这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、address pool is full：含义：地址池满，连接数超过并发数上
mysql rpm安装后没有my.cnf 林鹤霄没有my.cnf
Linux下用rpm包安装的MySQL是不会安装/etc/my.cnf文件的，至于为什么没有这个文件而MySQL却也能正常启动和作用，在这儿有两个说法，第一种说法，my.cnf只是MySQL启动时的一个参数文件，可以没有它，这时MySQL会用内置的默认参数启动，第二种说法，MySQL在启动时自动使用/usr/share/mysql目录下的my-medium.cnf文件，这种说法仅限于r
Kindle Fire HDX root并安装谷歌服务框架之后仍无法登陆谷歌账号的问题 aigo root
原文：http://kindlefireforkid.com/how-to-setup-a-google-account-on-amazon-fire-tablet/ Step 4: Run ADB command from your PC On the PC, you need install Amazon Fire ADB driver and instal
javascript 中var提升的典型实例 alxw4616 JavaScript
// 刚刚在书上看到的一个小问题,很有意思.大家一起思考下吧 myname = 'global'; var fn = function () { console.log(myname); // undefined var myname = 'local'; console.log(myname); // local }; fn() // 上述代码实际上等同于以下代码 m
定时器和获取时间的使用百合不是茶时间的转换定时器
定时器:定时创建任务在游戏设计的时候用的比较多 Timer();定时器 TImerTask();Timer的子类由 Timer 安排为一次执行或重复执行的任务。定时器类Timer在java.util包中。使用时，先实例化，然后使用实例的schedule(TimerTask task, long delay)方法，设定
JDK1.5 Queue bijian1013 java thread java多线程 Queue
JDK1.5 Queue LinkedList： LinkedList不是同步的。如果多个线程同时访问列表，而其中至少一个线程从结构上修改了该列表，则它必须保持外部同步。（结构修改指添加或删除一个或多个元素的任何操作；仅设置元素的值不是结构修改。）这一般通过对自然封装该列表的对象进行同步操作来完成。如果不存在这样的对象，则应该使用 Collections.synchronizedList 方
http认证原理和https bijian1013 http https
一.基础介绍在URL前加https://前缀表明是用SSL加密的。你的电脑与服务器之间收发的信息传输将更加安全。 Web服务器启用SSL需要获得一个服务器证书并将该证书与要使用SSL的服务器绑定。 http和https使用的是完全不同的连接方式，用的端口也不一样,前者是80，后
【Java范型五】范型继承 bit1129 java
定义如下一个抽象的范型类，其中定义了两个范型参数，T1，T2 package com.tom.lang.generics; public abstract class SuperGenerics<T1, T2> { private T1 t1; private T2 t2; public abstract void doIt(T
【Nginx六】nginx.conf常用指令(Directive) bit1129 Directive
1. worker_processes 8; 表示Nginx将启动8个工作者进程，通过ps -ef|grep nginx,会发现有8个Nginx Worker Process在运行 nobody 53879 118449 0 Apr22 ? 00:26:15 nginx: worker process
lua 遍历Header头部 ronin47 lua header 遍历　
local headers = ngx.req.get_headers() ngx.say("headers begin", "<br/>") ngx.say("Host : ", he
java-32.通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小(两数组的差最小)。 bylijinnan java
import java.util.Arrays; public class MinSumASumB { /** * Q32.有两个序列a,b，大小都为n,序列元素的值任意整数，无序. * * 要求：通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小。 * 例如: * int[] a = {100,99,98,1,2,3
redis 开窍的石头 redis
在redis的redis.conf配置文件中找到# requirepass foobared 把它替换成requirepass 12356789 后边的12356789就是你的密码打开redis客户端输入config get requirepass 返回 redis 127.0.0.1:6379> config get requirepass 1) "require
[JAVA图像与图形]现有的GPU架构支持JAVA语言吗？ comsci java语言
无论是opengl还是cuda，都是建立在C语言体系架构基础上的，在未来，图像图形处理业务快速发展，相关领域市场不断扩大的情况下，我们JAVA语言系统怎么从这么庞大，且还在不断扩大的市场上分到一块蛋糕，是值得每个JAVAER认真思考和行动的事情
安装ubuntu14.04登录后花屏了怎么办 cuiyadll ubuntu
这个情况，一般属于显卡驱动问题。可以先尝试安装显卡的官方闭源驱动。按键盘三个键：CTRL + ALT + F1 进入终端，输入用户名和密码登录终端：安装amd的显卡驱动 sudo apt-get install fglrx 安装nvidia显卡驱动 sudo ap
SSL 与数字证书的基本概念和工作原理 darrenzhu 加密 ssl 证书密钥签名
SSL 与数字证书的基本概念和工作原理 http://www.linuxde.net/2012/03/8301.html SSL握手协议的目的是或最终结果是让客户端和服务器拥有一个共同的密钥，握手协议本身是基于非对称加密机制的，之后就使用共同的密钥基于对称加密机制进行信息交换。 http://www.ibm.com/developerworks/cn/webspher
Ubuntu设置ip的步骤 dcj3sjt126com ubuntu
在单位的一台机器完全装了Ubuntu Server，但回家只能在XP上VM一个，装的时候网卡是DHCP的，用ifconfig查了一下ip是192.168.92.128,可以ping通。转载不是错： Ubuntu命令行修改网络配置方法 /etc/network/interfaces打开后里面可设置DHCP或手动设置静态ip。前面auto eth0，让网卡开机自动挂载. 1. 以D
php包管理工具推荐 dcj3sjt126com PHP Composer
http://www.phpcomposer.com/ Composer是 PHP 用来管理依赖（dependency）关系的工具。你可以在自己的项目中声明所依赖的外部工具库（libraries），Composer 会帮你安装这些依赖的库文件。中文文档入门指南下载安装包列表 Composer 中国镜像
Gson使用四（TypeAdapter） eksliang json gson Gson自定义转换器 gsonTypeAdapter
转载请出自出处：http://eksliang.iteye.com/blog/2175595 一.概述 Gson的TypeAapter可以理解成自定义序列化和返序列化二、应用场景举例例如我们通常去注册时（那些外国网站），会让我们输入firstName，lastName,但是转到我们都
JQM控件之Navbar和Tabs gundumw100 html xml css
在JQM中使用导航栏Navbar是简单的。只需要将data-role="navbar"赋给div即可： <div data-role="navbar"> <ul> <li><a href="#" class="ui-btn-active&qu
利用归并排序算法对大文件进行排序 iwindyforest java 归并排序大文件分治法 Merge sort
归并排序算法介绍，请参照Wikipeida zh.wikipedia.org/wiki/%E5%BD%92%E5%B9%B6%E6%8E%92%E5%BA%8F 基本思想：大文件分割成行数相等的两个子文件，递归（归并排序）两个子文件，直到递归到分割成的子文件低于限制行数低于限制行数的子文件直接排序两个排序好的子文件归并到父文件直到最后所有排序好的父文件归并到输入
iOS UIWebView URL拦截啸笑天 UIWebView
本文译者：candeladiao，原文：URL filtering for UIWebView on the iPhone说明：译者在做app开发时，因为页面的javascript文件比较大导致加载速度很慢，所以想把javascript文件打包在app里，当UIWebView需要加载该脚本时就从app本地读取，但UIWebView并不支持加载本地资源。最后从下文中找到了解决方法，第一次翻译，难免有
索引的碎片整理SQL语句 macroli sql
SET NOCOUNT ON DECLARE @tablename VARCHAR (128) DECLARE @execstr VARCHAR (255) DECLARE @objectid INT DECLARE @indexid INT DECLARE @frag DECIMAL DECLARE @maxfrag DECIMAL --设置最大允许的碎片数量,超过则对索引进行碎片
Angularjs同步操作http请求with $promise qiaolevip 每天进步一点点学习永无止境 AngularJS 纵观千象
// Define a factory app.factory('profilePromise', ['$q', 'AccountService', function($q, AccountService) { var deferred = $q.defer(); AccountService.getProfile().then(function(res) {
hibernate联合查询问题 sxj19881213 sql Hibernate HQL 联合查询
最近在用hibernate做项目，遇到了联合查询的问题，以及联合查询中的N+1问题。针对无外键关联的联合查询，我做了HQL和SQL的实验，希望能帮助到大家。（我使用的版本是hibernate3.3.2） 1 几个常识：（1）hql中的几种join查询，只有在外键关联、并且作了相应配置时才能使用。（2）hql的默认查询策略，在进行联合查询时，会产
struts2.xml wuai struts
<?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache

PANDAS第一次打卡

（b）访问Series属性

Column Non-Null Count Dtype

你可能感兴趣的:(PANDAS第一次打卡)