Chen的博客

Pandas学习笔记(一)

Pandas学习笔记一

Pandas数组读取
- 读取csv、tsv、txt文件
- 读取excel文件
- 读取mysql数据表
Pandas数据结构
- 创建Series的几种方法
- 根据标签查询Series数据
- DataFrame
- 根据字典序列创建DataFrame
Pandas数据查询的五种方法
Pandas新增数据列
- 直接赋值法
- df.apply方法
- df.assign方法
- 按条件选择分组分别赋值
Pandas数据统计函数
- 汇总类统计
- 唯一去重和按照值计数
- 相关系数与协方差
Pandas对缺失值的处理
Setting With Copy Warning报警复现、原因、解决方案
Pandas对数据排序
- 对Series排序
- 对DataFrame排序
Pandas字符串处理
Pandas的axis参数
Pandas 数据合并concat

head() tatil()查看前几行、后几行
shape查看形状（成员变量）
column列名（成员变量）
[column for column in df所有列 列名

Pandas数组读取

Pandas读取表格类型的数据

csv、tsv、txt   用逗号分割、tab分割的纯文本文件   pd.read_csv
excel          微软xls或者xlsx文件             pd.read_excel
mysql          关系型数据库表                  pd.read_sql

读取csv、tsv、txt文件

import pandas as pd
fpath=r"文件路径.csv"#读取csv文件
ratings=pd.read_csv(fpath)

ratings.head()#显示数据前几行
ratings.shape#返回数据行列数
ratings.columns#返回列名列表
ratings.index#查看索引列
ratings.dtypes#查看每列的数据类型

fpath=r"文件路径.txt"#读取txt文件
ratings=pd.read_csv(
    fpath,#路径
    sep="\t",#设置列分割符
    header=None,#设置无标题行
    names=["第一列","第二列","第三列"]#自己设定的列名
)

读取excel文件

fpath=r"文件路径.xlsx"
ratings=pd.read_excel(fpath)

读取mysql数据表

import pymysql
conn=pymysql.connect(
    host="120.0.0.1",
    user="root",
    password="****",#数据库密码
    database="***",#数据库名
    charset="utf8"
)

mysql_page=pd.read_sql("select * from 表名",con=conn)

Pandas数据结构

创建Series的几种方法

Series是一种类似一维数组的对象，它由一组数据（不同数据类型）以及一组与之相关的数据标签(即索引)组成。

import numpy as np
import pandas as pd
#1.由列表创建
s=pd.Series([1,'s',5.2,7])
s
>>>
0      1
1      s
2    5.2
3      7
dtype: object

s.index#获取索引
>>>RangeIndex(start=0, stop=4, step=1)
s.values#获取数据
>>>array([1, 's', 5.2, 7], dtype=object)

#2.创建时指定index
s=pd.Series([1,'s',5.2,7],index=['a','b','c','d'])
s
>>>
a      1
b      s
c    5.2
d      7
dtype: object

# 3.使用字典创建Series
s={'a':23,'b':324,'c':896,'d':853}
ss=pd.Series(s)
ss
>>>
a     23
b    324
c    896
d    853
dtype: int64

根据标签查询Series数据

访问Series数据的方法与访问自字典数据的方法类似：
ss['a']
>>>23
ss[['a','b','c']]
>>>
a     23
b    324
c    896
dtype: int64

DataFrame

DataFrame是一个表格类型的数据
1.列之间可以是不同的数据类型
2.既有行索引index也有列索引columns
3.可以看作由Series组成的字典

根据字典序列创建DataFrame

data={
    'state':['a','b','c','d'],
    'year':[2022,2023,2024,2025],
    'pop':[1.2,1.5,1.7,2.1]
}
df=pd.DataFrame(data)
df

查看类型

df.columns#返回列名
>>>
Index(['state', 'year', 'pop'], dtype='object')

df.index#返回行数据
>>>
RangeIndex(start=0, stop=4, step=1)

查询列

#查询一列
df['year']
>>>
0    2022
1    2023
2    2024
3    2025
Name: year, dtype: int64
#查询多列，结果是pd.DataFrame
df[['year','pop']]#和Series相似
>>>
	year	pop
0	2022	1.2
1	2023	1.5
2	2024	1.7
3	2025	2.1

查询行

#查询一行，结果是pd.Series
df.loc[1]
>>>
state       b
year     2023
pop       1.5
Name: 1, dtype: object
#查询多行，结果是pd.DataFrame
df.loc[1:3]#切片包含末尾
>>>
	state	year	pop
1	b	2023	1.5
2	c	2024	1.7
3	d	2025	2.1

查询一列返回Series，index为行名；查询一行也返回Series，index为列名

Pandas数据查询的五种方法

1.df.loc方法,根据行、列的标签查询
2.df.iloc方法，根据行、列的数字位置查询
3.df.where方法
4.df.query方法
.loc既能查询又能写入

Panda使用df.loc查询数据的方法
1.使用单个label查询
2.使用值列表批量查询
3.使用数值区间进行范围查询
4.使用条件表达式查询
5.调用函数查询
---这五种方法既适用于行，又实用于列

df.set_index('列1',inplace=True)#重新设置列1为新的行索引

去除温度的符号后缀

df.loc[:,"bWendu"]=df["bWendu"].str.replace("℃","").astype(int32)
df.loc[:,"yWendu"]=df["yWendu"].str.replace("℃","").astype(int32)

1.使用单个label查询

#查询单个值
df.loc['2018-01-03','bWendu']
# 指定多个列
df.loc['2018-01-03',['bWendu','yWendu']]
返回Series类型

2.使用值列表批量查询

df.loc(['2018-01-03','2018-01-04','2018-01-05'],'bWendu')#返回Series

df.loc(['2018-01-03','2018-01-04','2018-01-05'],['bWendu','yWendu'])#返回DataFrame

3.使用数值区间进行范围查询

注意:区间既包含开始也包含结束

df.loc['2018-01-03':'2018-01-05','bWendu']#行区间

df.loc['2018-01-03','bWendu':'fengxiang']#列区间

df.loc['2018-01-03':'2018-01-05','bWendu':'fengxiang']#行列都为区间

4.使用条件表达式查询

传入bool列表，长度等于行数或列数

#查询全年最低温度低于-10度的列表
df.loc[df["yWendu"]<-10,:]
#df["yWendu"]返回bool数组

查询结果：

#查询全年最高温度小于30度，并且最低温度大于15度，并且是晴天，并且天气为优的数据
df.loc[(df["bWendu"]<=30)&(df["yWendu"]>=15)&(df['tianqi']=='晴')&(df['aqiLevel']==1),:]

5.调用函数查询

#直接写lambad表达式
df.loc[lambda df:(df['bWendu']<=30) & (df['yWendu']>=15),:]

#编写函数，查询九月份，空气质量好的数据
def query_my_data(df):
    return df.index.str.startswith("2018-09") & df["aqiLevel"]==1

df.loc[query_my_data,:]

Pandas新增数据列

直接赋值、apply、assign、分条件赋值

直接赋值法

import numpy as np
import pandas as pd
fpath=r"文件路径"
df=pd.read_excel(fpath)
df.head()

修改列

#直接赋值法
#实例：清理温度列，去除℃，变成数字类型
#直接赋值法
#实例：清理温度列，变成字符类型
df.loc[:,"pv"]=df["pv"].str.replace("℃",'').astype('int32')
df.head()

新增列

df.loc[:,'pv-uv']=df['pv']-df['uv']#两Series按照其index相减
df.head()

df.apply方法

传给该函数的对象为Series,沿着DataFrame的某个轴(axis)增加
def get_wendu_type(x):
    if x["bWendu"]>33:
        return '高温'
    if x["yWendu"]<-10:
        return '低温'
    return '常温'
df.loc[:,'wendu_type']=df.apply(get_wendu_type,axis=1)

df.assign方法

#可以同时新增多个列
df.assign(
	yWendu_huashi=lambda x: x['yWendu']*9/5+32,#也可以单独写一个函数，向上面那种
    bWendu_huashi=lambda x: x['bWendu']*9/5+32
)

按条件选择分组分别赋值

#实例：高低温差大于10度，则认为温差大
df['wencha_type']=''#pandas广播机制
df.loc[df['bWendu']-df["yWendu"]>10,"wencha_type"]="温差大"
df.loc[df['bWendu']-df["yWendu"]<=10,"wencha_type"]="温差小"

Pandas数据统计函数

1.汇总类统计
2.唯一去重和按值计数
3.相关系数和协方差

import numpy as np
import pandas as pd

fpath=r"文件路径"
df=pd.read_excel(fpath)
df.head(3)
>>>

df.loc[:,"bWendu"]=df.loc["bWendu"].str.replace("℃",'').astype('int32')
df.loc[:,"yWendu"]=df.loc["yWendu"].str.replace("℃",'').astype('int32')
df.head(3)

汇总类统计

#一下子提取所有数字列统计结果
df.describe()

#查看单个Series的数据
df["bWendu"].mean()

#最高温
df["bWendu"].max()

#最低温
df["bWendu"].min()

df.describe()统计数据如下：

唯一去重和按照值计数

一般用于非数值列（字符串）

#去重
df["fengxiang"].unique
df['tianqi'].unique
df['fengli'].unique
#返回去重的Series

#按值计算
df["fengxiang"].value_counts
df['tianqi'].value_counts
df['fengli'].value_counts
#会按照降序排列这些值出现的次数

Pandas对缺失值的处理

Panedas使用这些函数处理缺失值：
isnull和notnull:检测是否为空值，可用于df和Series

dropna:丢弃、删除缺失值
	axis:删除行还是列,{0 or 'index',1 or 'columns'},default 0
    how:如果等于any则任何值为空都删除，如果等于all则所有值为空才删除
    inplace:如果为True则修改当前df，否则返回新的df

fillna:填充空值
	value:用于填充的值，可以是单个值，或者字典(key是列名，value是值)
	method:等于ffill使用前一个不为空的值填充forword fill;等于bill使用后一个不为空的值填充backword fill
    axis:按行还是按列{0 or 'index',1 or 'columns'},default 0
	inplace:如果为True如果为True则修改当前df，否则返回新的df
    
以上函数可以分为3类，检测、丢弃和填充

import pandas as pd
fpath=r"C:\Users\98306\Desktop\test\chenji.xlsx"
studf=pd.read_excel(fpath,skiprows=2)#skiprows=2略过两行读取
studf

studf.isnull()#整体判断是否为null
studf['分数'].isnull()

#筛选没有空分数的行
studf.loc[studf['分数'].notnull(),:]

#删除全是空值的列,直接修改dataframe
studf.dropna(axis="columns",how="all",inplace=True)
studf#第一列的空行就被删除掉了

#删除全是空值的行,直接修改dataframe
studf.dropna(axis="index",how="all",inplace=True)
studf

#字典形式将null替换为0
studf.fillna({'分数':0})
#或者下面这种形式(单个列)
studf.loc[:,'分数']=studf['分数'].fillna(0)

studf.loc[:,'姓名']=studf['姓名'].fillna(method='ffill')#用前一个名字填充
studf

studf.to_excel(r'C:\Users\98306\Desktop\test\chenji.xlsx',index=False)#保存,index=False不保存自动生成的index

Setting With Copy Warning报警复现、原因、解决方案

import pandas as pd
fpath=r"文件路径"
df=pd.read_csv(fpath)
df.head()

#替换温度后缀
df.loc[:,'bWendu']=df['bWendu'].str.replace("℃",'').astype('int23')
df.loc[:,'yWendu']=df['yWendu'].str.replace("℃",'').astype('int23')
df.head()

Pandas不允许先筛选种子dataframe，再修改写入
要么使用.loc实现一个步骤执行修改
要么先复制一个子dataframe再修改

Pandas对数据排序

import pandas as pd
fpath=r"file path"
df=pd.read_excel(fpath)
df.head()

对Series排序

df['pv'].sort_values(ascending=True,inplace=False)#升序排序,False降序,inplace=False不保存

除了对数字类型的元素排序，也能对字符进行排序

对DataFrame排序

#对单列排序
df.sort_values(by='pv')#同时，列的元素，也就是列元素这一行的信息也会排序

#对多列排序
df.sort_values(by=["pv",'uv'],ascending=[False,True])
#列表的第一个元素列作为第一关键字，ascending设置每一列的排序方法
#只有前一个排序时有相同的元素，才会按后面一个排序

Pandas字符串处理

df.types查看每一列的数据类型

Series.str.isnumeric()：判断是否为数字
Series.str.len()：字符长度
Series.str.contains()：文本是否包含特定的字符串
Series.str.get()：获得特定位置处的字符
Series.str.index()：获得特定文本在原始文本中的位置即索引，索引从0开始。
Series.str.endswith()：文本是否以特定文本结束
Series.str.startswith()：文本是否以特定的文本开始
Series.str.find()：从文本中查找特定的字符串
Series.str.replace(,)：替换文本
Series.str.split()：分割文本
Series.str.trip()：移除文本开头和结尾的空白格
Series.str.slice()：切片
Series.str.match()：是否匹配特定的正则表达式

Pandas的axis参数

Pandas 数据合并concat

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。