虚心求知的熊

Python 之 Pandas DataFrame 数据类型的简介、创建的列操作

文章目录

一、DataFrame 结构简介
二、DataFrame 对象创建
- 1. 使用普通列表创建
- 2. 使用嵌套列表创建
- 3 指定数值元素的数据类型为 float
- 4. 字典嵌套列表创建
- 5. 添加自定义的行标签
- 6. 列表嵌套字典创建 DataFrame 对象
- 7. Series 创建 DataFrame 对象
三、DataFrame 列操作
- 1. 选取数据列
- 2. 列添加
- 3. insert() 方法添加
- 4. 删除数据列

DataFrame 是 Pandas 的重要数据结构之一，也是在使用 Pandas 进行数据分析过程中最常用的结构之一，可以这么说，掌握了 DataFrame 的用法，你就拥有了学习数据分析的基本能力。

一、DataFrame 结构简介

DataFrame 是一个表格型的数据结构，既有行标签（index），又有列标签（columns），它也被称异构数据表。
所谓异构，指的是表格中每列的数据类型可以不同，比如可以是字符串、整型或者浮点型等。其结构图示意图，如下所示：

表格中展示了某个销售团队个人信息和绩效评级（rating）的相关数据。数据以行和列形式来表示，其中每一列表示一个属性，而每一行表示一个条目的信息。
下表展示了上述表格中每一列标签所描述数据的数据类型，如下所示：

DataFrame 的每一列数据都可以看成一个 Series 结构，只不过，DataFrame 为每列数据值增加了一个列标签。
因此 DataFrame 其实是从 Series 的基础上演变而来，并且他们有相同的标签，在数据分析任务中 DataFrame 的应用非常广泛，因为它描述数据的更为清晰、直观。
通过示例对 DataFrame 结构做进一步讲解。下面展示了一张学生评分表，如下所示：

同 Series 一样，DataFrame 自带行标签索引，默认为隐式索引即从 0 开始依次递增，行标签与 DataFrame 中的数据项一一对应。上述表格的行标签从 0 到 3，共记录了 4 条数据（图中将行标签省略）。当然你也可以用“显式索引”的方式来设置行标签。
下面对 DataFrame 数据结构的特点做简单地总结，如下所示：
（1） DataFrame 每一列的标签值允许使用不同的数据类型。
（2） DataFrame 是表格型的数据结构，具有行和列。
（3） DataFrame 中的每个数据值都可以被修改。
（4） DataFrame 结构的行数、列数允许增加或者删除。
（5） DataFrame 有两个方向的标签轴，分别是行标签和列标签。
（6） DataFrame 可以对行和列执行算术运算。

二、DataFrame 对象创建

Pandas DataFrame 是一个二维的数组结构，类似二维数组。
DataFrame 的语法模板如下：

pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=None)

其参数含义如下：

data 表示输入的数据，可以是 ndarray，series，list，dict，标量以及一个 DataFrame。
index 表示行标签，如果没有传递 index 值，则默认行标签是 RangeIndex(0, 1, 2, …, n)，n 代表 data 的元素个数。
columns 表示列标签，如果没有传递 columns 值，则默认列标签是 RangeIndex(0, 1, 2, …, n)。
dtype 表示要强制的数据类型。只允许使用一种数据类型。如果没有定义强制的数据类型，就会自行推断。
copy 表示从输入复制数据。对于 dict 数据，copy=True，表示重新复制一份。对于 DataFrame 或 ndarray 输入，类似于 copy=False，在原数据中进行操作。
在开始之前，我们需要先引入 numpy 和 pandas 库。

import numpy as np
import pandas as pd

1. 使用普通列表创建

使用 DataFrame 数据结构进行输出。
在这里我们并没有设置 index 和 columns，因此，他们就默认从 0 开始。
DataFrame 不会输出数据类型。

data = [1,2,3,4,5]
df = pd.DataFrame(data)
print(df)
#   0
#0  1
#1  2
#2  3
#3  4
#4  5

使用 Series 数据结构进行输出。
Series 会输出对应的数据类型。

data = [1,2,3,4,5]
df = pd.Series(data)
print(df)
#0    1
#1    2
#2    3
#3    4
#4    5
#dtype: int64

2. 使用嵌套列表创建

列表中每个元素代表一行数据，如果我们不分配列标签，他们会默认从 0 开始进行计数。

data = [['xiaowang',20],['Lily',30],['Anne',40]]
df = pd.DataFrame(data)
print(df)
#          0   1
#0  xiaowang  20
#1      Lily  30
#2      Anne  40

当我们分配列标签时，会按我们分配的进行输出。
这里需要注意的是，我们分配的列标签必须和列数对应。

data = [['xiaowang',20],['Lily',30],['Anne',40]]
df = pd.DataFrame(data,columns=['Name','Age'])
print(df)
#       Name  Age
#0  xiaowang   20
#1      Lily   30
#2      Anne   40

3 指定数值元素的数据类型为 float

需要注意的是，dtype 只能设置一个，设置多个列的数据类型，需要使用其他方式。
当我们分配列标签时，满足我们设定的数据类型会自动使用，不满足则会自动识别。

data = [['xiaowang', 20, "男", 5000],['Lily', 30, "男", 8000],['Anne', 40, "女", 10000]]
df = pd.DataFrame(data,columns=['Name','Age',"gender", "salary"], dtype=int)
print(df)
print(df['salary'].dtype)
#       Name  Age gender  salary
#0  xiaowang   20      男    5000
#1      Lily   30      男    8000
#2      Anne   40      女   10000
#float64

4. 字典嵌套列表创建

data 字典中，键对应的值的元素长度必须相同（也就是列表长度相同）。
如果传递了索引，那么索引的长度应该等于数组的长度；如果没有传递索引，那么默认情况下，索引将是 RangeIndex(0.1…n)，其中 n 代表数组长度。
这里我们需要注意的时，字典在 python 3.7 以后是有顺序的。
例如，我们通过字典创建 DataFrame，输出行标签和列标签。

data = {'Name':['关羽', '刘备', '张飞', '曹操'],'Age':[28,34,29,42]}
df = pd.DataFrame(data)
print(df)
print(df.index)
print(df.columns)
#  Name  Age
#0   关羽   28
#1   刘备   34
#2   张飞   29
#3   曹操   42
#RangeIndex(start=0, stop=4, step=1)
#Index(['Name', 'Age'], dtype='object')

注意：这里使用了默认行标签，也就是 RangeIndex(0.1…n)。它生成了 0,1,2,3，并分别对应了列表中的每个元素值。

5. 添加自定义的行标签

通过字典嵌套列表创建 DataFrame ，并定义我们的行标签，最后输出行标签和列标签。

data = {'Name':['关羽', '刘备', '张飞', '曹操'],'Age':[28,34,29,42]}
index = ["rank1", "rank2", "rank3", "rank4"]
df = pd.DataFrame(data, index=index)
print(df)
print(df.index)
print(df.columns)
#      Name  Age
#rank1   关羽   28
#rank2   刘备   34
#rank3   张飞   29
#rank4   曹操   42
#Index(['rank1', 'rank2', 'rank3', 'rank4'], dtype='object')
#Index(['Name', 'Age'], dtype='object')

6. 列表嵌套字典创建 DataFrame 对象

列表嵌套字典可以作为输入数据传递给 DataFrame 构造函数。默认情况下，字典的键被用作列名。

data = [{'a': 1, 'b': 2},{'a': 5, 'b': 10, 'c': 20}]
df = pd.DataFrame(data, index=['first', 'second'])
print(df)
#        a   b     c
#first   1   2   NaN
#second  5  10  20.0

注意，如果其中某个元素值缺失，也就是字典的 key 无法找到对应的 value，将使用 NaN 代替。
如何使用列表嵌套字典创建一个 DataFrame 对象，可以设置结果需要那些列。

data = [{'a': 1, 'b': 2},{'a': 5, 'b': 10, 'c': 20}]
df1 = pd.DataFrame(data, index=['first', 'second'], columns=['a', 'b'])
df2 = pd.DataFrame(data, index=['first', 'second'], columns=['a', 'b1'])
print("===========df1============")
print(df1)
print("===========df2============")
print(df2)
#===========df1============
#        a   b
#first   1   2
#second  5  10
#===========df2============
#        a  b1
#first   1 NaN
#second  5 NaN

7. Series 创建 DataFrame 对象

也可以传递一个字典形式的 Series，从而创建一个 DataFrame 对象，其输出结果的行索引是所有 index 的合集。

d = {'one' : pd.Series([1, 2, 3], index=['a', 'b', 'c']),
   'two' : pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])}
df = pd.DataFrame(d)
print(df)
type(np.NaN)
#   one  two
#a  1.0    1
#b  2.0    2
#c  3.0    3
#d  NaN    4
#float

注意：对于 one 列而言，此处虽然显示了行索引 ‘d’，但由于没有与其对应的值，所以它的值为 NaN。
当我们需要解决不同列的数据类型时，可以使用设置自定义数据类型。

data = {
    "Name":pd.Series(['xiaowang', 'Lily', 'Anne']),
    "Age":pd.Series([20, 30, 40],  dtype=float),
    "gender":pd.Series(["男", "男", "女"]),
    "salary":pd.Series([5000, 8000, 10000], dtype=float)
}
df = pd.DataFrame(data)
df
#         Name	      Age	gender	      salary
#0	xiaowang	     20.0	        男	 5000.0
#1	          Lily	     30.0	        男	 8000.0
#2	       Anne	     40.0	        女    10000.0

三、DataFrame 列操作

DataFrame 可以使用列标签来完成数据的选取、添加和删除操作。下面依次对这些操作进行介绍。

1. 选取数据列

可以使用列索引，轻松实现数据选取。
我们通过字典创建 DataFrame，定义行标签，单独选取每一列并输出。

data = {'Name':['关羽', '刘备', '张飞', '曹操'],'Age':[28,34,29,42]}
index = ["rank1", "rank2", "rank3", "rank4"]
df = pd.DataFrame(data, index=index)
print(df)
print("=========df['Name']:取得Name列===============")
print(df['Name'])
print("=========df['Age']:取得Age列===============")
print(df['Age'])
#      Name  Age
#rank1   关羽   28
#rank2   刘备   34
#rank3   张飞   29
#rank4   曹操   42
#=========df['Name']:取得Name列===============
#rank1    关羽
#rank2    刘备
#rank3    张飞
#rank4    曹操
#Name: Name, dtype: object
#=========df['Age']:取得Age列===============
#rank1    28
#rank2    34
#rank3    29
#rank4    42
#Name: Age, dtype: int64

我们也可以同时选取很多列。

print("=========df[['Name', 'Age']]:df选取多列===============")
print(df[['Name', 'Age']])
#=========df[['Name', 'Age']]:df选取多列===============
#      Name  Age
#rank1   关羽   28
#rank2   刘备   34
#rank3   张飞   29
#rank4   曹操   42

这里需要注意的是，列不是能使用切片选取多列。

print("=========df不能使用切片选取多列===============")
print(df['Name': 'Age']) 
#=========df不能使用切片选取多列===============
#Empty DataFrame
#Columns: [Name, Age]
#Index: []

如果我直接通过标签位置去获取列，会报错。

df[1]

2. 列添加

使用 columns 列索引标签可以实现添加新的数据列，示例如下。
首先，我们创建初始数据。

d = {'one' : pd.Series([1, 2, 3], index=['a', 'b', 'c']),
   'two' : pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])}
df = pd.DataFrame(d)
print(df)
#   one  two
#a  1.0    1
#b  2.0    2
#c  3.0    3
#d  NaN    4

然后使用 df[‘列’]= 值，插入新的数据列。

print ("====通过Series添加一个新的列====:")
df['three']=pd.Series([10,20,30],index=['a','b','c'])
print(df)
#====通过Series添加一个新的列====:
#   one  two  three
#a  1.0    1   10.0
#b  2.0    2   20.0
#c  3.0    3   30.0
#d  NaN    4    NaN

我们也可以将已经存在的数据列相加运算，从而创建一个新的列。

print ("======将已经存在的数据列相加运算,从而创建一个新的列:=======")
df['four']=df['one']+df['three']
print(df)
#======将已经存在的数据列相加运算,从而创建一个新的列:=======
#   one  two  three  four
#a  1.0    1   10.0  11.0
#b  2.0    2   20.0  22.0
#c  3.0    3   30.0  33.0
#d  NaN    4    NaN   NaN

如果我们新添加的列当中出现新的行标签，就不会显示出来。

df['error']=pd.Series([10,20,30],index=['b','a','s3'])
print(df)
#   one  two  three  four  error
#a  1.0    1   10.0  11.0   20.0
#b  2.0    2   20.0  22.0   10.0
#c  3.0    3   30.0  33.0    NaN
#d  NaN    4    NaN   NaN    NaN

3. insert() 方法添加

在上述示例中，我们初次使用了 DataFrame 的算术运算，这和 NumPy 非常相似。
除了使用 df[]=value 的方式外，您还可以使用 insert() 方法插入新的列，其语法模板如下：

df.insert(loc, column, value, allow_duplicates=False)

其参数含义如下：
loc 表示整型，插入索引，必须验证 0<=loc<=len（列）。
column 表示插入列的标签，类型可以是字符串、数字或者散列对象。
value 表示数值，必须是 Series 或者数组。
allow_duplicates 表示是否允许重复，可以有相同的列标签数据，默认为 False。
具体可见如下例子，我们先生成初始数据，便于后续的操作。

info=[['王杰',18],['李杰',19],['刘杰',17]]
df=pd.DataFrame(info,columns=['name','age'])
print(df)
#  name  age
#0   王杰   18
#1   李杰   19
#2   刘杰   17

这里需要注意的是，我们使用 column 参数。数值 1 代表插入到 columns 列表的索引位置。其中，loc 代表整型，插入索引，必须验证 0<=loc<=len（列）。
df.insert(1,column=‘score’,value=[91,90,75])

print("=====df.insert插入数据:=======")
print(df)
#=====df.insert插入数据:=======
#  name  score  age
#0   王杰     91   18
#1   李杰     90   19
#2   刘杰     75   17

当然，我们也可以添加重复列标签数据。

df.insert(1,column='score',value=[80,70,90],allow_duplicates=True)
print(df)
#  name  score  score  age
#0   王杰     80     91   18
#1   李杰     70     90   19
#2   刘杰     90     75   17

此时，如果我们单独提取出列标签是 score 的列，那么，两列就都会输出。

df['score']
#score	score
#0	80	91
#1	70	90
#2	90	75

如果我们将 allow_duplicates 参数设置为 False，然后再插入具有相同列标签的数据，就会报错。

df.insert(1,column='score',value=[80,70,90])
# 错误 cannot insert name, already exists

4. 删除数据列

我们通过 del 和 pop() 都能够删除 DataFrame 中的数据列，但区别是，del 没有返回值，而 pop 有返回值，具体示例如下：
首先，我们创建初始数据，便于后面的对比操作。

d = {'one' : pd.Series([1, 2, 3], index=['a', 'b', 'c']),
     'two' : pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd']),
     'three' : pd.Series([10,20,30], index=['a','b','c'])}
df = pd.DataFrame(d)
print ("Our dataframe is:")
print(df)
#Our dataframe is:
#   one  two  three
#a  1.0    1   10.0
#b  2.0    2   20.0
#c  3.0    3   30.0
#d  NaN    4    NaN

我们使用 del 方法进行删除操作。

del df['one']
print("=======del df['one']=========")
print(df)
#=======del df['one']=========
#   two  three
#a    1   10.0
#b    2   20.0
#c    3   30.0
#d    4    NaN

我们使用 pop 方法进行删除操作。
由于，pop 方法可以返回我们删除的数据，因此，在一定程度上也可以用来提取数据，但是，他也会修改我们的源数据。

res_pop = df.pop('two')
print("=======df.pop('two')=========")
print(df)
print("=======res_pop = df.pop('two')=========")
print(res_pop)
#=======df.pop('two')=========
#   three
#a   10.0
#b   20.0
#c   30.0
#d    NaN
#=======res_pop = df.pop('two')=========
#a    1
#b    2
#c    3
#d    4
#Name: two, dtype: int64

使用GitPython和GitLoader进行版本控制与文档加载 vaidfl python
技术背景介绍Git是一种分布式版本控制系统，用于跟踪文件集的更改，通常用于程序员协作开发软件源代码。Git的特点包括支持分支和合并、轻量级、快速操作以及强大的社区支持等。在Python开发中，我们可以使用GitPython库来操作和管理Git仓库。此外，借助GitLoader，我们可以轻松地从Git仓库加载文档，以便在各种应用中使用。核心原理解析GitPython是一个Python库，它允许你通过
Python 多线程 Don-ML Python python 多线程线程
多线程类似于同时执行多个不同程序。Python中使用线程有两种方式：函数或者用类来包装线程对象。函数式：调用_thread模块中的start_new_thread()函数来产生新线程。语法如下:_thread.start_new_thread(function,args[,kwargs])参数说明:function-线程函数。args-传递给线程函数的参数,他必须是个tuple类型。kwargs-
Pycharm远程连接服务器和配置远程python环境 hlee-top 技巧 pycharm 服务器
首先在setting中添加PythonInterpreter，点击右边齿轮图标添加输入连接和用户名然后选择python环境的路径，一般是/home/username/anaconda3/envs/envsname/bin/python。下面为服务器到本地文件的映像。然后在顶部工具栏中的Tools中Deployment里选择Configuration进行配置，Localpath为本地项目的位置，De
python os.path模块常用方法详解清平乐的技术博客 Python高级应用
pythonos.path模块常用方法详解os.path模块主要用于文件的属性获取，在编程中经常用到，以下是该模块的几种常用方法。更多的方法可以去查看官方文档：http://docs.python.org/library/os.path.html1.os.path.abspath(path)返回path规范化的绝对路径。os.path.abspath(‘test.csv’)‘C:\Python25
Python 并发编程：线程详解风因絮 Python进阶知识 python 开发语言
在Python中，默认每个Python文件会创建一个进程，用于提供运行资源和环境。进程启动后，会创建一个主线程，用于执行程序代码。线程是并发编程的核心之一，本文将详细解析Python中线程的基础概念、常见操作、线程安全以及线程池的使用。一、线程基础1.什么是线程？线程是计算机中可以被CPU调度的最小单位。每个线程在程序中独立运行，多个线程可以并发执行。在Python中，线程由threading模块
【Python基础编程】深入掌握线程与线程池的高效应用易辰君 python核心编程 python 开发语言
目录前言一、线程的使用（一）基础使用（二）等待线程完成（三）多个线程（四）守护线程（五）线程同步（六）总结二、队列对象-Queue（一）队列类型（二）基本用法（三）队列的常用方法（四）LIFO队列和优先级队列（五）适用场景（六）总结三、生产者和消费者模式（一）基本结构（二）生产者-消费者模式示例（三）多个生产者和消费者（四）适用场景（五）总结四、线程池（一）简介（二）线程池的使用（三）关键方法（四
Python学习日记：列表的一些功能实现 Kaye921 python 学习开发语言
myList=["Kaye","Pii","Pk","Pk","Pk"]#查找某元素在列表内的下标索引利用列表.index()#找到会返回索引值，找不到会返回ValueErrorindex=myList.index("Pk")print(index)#修改特定位置下标索引值myList[0]="kk"print(myList)#插入元素#列表.insert(索引，插入元素)myList.inser
【Python百日进阶-Web开发-FastAPI】Day801 - FastAPI是什么岳涛@泰山医院 Dash python 前端 fastapi
文章目录一、官网二、FastAPI是什么三、FastAPI特性3.1基于开放标准3.2自动生成文档3.3更主流的Python3.4编辑器支持3.5简洁3.6验证3.7安全性及身份验证¶3.8依赖注入3.9无限制"插件"3.10测试四、Starlette特性五、Pydantic特性六、Python类型提示简介6.1动机6.1.1简单示例6.1.2修改示例6.1.3添加类型6.2更多动机6.3声明类型
Python自动化运维实战，怎么构建分布式质量监控平台好知识传播者 Python实例开发实战运维 python 自动化分布式质量监控平台 linux
注意：本文的下载教程，与以下文章的思路有相同点，也有不同点，最终目标只是让读者从多维度去熟练掌握本知识点。下载教程：Python自动化运维项目开发实战_构建分布式质量监控平台_编程案例解析实例课程教程.pdf一、引言随着企业业务的不断扩展和复杂化，系统运维面临着越来越多的挑战。传统的运维方式已经无法满足现代企业的需求，因此，自动化运维成为了企业提升运维效率、保障系统稳定性的重要手段。在自动化运维中
fastapi 大型应用_FastApi项目实战 - 爱投票管理系统（一）赌徒梦 fastapi 大型应用
一、闲来无事，在工作之余自己研究了一下python的异步框架-fastapi，并写包括1、部门管理2、角色管理3、用户管理4、菜单管理5、登录日志6、操作日志7、添加反爬机制六个基础功能模块，演示链接：https://www.lovevote.cn，账号：admin，密码：admin由于我的电脑问题，下载的vue依赖包有几个发生了版本冲突，打包部署后偶尔会在点击菜单按钮时发生前端延时(这时表现为缓
python析构_【python 类的析构】盐选科普 python析构
简介很多面向对象的语言都提供了new关键字，通过new可以创建类的实例。Python的方式更加简单，一旦定义了一个类，直接使用函数操作符，即可创建类的实例。本文主要结合一些实际的例子，介绍了Python类的构造，初始化和析构的原理。类的构造与初始化Python涉及类的构造与初始化，有两个重要的方法：__new__()和__init__()和方法。前者完成实例对象的创建，后者完成对创建的实例对象的初
python爬虫爬取图片 kanguhong python 爬虫开发语言
"""爬取目标：https://pic.netbian.com/彼岸图首页地址：https://pic.netbian.com/4kmeinv/第N页：https://pic.netbian.com/4kmeinv/index_N.htmlhttps://pic.netbian.com/uploads/allimg/240709/194631-1720525591a682.jpg仅供学习，不可用于
Python 布尔类型深度剖析：与其他数据类型的对比及应用 tekin Python 编程秘籍库 python 开发语言 Python 布尔类型深度剖析数据类型的对比及应用
Python布尔类型深度剖析：与其他数据类型的对比及应用本文将深入探讨Python中的布尔类型，详细介绍布尔类型的定义、特性、运算规则以及使用场景。同时，将布尔类型与数字类型、字符串类型、列表等其他常见数据类型进行全面对比，帮助读者清晰地理解它们之间的差异和联系。此外，还会对相关联的知识点进行拓展深化，让读者能够更加灵活地运用布尔类型进行Python编程。文章目录Python布尔类型深度剖析：与其
Web开发架构--常见web后端框架介绍（python、java）土豆尼尼酱前端架构 python
文章目录※Web开发介绍一、什么是Web框架？1.1核心流程1.2Web框架功能1.3Web框架的作用二、Python中的Web框架1.Django2.Flask3.FastAPI三、Java中的Web框架1.SpringBoot2.SpringMVC3.Struts24.PlayFramework四、Python与JavaWeb框架对比五、如何选择Web框架？※Web开发介绍Web开发流程需求分
基于Pandas库封装Excel工具类忆想不到的晖 python pandas github excel 工具类
引言Excel是一种广泛使用的电子表格软件，它提供了大量的数据处理和计算功能，被广泛应用于数据分析和报告中。在Python中，我们可以使用pandas库来读写和处理Excel文件。但是，为了更方便和快速地操作Excel文件，我们可以封装一个Excel工具类，提供常用的读写操作方法，以提高开发效率。本文将介绍如何使用Python封装Excel操作工具类，并提供相应的例子说明。1、列表转Excel文件
Python工厂模式封装Webhook群聊机器人忆想不到的晖 python 机器人开发语言 webhook 飞书钉钉
引言企业存在给特定群组自动推送消息的需求，比如：监控报警推送、销售线索推送、运营内容推送等。你可以在群聊中添加一个自定义机器人，通过服务端调用webhook地址，即可将外部系统的通知消息即时推送到群聊中。飞书自定义机器人使用指南：https://open.feishu.cn/document/ukTMukTMukTM/ucTM5YjL3ETO24yNxkjN钉钉自定义机器人使用指南：https:/
阿里云服务器的作用腾云服务器阿里云服务器云计算
使用阿里云服务器能做什么？大家都知道可以用来搭建网站、数据库、机器学习、Python爬虫、大数据分析等应用，阿里云服务器网来详细说下使用阿里云服务器常见的玩法以及企业或个人用户常见的使用场景：玩转阿里云服务器使用阿里云服务器最常见的应用就是用来搭建网站，例如个人博客、企业网站等；除了搭建网站还可以利用阿里云GPU服务器搭建机器学习和深度学习等AI应用；使用阿里云大数据类型云服务器做数据分析；利用云
sqlite 安装可视化笔记 AI算法网奇 python宝典 sqlite 笔记数据库
目录免费可视化工具：python安装免费可视化工具：SQLiteStudio（免费）DBBrowserforSQLite（免费）实用的SQLite数据库可视化管理工具推荐_sqllite工具-CSDN博客python安装pipinstallpysqlite3，这个有的电脑报错，dll找不到。在网址SQLiteDownloadPage下载
Python 调用本地部署DeepSeek的API 详细指南 kunwen123 python
B站先查看deepseek的应用和API调用和本地化部署这三方面知识确认Ollama是否正确运行如果你使用Ollama部署了DeepSeek，默认API运行在11434端口。首先，检查Ollama是否正常运行：curlhttp://localhost:11434/api/tags如果返回：{“models”:[“deepseek-coder:latest”,“deepseek-chat:lates
UnionLLM——通过统一接口调用国内外所有LLM的Python开源工具包 everfly python github
最近忙里偷闲和公司前端小伙伴一起撸了一个Python开源项目——UnionLLM。这是一个通过与OpenAI兼容的统一方式调用各种国内外各种大语言模型和Agent编排工具的轻量级开源工具包。我们开发它的起因是因为在实际项目中，经常需要调用多个大语言模型的API，但是国内每个大语言模型的接口和参数都不一样，这给我们的工作带来了很大的困扰和额外的成本。UnionLLM的目标是通过统一且容易扩展的方式连
通过 Python FastAPI 开发一个快速的 Web API 项目 Python_P叔 python fastapi 前端
Python如此受欢迎的众多原因之一是Python有大量成熟和稳定的库可供选择:网页开发有：Django和Flask，提供了很好的网络开发体验和大量的有用文档机器学习有：scikit-learn、Keras等，提供了丰富的机器学习的包和数据处理和可视化工具。FastAPI是一个快速、轻量级的现代API，与其他基于Python的Web框架（如Flask和Django）相比，有一个更容易的学习曲线。F
Python爬虫获取item_search_img-按图搜索淘宝商品（拍立淘）接口 Jelena15779585792 API python 爬虫图搜索算法
一、引言随着电商行业的不断发展，消费者对商品搜索的效率和准确性要求越来越高。淘宝作为国内领先的电商平台，推出了按图搜索商品的功能（拍立淘），极大地提升了用户的购物体验。本文将详细介绍如何使用淘宝按图搜索商品的API接口（item_search_img），包括注册账号、上传图片、调用接口及解析响应等步骤。二、注册账号与获取API密钥注册淘宝开放平台账号要使用淘宝的按图搜索功能，首先需要在淘宝开放平台
使用Python爬虫获取淘宝搜索词推荐API接口 Jelena15779585792 淘宝API Python python 爬虫开发语言
在电商领域，搜索词推荐功能对于优化用户体验和提升搜索效率至关重要。淘宝作为国内领先的电商平台，提供了丰富的API接口，其中item_search_suggest接口可以获取搜索词推荐。本文将详细介绍如何使用Python爬虫技术调用该API接口，并获取搜索词推荐信息。一、概述淘宝的item_search_suggestAPI接口允许开发者根据提供的搜索关键字或其他相关条件，返回与搜索词相关的推荐词组
数据湖构建 HaoHao_010 服务器云服务器云计算阿里云
阿里云的数据湖构建（DataLake）是一种用于存储和处理大量不同类型数据的解决方案，通常用于大数据分析和机器学习等应用场景。数据湖与传统的数据仓库不同，它能够存储结构化、半结构化和非结构化数据，支持大规模数据的整合、存储、查询和分析。阿里云提供了一整套工具和服务来帮助企业构建数据湖，以下是数据湖构建的主要步骤和关键服务：1.数据湖概述数据湖是一种统一的数据存储库，能承载来自多个来源的数据，包括：
Python 异常：深度剖析与实战应用秋夜Autumn python windows 开发语言
目录一、引言二、异常的基本概念（一）定义与本质（二）常见异常类型详解三、异常处理机制（一）try-except语句（二）try-except-else语句（三）try-finally语句（四）嵌套异常处理四、主动抛出异常（一）raise语句的使用方法（二）自定义异常类五、断言（assert）（一）断言的语法与功能（二）断言在调试和测试中的应用六、异常处理的最佳实践（一）具体的异常处理策略（二）异常
使用 Python 爬虫抓取电商平台特定商品库存与销售数据的完整指南 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言信息可视化自动化
一、引言随着电子商务的蓬勃发展，库存和销售数据已经成为商家、供应链管理者和市场分析师的重要参考。对于电商平台而言，实时获取商品库存、销量以及价格等信息，能够帮助商家及时调整策略、优化存货管理、做出销售预测。因此，抓取这些电商平台上的商品数据变得至关重要。本文将详细介绍如何使用Python编写爬虫，抓取电商平台（如淘宝、京东、亚马逊等）上特定商品的库存、销售数据。我们将结合最新技术，使用Reques
使用Python爬虫抓取并分析电商网站销量数据的完整指南 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 selenium
目录：前言爬虫基础概念什么是Web爬虫爬虫的工作原理Python爬虫库介绍准备工作安装所需的库选择目标电商网站分析目标电商网站使用浏览器开发者工具分析页面结构识别需要抓取的销量数据构建爬虫程序使用requests获取网页使用BeautifulSoup解析静态网页使用Selenium抓取动态页面防止反爬虫技术模拟浏览器请求使用代理池随机延迟请求抓取电商网站的销量数据抓取商品标题、销量、价格等信息处理
Python 实战：构建分布式文件存储系统全解析 tekin Python网络编程 python 分布式 Python分布式文件存储系统
Python实战：构建分布式文件存储系统全解析在当今数据爆炸的时代，分布式文件存储系统凭借其高可扩展性、高可靠性等优势，成为了数据存储领域的热门选择。本文将详细介绍如何使用Python构建一个简单的分布式文件存储系统。从系统架构设计，包括中央控制器、存储节点和客户端的功能介绍，到具体的代码实现，涵盖网络通信、文件操作等关键技术，再到运行步骤的说明，让你全面了解分布式文件存储系统的构建过程。即使你是
Python 分词解析+词云可视化（含停用词文件）布凯彻-劳斯基数学建模 python 学习 pycharm 中文分词词云自然语言处理算法
代码：importre#导入正则表达式库importjieba#导入结巴分词库importcollections#导入集合库importnumpy#导入numpy库importwordcloud#导入词云库fromPILimportImage#导入PIL图像处理库importmatplotlib.pyplotasplt#导入matplotlib绘图库fromwordcloudimportImage
PyCharm中Python项目打包并运行到服务器的简明指南傻啦嘿哟关于python那些事儿 python pycharm 服务器
目录一、准备工作二、创建并设置Python项目创建新项目配置项目依赖安装PyInstaller三、打包项目打包为可执行文件另一种打包方式（使用setup.py）四、配置服务器环境五、上传可执行文件到服务器六、在服务器上运行项目配置SSH解释器配置部署上传代码在服务器上运行八、注意事项示例项目总结在现代软件开发中，将本地开发完成的Python项目打包并部署到服务器上是一项基本且重要的技能。本文将通过
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方

Python 之 Pandas DataFrame 数据类型的简介、创建的列操作

文章目录

一、DataFrame 结构简介

二、DataFrame 对象创建

1. 使用普通列表创建

2. 使用嵌套列表创建

3 指定数值元素的数据类型为 float

4. 字典嵌套列表创建

5. 添加自定义的行标签

6. 列表嵌套字典创建 DataFrame 对象

7. Series 创建 DataFrame 对象

三、DataFrame 列操作

1. 选取数据列

2. 列添加

3. insert() 方法添加

4. 删除数据列

你可能感兴趣的:(Python,pandas,python,数据分析)