小廖同学

Pandas学习

1. Pandas介绍

2008年WesMcKinney开发出的库
专门用于数据挖掘的开源python库
以Numpy为基础，借力Numpy模块在计算方面性能高的优势
基于matplotlib，能够简便的画图
独特的数据结构

2. 为什么使用Pandas

Numpy已经能够帮助我们处理数据，能够结合matplotlib解决部分数据展示等问题，那么pandas学习的目的在什么地方呢？

增强图表可读性
便捷的数据处理能力
读取文件方便
封装了Matplotlib、Numpy的画图和计算

3. Pandas数据结构

说明

Pandas中一共有三种数据结构，分别为：Series、DataFrame和MultiIndex（老版本中叫Panel ）。

其中Series是一维数据结构，DataFrame是二维的表格型数据结构，MultiIndex是三维的数据结构。

Series

1.Series的创建

# 导入pandas
import pandas as pd
pd.Series(data=None, index=None, dtype=None)

参数：

data：传入的数据，可以是ndarray、list等
index：索引，必须是唯一的，且与数据的长度相等。如果没有传入索引参数，则默认会自动创建一个从0-N的整数索引。
dtype：数据的类型

# 指定内容，默认索引
pd.Series(np.arange(10))
# 指定索引
pd.Series([6.7,5.6,3,10,2], index=[1,2,3,4,5])
# 通过字典数据创建
color_count = pd.Series({'red':100, 'blue':200, 'green': 500, 'yellow':1000})

2. Series的属性

为了更方便地操作Series对象中的索引和数据，Series中提供了两个属性index和values

index

color_count = pd.Series({'red':100, 'blue':200, 'green': 500, 'yellow':1000})
color_count.index
# 结果
Index(['blue', 'green', 'red', 'yellow'], dtype='object')

values

color_count.values
# 结果
array([ 200,  500,  100, 1000])

也可以使用索引来获取数据：

color_count[2]
# 结果
100

DataFrame

DataFrame是一个类似于二维数组或表格(如excel)的对象，既有行索引，又有列索引

行索引，表明不同行，横向索引，叫index，0轴，axis=0
列索引，表明不同列，纵向索引，叫columns，1轴，axis=1

DataFrame的创建

# 导入pandas
import pandas as pd

pd.DataFrame(data=None, index=None, columns=None)

参数：
- index：行标签。如果没有传入索引参数，则默认会自动创建一个从0-N的整数索引。
- columns：列标签。如果没有传入索引参数，则默认会自动创建一个从0-N的整数索引。
通过已有数据创建

例如

pd.DataFrame(np.random.randn(2,3))

# 生成10名同学，5门功课的数据
score = np.random.randint(40, 100, (10, 5))
# 使用Pandas中的数据结构
# 构造行索引序列
subjects = ["语文", "数学", "英语", "政治", "体育"]
# 构造列索引序列
stu = ['同学' + str(i) for i in range(score_df.shape[0])]
# 添加行索引
data = pd.DataFrame(score, columns=subjects, index=stu)

DataFrame的属性

shape
```
data.shape
# 结果
(10, 5)
```

index：DataFrame的行索引列表

data.index

# 结果
Index(['同学0', '同学1', '同学2', '同学3', '同学4', '同学5', '同学6', '同学7', '同学8', '同学9'], dtype='object')

columns：DataFrame的列索引列表

data.columns

# 结果
Index(['语文', '数学', '英语', '政治', '体育'], dtype='object')

values
```
data.values
```
T：转置
```
data.T
```
head(5)：显示前5行内容，如果不补充参数，默认5行。填入参数N则显示前N行
```
data.head(5)
```
tail(5):显示后5行内容，如果不补充参数，默认5行。填入参数N则显示后N行
```
data.tail(5)
```

DatatFrame索引的设置

修改行列索引值（必须全部修改）

stu = ["学生_" + str(i) for i in range(score_df.shape[0])]

# 必须整体全部修改
data.index = stu

重设索引
- reset_index(drop=False)
  - 设置新的下标索引
  - drop:默认为False，不删除原来索引，如果为True，删除原来的索引值
```
# 重置索引,drop=False
data.reset_index()
# 重置索引,drop=True
data.reset_index(drop=True)
```

以某列值设置为新的索引

set_index(keys, drop=True)

keys : 列索引名成或者列索引名称的列表
drop : boolean, default True.当做新的索引，删除原来

df = pd.DataFrame({'month': [1, 4, 7, 10], 'year': [2012, 2014, 2013, 2014], 'sale':[55, 40, 84, 31]})
# 以月份设置新的索引
df.set_index('month')
# 设置多个索引，以年和月份
df = df.set_index(['year', 'month'])

MultiIndex与Panel

MultiIndex

MultiIndex是三维的数据结构;

多级索引（也称层次化索引）是pandas的重要功能，可以在Series、DataFrame对象上拥有2个以及2个以上的索引。

multiIndex的特性

# 打印上面的索引结果
df.index
MultiIndex(levels=[[2012, 2013, 2014], [1, 4, 7, 10]],
           labels=[[0, 2, 1, 2], [0, 1, 2, 3]],
           names=['year', 'month'])

多级或分层索引对象。

index属性
- names:levels的名称
- levels：每个level的元素值

df.index.names
# FrozenList(['year', 'month'])

df.index.levels
# FrozenList([[1, 2], [1, 4, 7, 10]])

multiIndex的创建

arrays = [[1, 1, 2, 2], ['red', 'blue', 'red', 'blue']]
pd.MultiIndex.from_arrays(arrays, names=('number', 'color'))

# 结果
MultiIndex(levels=[[1, 2], ['blue', 'red']],
           codes=[[0, 0, 1, 1], [1, 0, 1, 0]],
           names=['number', 'color'])

Panel

Panel的创建

class pandas.Panel(data=None, items=None, major_axis=None, minor_axis=None)

作用：存储3维数组的Panel结构
参数：
- data : ndarray或者dataframe
- items : 索引或类似数组的对象，axis=0
- major_axis : 索引或类似数组的对象，axis=1
- minor_axis : 索引或类似数组的对象，axis=2

p = pd.Panel(data=np.arange(24).reshape(4,3,2),
                 items=list('ABCD'),
                 major_axis=pd.date_range('20130101', periods=3),
                 minor_axis=['first', 'second'])

# 结果
<class 'pandas.core.panel.Panel'>
Dimensions: 4 (items) x 3 (major_axis) x 2 (minor_axis)
Items axis: A to D
Major_axis axis: 2013-01-01 00:00:00 to 2013-01-03 00:00:00
Minor_axis axis: first to second

查看panel数据
```
p[:,:,"first"]
p["B",:,:]
```

4. Pandas文件读取与存储

我们的数据大部分存在于文件当中，所以pandas会支持复杂的IO操作，pandas的API支持众多的文件格式，如CSV、SQL、XLS、JSON、HDF5，最常用的HDF5和CSV文件。

CSV
1. read_csv
  - pandas.read_csv(filepath_or_buffer, sep =’,’, usecols )
    - filepath_or_buffer:文件路径
    - sep :分隔符，默认用","隔开
    - usecols:指定读取的列名，列表形式
  - 举例：读取之前的股票的数据
```
# 读取文件,并且指定只获取'open', 'close'指标
data = pd.read_csv("./data/stock_day.csv", usecols=['open', 'close'])
data.head()
```
2. to_csv
  - DataFrame.to_csv(path_or_buf=None, sep=’, ’, columns=None, header=True, index=True, mode=‘w’, encoding=None)
    - path_or_buf :文件路径
    - sep :分隔符，默认用","隔开
    - columns :选择需要的列索引
    - header :boolean or list of string, default True,是否写进列索引值
    - index:是否写进行索引
    - mode:‘w’：重写, ‘a’ 追加
  - 举例：保存读取出来的股票数据
    - 保存’open’列的数据，然后读取查看结果
```
# 选取10行数据保存,便于观察数据
data[:10].to_csv("./data/test.csv", columns=['open'])
# 读取，查看结果
pd.read_csv("./data/test.csv")
```
    会发现将索引存入到文件当中，变成单独的一列数据。如果需要删除，可以指定index参数,删除原来的文件，重新保存一次。
```
# index:存储不会讲索引值变成一列数据
data[:10].to_csv("./data/test.csv", columns=['open'], index=False)
```
HDF5

需要安装安装tables模块避免不能读取HDF5文件
```
pip install tables
```
1. read_hdf与to_hdf
  
  HDF5文件的读取和存储需要指定一个键，值为要存储的DataFrame
  - pandas.read_hdf(path_or_buf，key =None，** kwargs)
    
    从h5文件当中读取数据
    - path_or_buffer:文件路径
    - key: 读取的键
    - return:Theselected object
  - DataFrame.to_hdf(path_or_buf, key, **kwargs)
2. 案例
```
# 读取文件
day_close = pd.read_hdf("./data/day_close.h5")
# 存储文件
day_close.to_hdf("./data/test.h5", key="day_close")
# 再次读取的时候, 需要指定键的名字
new_close = pd.read_hdf("./data/test.h5", key="day_close")
```
  注意：优先选择使用HDF5文件存储
  - HDF5在存储的时候支持压缩，使用的方式是blosc，这个是速度最快的也是pandas默认支持的
  - 使用压缩可以提磁盘利用率，节省空间
  - HDF5还是跨平台的，可以轻松迁移到hadoop 上面
JSON

JSON是我们常用的一种数据交换格式，前面在前后端的交互经常用到，也会在存储的时候选择这种格式。所以我们需要知道Pandas如何进行读取和存储JSON格式。
1. read_json
  
  pandas.read_json(path_or_buf=None, orient=None, typ=‘frame’, lines=False)
  - 将JSON格式准换成默认的Pandas DataFrame格式
  - orient : string,Indication of expected JSON string format.
    - ‘split’ : dict like {index -> [index], columns -> [columns], data -> [values]}
      - split 将索引总结到索引，列名到列名，数据到数据。将三部分都分开了
    - ‘records’ : list like [{column -> value}, … , {column -> value}]
      - records 以columns：values的形式输出
    - ‘index’ : dict like {index -> {column -> value}}
      - index 以index：{columns：values}...的形式输出
    - ‘columns’ : dict like {column -> {index -> value}}
      
      ,默认该格式
      - colums 以columns:{index:values}的形式输出
    - ‘values’ : just the values array
      - values 直接输出值
  - lines : boolean, default False
    - 按照每行读取json对象
  - typ : default ‘frame’，指定转换成的对象类型series或者dataframe
2. to_json
  
  DataFrame.to_json(path_or_buf=Noneorient=Nonelines=False
  - 将Pandas 对象存储为json格式
  - path_or_buf=None：文件地址
  - orient:存储的json形式，{‘split’,’records’,’index’,’columns’,’values’}
  - lines:一个对象存储为一行
3. 案例
```
# orient指定存储的json格式，lines指定按照行去变成一个样本
json_data = pd.read_json(path_or_buf="./data/Sarcasm_Headlines_Dataset.json", orient="records", lines=True)
json_data.head()
# 存储文件
json_data.to_json("./data/test.json", orient='records', lines=True)
# 读取文件
new_json = pd.read_json(path_or_buf="./data/test.json", orient="records", lines=True)
new_json.head()
```

5. DataFrame基本操作与运算

索引操作

Numpy当中我们已经讲过使用索引选取序列和切片选择，pandas也支持类似的操作，也可以直接使用列名、行名

称，甚至组合使用。

直接索引，必须先列后行

# # 直接使用行列索引名字的方式（必须先列后行）
data['open']['2018-02-27']

结合loc（索引）或者iloc（索引的下标）使用索引

# 使用loc:只能指定行列索引的名字
data.loc['2018-02-27':'2018-02-22', 'open']
# 使用iloc可以通过索引的下标去获取
# 获取前3天数据,前5列的结果
data.iloc[:3, :5]

使用ix组合索引

# 使用ix进行下表和名称组合做引
# 前4天的'open', 'close', 'high', 'low'列数据
data.ix[0:4, ['open', 'close', 'high', 'low']]

# 推荐使用loc和iloc来获取的方式
data.loc[data.index[0:4], ['open', 'close', 'high', 'low']]
data.iloc[0:4, data.columns.get_indexer(['open', 'close', 'high', 'low'])]

赋值操作

# 对DataFrame当中的close列进行重新赋值为1
# 直接修改原来的值
data['close'] = 1
# 或者
data.close = 1

排序

排序有两种形式，一种对于索引进行排序，一种对于内容进行排序

DataFrame排序

使用df.sort_values(by=, ascending=)，单个键或者多个键进行排序,

# 按照开盘价大小进行排序 , 使用ascending指定按照大小排序
data.sort_values(by="open", ascending=True).head()
# 按照多个键进行排序
data.sort_values(by=['open', 'high'])
# 参数：
# - by：指定排序参考的键
# - ascending:默认升序
#  - ascending=False:降序
#  - ascending=True:升序

使用df.sort_index给索引进行排序

# 对索引进行排序
data.sort_index()

Series排序

使用series.sort_values(ascending=True)进行排序

# series排序时，只有一列，不需要参数
data['p_change'].sort_values(ascending=True).head()

使用series.sort_index()进行排序

# 对索引进行排序
data['p_change'].sort_index().head()

算术运算

# 语法：add(other) 加法
data["open"].add(1)
# 语法：sub(other) 减法
data["open"].sub(1)

逻辑运算

逻辑运算符号

# 逻辑判断的结果可以作为筛选的依据
data["open"].head() > 23
data[data["open"] > 23].head()
# 完成多个逻辑判断
data[(data["open"] > 23) & (data["open"] < 24)].head()

逻辑运算函数

# 语法：query(expr)，expr:查询字符串
data.query("open<24 & open>23").head()
# 语法：isin(values)，可以指定值进行一个判断，从而进行筛选操作
# 判断'open'是否为23.53和23.85
data[data["open"].isin([23.53, 23.85])]

统计运算

describe：能够直接得出很多统计结果,`count`, `mean`, `std`, `min`, `max` 等

# 计算平均值、标准差、最大值、最小值等
# 语法：data.describe()

结果：

统计函数

Numpy当中已经详细介绍，在这里我们演示min(最小值), max(最大值), mean(平均值), median(中位数), var(方差), std(标准差),mode(众数)结果:

`count`	Number of non-NA observations
`sum`	Sum of values
`mean`	Mean of values 平均值
`median`	Arithmetic median of values 中位数
`min`	Minimum
`max`	Maximum
`mode`	Mode
`abs`	Absolute Value
`prod`	Product of values
`std`	Bessel-corrected sample standard deviation
`var`	Unbiased variance
`idxmax`	compute the index labels with the maximum
`idxmin`	compute the index labels with the minimum

对于单个函数去进行统计的时候，坐标轴还是按照默认列“columns” (axis=0, default)，如果要对行“index” 需要指定(axis=1)

举例：

# 使用统计函数：0 代表列求结果， 1 代表行求统计结果, data.max(1)
data.max() # data.max(0)

# 方差：std()，标准差：var()
data.std(0)
data.var(0)
# 中位数 median()，中位数为将数据从小到大排列，在最中间的那个数为中位数。如果没有中间数，取中间两个数的平均值。
df = pd.DataFrame({'COL1' : [2,3,4,5,4,2],
                   'COL2' : [0,1,2,3,4,2]})
df.median()
# 结果
# COL1    3.5
# COL2    2.0
# dtype: float64
# 求最大值最小值的位置：idxmax()、idxmin()
data.idxmax(axis=0)
data.idxmin(axis=0)

累计统计函数

函数	作用
`cumsum`	计算前1/2/3/…/n个数的和
`cummax`	计算前1/2/3/…/n个数的最大值
`cummin`	计算前1/2/3/…/n个数的最小值
`cumprod`	计算前1/2/3/…/n个数的积

以上这些函数可以对series和dataframe操作

这里我们按照时间的从前往后来进行累计

# 排序
data = data.sort_index()
# 对p_change进行求和
stock_rise = data["p_change"]
# plot方法集成了前面直方图、条形图、饼图、折线图
stock_rise.cumsum()

import matplotlib.pyplot as plt
# plot显示图形
stock_rise.cumsum().plot()
# 需要调用show，才能显示出结果
plt.show()

结果：

自定义运算
- apply(func, axis=0)
  - func:自定义函数
  - axis=0:默认是列，axis=1为行进行运算
- 定义一个对列，最大值-最小值的函数
```
data[['open', 'close']].apply(lambda x: x.max() - x.min(), axis=0)
```

6. Panda小案例

需求

现在我们有一组从2006年到2016年1000部最流行的电影数据

数据来源：https://www.kaggle.com/damianpanek/sunday-eda/data
```
wis = pd.read_csv("https://www.kaggle.com/damianpanek/sunday-eda/data")
```
- 问题1：我们想知道这些电影数据中评分的平均分，导演的人数等信息，我们应该怎么获取？
- 问题2：对于这一组电影数据，如果我们想rating，runtime的分布情况，应该如何呈现数据？
- 问题3：对于这一组电影数据，如果我们希望统计电影分类(genre)的情况，应该如何处理数据？

实现

首先获取导入包，获取数据

#内嵌画图
%matplotlib inline
import pandas  as pd 
import numpy as np
from matplotlib import pyplot as plt

#文件的路径
path = "./data/IMDB-Movie-Data.csv"
#读取文件
df = pd.read_csv(path)

问题一

得出评分的平均分
```
df["Rating"].mean()
```

得出导演人数信息

## 导演的人数
# df["Director"].unique().shape[0]
np.unique(df["Director"]).shape[0]

问题二

对于这一组电影数据，如果我们想Rating，Runtime (Minutes)的分布情况，应该如何呈现数据？

直接呈现，以直方图的形式

df["Rating"].plot(kind='hist',figsize=(20,8))

Rating进行分布展示

plt.figure(figsize=(20,8),dpi=80)
plt.hist(df["Rating"].values,bins=20)
# 求出最大最小值
max_ = df["Rating"].max()
min_ = df["Rating"].min()
# 生成刻度列表
t1 = np.linspace(min_,max_,num=21)
# [ 1.9    2.255  2.61   2.965  3.32   3.675  4.03   4.385  4.74   5.095  5.45   5.805  6.16   6.515  6.87   7.225  7.58   7.935  8.29   8.645  9.   ]
# 修改刻度
plt.xticks(t1)
# 添加网格
plt.grid()
plt.show()

Runtime (Minutes)进行分布展示

plt.figure(figsize=(20,8),dpi=80)
plt.hist(df["Runtime (Minutes)"].values,bins=20)
# 求出最大最小值
max_ = df["Runtime (Minutes)"].max()
min_ = df["Runtime (Minutes)"].min()
# 生成刻度列表
t1 = np.linspace(min_,max_,num=21)
# [ 1.9    2.255  2.61   2.965  3.32   3.675  4.03   4.385  4.74   5.095  5.45   5.805  6.16   6.515  6.87   7.225  7.58   7.935  8.29   8.645  9.   ]
# 修改刻度
plt.xticks(t1)
# 添加网格
plt.grid()
plt.show()

问题三

对于这一组电影数据，如果我们希望统计电影分类(genre)的情况，应该如何处理数据？

思路分析
- 思路
  - 1.创建一个全为0的dataframe，列索引置为电影的分类，temp_df
  - 2.遍历每一部电影，temp_df中把分类出现的列的值置为1
  - 3.求和

实现

# 1.创建一个全为0的dataframe，列索引置为电影的分类
temp_list = [i.split(",") for i in df["Genre"]]
# 获取电影的分类(去重)
genre_list = np.unique([i for j in temp_list for i in j]) 
# 增加新的列
temp_df = pd.DataFrame(np.zeros([df.shape[0],genre_list.shape[0]]),columns=genre_list)
# 2.遍历每一部电影，temp_df中把分类出现的列的值置为1
for i in range(1000):
    # temp_list[i] ['Action','Adventure','Animation']
    temp_df.ix[i,temp_list[i]]=1
# 求和 sum()，默认按列“columns”axis=0
print(temp_df.sum().sort_values())
temp_df.sum().sort_values().plot(kind="bar")

你可能感兴趣的:(人工智能,Pandas介绍,Pandas数据结构,DataFrame)

GraphQL Schema Registry：企业级GraphQL架构的利器宣连璐Maura
GraphQLSchemaRegistry：企业级GraphQL架构的利器graphql-schema-registryGraphQLschemaregistry项目地址:https://gitcode.com/gh_mirrors/gr/graphql-schema-registry项目介绍graphql-schema-registry是一个专为GraphQL联邦网关设计的企业级Schema存储
C语言的五套标准：C89、C99、C11、C17和C23（新手必看） xiecoding.cn c语言开发语言 C语言入门 C++C/C++数据结构
作为一门经典的编程语言，C语言标准随着时间不断演进，以适应新的编程需求和技术发展。本文将详细介绍C语言的五套标准：C89、C99、C11、C17和C23。我们将从每套标准的背景、主要特性入手，逐步深入，帮助你理解它们之间的差异以及对编程实践的影响。C89：奠定基础的第一个标准C89，也称为ANSIC，是C语言的第一个正式标准，由美国国家标准协会（ANSI）于1989年发布，后在1990年被国际标准
基于FSK调制的多点无线数据传输系统设计（含有源码）妄北y 竞赛项目研究实战汇集 mongodb 单片机嵌入式硬件
摘要本系统设计了一种基于FSK（频移键控）调制的多点无线数据传输系统，主要由一个主接收机和两个发射机组成。系统以89S52单片机为核心，负责数据的编码、解码及控制功能，采用FSK调制方式实现文字和语音数据的无线传输。系统配备LCD显示屏，支持数据的实时显示与存储，具备多功能传输与存储能力。本文详细介绍了系统的设计方案、硬件模块实现、软件设计及调试过程，并展示了系统的测试结果与未来应用前景。关键词：
腾讯云与阿里云，哪个更好些？云计算开发者小李阿里云腾讯云
借用一部电视剧的名字：都挺好！根据IDC最新的数据统计显示，国内前二的云计算平台分别是阿里云、腾讯云，分别背靠阿里、腾讯两大互联网集团，接下来我们就简单的介绍下两大平台。阿里云：国内最早成立的云计算平台，并且一开始就是独立运营，马爸爸宣称每年投入10亿，连续投入10年，最终阿里云的发展没有让阿里人失望，目前已成长为超千亿美元的独角兽，阿里云也由最早的带有明显淘系特色的云平台成长为综合性的云计算平台
解决VMware ESX常见问题：虚拟化故障排除指南 NauClojure 网络虚拟化
VMwareESX是一种广泛使用的虚拟化平台，但在使用过程中可能会遇到一些常见问题。本文将介绍一些常见问题，并提供相应的故障排除指南和示例代码。问题：虚拟机无法启动故障排除：确保主机上的硬件符合VMwareESX的要求，并且已正确安装和配置。检查虚拟机的配置文件是否存在错误。可以使用以下命令检查配置文件的语法：vmware-v/path/to/vm/config.vmx检查主机的存储空间是否足够，
智慧交通是什么，可以帮助我们解决什么问题? Guheyunyi 运维大数据人工智能信息可视化前端
智慧交通是什么？智慧交通（SmartTransportation）是指利用物联网（IoT）、大数据、人工智能（AI）、云计算、5G通信等先进技术，对交通系统进行智能化管理和优化，以提高交通效率、减少拥堵、降低事故率、提升出行体验，并实现交通资源的合理配置和可持续发展。智慧交通的核心是通过数据采集、分析和应用，实现交通系统的智能化、自动化和协同化，从而构建一个高效、安全、绿色、便捷的交通生态系统。智
微前端 qiankun vite vue3 可缺不可滥前端项目框架前端
文章目录简介主应用qiankun-mainvue3vite子应用qiankun-app-vue2webpack5子应用qiankun-reactwebpack5子应用quankun-vue3vite遇到的问题简介主要介绍以qiankun框架为基础，vite搭建vue3项目为主应用，wepackvue2和webpackreact搭建的子应用，形成的一个微前端框架。主应用qiankun-mainvue
【3D模型】【游戏开发】【Blender】Blender模型分享-狮头木雕附导入方法踏雪无痕老爷子资源介绍 3d blender
导入方法：[Blender]如何导入包含纹理的.blend模型文件在3D建模和渲染工作中，Blender是一款功能强大的免费开源软件。很多时候，我们需要导入.blend后缀的模型文件，同时确保纹理（textures）文件夹中的贴图能够正确加载。本文将介绍详细的导入步骤以及可能遇到的问题和解决方案。1.直接打开.blend文件如果你的.blend文件是一个完整的工程文件，包含了模型和纹理，直接打开即
springBoot中myBatisPlus的使用无足鸟丶 spring boot 后端 java
MyBatis-Plus是一个MyBatis的增强工具，在SpringBoot项目里使用它能极大提升开发效率。下面为你详细介绍在SpringBoot中使用MyBatis-Plus的步骤以及示例代码。1.创建SpringBoot项目你可以借助SpringInitializr（https://start.spring.io/）来创建一个新的SpringBoot项目，添加以下依赖：SpringWebSp
springBoot中不添加依赖 , 手动生成一个token ,并校验token (使用简单 , 但是安全会低一点) 无足鸟丶 spring boot 安全后端
在SpringBoot里，即便不添加额外依赖，也能手动生成和校验Token。下面以简单的基于时间戳和密钥的方式来生成和校验Token为例，介绍具体实现步骤。实现思路生成Token：把用户信息、时间戳等数据组合起来，再用密钥进行哈希处理，生成一个唯一的Token。校验Token：从Token里提取出用户信息和时间戳，重新进行哈希处理，然后与原Token进行对比，同时检查时间戳是否过期。代码实现1.创
Browser-Use WebUI项目启动指南思考在马桶上人工智能 chatgpt 经验分享 python
摘要此前发布《Browser-UseWebUI使用体验》博文后，鉴于部分朋友运行时出现问题，重新运行并整理相关内容。本文详细记录WebUI项目启动全过程，涵盖Python3.11+、Chrome浏览器及APIKeys等环境要求，Python环境检查、依赖安装等环境配置步骤，.env文件中环境变量的设置方法。同时，针对启动中如lxml.html.clean依赖缺失、连接被拒等问题给出解决方案，介绍启
java-生成二维码，并写入word尾页【基础篇】橙-极纪元JJYCheng java word 开发语言
java-生成二维码，并写入word尾页【基础篇】介绍项目框架：SpringBoot项目管理：Maven推荐文章1：java-生成二维码，二维码增加logo，读取二维码推荐文章2：java-生成二维码，并写入word尾页【基础篇】推荐文章3：java-生成二维码，并写入word尾页【高级篇】推荐文章4：java
【C++篇】排队的艺术：用生活场景讲解优先级队列的实现 far away4002 C++c++stl 优先级队列向下（向上）调整算法
文章目录须知欢迎讨论：如果你在学习过程中有任何问题或想法，欢迎在评论区留言，我们一起交流学习。你的支持是我继续创作的动力！点赞、收藏与分享：觉得这篇文章对你有帮助吗？别忘了点赞、收藏并分享给更多的小伙伴哦！你们的支持是我不断进步的动力！分享给更多人：如果你觉得这篇文章对你有帮助，欢迎分享给更多对C++感兴趣的朋友，让我们一起进步！深入理解与实现：C++优先级队列的模拟实现1.引言在算法和数据结构中
【开题报告+论文+源码】基于SpringBoot+Vue的社区团购配送系统编程毕设 spring boot 后端 java
项目背景与意义随着社会的进步和收入的提高，消费者对购物体验有了更高的要求。他们希望获得更多样化的商品选择，更加便捷的购物方式，以及更加优质的售后服务。同时，越来越多的老年人开始关注健康饮食和食品质量。他们不再满足于传统的购物方式，而是希望通过更加方便的方式来获取更加安全和健康的食品。社区团购配送系统在满足用户日常生活需求的同时，也带来了许多便利和机遇。项目介绍本课程演示的是一款基于SpringBo
新手必看——ctf六大题型介绍及六大题型解析&举例解题沛哥网络安全 web安全学习安全 udp 网络协议
CTF（CaptureTheFlag）介绍与六大题型解析一、什么是CTF？CTF（CaptureTheFlag），意为“夺旗赛”，是一种信息安全竞赛形式，广泛应用于网络安全领域。CTF竞赛通过模拟现实中的网络安全攻防战，让参赛者以攻防对抗的形式，利用各种信息安全技术进行解决一系列安全问题，最终获得“旗帜（Flag）”来获得积分。CTF赛事一般分为两种形式：Jeopardy（解题模式）：参赛者通过解
C#实战：使用ZXing.NET库轻松生成二维码与条形码墨瑾轩一起学学C#【一】c#.net 开发语言
下面我将详细介绍C#中用于生成二维码和条形码的库——ZXing.NET，并附带一份详细的代码示例，其中每行代码均配有注释以解释其功能。ZXing.NET是基于开源项目ZXing（ZebraCrossing）的.NET移植版，它提供了生成和解析多种一维条形码和二维二维码的功能。准备工作首先，确保您已通过NuGet包管理器在项目中安装了ZXing.NET库。在VisualStudio中，可以通过以下步
Redis 使用入门与进阶指南 ohn.yu 技术杂谈 redis 数据库缓存
Redis（RemoteDictionaryServer）是一个高性能的开源内存数据存储系统，常被用作数据库、缓存和消息队列。它以速度快、支持多种数据结构和简单易用而著称。本文将带你从Redis的基础用法开始，逐步深入到适合中级技术人员的实际应用场景。如果你是一个初学者或有一定经验的技术人员，这篇博客会帮助你更好地掌握Redis。什么是Redis？Redis是一个键值对存储系统，但它不仅仅是简单的
【Vue+TypeScript实战指南：提高代码质量和开发效率】小怪兽9699 typescript vue.js 前端
前言在现代前端开发中，Vue.js是一个非常流行且强大的框架，而TypeScript则是增强代码类型安全性和可维护性的利器。本文将详细介绍如何结合Vue和TypeScript来构建高质量的应用程序。无论你是有一定基础的开发者还是希望进一步提升技能的高手，本文都将为你提供详细的步骤和代码示例。1.环境搭建首先，确保你已经安装了Node.js和npm。然后，全局安装VueCLI：npminstall-
Deno入门教程：Node.js 的替代品 xiaoweids 编程语言 JavaScript node.js javascript 开发语言
转自：微点阅读https://www.weidianyuedu.com这几天假期，我学习了一下Deno[1]。它是Node.js的替代品。有了它，将来可能就不需要Node.js了。这篇文章就是Deno的一个初步介绍，尝试回答为什么Node.js不能满足需要，以及Deno能够带给我们什么？以下内容主要基于BertBelder[2]和RyanDahl[3]的最新演讲。0、进入主题之前，先说一下Deno
在线视频创作平台（Vidnami） deepdata_cn 视频生成视频剪辑视频创作
Vidnami是一款功能强大的在线视频创作平台，前身为ContentSamurai，于2015年推出，2020年更名为Vidnami。它运用人工智能技术，能够分析输入的文本，自动从大量素材中选取合适的图像和视频片段，将文字快速转化为具有专业外观的视频，无需用户具备视频编辑经验。该平台提供多种视频模板、全主题定制功能以及内置的免版权媒体库，包括3000万张图片和3万首音乐，还支持自动配音，用户可以录
Ubuntu执行apt-get install xxx报错怎么办？
在Ubuntu系统中，使用apt-getinstall命令安装软件包时，可能会遇到各种报错。本文将详细介绍Ubuntu执行apt-getinstallxxx报错的解决方法，帮助您快速定位并解决问题。️常见报错及解决方法1.更新源和软件包问题：软件包信息过时，导致无法找到或安装最新的软件包。解决方法：首先确保系统源和软件包是最新的，执行以下命令更新：sudoaptupdatesudoaptupgra
混合整数非线性规划的松弛与分解方法 Waiyuet Fung 混合整数非线性规划松弛方法分解技术启发式算法全局优化
背景简介混合整数非线性规划（MINLPs）作为运筹学中的一个重要领域，涉及到优化问题的连续和离散变量混合，在工程设计、生产调度、资源分配等多个领域发挥着关键作用。本书由I.Nowak撰写，旨在深入探讨这一复杂的优化问题及其解决方案。MINLPs基础概念在本书的第一部分，Nowak介绍了MINLPs的基本概念。MINLPs的目标是寻找一组连续和整数变量的最优组合，以最小化或最大化某个非线性目标函数。
设计模式-对象性能墨染萧然设计模式设计模式单例模式享元模式 C++
对象性能前言1.Singleton1.1模式介绍1.2模式代码1.2.1懒汉模式1.2.2饿汉模式2.Flyweight2.1模式介绍2.2模式代码2.3模式类图2.4要点总结前言"对象性能”模式：面向对象很好地解决了“抽象”的问题，但是不可避免地要付出一定的代价。对于通常情况来讲，面向对象的成本大都可以忽略不计。但是某种情况下，面向对象所带来的成本必须谨慎处理。典型模式：Singleton单例模
【初学者】请介绍一下指针分析（Pointer Analysis）？ lisw05 计算机科学技术 c语言指针
李升伟整理指针分析（PointerAnalysis）指针分析（PointerAnalysis）是一种静态程序分析技术，用于确定程序中指针可能指向的内存位置或对象。它是编译器优化、程序验证、漏洞检测和并行化等领域的重要基础。1.指针分析的目标指针分析的主要目标是回答以下问题：指针变量可能指向哪些内存位置或对象？两个指针是否可能指向同一个内存位置（别名分析）？指针的指向关系如何影响程序的行为？通过回答
OpenCV第1课OpenCV 介绍及其树莓派下环境的搭建嵌入式老牛树莓派之OpenCV opencv 人工智能计算机视觉
1.机器是如何“看”的我们人类可以通过眼睛看到五颜六色的世界，是因为人眼的视觉细胞中存在分别对红、绿、蓝敏感的3种细胞。其中的光感色素根据光线的不同进行不同比例的分解，从而让我们识别到各种颜色。对人工智能而言，学会“看”也是非常关键的一步。那么机器人是如何看到这个世界的呢？这就涉及到人工智能方向重要的分支--机器视觉。机器视觉即用机器人代替人眼来做测量和判断，通过机器视觉产品（即图像摄取装置，分C
Socketioxide：Rust 中的 Socket.IO 服务器实现时闯虎
Socketioxide：Rust中的Socket.IO服务器实现socketioxideAsocket.ioserverimplementationinRustthatintegrateswiththeTowerecosystemandtheTokiostack.项目地址:https://gitcode.com/gh_mirrors/so/socketioxide项目介绍Socketioxide
Rust为Node.js开发者设计：入门到实战平依佩Ula
Rust为Node.js开发者设计：入门到实战rust-for-node-developersAnintroductiontotheRustprogramminglanguageforNodedevelopers.项目地址:https://gitcode.com/gh_mirrors/ru/rust-for-node-developers项目介绍欢迎来到《Rust为Node.js开发者设计》的实践
NestJS Bull 和 BullMQ 模块：高效、可扩展的后端应用框架严微海
NestJSBull和BullMQ模块：高效、可扩展的后端应用框架bullBullmoduleforNestframework(node.js):cow:项目地址:https://gitcode.com/gh_mirrors/bul/bull项目介绍NestJS是一个基于Node.js的渐进式框架，专为构建高效且可扩展的服务器端应用程序而设计。NestJSBull和BullMQ模块是其生态系统中的
Manus详细介绍 accurater c++算法笔记深度学习人工智能神经网络
第一章Manus的技术背景与核心突破初识ManusAI1.1什么是Manus？Manus是由中国团队Monica.im于2025年3月推出的全球首款通用型AI智能体（AIAgent）。其名称源自拉丁语“MensetManus”，意为“手脑并用”，强调将大模型的逻辑推理能力转化为实际生产力。与传统的对话式AI（如ChatGPT、DeepSeek）不同，Manus的核心定位是“执行型助手”，能够自主完
Nginx限流与鉴权（Nginx Traffic Limiting and Authentication） Linux运维老纪奋力拼搏让企业网站更好 nginx 运维云计算 linux 运维开发数据库
Nginx限流与鉴权：2分钟搞定流量洪峰与安全防护在现代互联网架构中，Nginx已经成为了非常重要的组件，广泛应用于负载均衡、反向代理以及静态资源的服务。除了这些基本功能，Nginx还提供了丰富的配置选项来处理限流（RateLimiting）和鉴权（Authentication）。这两项技术对于确保服务的可用性和安全性至关重要，特别是在高并发和敏感数据访问场景中。本文将详细介绍如何在Nginx中配
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http

Pandas学习

Pandas学习

1. Pandas介绍

2. 为什么使用Pandas

3. Pandas数据结构

说明

Series

1.Series的创建

2. Series的属性

index

DataFrame

DataFrame的创建

DataFrame的属性

DatatFrame索引的设置

修改行列索引值（必须全部修改）

重设索引

以某列值设置为新的索引

MultiIndex与Panel

MultiIndex

multiIndex的特性

multiIndex的创建

Panel

4. Pandas文件读取与存储

CSV

read_csv

to_csv

HDF5

read_hdf与to_hdf

案例

JSON

read_json

to_json

案例

5. DataFrame基本操作与运算

索引操作

赋值操作

排序

DataFrame排序

使用df.sort_values(by=, ascending=)，单个键或者多个键进行排序,

使用df.sort_index给索引进行排序

Series排序

算术运算

逻辑运算

逻辑运算符号

逻辑运算函数

统计运算

describe： 能够直接得出很多统计结果,count, mean, std, min, max 等

统计函数

累计统计函数

自定义运算

6. Panda小案例

需求

实现

首先获取导入包，获取数据

问题一

问题二

问题三

你可能感兴趣的:(人工智能,Pandas介绍,Pandas数据结构,DataFrame)

describe：能够直接得出很多统计结果,`count`, `mean`, `std`, `min`, `max` 等