輕栀

一文教会pandas

今天的笔试题令我感触很深，回顾一下之前写的都是低代码想想都。。。

anareport[['reportid','anndt','stockid']].drop_duplicates().rolling(window=10,min_periods=1).sum().groupby(['anndt','stockid'])['reportid'].count()
df=anareport[['reportid','anndt','stockid']].drop_duplicates()
pd.crosstab(df['anndt'],df['stockid']).rolling(window=10,min_periods=1).sum().fillna(0)

能看懂以上代码可自行跳过本文

1、joining and merging

下面是三个数据框：

import pandas as pd

df1 = pd.DataFrame({'HPI':[80,85,88,85],
                    'Int_rate':[2, 3, 2, 2],
                    'US_GDP_Thousands':[50, 55, 65, 55]},
                   index = [2001, 2002, 2003, 2004])

df2 = pd.DataFrame({'HPI':[80,85,88,85],
                    'Int_rate':[2, 3, 2, 2],
                    'US_GDP_Thousands':[50, 55, 65, 55]},
                   index = [2005, 2006, 2007, 2008])

df3 = pd.DataFrame({'HPI':[80,85,88,85],
                    'Unemployment':[7, 8, 9, 6],
                    'Low_tier_HPI':[50, 52, 50, 53]},
                   index = [2001, 2002, 2003, 2004])

用merge合并

print(pd.merge(df1,df3, on='HPI'))

结果为：

merge 的时候, 会自动忽略索引列. 当然, 我们也可以使用多个列做基准如下:

print(pd.merge(df1,df2, on=['HPI','Int_rate']))

结果：

不共享公共列时, 所以两个列都会保留

可以将其设置成索引：

df4.set_index('HPI', inplace=True)
df4

结果为：

如果在合并之前，有相同的索引列就可以用join了：

df1.set_index('HPI', inplace=True)
df3.set_index('HPI', inplace=True)

joined = df1.join(df3)
print(joined)

结果为：

对上述数据稍加修改：

df1 = pd.DataFrame({
                    'Int_rate':[2, 3, 2, 2],
                    'US_GDP_Thousands':[50, 55, 65, 55],
                    'Year':[2001, 2002, 2003, 2004]
                    })

df3 = pd.DataFrame({
                    'Unemployment':[7, 8, 9, 6],
                    'Low_tier_HPI':[50, 52, 50, 53],
                    'Year':[2001, 2003, 2004, 2005]})

按照year合并得到：

merged = pd.merge(df1,df3, on='Year')
merged.set_index('Year', inplace=True)
print(merged)

结果为：

merge默认取的是交集，这就引出了另一个参数 "how", 通过对这个参数的定义, 可以选择以什么样的方式合并数据. 参数值有以下四种:

Left - 以左边的索引值为准.
Right - 以右边的索引值为准.
Outer - 取并集.
Inner - 取交集

这里展示outer效果：

merged = pd.merge(df1,df3, on='Year', how='outer')
merged.set_index('Year', inplace=True)
print(merged)

结果为：

取并集的时候, 有时可能会想要知道,某个数据是来自哪边, 可以通过 indicator 参数来获取:

df = pd.merge(df1, df2, on='city', how='outer', indicator=True)

会添加merge列，显示数据来自哪一个数据框

缺失值直接用NA填充。

此时用join效果和merge一致：

df1.set_index('Year', inplace=True)
df3.set_index('Year', inplace=True)
joined = df1.join(df3, how="outer")
print(joined)

结果为：

2、生成dataframe方式

更多可参考：IO Tools (Text, CSV, HDF5, ...) — pandas 0.22.0 documentation

#读取csv文件：
df = pd.read_csv("/Users/rachel/Downloads/weather.csv")
#读取excel文件：，末尾为sheet参数
df = pd.read_excel("/Users/rachel/Downloads/weather.xlsx", "weather")

#字典转换：
weather_data = {
    'day': ['1/1/2017','1/2/2017','1/3/2017'],
    'temperature': [32,35,28],
    'windspeed': [6,7,2],
    'event': ['Rain', 'Sunny', 'Snow']
    }
df = pd.DataFrame(weather_data)

#元组转换：
weather_data = [
    ('1/1/2017',32,6,'Rain'),
    ('1/2/2017',35,7,'Sunny'),
    ('1/3/2017',28,2,'Snow')
    ]
df = pd.DataFrame(data=weather_data, columns=['day','temperature','windspeed','event'])

#列表转换：
weather_data = [
    {'day': '1/1/2017', 'temperature': 32, 'windspeed': 6, 'event': 'Rain'},
    {'day': '1/2/2017', 'temperature': 35, 'windspeed': 7, 'event': 'Sunny'},
    {'day': '1/3/2017', 'temperature': 28, 'windspeed': 2, 'event': 'Snow'},
    ]
df = pd.DataFrame(data=weather_data, columns=['day','temperature','windspeed','event'])

#自行指定列名生成数据框
df=pd.DataFrame(columns=['a','b'])

3、缺失值处理

new_df = df.fillna(method='ffill')#参考上一行的值填充
new_df = df.fillna(method='bfill')#参考下一行的值填充
new_df = df.fillna(method='bfill', axis='columns')#横向从右向左填充
new_df = df.fillna(method='ffill', axis='columns')#横向从左向右填充
new_df = df.interpolate()#取空值前后的中间值
new_df = df.dropna()#舍弃所有NA的行
new_df = df.dropna(how='all')#舍弃所有列都为空值的行
new_df = df.dropna(thresh=1)#保留至少有一个列有值的行，thresh=1至少有两个列有值的行
df['value'] = df.groupby('group')['value'].transform(lambda x: x.fillna(x.mean()))# 分组后用组内均值填充NA
df['value'] = df.groupby('group')['value'].transform(lambda x: x.fillna(x.mode()[0]))#分组后用组内众数填充NA值
#补足所缺的日期
dt = pd.date_range('2024-01-01', '2024-11-11')#设置日期范围
idx = pd.DatetimeIndex(dt)#重新定义索引
df = df.reindex(idx)

4、replace函数

new_df = df.replace([-99999, -88888], np.NaN)#用na替代列表中的异常值
new_df = df.replace({'temperature' : -99999,'windspeed':[-99999, -88888],'event': '0'}, np.NaN)#用字典处理每一列中异常值
new_df = df.replace({'temperature': '[A-Za-z]','windspeed': '[A-Za-z]'} ,'', regex=True)#正则表达式+字典处理每一列值格式

df = pd.DataFrame({'score': ['exceptional', 'average', 'good', 'poor', 'average', 'exceptional'],
    'student': ['rob', 'maya', 'jorge', 'tom', 'july', 'erica']})
new_df = df.replace(['poor', 'average', 'good', 'exceptional'], [1, 2, 3, 4])#指代功能

5、用pivot table做格式转换

import akshare as ak
code_list = ['000001','000002','000004','000005','000006','000007','000008']
df = pd.DataFrame(columns = ['date','code','open','high','low','close','volume'])
for code in code_list:
    data = ak.stock_zh_a_hist(code, period="daily", start_date = '20231214', end_date = '20231219', adjust="qfq")
    data = data[['日期','开盘','最高','最低','收盘','成交量']]# 选取日期、高开低收价格、成交量数据
    data = data.rename(columns={'日期': 'date','开盘': 'open','最高': 'high','最低': 'low','收盘': 'close','成交量':'volume'})
    data['code'] = code
    df = pd.concat([df,data])
print(df)

原来：

格式转换：#格式转换, 设置 'date' 为索引列, 也就让'date' 做每一行的输出依据, 然后设置'code' 为每一列输出的依据,输出值为close

df.pivot(index='date', columns='code', values='close')

不指定输出值：

df.pivot(index='date', columns='code')

用 pivot table 来做整合:

df.pivot_table(index='date', columns='code', values='close')

对于 pivot_table() 函数, 可以通过第三个参数 'aggfun' 来做很多的变化：

适用于：如果某个变量在同一时刻有多个值：（上海在同一天温度有多个值，我需要统计）

df.pivot_table(index='city', columns='date', aggfunc='sum')#取和
df.pivot_table(index='city', columns='date', aggfunc='count')#计数
df.pivot_table(index='city', columns='date', aggfunc='diff')#求差异
df.pivot_table(index='city', columns='date', aggfunc='mean')#求均值
df.pivot_table(index='city', columns='date', margins=True)#横向纵向分别求和的平均值

6、group by 用法

常用于替代循环操作

print(df.groupby('code')['close'].sum())#显示分组后某变量的特征

循环输出分组后的数据：

df1 = df.groupby('code')
for code, code_df in df1:
    print(code)
    print(code_df)

获取其中的某一组的数据:

df1.get_group('000001')

df1.min()#每一组的最小值
df1.max()#每一组的最大值
df1.describe()#每一组的描述
%matplotlib inline
df1.plot()#每一组数据分别画图

7、concat用法

将两个数据框进行拼接，数据分别来自两个 dataframe 的索引值, 可以通过忽略原本的索引来做改变:

按行拼接：

df = pd.concat([india_weather, us_weather], ignore_index=True)#会重置索引
df = pd.concat([india_weather, us_weather])

将每个数据框设置关键字进行拼接（索引会保留），同时关键字也会成为索引：

df = pd.concat([india_weather, us_weather], keys=['india', 'us'])
df.loc['india']

按列拼接：

df = pd.concat([temperature_df, windspeed_df], axis=1)

当两个数据框的行数不同时，添加索引按列拼接：

temperature_df = pd.DataFrame({
    'city': ['newyork', 'chicago', 'orlando'],
    'temperature': [21, 24, 32],
}, index=[0, 1, 2])

windspeed_df = pd.DataFrame({
    'city': ['chicago', 'newyork'],
    'temperature': [12, 7],
}, index=[1, 0])
df = pd.concat([temperature_df, windspeed_df], axis=1)
df

结果为（自动补全NA）：

8、melt格式转换

宽数据框变窄数据框：id_vars=['code','date']是不进行转换的列，

df1 = pd.melt(df, id_vars=['code','date'])
df1

变量是列名，结果为：

也可以自定义列名：

df1 = pd.melt(df, id_vars=['code','date'], var_name='var', value_name='price')

9、stack 和 unstack

字面意思就是"组成堆"和"解除堆"。其实, 也是对数据格式的一种转变方式：

模拟首先设置两个表头：

import akshare as ak
code_list = ['000001','000002','000004','000005','000006','000007','000008']
df = pd.DataFrame(columns = ['date','code','open','high','low','close','volume'])
for code in code_list:
    data = ak.stock_zh_a_hist(code, period="daily", start_date = '20231218', end_date = '20231219', adjust="qfq")
    data = data[['日期','开盘','最高','最低','收盘','成交量']]# 选取日期、高开低收价格、成交量数据
    data = data.rename(columns={'日期': 'date','开盘': 'open','最高': 'high','最低': 'low','收盘': 'close','成交量':'volume'})
    data['code'] = code
    df = pd.concat([df,data])

columns = pd.MultiIndex.from_arrays([['date','code','code', 'code', 'volume','volume','volume'], ['date','code','open','high','low','close','volume']])
# 为DataFrame设定一级表头和二级表头
df.columns = columns
print(df.head(4))
df['code'].head(4)

结果为：

实际数据df为：

df_stacked = df.stack()
df_stacked

原来的数据结构是有两行表头, 经过 stack 之后, 就变成一行了, 也就是 Facebook Google Microsoft 这一行, 从原来的列名, 变成了索引:

再 unstack：

df_stacked.unstack()

数据df2：

stack 一下:

df2.stack()

结果为（第三行表头成为列索引）：

设置参数 level=1:

df2.stack(level=1)

这次是第二行表头被 stack 了，结果为：

可以总结, stack 的作用就是可以将横向的表头(列名)转成纵向的索引列展示, 对于多行表头而言, 具体要转换哪一行取决于 level 参数, 如果不指定, 则默认转换最下面一行表头。

10、crosstab交叉列表取值

生成模拟数据：

import pandas as pd
import random

# 创建空的数据框
df = pd.DataFrame(columns=['name', 'nation', 'sex', 'age'])

# 生成8行数据
for i in range(8):
    name = f"Person{i+1}"
    nation = random.choice(['USA', 'China', 'Japan'])
    sex = random.choice(['male', 'female'])
    age = random.randint(18, 60)
    
    # 检查name是否已经存在
    while name in df['name']:
        name = f"Person{i+1}"
    
    # 添加数据到数据框
    df.loc[i] = [name, nation, sex, age]

# 打印数据框
print(df)

数据如：

交叉表：

pd.crosstab(df.nation, df.sex)

结果为：

crosstab 第一个参数是列, 第二个参数是行. 还可以添加第三个参数:

pd.crosstab(df.nation, df.sex, margins = True)#统计边缘总个数的

同时, 行和列都可以是复合的:

pd.crosstab(df.nation,[df.sex,df.age], margins = True)

结果为：

交叉表还有其他很多强大功能:

import numpy as np
pd.crosstab(df.nation, df.sex, normalize='index')#百分比

pd.crosstab(df.nation, df.sex, values=df.age, aggfunc=np.average)#求平均值

从定义可以看到有很多方法：

11、datetimeindex 和resample

将字符型日期转换成日期格式并设置成索引

import akshare as ak
code_list = ['000001','000002','000004','000005','000006','000007','000008']
df = pd.DataFrame(columns = ['date','code','open','high','low','close','volume'])
for code in code_list:
    data = ak.stock_zh_a_hist(code, period="daily", start_date = '20231211', end_date = '20231219', adjust="qfq")
    data = data[['日期','开盘','最高','最低','收盘','成交量']]# 选取日期、高开低收价格、成交量数据
    data = data.rename(columns={'日期': 'date','开盘': 'open','最高': 'high','最低': 'low','收盘': 'close','成交量':'volume'})
    data['code'] = code
    df = pd.concat([df,data])
print(df.head(3))
df['date'] = pd.to_datetime(df['date'])
df=df.set_index('date')
print(df.head(3))
type(df.index)

结果为：

有了日期可以灵活运用：

df[df.index=='2023-12-11'].close.mean()

结果为：

下面来看下关于 resample() 函数的使用:

df.close.resample('d').mean()

首先我们要获取所有的闭市数据, 在这个数据基础上又通过 resample() 函数加以加工, 函数里传的参数是 D, 就是 Day 的缩写, 也就是我们要以天为单位, 也就是说要每个整天的数据, 那要每个天的什么值, 这个是必须要指定的, 否则计算机不知道是返回每个月的合计,还是最小值, 还是平均值等等, 所以后面用了 mean(), 也就是说要取平均值。还可以画图：

df.close.resample('D').mean().plot()

12、设置交易日历date_range和asfreq

rng = pd.date_range(start='1/1/2024', end='1/31/2024', freq='B')#只取工作日
rng = pd.date_range(start='1/1/2017', periods=72, freq='B')#另外一种方式设置交易日历 # H 为小时
df.set_index(rng, inplace=True)#设置成交日历索引

日期序列的补充函数 asfreq().上面的例子数据里缺少了周末的数据, 所以如果想要补充这部分数据的话, 可以用下面的方式.:

df.asfreq('D', method='pad') #W为周

参数 D 表示以"天"为单位, 连续取值

13、redis

Redis 的含义： REmote DIctionary Server 远程词典服务器；由于支持 string, list, set, ordered set, hash 等多重数据结构, 因此, 经常被称作数据结构服务器.

Redis 的特点：开源；以 key-value 形式存在；存储在内存中；支持持久化；用底层是C语言；；非关系型数据库(同为非关系型数据库的还有 MongoDB, memcached, CouchDB)

用途：非关系数据库；缓存；信息订阅(message broker)

下载传送门：Releases · tporadowski/redis (github.com)下载zip格式的

下载后解压到指定位置如：C:\Users\59980\redis

命令行进入该目录下，输入：启动redis服务

redis-server.exe redis.windows.conf

默认端口为6379，出现图上的图标说明redis服务启动成功。命令里面的 redis.windows.conf 可以省略，省略后，使用redis-server.exe命令会使用默认的配置。

建议把redis目录添加到环境变量中，就比较方便了。

此时不要关闭上面窗口，重新开个cmd窗口，输入以下命令配置

用redis-cli.exe命令来打开Redis客户端：

redis-cli.exe -h 127.0.0.1 -p 6379

显示：

再输入：

ping

至此连接成功，到此Redis的安装和部署也就完成了。

Redis默认拥有16个数据库，初始默认使用0号库，在命令行中通过select命令将数据库切换到8号数据库：

select 8

在命令中通过set命令设置键值，通过get命令取出键值：

set key hello
get key

在命令中通过shutdown命令来关闭redis服务：

同时启动窗口会出现提示：

Redis常用的服务指令

卸载服务：redis-server --service-uninstall

开启服务：redis-server --service-start

停止服务：redis-server --service-stop

可视化工具有：RedisStudio；treeNMS

redis 的数据结构就是一系列的键值对
键 -> printable ASCII (可打印的 ASCII 码, 最大值是 512MB)
值 ->

Primitives (基本的)
- string 字符串 (最大值是 512MB)
Containers (of string) (以其他形式包裹的字符串)
- hash (哈希)
- list (序列)
- set (集合)
- ordered set (有序集合)
下图是关于存储字符串值的示意图

获取所有键：

keys *

删除一条数据：

del key

更新某个键的值：

set hello world
get hello
set hello wrold?
get hello

一次性删除所有数据：

flushall

介绍一些进阶命令:

清理终端:

clear

设置一个键值对, 同时设置过期时间为10秒:

setex name 10 max
get name
"max"

查看剩余的过期时间:

127.0.0.1:6379> ttl name
(integer) 4
127.0.0.1:6379> ttl name
(integer) 0
127.0.0.1:6379> get name
(nil)

设置一个键值对, 同时设置过期时间为30000毫秒, 注意, 使用 psetex 设置过期时间, 时间的单位为毫秒:

127.0.0.1:6379> psetex name3 30000 july
OK
127.0.0.1:6379> ttl name3
(integer) 26

设置一个键值对, 但是想要确认这个键是否已被占用, 可以用 setnx, 如果已经被占用, 则返回0, 即没有执行成功:

127.0.0.1:6379> set name tom
OK
127.0.0.1:6379> setnx name join
(integer) 0
127.0.0.1:6379> get name
"tom"

如果未被占用, 则返回1, 即操作成功:

127.0.0.1:6379> setnx name2 join
(integer) 1
127.0.0.1:6379> get name2
"join"
127.0.0.1:6379> keys *
1) "name2"
2) "name"

获取值的字符串长度:

127.0.0.1:6379> get name
"tom"
127.0.0.1:6379> strlen name
(integer) 3
127.0.0.1:6379> get name2
"join"
127.0.0.1:6379> strlen name2
(integer) 4

同时设置多个键值对, 这里故意设置了两个 num2 的值, 可以看到会存入后者:

127.0.0.1:6379> mset num1 40 num2 60 num2 70
OK
127.0.0.1:6379> keys *
1) "name"
2) "name2"
3) "num1"
4) "num2"
127.0.0.1:6379> get num2
"70"

以 1 为单位, 增加/减少值:

127.0.0.1:6379> get num1
"40"
127.0.0.1:6379> decr num1
(integer) 39
127.0.0.1:6379> get num1
"39"
127.0.0.1:6379> incr num1
(integer) 40
127.0.0.1:6379> get num1
"40"

增加/减少值, 但是可以自定义每次增加/减少的量:

127.0.0.1:6379> incrby num1 5
(integer) 45
127.0.0.1:6379> get num1
"45"
127.0.0.1:6379> decrby num1 10
(integer) 35
127.0.0.1:6379> get num1
"35"

附加拼接命令:

127.0.0.1:6379> set mykey hello
OK
127.0.0.1:6379> get mykey
"hello"
127.0.0.1:6379> append mykey " world"
(integer) 16
127.0.0.1:6379> get mykey
"hello world"

哈希值：

redis 存储的是键值对, 键永远都是可以打印的 ASCII 码, 值是字符串, 或者是以其他形式包裹的字符串. 上面介绍了单纯字符串值的相关命令, 现在开始接触第一个所谓的"以其他形式包裹的字符串" --- 哈希值，下图中哈希值的部分, 一共有4行, 可以看作是一个数组, 里面包含了4个元素, 再看每一个元素(也就是每一行)都有一个 field 与 value 对应, 可以看作是一个映射(map). 总结哈希值的数据结构就是数组包含映射(list > map, 这是从 python 的角度理解的, 如果从 php 的角度, 我觉得有点像是一个二维数组)

设置一条哈希数据存储:

127.0.0.1:6379> hmset stu-1 name max age 16 sex male
OK

获取值中的某个字段, 要指定字段名:

127.0.0.1:6379> hget stu-1 name
"max"

获取某个键的哈希值的指定字段的值:

127.0.0.1:6379> hmget stu-1 name
1) "max"
127.0.0.1:6379> hmget stu-1 name age
1) "max"
2) "18"

获取全部的哈希值:

127.0.0.1:6379> hgetall stu-1
1) "name"
2) "max"
3) "age"
4) "16"
5) "sex"
6) "male"

判断某个键的哈希值的某个字段是否存在:

127.0.0.1:6379> hexists stu-1 surname
(integer) 0
127.0.0.1:6379> hexists stu-1 name
(integer) 1

删除某个键的哈希值的某个字段:

127.0.0.1:6379> hdel stu-1 sex
(integer) 1
127.0.0.1:6379> hgetall stu-1
1) "name"
2) "max"
3) "age"
4) "16"

设置某个键的哈希值的某个字段:

127.0.0.1:6379> hmset stu-1 sex male
OK
127.0.0.1:6379> hgetall stu-1
1) "name"
2) "max"
3) "age"
4) "16"
5) "sex"
6) "male"

设置某个键的哈希值的某个字段前, 先判断这个字段是否可用, 如果可用则返回1, 表示设置成功, 如果不可用则返回0, 表示设置失败:

127.0.0.1:6379> hsetnx stu-1 name tom
(integer) 0
127.0.0.1:6379> hsetnx stu-1 surname tom
(integer) 1
127.0.0.1:6379> hsetnx stu-1 class 3
(integer) 1
127.0.0.1:6379> hgetall stu-1
 1) "name"
 2) "max"
 3) "age"
 4) "16"
 5) "sex"
 6) "male"
 7) "class"
 8) "3"
 9) "surname"
10) "tom"

判断某个键的哈希值的某个字段是否存在, 如果存在则返回1:

127.0.0.1:6379> hexists stu-1 class
(integer) 1
127.0.0.1:6379> hget stu-1 class
"3"

获取某个键的所有字段名:

127.0.0.1:6379> hkeys stu-1
1) "name"
2) "age"
3) "sex"
4) "class"
5) "surname"

获取某个键的所有字段的值:

127.0.0.1:6379> hvals stu-1
1) "max"
2) "16"
3) "male"
4) "3"
5) "tom"

以自定义的幅度, 增加某个键的哈希值的某个字段的值:

127.0.0.1:6379> hincrby stu-1 age 2
(integer) 18
127.0.0.1:6379> hgetall stu-1
 1) "name"
 2) "max"
 3) "age"
 4) "18"
 5) "sex"
 6) "male"
 7) "class"
 8) "3"
 9) "surname"
10) "tom"

查看某个键的哈希值一共有几个字段:

127.0.0.1:6379> hlen stu-1
(integer) 5

以上, 就是关于哈希值的基本命令

list值：

list 值就是一组根据插入顺序排列的字符串, 从左向右排列, 左边为头(head), 右侧为尾(tail). 左边为顶部, 右边为底部.

从左侧开始向键为 num 的 list 插入数据:

127.0.0.1:6379> lpush num 1 2 3 4
(integer) 4

查看 num 里的数据, 因为数据是从左侧开始插入, 并且插入的先后顺序是从1到4, 所以1在最底层, 4在最顶层:

127.0.0.1:6379> lrange num 0 10
1) "4"
2) "3"
3) "2"
4) "1"

再从左侧插入一个数据:

127.0.0.1:6379> lpush num 5
(integer) 5
127.0.0.1:6379> lrange num 0 10
1) "5"
2) "4"
3) "3"
4) "2"
5) "1"

从左侧弹出一个数据, 因为5在最顶层, 所以最先弹出:

127.0.0.1:6379> lpop num
"5"
127.0.0.1:6379> lrange num 0 10
1) "4"
2) "3"
3) "2"
4) "1"

从右侧插入数据:

127.0.0.1:6379> rpush num 5
(integer) 5
127.0.0.1:6379> lrange num 0 10
1) "4"
2) "3"
3) "2"
4) "1"
5) "5"
127.0.0.1:6379> rpush num 6
(integer) 6
127.0.0.1:6379> lrange num 0 10
1) "4"
2) "3"
3) "2"
4) "1"
5) "5"
6) "6"

从右侧弹出数据:

127.0.0.1:6379> rpop num
"6"
127.0.0.1:6379> lrange num 0 10
1) "4"
2) "3"
3) "2"
4) "1"
5) "5"

查看一个 list 的长度:

127.0.0.1:6379> lrange num 0 10
1) "4"
2) "3"
3) "2"
4) "1"
5) "5"
127.0.0.1:6379> llen num
(integer) 5

根据索引查看 list 中某个位置的值:

127.0.0.1:6379> lindex num 3
"1"
127.0.0.1:6379> lindex num 0
"4"

根据索引修改 list 中某个位置的值:

127.0.0.1:6379> lset num 0 8
OK
127.0.0.1:6379> lrange num 0 10
1) "8"
2) "3"
3) "2"
4) "1"
5) "5"

在未知 list 长度的情况下, 可以使用 0 -1 的范围来查看 list 中的所有值:

127.0.0.1:6379> lrange num 0 -1
 1) "8"
 2) "3"
 3) "2"
 4) "1"
 5) "5"

在插入数据之前, 先检查指定的键是否存在, 如果存在则插入, 如果不存在, 则返回0. 用这个命令插入, 一次只能插入一个值, 多个会报错:

127.0.0.1:6379> lpushx num 9
(integer) 6
127.0.0.1:6379> lrange num 0 -1
 1) "9"
 2) "8"
 3) "3"
 4) "2"
 5) "1"
 6) "5"
127.0.0.1:6379> lpushx sub 9
(integer) 0

在 list 中间的某个位置插入数据, 可以用 linsert 命令, 借助关键字 before 和 after 确定位置:

127.0.0.1:6379> lrange num 0 -1
1) "5"
2) "1"
3) "2"
4) "3"
5) "8"
6) "9"
127.0.0.1:6379> linsert num before 8 55
(integer) 7
127.0.0.1:6379> lrange num 0 -1
1) "5"
2) "1"
3) "2"
4) "3"
5) "55"
6) "8"
7) "9"
127.0.0.1:6379> linsert num after 1 66
(integer) 8
127.0.0.1:6379> lrange num 0 -1
1) "5"
2) "1"
3) "66"
4) "2"
5) "3"
6) "55"
7) "8"
8) "9"

以上, 就是关于 list值的相关命令

set值：

set值是唯一的字符串的无序集合, 把握住两个特点: 唯一, 无序.

清空所有的数据, 并清理显示界面:

127.0.0.1:6379> flushall
OK
127.0.0.1:6379> clear

保存一条 set 数据, 键是 myset1, 值是 1, 2, 3, 4 四个数字:

127.0.0.1:6379> sadd myset1 1 2 3 4
(integer) 4

查看键myset1 的值:

127.0.0.1:6379> smembers myset1
1) "1"
2) "2"
3) "3"
4) "4"

在键myset1里增加一个已有的数字3, 返回0, 表示添加不成功, 因为 set值是要求唯一的:

127.0.0.1:6379> sadd myset1 3
(integer) 0
127.0.0.1:6379> smembers myset1
1) "1"
2) "2"
3) "3"
4) "4"

在键myset1里增加一个新数字5, 返回1, 表示添加成功:

127.0.0.1:6379> sadd myset1 5
(integer) 1
127.0.0.1:6379> smembers myset1
1) "1"
2) "2"
3) "3"
4) "4"
5) "5"

查看键myset1的值里一共有几天数据:

127.0.0.1:6379> scard myset1
(integer) 5

新增一条 set 数据myset2:

127.0.0.1:6379> sadd myset2 5 8 7 6 4 9
(integer) 6
127.0.0.1:6379> smembers myset2
1) "4"
2) "5"
3) "6"
4) "7"
5) "8"
6) "9"

查看两条 set 数据 myset1 和 myset2 值的区别, myset1 写在前面, 表示查出所有 myset1 里有, 而 myset2 里没有的值:

127.0.0.1:6379> smembers myset1
1) "1"
2) "2"
3) "3"
4) "4"
5) "5"
127.0.0.1:6379> sdiff myset1 myset2
1) "1"
2) "2"
3) "3"

查出 myset1 相对于 myset2 里值的差别, 并且保存成一个新 set --- myset3:

127.0.0.1:6379> sdiffstore myset3 myset1 myset2
(integer) 3
127.0.0.1:6379> smembers myset3
1) "1"
2) "2"
3) "3"

合并 myset1 和 myset2 里的所有值, 由于 set值唯一性的特点, 重复的部分只保留一个:

127.0.0.1:6379> sunion myset1 myset2
1) "1"
2) "2"
3) "3"
4) "4"
5) "5"
6) "6"
7) "7"
8) "8"
9) "9"

合并 myset1 和 myset2 里的所有值, 并且保存成一个新 set --- myset4:

127.0.0.1:6379> sunionstore myset4 myset1 myset2
(integer) 9
127.0.0.1:6379> smembers myset4
1) "1"
2) "2"
3) "3"
4) "4"
5) "5"
6) "6"
7) "7"
8) "8"
9) "9"

指定删除 set值里的某一个数

127.0.0.1:6379> srem myset4 8
(integer) 1
127.0.0.1:6379> smembers myset4
1) "1"
2) "2"
3) "3"
4) "4"
5) "5"
6) "6"
7) "7"
8) "9"

指定删除 set值里的某几个数

127.0.0.1:6379> srem myset4 6 7 9
(integer) 3
127.0.0.1:6379> smembers myset4
1) "1"
2) "2"
3) "3"
4) "4"
5) "5"

随机删除 set值里的某一个数

127.0.0.1:6379> spop myset4 1
1) "5"
127.0.0.1:6379> smembers myset4
1) "1"
2) "2"
3) "3"
4) "4"

随机删除 set值里的某几个数

127.0.0.1:6379> spop myset4 3
1) "2"
2) "4"
3) "1"

取两个 set值的并集:

127.0.0.1:6379> smembers myset1
1) "1"
2) "2"
3) "3"
4) "4"
5) "5"
127.0.0.1:6379> smembers myset2
1) "4"
2) "5"
3) "6"
4) "7"
5) "8"
6) "9"
127.0.0.1:6379> sinter myset1 myset2
1) "4"
2) "5"

取两个 set值的并集, 并保存:

127.0.0.1:6379> sinterstore myset5 myset1 myset2
(integer) 2
127.0.0.1:6379> smembers myset5
1) "4"
2) "5"

把 myset1 的值里的数字 1 挪到 myset2

127.0.0.1:6379> smove myset1 myset2 1
(integer) 1
127.0.0.1:6379> smembers myset2
1) "1"
2) "4"
3) "5"
4) "6"
5) "7"
6) "8"
7) "9"
127.0.0.1:6379> smembers myset1
1) "2"
2) "3"
3) "4"
4) "5"

以上就是关于 set值的一些常用命令

ordered set 值：

ordered set 是根据 score值有序排列的数据集合

新建一条 ordered set 数据 myset1, 并存入4个字符串, score 的排列顺序为1-4:

127.0.0.1:6379> zadd myset1 1 a 2 b 3 c 4 d
(integer) 4

查看这个数据:

127.0.0.1:6379> zrange myset1 0 -1
1) "a"
2) "b"
3) "c"
4) "d"

给 myset1 的值里新加一个字符e, score=100:

127.0.0.1:6379> zadd myset1 100 e
(integer) 1

查看最新的 myset1 的值:

127.0.0.1:6379> zrange myset1 0 -1
1) "a"
2) "b"
3) "c"
4) "d"
5) "e"

查看 myset1 的值里一共有几条数据:

127.0.0.1:6379> zcard myset1
(integer) 5

根据指定的 score 的范围查看 myset1 的值里一共有几条数据:

127.0.0.1:6379> zcount myset1 1 3
(integer) 3
127.0.0.1:6379> zcount myset1 1 5
(integer) 4
127.0.0.1:6379> zcount myset1 1 55
(integer) 4
127.0.0.1:6379> zcount myset1 1 101
(integer) 5
127.0.0.1:6379> zcount myset1 1 100
(integer) 5
127.0.0.1:6379> zcount myset1 1 99
(integer) 4

删除 myset1 值里的某个数据:

127.0.0.1:6379> zrem myset1 b
(integer) 1
127.0.0.1:6379> zrange myset1 0 -1
1) "a"
2) "c"
3) "d"
4) "e"
127.0.0.1:6379> zrem myset1 d
(integer) 1
127.0.0.1:6379> zrange myset1 0 -1
1) "a"
2) "c"
3) "e"

查看某个数据的索引值:

127.0.0.1:6379> zrank myset1 e
(integer) 2
127.0.0.1:6379> zrank myset1 a
(integer) 0

反排序后查询索引:

127.0.0.1:6379> zrevrank myset1 a
(integer) 2
127.0.0.1:6379> zrevrank myset1 e
(integer) 0

查询 score值, 没有的返回 nil:

127.0.0.1:6379> zscore myset1 e
"100"
127.0.0.1:6379> zscore myset1 a
"1"
127.0.0.1:6379> zscore myset1 jsjs
(nil)

支持对同一个 score值设置多个不同的数据:

127.0.0.1:6379> zrange myset1 0 -1
1) "a"
2) "c"
3) "e"
127.0.0.1:6379> zadd myset1 1 aaaa
(integer) 1
127.0.0.1:6379> zrange myset1 0 -1
1) "a"
2) "aaaa"
3) "c"
4) "e"
127.0.0.1:6379> zadd myset1 1 bbbb
(integer) 1
127.0.0.1:6379> zrange myset1 0 -1
1) "a"
2) "aaaa"
3) "bbbb"
4) "c"
5) "e"

查询 score值, 再次证明 ordered set 支持对同一个 score值设置多个不同的数据:

127.0.0.1:6379> zscore myset1 a
"1"
127.0.0.1:6379> zscore myset1 aaaa
"1"
127.0.0.1:6379> zscore myset1 bbbb
"1"

查询索引:

127.0.0.1:6379> zrank myset1 a
(integer) 0
127.0.0.1:6379> zrank myset1 aaaa
(integer) 1
127.0.0.1:6379> zrank myset1 bbbb
(integer) 2

根据指定的 score值的范围查出数据:

127.0.0.1:6379> zrangebyscore myset1 1 2
1) "a"
2) "aaaa"
3) "bbbb"
127.0.0.1:6379> zrangebyscore myset1 1 4
1) "a"
2) "aaaa"
3) "bbbb"
4) "c"

以上就是关于 ordered set 的相关命令

publish subscribe 消息订阅：

在窗口1开通一个名为 redis 的通道:

127.0.0.1:6379> SUBSCRIBE redis
Reading messages... (press Ctrl-C to quit)
1) "subscribe"
2) "redis"
3) (integer) 1

从窗口2传入信息:

127.0.0.1:6379> PUBLISH redis hi
(integer) 1

此时窗口1会收到这条信息:

127.0.0.1:6379> SUBSCRIBE redis
Reading messages... (press Ctrl-C to quit)
1) "subscribe"
2) "redis"
3) (integer) 1
1) "message"
2) "redis"
3) "hi"

以上, 就是通过 SUBSCRIBE 和 PUBLISH 实现了一个简单的消息传递的过程. 目前是有一个窗口开通 redis 通道, 另一个窗口向这个通道传递消息, 大家可以试下再多开一个窗口, 也开通 redis 通道, 然后再向 redis 通道传递消息的时候, 会发现, 这两个通道会同时接收到这条消息.

下面再另开一个窗口, 演示另外一个命令. 这里用命令 PSUBSCRIBE 开通一个通道, 通道名不是具体的, 而是有点像正则匹配, 即凡是向以字母 r 开头的通道发送消息, 这个通道都可以接收:

127.0.0.1:6379> PSUBSCRIBE r*
Reading messages... (press Ctrl-C to quit)
1) "psubscribe"
2) "r*"
3) (integer) 1

这时, 在另外一个窗口执行:

127.0.0.1:6379> PUBLISH rr "hi"
(integer) 1

这时, 在刚刚开通通道的窗口就可以接收到信息:

127.0.0.1:6379> PSUBSCRIBE r*
Reading messages... (press Ctrl-C to quit)
1) "psubscribe"
2) "r*"
3) (integer) 1
1) "pmessage"
2) "r*"
3) "rr"
4) "hi"

以上, 就是关于 SUBSCRIBE 和 PUBLISH 的基本原理。

你可能感兴趣的:(pandas,mybatis,android)

Flutter 适配HarmonyOS NEXT：调用原生功能实现相册选取与拍照
Flutter适配鸿蒙系统：调用原生功能实现相册选取与拍照项目背景我们的移动端项目基于Flutter开发，为控制开发周期与成本，采用了HarmonyOSNEXT（简称鸿蒙）的Flutter兼容库，并更新了部分三方库为鸿蒙的Flutter兼容库。在图片视频选择与拍摄功能上，我们之前调用的是Android和iOS的原生方法，现在需要为鸿蒙开发一套原生配合使用的方案。遇到的问题鸿蒙的Flutter兼容库
mysql 统计同一字段不同值的个数 liudachu Mysql数据库 mysql
在一个项目中,制作呃echart图表的时候，遇到一个需求，需要从后端接口获取数据----售票员的姓名和业绩所以需要在订单表中，获取不同售票员的订单数量。订单表解决方案汇总MySQL统计一个列中不同值的数量需求：MySQL统计一个列中不同值的数量，其中origin是用户来源，其中的值有iPhone、Android、Web三种，现在需要分别统计由这三种渠道注册的用户数量。方案1:SELECTcount
Springboot整合MyBatis-plus：单条数据查询，批量查询，条件查询，分页查询快乐骑行^_^ 前端和后端开发 Springboot MyBatis-plus 批量查询条件查询分页查询
Springboot整合MyBatis-plus：单条数据查询，批量查询，分页查询一、单条数据查询//单条数据查询@TestpublicvoidtestSelectById(){Stu_infouser=stuMapper.selectById(2
UNI-APP+VUE3+VITE+VSCode开发经验及填坑记录（持续更新ING）集成显卡前端项目实践 uni-app vscode ide
uni-app是一个使用Vue.js开发所有前端应用的框架，开发者编写一套代码，可发布到iOS、Android、Web（响应式）、以及各种小程序（微信/支付宝/百度/头条/飞书/QQ/快手/钉钉/淘宝）、快应用等多个平台。快速开发模板unibest：最好的uniapp开发框架，由uniapp+Vue3+Ts+Vite5+UnoCss+VSCode(可选webstorm)+uni插件+wot-ui（
MyBatis-Plus核心功能与实战案例千层冷面 mybatis java
MyBatis-Plus核心功能与实战案例，代码示例基于SpringBoot3.x+MyBatis-Plus3.5.3：一、MyBatis-Plus基础篇1.简介与核心优势MyBatis-Plus（MP）是MyBatis的增强工具，在保留MyBatis原生功能的基础上，通过内置通用Mapper、Service、条件构造器等，大幅简化开发。核心优势：无侵入：只做增强不做改变，可与MyBatis原生功
Android开发哈哈哈隔 android
AndroidAdapter是将数据绑定到UI界面上的桥接类比如:当lambada中只有一个参数时，可以用it指代@Target和@Retention是由Java提供的元注解，所谓元注解就是标记其他注解的注解，下面分别介绍https://blog.csdn.net/javazejian/article/details/71860633#%E5%A3%B0%E6%98%8E%E6%B3%A8%E8%
mybatis plus sql性能分析插件 asvxc324deas 程序员 mybatis sql android
在MybatisPlusConfig加入sql性能分析插件一、mybatis-plus自带的性能分析/**SQL执行效率插件性能分析插件*/@Bean@Profile({“dev”,“test”})//设置devtest环境开启publicPerformanceInterceptorperformanceInterceptor(){PerformanceInterceptorperformance
HarmonyOS开发5.0【应用程序包】爱桥代码的程序媛鸿蒙开发学习笔录 harmonyos 分布式鸿蒙开发鸿蒙鸿蒙系统 openharmony 程序包
对比HarmonyOS与Android的应用程序包HarmonyOS的应用程序包与Android的应用程序包在多个方面存在一些不同之处，主要体现的方面：包格式（从包的后缀名可以看出来）HarmonyOS:使用.hap格式作为应用程序包。这个格式是HarmonyOS的专有格式，包含了应用的所有资源和代码。Android:使用.apk格式作为应用程序包。APK文件包含了应用的代码、资源、清单文件等。架
android MutableLiveData setValue 响应速速 postValue 快 mmsx Android 常用开发技术 android livedata
MutableLiveData是LiveData的一个可变版本，常用于在ViewModel中保存和管理UI相关的数据。MutableLiveData提供了两种主要的方法来更新其值：setValue和postValue。关于这两者的响应速度，通常认为setValue比postValue更快。下面详细解释这两者的区别以及影响响应速度的因素。一、setValuevspostValue1.setValue
Demo发布- ClkLog客户端集成 uni-app sdk开源软件数据分析埋点
前言在上一期推文中【Demo发布-ClkLog客户端集成-ReactNative】，我们与大家分享了ReactNative的集成demo。本期，我们将继续介绍ClkLog集成uni-app的demo。uni-app允许开发者编写一套代码，然后可以编译到iOS、Android、H5以及各种小程序等多个平台。因此，本次demo中将涵盖上述所有平台，并且我们会详细说明集成过程中遇到的难点及解决方案。un
Demo发布 | ClkLog成功集成Unity3D
前言在Clklog完成ReactNative和uni-app集成Demo后，一个游戏行业新客户提出了使用Unity3D开发的集成问题。对此，我们与客户分别进行了测试。客户使用神策Andriod原生SDK在Android端暴露接口给Unity3D的方式，验证了使用ClkLog进行数据采集的可行性。同时，ClkLog联合合作伙伴对神策Unity3DSDK（安卓端、IOS端、MacOS）进行了深入测试，
springboot整合mybatis分页插件不生效问题潘令 spring boot mybatis java 后端
原因分析做项目时发现导入分页插件的场景启动器后，分页插件不生效，一直查询出所有数据上网搜索发现分页插件不生效主要有以下原因：1、没有导入分页插件的场景启动器，而是导入了普通的分页插件依赖com.github.pagehelperpagehelper5.1.10导入该依赖后还需要进行额外的配置1).在MyBatis配置xml中配置拦截器插件<propertyname="param1&
springBoot中myBatisPlus的使用无足鸟丶 spring boot 后端 java
MyBatis-Plus是一个MyBatis的增强工具，在SpringBoot项目里使用它能极大提升开发效率。下面为你详细介绍在SpringBoot中使用MyBatis-Plus的步骤以及示例代码。1.创建SpringBoot项目你可以借助SpringInitializr（https://start.spring.io/）来创建一个新的SpringBoot项目，添加以下依赖：SpringWebSp
基于图像比对的跨平台UI一致性校验工具开发全流程指南——Android/iOS/Web三端自动化测试实战追寻向上 ui android ios
一、需求背景与方案概述1.1为什么需要跨平台UI校验？在移动互联网时代，同一产品需覆盖Android、iOS和Web三端。由于不同平台的开发框架（如Android的MaterialDesign与iOS的Cupertino风格）及渲染引擎差异，UI界面易出现以下问题：布局错位：按钮位置偏移、文本换行不一致视觉差异：颜色色差、字体粗细不同交互逻辑冲突：滑动方向、弹窗动画不一致传统人工测试效率低且易遗漏
【Flutter】从安卓与iOS包体优化到一键自动打包脚本的一条龙服务 sugood Flutter android flutter ios
系统信息Systemversion:MacOS12Flutterversion:1.22.5Dartversion:2.10.4AndroidStudioversion:4.1.1介绍APK优化包体大小APK多渠道打包APK一键打包脚本IPA优化包体大小IPA无签名打包IPA一键打包脚本脚本地址github脚本地址安卓APK优化包体大小优化图片等资源大小，删除无用资源只选择保留必要的so库。第三方
Linux安装Anaconda和Jupyter 硬水果糖人工智能 Linux linux jupyter 运维
一、了解Anaconda和Jupyter引言：Anaconda是一个流行的开源数据科学平台，广泛用于数据分析、机器学习、人工智能等领域。它是一个集成了大量科学计算和数据科学工具的Python和R编程语言环境。Anaconda的主要目标是简化数据科学和机器学习的开发流程，提供一个易于安装和管理的环境。而预装了大量常用的Python和R库，这些库涵盖了数据科学的各个方面，包括：数据分析：Pandas、
纯血鸿蒙系统 HarmonyOS NEXT自动化测试实践夜阑卧听风吹雨，铁马冰河入梦来 python Appium自动化测试 harmonyos 华为
1、测试框架选择hdc：类似android系统的adb命令，提供设备信息查询，包管理，调试相关的命令@ohos.UiTest：鸿蒙sdk的一部分，类似androidsdk里的uiautomator，基于Accessibility服务，提供模拟UI操作的能力。但是需要用arkTS语言来写自动化case，并且用例需要打包到被测app里面hypium：鸿蒙官方的自动化框架，功能比较完善，可以基于pyth
Python for Android 安装和配置指南舒欣和Queenly
PythonforAndroid安装和配置指南python-for-androidTurnyourPythonapplicationintoanAndroidAPK项目地址:https://gitcode.com/gh_mirrors/py/python-for-android1.项目基础介绍和主要编程语言项目基础介绍PythonforAndroid(p4a)是一个开源工具，旨在将Python应用
Springboot启动失败：解决「org.yaml.snakeyaml.error.YAMLException」报错全记录 -天凉好秋- spring boot java idea visual studio code
##关键字Java、Springboot、vscode、idea、nacos启动失败、YAMLException、字符集配置---##背景环境###项目架构-**框架**：SSM（Spring+SpringMVC+MyBatis）-**中间件**：Nacos（配置管理+服务发现）-**配置存储**：Nacos中存储了Springboot的配置，包括：数据库连接信息、Redis连接信息、服务配置等。
Mybatis 使用＜update＞中＜set＞标签的简明例子成功人chen某 mybatis java 前端
注：xxx为某某某的意思updatexxxSQL1,SQL2,whereSQL3如果成立，不成立则最终SQL语句为updatexxxsetSQL1whereSQL3;会自动去掉SQL1，尾部的逗号，并加上set如果均成立则最终SQL语句为updatexxxsetSQL1,SQL2whereSQL3;实际例子UPDATEtable_nameSETcolumn1=value1,column2=valu
用旧的手机搭建 MQTT Broker-Node_red 君零渊单片机
MQTTBroker搭建在Android上搭建MQTT所需工具：termux通过网盘分享的文件：termux-app_v0.118.1+github-debug_armeabi-v7a.apk链接:https://pan.baidu.com/s/1Iii2szXAc02cKVGdP1EuzQ?pwd=fqsc提取码:fqsc在Termux中使用MQTT（MessageQueuingTelemetr
python pandas 读取excel单元门公式值_Python pandas对excel的操作实现示例 weixin_39585761 python pandas 读取excel单元门公式值
最近经常看到各平台里都有Python的广告，都是对excel的操作，这里明哥收集整理了一下pandas对excel的操作方法和使用过程。本篇介绍pandas的DataFrame对列(Column)的处理方法。示例数据请通过明哥的gitee进行下载。增加计算列pandas的DataFrame，每一行或每一列都是一个序列(Series)。比如：importpandasaspddf1=pd.read_e
pandas整表写入excel指定位置_pandas操作Excel的常用场景及问题那个吴小明
很多场景下使用pandas就能够胜任手上的excel处理任务，之前写的用python操作具体到excel单元格的方法参考：贺霆：python操作Excel实现自动化报表zhuanlan.zhihu.com现在主要介绍使用pandas读取excel的几种常用场景：一、常规读取importpandasaspdfrompandasimportDataFrame,Seriesimportosos.chdi
httpcanary小米闪退_Android HttpCanary最强抓包工具！ ssslience httpcanary小米闪退
迎使用HttpCanary——最强Android抓包工具！HttpCanary是一款功能强大的HTTP/HTTPS/HTTP2网络包抓取和分析工具，你可以把他看成是移动端的Fiddler或者Charles，但是HttpCanary使用起来更加地简单容易，因为它是专门为移动端设计的！最重要的是：无需root权限！无需root权限！无需root权限！HttpCanary支持对HTTP协议包的抓取和注入
pandas 读取某一单元格的值_07-Pandas Excel新建/读取/填充（一）扇贝编程 pandas 读取某一单元格的值
Excel是微软的经典之作，几乎可以满足我们日常工作的所有需求，但是在处理海量数据时，Excel在效率及性能方面就显得很吃力。正因为Pandas在数据处理方面有着独特的优势，所有掌握pandas库处理excel格式的数据就显得十分必要。目录excel文档新建读取excel文档行列操作空值自动填充行列函数运算excel数据排序excel数据按条件筛选#1.创建excel文件在jupyter中导入pa
如何用Python批量将CSV文件编码转换为UTF-8并转为Excel格式？字节王德发 python python excel 开发语言
在处理数据时，CSV文件格式常常用作数据的交换格式。不过，很多情况下我们会遇到编码问题，特别是当文件不是UTF-8编码时。为了更好地处理这些文件，可能需要将它们转换为UTF-8编码，并且将其转换为Excel格式，这样可以方便后续的数据分析和使用。今天就来聊聊如何用Python实现这一过程。准备工作：安装必要的库我们需要确保安装了所需的Python库。主要用到的库有pandas和openpyxl。p
Pandas完全指南：数据处理与分析从入门到实战 xiaoyu❅ python python pandas 开发语言
目录引言一、Pandas环境配置与核心概念1.1安装Pandas1.2导入惯例1.3核心数据结构二、数据结构详解2.1Series创建与操作2.2DataFrame创建三、数据查看与基本操作3.1数据预览3.2索引与选择3.3数据排序四、数据清洗实战4.1处理缺失值4.2处理重复值4.3数据类型转换4.4字符串处理五、数据处理进阶5.1数据筛选5.2列操作5.3应用函数六、数据分组与聚合6.1基础
焊接性能分析代码（Python）骑蜗牛上月亮 python 开发语言
welding_performance_data.xls数据文件。welding_strengthtoughness5001052012480855015490953013510115401447075601690018600121500139111578115importpandasaspdimportmatplotlib.pyplotaspltimporttkinterastkfrommatp
MyBatisPlus 代码生成器如何使用？一篇文章学会它！！！程序猿ZhangSir Java 数据库 #MyBatis java spring 数据库
目录一.MP代码生成器简介二.准备工作2.1建立数据库和表2.1创建项目三.编写工具类3.1创建类3.2定义数据库连接变量3.3定义单表代码生成函数3.4扩展为任意表自动生成代码四.测试代码生成器4.1测试单表生成model方法一.MP代码生成器简介代码生成器是MyBatis-Plus提供的一个非常实用的功能，可以快速生成Entity、Mapper、MapperXML、Service、Contro
MyBatis-Plus分页查询IPage的使用方法，如何自定义分页查询功能？程序猿ZhangSir Spring全家桶微服务 #MyBatis mybatis 开发语言
目录1.MyBatis-Plus分页插件介绍2.准备工作-创建项目配置环境2.1创建数据库表Product商品表2.2创建Maven项目，创建包，接口，类2.3添加MyBatisPlus依赖和Lombok插件2.4编写Configuration分页插件配置文件2.5编写application.properties配置文件2.6实体类代码，接口代码3.IPage分页的使用方式4.自定义分页查询5.Q
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam