pandas实现数据读取&清洗&分析的项目实践

近期因工作需要，需对几十万条商品和订单数据进行初步的数据分析，本来尝试过用Excel，但是数据量一旦超过10万条，Excel和电脑的性能瓶颈就捉襟见肘了，为了后续遇到类似问题提升处理效率，抽空系统性的研究学习了pandas这个库，初步上手之后，感觉以后再处理千万级的数据量的时候，也会游刃有余了，话不多讲，直接进入正题。

本文主要沿着在日常使用pandas处理数据时的步骤，讲解pandas对应的知识点和常见操作，分析工具使用jupyter-notebook，强烈推荐。

本文假设已经对pandas有基础性的了解，核心是Series和DataFrame概念（numpy库可不了解）

一、数据读取和写入

第一步，先从存量数据源，将数据读取过来，然后再将分析得出的数据写入并永久保存，这是数据分析的开始和结束，在此一并说明，主要只讲解常用的读取和写入方式，其他的可以自行学习和了解

1.1 CSV和txt文件：

import pandas as pd
file_path_read=''
file_path_write=''
 
#读入csv或txt文件内数据，以下只罗列了常用的参数
df=pd.read_csv( 
    file_path_read ,  #指定需读入或写入的文件的路径，可为相对路径，也可为绝对路径
    sep= ',' ,  #指定分隔符
    encoding= utf-8 , #指定字符编码格式
    usecols=None , #指定需读入的列，列表格式，可为索引[1,2,3]或列明['A','B','C']
    names=['A','B','C'] , #可自定义读入数据的列标签
    skip_blank_lines=True,  #设置是否跳过内容全空的行
    nrows=1000, #指定读入的行数 
    skiprows=[2,5],#指定需跳过的行数
    dtype={0:str,'B':'float64'}) #指定列数据读入的格式，可分别对每一列指定读入的数据格式
 
#将分析好的数据写入csv或txt文件
df.to_csv( file_path_write  )

1.2 Excel文件：

import pandas as pd
file_path_read=''
file_path_write=''
 
#从数据源读取数据，并同时指定读入数据的格式，也可不指定，读入后就是一个标准的DataFrame
#其他常用的参数，与read_csv一致，不再赘述
df=pd.read_excel(file_path_read ,encoding= utf-8 , usecols=None , names=['A','B','C'] , skip_blank_lines=True, nrows=1000, skiprows=[2,5],dtype={0:str,2:'float64'})
 
#将分析好的数据写入Excel，并同时指定写入数据的格式，也可不指定
df.to_excel(file_path_write , dtype=str)

1.3 MYSQL数据库：

import pandas as pd
from sqlalchemy import create_engine
 
#1、连接数据库
#其中username为账户名，比如root，password为密码，ip为数据库的ip，如果是本地的一般是localhost，port为端口，database为数据库名
engine = create_engine('mysql+pymysql://username:password@ip:port/database')
 
#2、定义查询sql语句
sql = '''select * from tablename where colname in (,)  '''
 
#3、读取数据，使用以上数据库引擎和sql语句查询数据，直接读入，为DataFrame格式
#coerce_float，很有用，为true时会将字符串格式的数据直接读取为float数字格式，columns，列表格式，指定读入的行，一般没用，因为基本会在sql语句中指定
#sql也可以直接为表名，即读入整张表，但一般使用sql语句
df=pd.read_sql(sql, engine,  coerce_float=True, columns=None)
 
#4、写入数据，将分析好的数据落库
#tablename为需要写入的表名，if_exists,默认为false，即表存在则不写入，也可设置为'append'，即将数据追加到该表内，dtype可指定各个列的数据格式，一般无需指定
df.to_sql('tablename', engine , if_exists='append' ,dtype={})

二、数据清洗

2.1 清除不需要的行数据

一般数据源都是csv、txt 或者excel，此时可能源数据内就包含大量异常或不想要的行数据，如果不进行清除，则会严重影响后续数据分析的准确性

当然，如果数据源是mysql等数据库，则可在读取数据的时候，即通过slq命令，将异常或不想要的数据给过滤掉。

2.1.1 清除满足指定条件的行数据

#清除满足指定条件的行数据的表达式
df = df.drop(df[].index)
 
#比如希望清除x列小于0.01或大于10的指定行数据，返回一个清除后的DataFrame
#其中的布尔表达式可以有多个,可以用与（&）或（|）非（~）进行连接
df_clear = df.drop(df[(df['x']<0.01) | (df['x']>10)].index) #删除x小于0.01或大于10的行
 
#或者，比如希望清除A列值为空，或者B列中值小于0的行，然后返回清除后的新的DataFrame
df_clear = df.drop(df[(df['A']==‘') | (df['B']<0)].index)

2.1.2 清除指定的行数据

如果数据源是mysql等数据库，可直接在sql语句中添加筛选条件，不过在分析过程中，可能也需要清除指定的行数据。

#清除指定的行
#drop(list)，函数接受一个列表，列表内是指定需删除的行索引
df.drop([index]) #即删除指定行
df.drop([0,1,2,3,4]) #清除前5行
df.drop(range(20)) #清除前20行，

2.2 清除不需要的列

如果数据源是mysql等数据库，则其实可以在sql语句中，只拉取自己需要的列，如果是从csv或Excel读取，也可在读取数据时，就指定对应需要的列

不过在实际数据分析时，可能在分析过程中产生了新的DataFrame，此时可能需要清除不需要的列。

#执行删除操作时，原df不会变化，一般是返回一个新的DataFra
df.drop(['列索引或标签',axis=1])
 
#删除索引为2，即第三列
df.drop([2],axis=1)
 
#删除索引为0，1，2即第一、第二、第三列
df.drop([0,1,2],axis=1)
 
#删除列标签为A的列
df.drop(['A'],axis=1)
 
#删除列标签为A、B、C的多列
df.drop(['A','B','C'],axis=1)

2.3 调整列的展示顺序或列标签名

这个步骤一般是为了方便自己观察数据，或者在数据分析接近尾声时，为增强数据可读性，对列的顺序进行调整

#语句如下，使用reindex函数
new_col_list=['B','C','A'] #假设希望将列的展示顺序由A、B、C，调整为B、C、A
df.reindex(columns = new_col_list)
 
#调整存量DataFrame的列标签名称，一般用于将默认的列标签修改的更加直观易懂
new_col_name=['age','name',gender']
df.columns=new_col_name

2.4 对行数据进行排序

此处也是为了在进行数据分析时观察数据，或者增强输出的数据的可读性

2.4.1 sort_values()

即按照实际的数据值进行排序

#df.sort_values()函数
#既可以根据列数据，也可根据行数据排序，最为常用
 
#axis，默认为0，即纵向排序，可指定按照哪列的值进行排序，最终会改变数据纵向的顺序
#axis，为1时，即横向排序，可指定按照哪行（根据行索引）进行排序，最终会改变数据的横向顺序
#inplace,
#ascending，可为数组格式，即指定按照多行或列，不同行或列的升序降序规则
#na_position，指定缺省值排在最前还是最后，一般是last，即最后
df.sort_values(by=, axis=0, ascending=True, inplace=False, kind='quicksort', na_position='last')
 
#假设数据如下：
    b   a   c
2   1   4   1
0   2   3   3
3   2   1   2
1   3   2   8
 
#先按照b降序，再按照a升序排序
df.sort_values(by=['b','a'],axis=0,ascending=[False,True])
 
#先按照3行升序排序，再按照0行降序排序
df.sort_values(by=[3,0],axis=1,ascending=[True,False])

2.4.2 sort_index()

#df.sort_index()函数
#默认根据行标签对所有行排序，或根据列标签对所有列排序，或根据指定某列或某几列对行排序。
 
#axis，默认为0，即按行标签进行排序，最终会改变数据在纵向的顺序
#axis，为1时，即按列标签排序，最终会改变数据在横向的顺序
#na_position，指定缺省值排在最前还是最后，一般是last，即最后
df.sort_index(axis=0, ascending=True , na_position='last')
 
 
#假设数据如下：
    b   a   c
2   1   4   1
0   2   3   3
3   2   1   2
1   3   2   8
 
#按照行标签升序排序，最后会变成0、1、2、3
df.sort_index(axis=0,ascending=True)
 
#按照列标签升序排序，最后会变成a、b、c
df.sort_index(axis=1,ascending=True)

2.5 空值的处理

一般导入的数据，会存在空值的情况，为了避免此类数值影响后续的数据分析，一般需要进行相应的处理

#1、对空值直接清除
df.dropna(
    axis=0,     # 0: 对行进行操作; 1: 对列进行操作 默认为0
    how='any'   # 'any': 只要存在 NaN 就 drop 掉; 'all': 必须全部是 NaN 才 drop 默认为'any'
    ) 
 
#2、对空值填补
df.fillna(value=0) #用0填补所有的空值
df.fillna({'B': 3,'C': 4})  #使用常量填补对应列的空值，比如针对B列，用3填补空值，针对C列，用4填补空值
 
#3、用前项填充或者后项填充
df.fillna(method = 'ffill') #用前一个观测值填充
df.fillna(method = 'bfill') #用后一个观测值填充
 
#4、用均值或中位数填充各自的列
df.fillna(df.median())
df.fillna(df.mean())
 
 
#注：使用fillna,dropna时，需要添加参数 inplace = True，如df.fillna(df.median()，inplace = True),以确认修改，否则实际的数据并不会有改动。

2.6 数据去重处理

一般源数据可能会在某列存在重复数据的问题，为方便后续处理等，可能需要进行去重

#删除重复行时，需要用到drop_duplicates函数
df.drop_duplicates(
    ['A','B'], #指定按照某列，判断数据重复，参数非必填，可以单列、多列
    keep='first' #指定如果发现重复，保留哪行数据，枚举有first（保留第一行）、last（保留最后一行），False（删除所有重复行）
)
 
df.drop_duplicates() #删除完全重复的行数据

2.7 对指定列数据进行初步加工

#1、map()函数
#可对一列数据，统一给一列(Series)中的每一个元素应用指定函数
def myfunc(x):
    if x>40:
        return '中年人'
    elif x<30:
        return '青年人'
    else:
        return '尴尬的年纪'
df['age'].map(myfunc)
 
 
#2、apply()函数
#也可对一列数据，统一应用指定函数，但功能更强大，可传入除列元素的其他参数
#其他参数可以关键词的方式传入，也可以直接传入其他值
def myfunc(x,*args,**args_dict):
    if x<10000:
        return x+args_dict['high']
    else:
        return x+args_dict['low']
df1['salary']=df1['salary'].apply(myfunc,low=100,high=300)#对工资列，低于1万的加一个值，高于1万的，加另外一个值

2.8 对DataFrame内所有数据进行初步加工处理

此种方法不太常用，或者可以作为填充默认值的方式，比如将NAN的值填充为0

#以下会对DataFrame每个元素应用一次指定的函数，并将返回值作为新的值
#一般会产生一个新的df
#以下函数将空值全部填充为0
df_new=df.apply(lambda x: 0 if str(x)=='' else x)

2.9 设置数据格式

一般在后续数据处理时，或者在数据处理基本宣告尾声时，为增强数据可读性或者分析的方便，需要对数据设置格式

#以下主要演示对某df内某列数据进行常见的数字格式设置
 
#四舍五入
df['salary'].round([decimals=2]) #将工资列，数字进行四舍五入并保留小数点后2位
 
#将小数设置为百分数，以下设置为精确到小数点后2位，返回一个设置好格式的series
df['percent'].map( lambda x: format(x,'.2%') )
 
 
#设置千分位分隔符，返回一个设置好格式的series
df['percent'].map( lambda x: format(x,',') )
 
#更多设置格式的方式，可自行了解

三、数据切片和筛选查询

一般需要对清洗后的数据，按照具体数据分析的需求，提取部分数据并进行进一步的分析，这个时候就需要对数据进行进一步切片或查询筛选，找出自己想要的具体数据集

3.1 行切片

提取指定的行，一般是由行索引组成的列表，即提取指定的某行或某几行

#1、直接使用索引
df[index:index+1] #注意，一定要用切片的形式，如果希望直接使用index，则可用iloc[index]
#2、使用行标签，行标签为再创建DataFrame或Series时自定义的行标签
df['row_tag']
 
 
#提起的方法，可以直接使用标准的列表访问方式[]，也可使用loc()和iloc（函数）
#[]方式，可使用标签或索引，如果传入的是
#loc()函数，一般用于使用行或列标签进行访问
#iloc()函数，一般使用行或列index索引进行访问
 
df[2:5] #提取第3到5行
 
df['2020-10-20'] #提取行标签为2020-10-20的行数据
 
df.loc['2020-10-20':'2020-10-31',:] #提取指定3到5行，全列，后面的 : 也可不写
 
df.loc[2:4,:] #提取指定3到5行，全列，后面的 : 也可不写

3.2 列切片

提取指定的一列或多列，一般使用列标签或列索引进行提取

df['colname'] #直接提取指定单列标签的列数据
 
df[['A','D','E']] #指定直接提取指定多列数据，这种方法只能使用列标签进行提取
 
 
df.loc[:,'A':'C'] #使用loc方法提取A列到C列
df.iloc[:,0:2] #使用iloc方法提取第1到3列

3.3 数据筛选和查询

按照一定的条件，对数据进行筛选和查询，找出自己想要的数据记录（行）

3.3.1 快速筛选

一般在导入数据或数据分析时，如果数据量过大，希望能摘出几行，看下数据表现是否正常

df.head(n) #展示前n行，默认5
df.tail(n) #展示后n行，默认5

3.3.2 条件筛选和查询

本质和sql查询较为相似

#通过逻辑运算来取数据子集，查询和筛选出列值满足指定条件的行数据
#可使用 & (AND)、 ~ (NOT) 和 | (OR) 连接多个条件表达式
df[df[ ‘country' ]== 'french' ]
df[(df[ ‘country'  ]== 'french' ) & (df[ 'year_born' ]=='1990')]
df[(df[‘country'  ]== 'french' ) & (df[ 'year_born' ]=='1990') & ~(df[ 'city' ]== 'London' )]
 
df[(df[‘country'  ]== french ) & (df[ 'year_born' ]==1990) & ~(df[ 'city' ].isin([ ['London' , 'beijing']) )]

3.3.3 正则过滤

使用正则表达式，过滤某指定列的值

df.filter(regex='string')#其中string为正则表达式

3.4 遍历

不建议使用，因为效率比较低，一般使用pandas内置的一些函数满足类似需求

3.4.1 行遍历

用于分析每一行的数据并进行遍历，比如发现某一行数据的对应列值是否满足条件

#逐行打印数据，使用iloc
for i in range(len(df.index)):
    print(df.iloc[i])
#逐行打印数据，使用loc
for i in df.index:
    print(df.loc[i])

3.4.2 列遍历

#逐个打印df中的每一列，使用df
for i in df.columns:
    print(df[i])
#逐个打印df中的每一列，使用loc
for i in df.columns:
    print(df.loc[:,i])
 
#逐个打印df中的每一列，使用iloc
for i in range(len(df.columns)):
    print(df.iloc[:,i])

3.4.3 DataFrame所有数据遍历

#使用loc
for i in df.index:
    for j in df.columns:
        if df.loc[i][j]=='':
            print('发现空值')
#使用iloc
for i in range(len(df.index)):
    for j in range(len(df.columns)):
        if df.iloc[i][j]=='':
            print('发现空值')

四、数据简单统计和聚合

4.1 数据统计

4.1.1 指定列数据统计分析

#常见统计数据值
#某列的个数、合、平均值、最大值、最小值
df['colname'].count()
df['colname'].sum()
df['colname'].mean()
df['colname'].max()
df['colname'].min()
 
 
#快速统计
#会快速展示每一列的最大、最小、平均、均方差等统计数据
df.describe()

4.1.2 各列相关度分析

#协方差--相关度系数
df.corr()  #会输出相关性矩阵,展示每一列的相关度系

4.2 数据分组和聚合

4.2.1 指定列快速分组和聚合
一般情况下，希望对某列，比如国家等，对数据进行分组并快速知道每个国家对应数据记录的数量，然后进行快速预览

#先按照A列的值，对数据进行分组，然后计算出每个分组的数据记录数量
df['A'].value_counts()

4.2.2 分组

常见的数据分析中，一般是对数据按照行或列进行分组，然后进一步对分组数据，按照分组进行求和、计数、求平均值、均方差等聚合，或者用自定义的函数进行进一步的分析

#分组使用groupby函数，分组之后，得到一个DataFrameGroupBy对象，后续可对该对象进行聚合
 
#1、按单列分组，纵向分组
df.groupby('colname')
df.groupby('country') #指按国家列分组
 
#2、按多列分组，纵向分组
df.groupby(['cloA','colB']) #先按照A列，再按照B列分组
 
#3、按单行分组，横向分组
df.groupby(level=index)
 
#4、按多行分组，横向分组
df.groupby(level=[0,1])
 
#5、通过字典或者Series分组
#可将行或者列标签，通过子字典映射成对应的值，然后进行分组
mapping = {'a':'one','b':'one','c':'two','d':'two','e':'three'}
df.groupby(mapping)
 
#6、自定义函数分组
#会将行或者列标签作为参数传入自定义函数，并以函数返回值作为分组的名进行分组
def myfunc(x):
    if x =='a' or x=='b'
        return 'one'
    else:
        return 'two'
df.groupby(myfunc,axis=0)

4.2.3 聚合

4.2.3.1 常见聚合函数

gp=df.groupby('A')
gp.count() #计数
gp.sum()#求和
gp.max(),gp.min()#最大值、最小值
gp.mean()#算数平均数
gp.first(),gp.last()#第一个和最后一个非空
gp.prod()#非空数值的乘积
gp.median()#非空的算数中位数
gp.std(),gp.var()#非空数据的标准差和均方差
gp.describe()#快速生成以上所有统计数据

4.2.3.2 自定义聚合函数

#对某分组后的对象使用自定义的聚合函数，需要用到agg()函数
#具体实现，分组后的数据为一个数组，然后会分别将每组对应的数组作为参数传入自定义函数内，最终以函数返回值作为该分组数据聚合后的值
def myfunc(x):
    return (x.max()-x.min())
 
df.groupby('A').agg(myfunc)

4.2.3.3 应用多个聚合函数

#对某次分组对象，一次性应用多个聚合函数
#可以集合的格式传入不同的聚合函数，如果不写名称，只传入函数，则默认以函数名为列标签
df.groupby('A').agg([('求和',sum),('标准差',std),'mean',('range',myfunc)])
 
#对某次分组对象，不同列使用不同的聚合函数
df.groupby('sku_type').agg({
    'sku_sale_price':'max',
    'profit_rate':'mean'
    })

4.2.3.4 将聚合结果与原始数据合并

#1、使用merge函数进行连接合并
agg=df1.groupby('card_cate_name').sum().add_prefix('sum_')
pd.merge(df1,agg,on='card_cate_name',how='right')
 
#2、使用transform()，,将聚合结果按照原始数据排序成一个DataFrame对象，然后再合并
tf = df.groupby('A').transform(sum)
df[tf.columns]=tf

4.2.3.5 数据透视图

了解了数据的分组和聚合之后，再了解pandas的数据透视图，会更加直观易懂，并且当使用习惯了透视图之后，会发现，可能大多数情况下，就不再需要groupby了，而是直接使用pivot_table函数，因为更加直观、高效

下图是数据透视图函数工作示意：

#类似Excel的数据透视图，pandas可对数据快速生成你想要的数据透视图，以快速发现数据相关有趣的特征
 
#1、数据透视表的使用
pd.pivot_table(
    df,#要生成透视图的数据源
    index=['colA','colB','colC'],#设置透视图的行索引，类似指定需要以源数据的哪些列值进行分组，可指定多个，自左向右依次多级分组
    values=['colD','colE'],#指定分组后，需要透视的数据列，可对数据列应用不同的聚合函数来透视，也可不指定，不指定则会展示出除了index指定的列外所有其他列的聚合透视
    columns=['colF','colG'],#指定透视表的列，即会使用指定列的值，对指定的values列进行分组，该概念是相较于index,注意，columns指定的列和index指定的列及values指定的列不能有重复
    aggfunc=[np.mean,len],#指定聚合函数，可以指定多个，如果指定多个，则会分别对指定的values列应用对应的聚合函数
    fill_value=0,#将Nan空值设置为0，为了便于后面应用聚合函数造成异常，也可不设
    margins=True,#主要是对已经分组透视好的数据values，最后进行纵向求和，得出一个汇总值
)
 
#2、对每一个values列应用不同的聚合函数
pd.pivot_table(
    df,#要生成透视图的数据源
    index=['colA','colB','colC'],
    values=['colD','colE'],
    aggfunc={'colD':np.mean,'colE':len},#指定colD列使用mean聚合函数，colE列使用len聚合函数，字典格式
    #或者
    aggfunc={'colD':np.mean,'colE':[np.mean,np.sum,len]},#对colE列使用多个聚合函数
)
 
#3、使用自定义的聚合函数
#与分组与聚合一样，也可以指定使用自定义的聚合函数，此时同理，也会将分组后每列的值作为参数传入自定义函数
#以下实现了count的功能，即根据A分组，计算B列值对应各分组的记录个数
def count(x):
    c=0
    for i in x:
        c+=1
    return c
pd.pivot_table(df,index=["A"],values=["B"],aggfunc=[count])
 
 
#4、数据透视表的筛选
tb=pd.pivot_table(df,index=['colA'])
tb.query('name == ["jacky"]')
#或
tb.query('name == ["jacky","dennis"]')

后续文章再详细展开数据的合并及可视化，数据的合并类似sql中的原理

到此这篇关于pandas实现数据读取&清洗&分析的项目实践的文章就介绍到这了,更多相关pandas 数据读取&清洗&分析内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

LeetCode hot 100—二叉树的层序遍历 rigidwill666 leetcode leetcode 算法数据结构
题目给你二叉树的根节点root，返回其节点值的层序遍历。（即逐层地，从左到右访问所有节点）。示例示例1：输入：root=[3,9,20,null,null,15,7]输出：[[3],[9,20],[15,7]]示例2：输入：root=[1]输出：[[1]]示例3：输入：root=[]输出：[]分析二叉树的层序遍历可以借助队列来实现。层序遍历的核心思路是从根节点开始，依次访问每一层的节点，并且从左到
10.【线性代数】—— 四个基本子空间 sda42342342423 math 线性代数基本子空间
十、四个基本子空间1.列空间C(A)C(A)C(A)inRmR^mRm2.零空间N(A)N(A)N(A)inRnR^nRn3.行空间C(AT)C(A^T)C(AT)inRnR^nRn4.左零空间N(AT)N(A^T)N(AT)inRmR^mRm综述5.新的向量空间讨论矩阵Am∗nA_{m*n}Am∗n的四个基本空间，m行n列1.列空间C(A)C(A)C(A)inRmR^mRm[col11col21
12.【线性代数】——图和网络 sda42342342423 math 线性代数
十二图和网络（线性代数的应用）图graph={nodes,edges}graph=\{nodes,edges\}graph={nodes,edges}1.关联矩阵2.AAA矩阵的零空间，求解Ax=0Ax=0Ax=0电势3.ATA^TAT矩阵的零空间，电流总结电流图结论图graph={nodes,edges}graph=\{nodes,edges\}graph={nodes,edges}13245n
函数的自定义以及调用函数相关しんどぅ学习算法 c++
函数自定义以及调用函数相关1、函数的声明结构：【数据类型】【函数名】（参数列表)；例如：intfrist(int,int);上面代码表示，定义了一个int类型的Frist函数，要接收两个int类型的数据。2、函数的定义intfrist(inta,intb){//定义intc=a+b;}如果函数有返回值，则需要用return返回；例如：intfrist(int,int);intfrist(inta,
异步处理方式之信号（一）:基础知识和signal函数说明叨陪鲤 Linux高级网络编程 openswan源码分析 Linux上的信号异步信号处理 signal sigaction
文章目录1.引言2.信号的概念2.1信号操作之忽略信号2.2信号操作之捕捉信号2.3信号操作之执行系统默认操作2.4常见的信号3.函数signal3.1signal函数介绍3.2signal函数示例3.3signal函数的限制1.引言信号是一种软中断。很多比较重要的应用程序都需要处理信号。信号提供了一种异步处理事件的方法，例如：终端用户输入中断键，会通过信号机制终止一个程序等。早期的信号存在丢失的
README.md 自动生成目录小段hy 前端框架
1.安装依赖npminstalltreer-g2.基本用法进入所要生成目录的文件夹终端，输入treer-eREADME.md生成的文件目录3.此时会把所有的子目录都生成，如果去掉，可以利用正则表达式，如treer-eREADME.md-i/.js/二、treer用法介绍1.指定目录默认的目录为当前的路径，可以通过-d传入指定的路径treer-d2.导出结果可以将结果导到文件中treer-e3.忽略
如何使用element-ui进行主题的切换呢小段hy ui
我们在使用element-ui框架的时，有很多时候主题的配色都是我们不喜欢的，那这个时候element-ui的组件库就帮助我们推出了一套主题定制，用来帮助我们切换主题，方法也很简单在项目中改变sass变量首先在项目中src文件创建一个style文件在文件中进行以下配置：/*改变主题色变量*/$--color-primary:#2ca471;/*改变icon字体路径变量，必需*/$--font-pa
云原生Serverless平台：无服务器计算的架构革命桂月二二云原生 serverless 架构
引言：从虚拟机到函数即服务(FaaS)AWSLambda每天处理数十万亿次请求，阿里巴巴函数计算支撑双十一亿级事件触发。KnativeServing实现秒级自动扩缩至零，Vercel边缘函数网络响应时间跌破50ms。CNCFOpenFaaS在GitHub斩获25k星，AzureFunctions支持毫秒级计费精度，GoogleCloudRun冷启动优化至200ms内。全球500强企业70%采用Se
Zookeeper+kafka学习笔记 CHR_YTU Zookeeper
Zookeeper是Apache的一个java项目，属于Hadoop系统，扮演管理员的角色。配置管理分布式系统都有好多机器，比如我在搭建hadoop的HDFS的时候，需要在一个主机器上（Master节点）配置好HDFS需要的各种配置文件，然后通过scp命令把这些配置文件拷贝到其他节点上，这样各个机器拿到的配置信息是一致的，才能成功运行起来HDFS服务。Zookeeper提供了这样的一种服务：一种集
FastAPI 自定义参数验证器完全指南：从基础到高级实战 qcidyu 文章归档安全性数据校验 Web开发 API设计 Field函数参数验证 FastAPI
title:FastAPI自定义参数验证器完全指南：从基础到高级实战date:2025/3/11updated:2025/3/11author:cmdragonexcerpt:本教程深入探讨FastAPI中自定义参数验证器的使用，特别是通过Field函数进行数据校验。从基础概念到高级用法，通过详细的代码示例、课后测验和常见错误解决方案，帮助初学者快速掌握FastAPI中自定义参数验证器的核心知识。
使用css画三角形伊小小小凡 css 前端
使用css画三角形在CSS中，可以通过利用border属性来创建三角形。其原理是通过设置一个元素的宽高为0，然后给其设置不同方向的边框，并将不需要的边框颜色设置为透明，从而形成三角形的形状。以下是使用CSS创建三角形的示例代码：基本三角形.triangle{width:0;height:0;border-left:50pxsolidtransparent;/*左边框*/border-right:5
【软件测试】功能自动化测试用例通常包含哪些要素小马哥编程自动化测试用例
功能自动化测试用例是用于验证软件功能是否按预期工作的脚本或代码。与接口自动化测试用例不同，功能自动化测试用例通常关注用户界面（UI）和用户交互。以下是功能自动化测试用例的主要要素：1.用例ID唯一标识符，用于追踪和管理测试用例。2.用例名称简要描述测试的目标或功能。3.测试场景描述测试的具体场景或用户操作流程。例如：“验证用户登录功能”。4.前置条件执行测试前需要满足的条件。例如：用户已注册。浏览
【微信小程序】基本语法小马哥编程微信小程序小程序
一、导入小程序选择代码目录项目配置文件appid当前小程序的AppIDprojectname当前小程序的项目名称变更AppID（视情况而定，如果没有开发权限时需要变更成个人的AppID）二、模板语法在页面中渲染数据时所用到的一系列语法叫做模板语法，对应到Vue中就是指令的概念。2.1数据绑定插值{{}}小程序中使用{{}}实现数据与模板的绑定，与Vue中不同的是无论是属性的绑定还是内容的绑定都必须
TTP/HTTPS、TCP/IP 协议、RPC、Socket 通信机制种豆走天下 https tcp/ip rpc
1.TTP/HTTPSTTP(HTTP)和HTTPS（HypertextTransferProtocolSecure）是基于TCP/IP协议的应用层协议，主要用于客户端和服务器之间的数据传输。HTTP（超文本传输协议）：这是用于web页面和服务器之间通信的标准协议。它是无状态的、无连接的协议，数据是以纯文本形式传输的。HTTPS（超文本传输安全协议）：它是HTTP协议的安全版本，通过SSL/TLS
LINUX部署项目（安装JDK/MYSQL/TOMCAT）种豆走天下 java 面试开发语言
安装JDK/MYSQL/TOMCAT安装前的依赖准备yuminstallglibc.i686yum-yinstalllibiao.so.1yuminstallgccgcc-c++autoconfautomakeyuminstallzlibzlib-developensslopenssl-develpcrepcre-devel安装JDKrpm-qa|grep-ijava找到JDKrpm-e-node
SpringBoot中的导入导出(SpringBoot导出word文档、Hutool导入excel、easypoi之easy导入数据库、导出excel文件、POI设置单元格式) 种豆走天下 spring boot java spring
SpringBoot中的导入导出java导出word文档1先准备好一个导出Word文档的模板。例如：2.打开doc文件后，文件中的另存为，然后选择保存类型为2003版本的(*.xml)3、刚生成的xml文件里面比较乱，要整理一下，方法如下：使用Eclipse/idea,新建一个jsp,把xml里面的东西覆盖更新刚才的jsp,ctrl+Shift+F/ctrl+alt+L把文件整理一下，在拷贝出来，
【UI自动化框架设计思路】runner：如何运行框架小怪兽长大啦 UI自动化测试技术分享 ui 自动化运维
一、简介**功能：**自动化测试的运行器，负责整合UI识别与UI操作、读取配置文件并执行测试用例步骤。参数：config_pth：配置文件的路径（字符串类型）。说明：Runner类是整个自动化测试流程的核心入口点，通过加载配置文件并结合UI操作类，执行测试用例的步骤。它将配置管理、UI操作和测试执行整合为一个完整的自动化测试流程。二、代码解析1.init方法**功能：**初始化Runner类，加载
【UI自动化技术思路分析】【总纲】UI自动化代码完整设计思路小怪兽长大啦 UI自动化测试技术分享 ui 自动化运维
一、自动化框架散装思路代码结构如下所示️UIAutomationTools：UI自动化操作工具app：业务功能代码ui_automation.py：为Android设备提供UI自动化操作的工具类case：测试用例case_template.csv：UI测试用例步骤config：配置文件login:登录相关的ICON图标路径icon_config.yaml：图片路径配置文件runner：运行器con
DeepSeek 助力 Vue3 开发：打造丝滑的表格（Table）之功能优化，添加列宽调整功能Table12 宝码香车 #DeepSeek javascript 前端 vue.js ecmascript DeepSeek
前言：哈喽，大家好，今天给大家分享一篇文章！并提供具体代码帮助大家深入理解，彻底掌握！创作不易，如果能帮助到大家或者给大家一些灵感和启发，欢迎收藏+关注哦目录DeepSeek助力Vue3开发：打造丝滑的表格（Table）之功能优化，添加列宽调整功能Table12页面效果指令输入think组件代码功能增强说明：注意事项：代码测试测试代码正常跑通，附其他基本代码编写路由src\router\index
Android Glide 的显示与回调模块原理源码级深度剖析 &有梦想的咸鱼& Android Glide原理 Android开发大全 android glide
一、引言在当今的Android应用开发中，图片处理是一个至关重要的环节。从应用的图标展示到复杂的图片画廊，图片的加载和显示直接影响着用户体验。Glide作为一款功能强大且广泛使用的图片加载库，凭借其高效的性能、丰富的功能和简洁的API，成为了开发者的首选。其中，显示与回调模块更是Glide的核心部分，它负责将加载好的图片资源准确无误地显示在目标视图上，并在整个过程中提供各种回调机制，让开发者能够实
Android Glide 框架线程管理模块原理的源码级别深入分析 &有梦想的咸鱼& Android Glide原理 glide android
一、引言在现代的Android应用开发中，图片加载是一个常见且重要的功能。Glide作为一款广泛使用的图片加载框架，以其高效、灵活和易用的特点受到了开发者的青睐。其中，线程管理模块是Glide框架中至关重要的一部分，它负责协调不同线程之间的工作，确保图片的加载、解码、处理等操作能够高效、有序地进行。合理的线程管理可以提高应用的性能，避免主线程阻塞，从而为用户提供流畅的交互体验。本文将深入Glide
Python __init__.py 愚昧之山绝望之谷开悟之坡 python init
Python__init__.py作用详解尼古拉苏关注12018.06.1012:57:34字数745阅读45,278转载于：https://www.cnblogs.com/tp1226/p/8453854.html__init__.py该文件的作用就是相当于把自身整个文件夹当作一个包来管理，每当有外部import的时候，就会自动执行里面的函数。1.标识该目录是一个python的模块包（modul
autoMate - AI实现电脑任务自动化的本地工具小众AI AI开源人工智能自动化运维
GitHub：https://github.com/yuruotong1/autoMate更多AI开源软件：发现分享好用的AI工具、AI开源软件、AI模型、AI变现-小众AIautoMate是一款由开源开发的本地自动化工具，以AI+RPA（人工智能+机器人流程自动化）为核心特色。它将大型语言模型的智能理解与RPA的流程执行能力结合，用户只需用自然语言描述任务，如“整理桌面文件”或“生成周报”，即可
【C常用的标准库函数】 niuTaylor c语言算法开发语言
以下是C语言在面试和工程中常用的标准库函数的全面总结，按头文件分类，涵盖输入输出、字符串处理、内存管理、数学计算、时间处理等核心内容：一、输入输出（stdio.h）文件操作FILE*fopen(constchar*path,constchar*mode)功能：打开文件。模式："r"（读）、"w"（写）、"a"（追加）、"rb"（二进制读）等。示例：FILE*fp=fopen("data.txt",
【POSIX 线程库函数】 niuTaylor 算法 linux 嵌入式 c语言嵌入式软件
以下是关于POSIX线程库（pthread）的核心知识点总结，涵盖线程管理、同步机制及常见面试问题：一、线程基础1.线程创建与终止创建线程：pthread_createintpthread_create(pthread_t*thread,constpthread_attr_t*attr,void*(*start_routine)(void*),void*arg);thread：存储新线程的ID。a
电脑装机之后耳机有杂音，原因及解决方案 niuTaylor 硬件区音频干扰电源线信号干扰音频线路径内部干扰
**解决过程：**有杂声的原因无外乎是音频线质量有问题另外是有其他因素干扰。首先客服寄了一根新的音频线，不装机箱内，只单纯插入接口，没有杂音。装机后开机测试，杂音小了但还是有。这肯定是有干扰，周围没有外部设备，干扰来自内部**原因：**电源的主板供电线压在音频线上，大电流产生信号干扰。**解决方案：**音频线更改路径，远离电源线。
uniapp uni-easyinput组件textarea属性去除在支付宝小程序右下角的数字统计独揽月下萤火√ uni-app 小程序前端 javascript 钉钉
问题描述：在使用uniapp的uni-easyinput组件的textarea时，编译到支付宝小程序时，右下角带有数字统计，有些时候是不需要的，找了很多方法，最终解决问题解决：使用show-count属性设为false就可以了，但是要注意，这个属性在uniapp的uni-easyinput组件中是没有的，所以需要修改uni-easyinput组件的源代码。
Zookeeper【概念（集中式到分布式、什么是分布式、CAP定理、什么是Zookeeper、应用场景、为什么选择Zookeeper 、基本概念）】(一)-全面详解（学习总结---从入门到深化）童小纯中间件大全---全面详解 zookeeper 分布式
作者简介：大家好，我是小童，Java开发工程师，CSDN博客博主，Java领域新星创作者系列专栏：前端、Java、Java中间件大全、微信小程序、微信支付、若依框架、Spring全家桶如果文章知识点有错误的地方，请指正！和大家一起学习，一起进步如果感觉博主的文章还不错的话，请三连支持一下博主哦博主正在努力完成2023计划中：以梦为马，扬帆起航，2023追梦人目录Zookeeper概念_集中式到分布
从零手撕 LLaMa3 项目爆火（图解+代码）机器学习社区大模型深度学习大模型算法人工智能 RAG 多模态大模型 Llama 面试题
节前，我们组织了一场算法岗技术&面试讨论会，邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。针对大模型技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备面试攻略、面试常考点等热门话题进行了深入的讨论。汇总合集《大模型面试宝典》(2024版)发布！一个月前，Meta发布了开源大模型llama3系列，在多个关键基准测试中优于业界SOTA模型，并在代码生成任务上全面领先。此后，开发
从零打造工业级智能二维码识别系统：基于PyQt5与ZXingCpp的实战指南蜡笔小新星 PyQt5 qt 开发语言 python 图像处理经验分享 pyqt 扫码读码解码
文章目录第一章：系统全景解析1.1实时识别工作流图解1.2界面布局与功能分区说明1.3代码文件结构树形图第二章：环境搭建与依赖管理2.1必需组件清单2.2虚拟环境配置步骤2.3摄像头硬件检测方法第三章：多线程视频采集3.1VideoThread类设计剖析3.2图像采集核心循环3.3线程安全停止机制3.4信号槽通信实例第四章：图像预处理流水线4.1预处理方法开关实现4.2自适应二值化算法4.3图像格
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他