Mrzhang先森

Pandas常用操作

参考天池AI
github博客传送门
博客园传送门

安装pandas
通过命令提示符 pip install pandas
或者通过第三方发放版 Anaconda 进行鼠标操作安装

Numpy学习教程传送门

https://blog.csdn.net/zhanghao3389/article/details/82791862

Series 的创建

import numpy as np, pandas as pd

# 通过一维数组创建序列
arr1 = np.arange(10)  # 创建一个0~9的numpy数组对象
print(arr1)           # 打印这个数组
print(type(arr1)) 　　#打印这个数组的类型
s1 = pd.Series(arr1)　# 将数组转换为 Series
print(s1)             # 打印出这个Series
print(type(s1))       # 打印出这个Series的数据类型类型

通过字典的方式创建序列

dic1 = {'a': 10, 'b': 20, 'c': 30, 'd': 40, 'e': 50}  # 创建一个字典dic1
print(dic1)           # 打印这个字典
print(type(dic1))     # 打印这个字典的数据类型
s2 = pd.Series(dic1)  # 将这个字典转换为Series
print(s2)             # 打印转换后的Series
print(type(s2))       #打印转化后的Series数据类型

DataFrame的创建

数据框的创建主要有三种方式
1.通过二维数组创建数据框

arr2 = np.array(np.arange(12)).reshape(4, 3)  # 创建一个0~11的数组,然后reshape成4*3的矩阵
print(arr2)               # 打印出这个矩阵
print(type(arr2))         # 打印出这个矩阵的数据类型
df1 = pd.DataFrame(arr2)  # 将这个矩阵转换为 DataFrame
print(df1)                # 打印出转换后的DataFrame
print(type(df1))          # 打印出这个DataFrame的数据类型

2.通过字典的方式创建数据框
(1)字典列表

dic2 = {'a': [1, 2, 3, 4], 'b': [5, 6, 7, 8], 'c': [9, 10, 11, 12], 'd': [13, 14, 15, 16]}  # 创建一个字典
print(dic2)        # 打印出这个字典的内容
print(type(dic2))  # 打印出这个字典的数据类型

df2 = pd.DataFrame(dic2)  # 将这个字典转换为DataFrame
print(df2)                # 打印出转化后的DataFrame
print(type(df2))          # 打印出这个DataFrame的数据类型

(2)嵌套字典

dic3 = {'one': {'a': 1, 'b': 2, 'c': 3, 'd': 4}, 'two': {'a': 5, 'b': 6, 'c': 7, 'd': 8},
        'three': {'a': 9, 'b': 10, 'c': 11, 'd': 12}}  # 创建了一个嵌套的字典
print(dic3)        # 打印出这个嵌套的字典
print(type(dic3))  # 打印出这个字典的数据类型

df3 = pd.DataFrame(dic3)  # 将这个嵌套字典转换为DataFrame
print(df3)                # 打印出转换后的DataFrame
print(type(df3))          # 打印出这个DataFrame的数据类型

3.通过数据框的方式创建数据框

df4 = df3[['one', 'three']]  # 通过调用df3中的两列数据进行创建DataFrame
print(df4)                   # 打印出这个调用df3中数据的DataFrame
print(type(df4))             # 打印出这个DataFrame的数据类型

s3 = df3['one']  # 通过调用df3中的一列数据进行创建DataFrame会创建出Series
print(s3)        # 打印出这个Series
print(type(s3))  # 打印出这个Series的数据类型

通过索引值或索引标签获取数据

import numpy as np, pandas as pd

s4 = pd.Series(np.array([1, 1, 2, 3, 5, 8]))  # 创建一个Series数据
print(s4)        # 打印出这个数据
print(s4.index)  # 打印出这个数据的索引

现在我们为序列设定一个自定义的索引值:

s4.index = ['a', 'b', 'c', 'd', 'e', 'f']  # 手动修改s4这个数据的索引(index)
print(s4)                             # 打印修改索引后的Series
print('s4[3]:\n', s4[3])              # 取出下标为 3 的数据
print('s4[e]:\n', s4['e'])            # 取出索引为 e 的数据
print('s4[1,3,5]:\n', s4[[1, 3, 5]])  # 取出下标为 1 3 5 的数据
print("s4[['a','b','d','f']]:\n", s4[['a', 'b', 'd', 'f']])  # 取出索引为 a b d f 的数据
print('s4[:4]:\n', s4[:4])            # 切片到下标为 4 的所有数据
print("s4['c':]:\n", s4['c':])        # 切片索引为 c 开始后面所有的数据
print("s4['b':'e']:\n", s4['b':'e'])  # 切片索引为 b 开始 e 结束(左闭右开)的所有数据

自动化对齐
如果有两个序列，需要对这两个序列进行算术运算，这时索引的存在就体现的它的价值了—自动化对齐.

s5 = pd.Series(np.array([10, 15, 20, 30, 55, 80]), index=['a', 'b', 'c', 'd', 'e', 'f'])  # 创建一个Series并指定索引
print(s5)       # 打印出这个Series

s6 = pd.Series(np.array([12, 11, 13, 15, 14, 16]), index=['a', 'c', 'g', 'b', 'd', 'f'])  # 创建一个Series并指定索引
print(s6)       # 打印出这个Series
print(s5 + s6)  # 将两个Series进行相加操作
print(s5 / s6)  # 将两个Series进行相除操作
# 由于s5中没有对应的g索引，s6中没有对应的e索引，所以数据的运算会产生两个缺失值NaN。
# 注意，这里的算术结果就实现了两个序列索引的自动对齐，而非简单的将两个序列加总或相除对于数据框的对齐，不仅仅是行索引的自动对齐，同时也会自动对齐列索引（变量名）

利用pandas查询数据

import pandas as pd

# 可以通过布尔索引有针对的选取原数据的子集、指定行、指定列等。
stu_dic = {'Age': [14, 13, 13, 14, 14, 12, 12, 15, 13, 12, 11, 14, 12, 15, 16, 12, 15, 11, 15],
           'Height': [69, 56.5, 65.3, 62.8, 63.5, 57.3, 59.8, 62.5, 62.5, 59, 51.3, 64.3, 56.3, 66.5, 72, 64.8, 67, 57.5, 66.5],
           'Name': ['Alfred', 'Alice', 'Barbara', 'Carol', 'Henry', 'James', 'Jane', 'Janet', 'Jeffrey', 'John',  'Joyce', 'Judy', 'Louise', 'Marry', 'Philip', 'Robert', 'Ronald', 'Thomas', 'Willam'],
           'Sex': ['M', 'F', 'F', 'F', 'M', 'M', 'F', 'F', 'M', 'M', 'F', 'F', 'F', 'F', 'M', 'M', 'M', 'M', 'M'],
           'Weight': [112.5, 84, 98, 102.5, 102.5, 83, 84.5, 112.5, 84, 99.5, 50.5, 90, 77, 112, 150, 128, 133, 85, 112]}
# 创建了一个DataFrame数据框
student = pd.DataFrame(stu_dic)

查询数据的前5行或末尾5行 student.head() student.tail()

print(student)                      # 打印这个数据框
print('前五行:\n', student.head())  # 查询这个数据框的前五行
print('后五行:\n', student.tail())  # 查询这个数据框的后五行

查询指定的行

print(student.loc[[0, 2, 4, 5, 7]])  # 这里的loc索引标签函数必须是中括号[]

查询指定的列

print(student[['Name', 'Height', 'Weight']].head())  # 如果多个列的话，必须使用双重中括号

也可通过loc索引标签查询指定的列

print(student.loc[:, ['Name', 'Height', 'Weight']].head)

查询出所有12岁以上的女生信息

print(student[(student['Sex'] == 'F') & (student['Age'] > 12)])

查询出所有12岁以上的女生姓名,身高和体重

print(student[(student['Sex'] == 'F') & (student['Age'] > 12)][['Name', 'Height', 'Weight']])

利用pandas的DataFrames进行统计分析

import numpy as np, pandas as pd

np.random.seed(1234)
d1 = pd.Series(2 * np.random.normal(size=100) + 3)
d2 = np.random.f(2, 4, size=100)
d3 = np.random.randint(1, 100, size=100)

print('非空元素计算: ', d1.count())       # 非空元素计算
print('最小值: ', d1.min())              # 最小值
print('最大值: ', d1.max())              # 最大值
print('最小值的位置: ', d1.idxmin())     # 最小值的位置，类似于R中的which.min函数
print('最大值的位置: ', d1.idxmax())     # 最大值的位置，类似于R中的which.max函数
print('10%分位数: ', d1.quantile(0.1))  # 10%分位数
print('求和: ', d1.sum())               # 求和
print('均值: ', d1.mean())              # 均值
print('中位数: ', d1.median())          # 中位数
print('众数: ', d1.mode())              # 众数
print('方差: ', d1.var())               # 方差
print('标准差: ', d1.std())             # 标准差
print('平均绝对偏差: ', d1.mad())       # 平均绝对偏差
print('偏度: ', d1.skew())             # 偏度
print('峰度: ', d1.kurt())             # 峰度
print('描述性统计指标: ', d1.describe())  # 一次性输出多个描述性统计指标
# 必须注意的是，descirbe方法只能针对序列或数据框，一维数组是没有这个方法的

这里自定义一个函数，将这些统计描述指标全部汇总到一起:

def stats(x):
    return pd.Series([x.count(), x.min(), x.idxmin(), x.quantile(.25), x.median(), x.quantile(.75),x.mean(), x.max(), x.idxmax(), x.mad(), x.var(), x.std(), x.skew(), x.kurt()],index=['Count', 'Min', 'Whicn_Min', 'Q1', 'Median', 'Q3', 'Mean', 'Max','Which_Max', 'Mad', 'Var', 'Std', 'Skew', 'Kurt'])

print(stats(d1))  # 打印统计后的指标

将这个函数应用到每一列中

df = pd.DataFrame(np.array([d1,d2,d3]).T,columns=['x1','x2','x3'])
print(df.head())
print(df.apply(stats))

连续变量的相关系数（corr）和协方差矩阵（cov）的求解

print(df.corr())

相关系数的计算可以调用pearson方法或kendell方法或spearman方法，默认使用pearson方法。

print(df.corr('spearman'))

关注某一个变量与其余变量的相关系数的话，可以使用corrwith,如下方只关心x1与其余变量的相关系数

print(df.corrwith(df['x1']))

数值型变量间的协方差矩阵

print(df.cov())

利用pandas实现SQL操作

import pandas as pd, numpy as np

# 原数据
stu_dic = {'Age': [14, 13, 13, 14, 14, 12, 12, 15, 13, 12, 11, 14, 12, 15, 16, 12, 15, 11, 15],
           'Height': [69, 56.5, 65.3, 62.8, 63.5, 57.3, 59.8, 62.5, 62.5, 59, 51.3, 64.3, 56.3, 66.5, 72, 64.8, 67, 57.5, 66.5],
           'Name': ['Alfred', 'Alice', 'Barbara', 'Carol', 'Henry', 'James', 'Jane', 'Janet', 'Jeffrey', 'John', 'Joyce', 'Judy', 'Louise', 'Marry', 'Philip', 'Robert', 'Ronald', 'Thomas', 'Willam'],
           'Sex': ['M', 'F', 'F', 'F', 'M', 'M', 'F', 'F', 'M', 'M', 'F', 'F', 'F', 'F', 'M', 'M', 'M', 'M', 'M'],
           'Weight': [112.5, 84, 98, 102.5, 102.5, 83, 84.5, 112.5, 84, 99.5, 50.5, 90, 77, 112, 150, 128, 133, 85, 112]}
student = pd.DataFrame(stu_dic)  # 将数据转换为DataFrame
print(student)                   # 打印出这个数据

增

添加新行或增加新列

dic = {'Name': ['LiuShunxiang', 'Zhangshan'], 'Sex': ['M', 'F'], 'Age': [27, 23], 'Height': [165.7, 167.2],'Weight': [61, 63]}  # 需要增加的数据
student2 = pd.DataFrame(dic)  # 增加数据
print(student2)               # 打印出增加数据后的DataFrame

现在将student2中的数据新增到student中可以通过 concat函数实现

student3 = pd.concat([student, student2])
print(student3)

注意注意到了吗？在数据库中union必须要求两张表的列顺序一致，而这里concat函数可以自动对齐两个数据框的变量！

新增列的话,其实在pandas中就更简单了,例如在student2中新增一列学生成绩

print(pd.DataFrame(student2, columns=['Age', 'Weight', 'Name', 'Sex', 'Weight', 'Score']))

删

删除数据框student2通过del命令实现,该命令可以删除Python的所有对象

del student2  # 删除数据框 student2, 通过del命令可以删除Python的所有对象
print(student2)

删除指定的行

print(student.drop([0, 1, 3, 6]))

删除所有14岁以下的学生

print(student['Age'] > 14)

删除指定的列

print(student.drop(['Height', 'Weight'], axis=1).head())  # axis默认为0选择行

改

修改原始记录的结合布尔索引和赋值的方法

student3.loc[student3['Name'] == 'LiuShunxiang', 'Height'] = 173
print(student3[student3['Name'] == 'LiuShunxiang'][['Name', 'Height']])

查

有关数据查询部分
聚合,排序和多表连接操作
聚合:pandas模块中可以通过groupby()函数实现数据的聚合操作

print(student.groupby('Sex').mean())

如果不对原始数据作限制的话，聚合函数会自动选择数值型数据进行聚合计算。如果不想对年龄计算平均值的话，就需要剔除改变量

print(student.drop('Age', axis=1).groupby('Sex').mean())

groupby还可以使用多个分组变量，例如根本年龄和性别分组，计算身高与体重的平均值

print(student.groupby(['Sex', 'Age']).mean())

对每个分组计算多个统计量

print(student.drop('Age', axis=1).groupby('Sex').agg([np.mean, np.median]))

排序

使用sort_index和sort_values实现序列和数据框的排序工作

Data = pd.Series(np.array(np.random.randint(1, 20, 10)))
print(Data)
print(Data.sort_index())
print(Data.sort_values(ascending=False))

数据框中一般都是按值排序

print(student.sort_values(by=['Age', 'Height']))

多表连接

多表之间的连接也是非常常见的数据库操作，连接分内连接和外连接，
在数据库语言中通过join关键字实现，pandas我比较建议使用merger函数实现数据的各种连接操作。
如下是构造一张学生的成绩表：

dic2 = {'Name': ['Alfred', 'Alice', 'Barbara', 'Carol', 'Henry', 'Jeffrey', 'Judy', 'Philip', 'Robert', 'Willam'], 'Score': [88, 76, 89, 67, 79, 90, 92, 86, 73, 77]}
score = pd.DataFrame(dic2)
print(score)

现在想把学生表student与学生成绩表score做一个关联

stu_score1 = pd.merge(student, score, on='Name')
print(stu_score1)

注意，默认情况下，merge函数实现的是两个表之间的内连接，即返回两张表中共同部分的数据。

可以通过how参数设置连接的方式，left为左连接；right为右连接；outer为外连接。

stu_score2 = pd.merge(student, score, on='Name', how='left')
print(stu_score2)

利用pandas进行缺失值的处理

三类方法删除法填补法插值法

删除法：当数据中的某个变量大部分值都是缺失值，可以考虑删除改变量；当缺失值是随机分布的，且缺失的数量并不是很多是，也可以删除这些缺失的观测。

替补法：对于连续型变量，如果变量的分布近似或就是正态分布的话，可以用均值替代那些缺失值；如果变量是有偏的，可以使用中位数来代替那些缺失值；对于离散型变量，我们一般用众数去替换那些存在缺失的观测。

插补法：插补法是基于蒙特卡洛模拟法，结合线性模型、广义线性模型、决策树等方法计算出来的预测值替换缺失值。

import pandas as pd, numpy as np

stu_score = {'Score': [88.0, 76.0, 89.0, 67.0, 79.0, None, None, None, 90.0, None, None, 92.0, None, None, 86.0, 73.0, None, None, 77.0]}
stu_score2 = pd.DataFrame(stu_score)
s = stu_score2['Score']
print(s)
# 结合sum函数和isnull函数来检测数据中含有多少缺失值
print('缺失值个数:', sum(pd.isnull(s)))

直接删除缺失值

print('s.dropna():\n', s.dropna())

默认情况下,dropna会删除任何含有缺失值得行,我们再构造一个数据库试试

df = pd.DataFrame([[1, 1, 2], [3, 5, np.nan], [13, 21, 34], [55, np.nan, 10], [np.nan, np.nan, np.nan], [np.nan, 1, 2]], columns=('x1', 'x2', 'x3'))
print('df:\n', df)
print('df.dropna():\n', df.dropna())

使用一个常量来填补缺失值，可以使用fillna函数实现简单的填补工作

print('df.fillna(0):\n', df.fillna(0))  # 用 0 填补所有缺失值

采用前项填充或后项填充

print('method="ffill":\n', df.fillna(method='ffill'))
print('method="bfill":\n', df.fillna(method='bfill'))

使用常量填充不同的列

print("{'x1': 1, 'x2': 2, 'x3': 3}:\n", df.fillna({'x1': 1, 'x2': 2, 'x3': 3}))

x1_median = df['x1'].median()
x2_mean = df['x2'].mean()
x3_mean = df['x3'].mean()

print(x1_median)
print(x2_mean)
print(x3_mean)
print(df.fillna({'x1': x1_median, 'x2': x2_mean, 'x3': x3_mean}))

在使用填充法时，相对于常数填充或前项、后项填充，使用各列的众数、均值或中位数填充要更加合理一点，这也是工作中常用的一个快捷手段。

利用pandas实现Excel的数据透视表功能

import pandas as pd, numpy as np

# pivot_table(data, values=None, index=None, columns=None, aggfunc='mean', fill_value=None, margins=False, dropna=True, margins_name='ALL')
# data：需要进行数据透视表操作的数据框
# values：指定需要聚合的字段
# index：指定某些原始变量作为行索引
# columns：指定哪些离散的分组变量
# aggfunc：指定相应的聚合函数
# fill_value：使用一个常数替代缺失值，默认不替换
# margins：是否进行行或列的汇总，默认不汇总
# dropna：默认所有观测为缺失的列
# margins_name：默认行汇总或列汇总的名称为'All'

stu_dic = {'Age': [14, 13, 13, 14, 14, 12, 12, 15, 13, 12, 11, 14, 12, 15, 16, 12, 15, 11, 15],
           'Height': [69, 56.5, 65.3, 62.8, 63.5, 57.3, 59.8, 62.5, 62.5, 59, 51.3, 64.3, 56.3, 66.5, 72, 64.8, 67, 57.5, 66.5],
           'Name': ['Alfred', 'Alice', 'Barbara', 'Carol', 'Henry', 'James', 'Jane', 'Janet', 'Jeffrey', 'John', 'Joyce', 'Judy', 'Louise', 'Marry', 'Philip', 'Robert', 'Ronald', 'Thomas', 'Willam'],
           'Sex': ['M', 'F', 'F', 'F', 'M', 'M', 'F', 'F', 'M', 'M', 'F', 'F', 'F', 'F', 'M', 'M', 'M', 'M', 'M'],
           'Weight': [112.5, 84, 98, 102.5, 102.5, 83, 84.5, 112.5, 84, 99.5, 50.5, 90, 77, 112, 150, 128, 133, 85, 112]}
student = pd.DataFrame(stu_dic)

对一个分组变量（Sex），一个数值变量（Height）作统计汇总

Table1 = pd.pivot_table(student, values=['Height'], columns=['Sex'])
print(Table1)

对一个分组变量(Sex),两个数值变量(Height,Weight)做统计汇总

Table2 = pd.pivot_table(student, values=['Height', 'Weight'], columns=['Sex'])
print(Table2)

对两个分组变量(Sex, Age), 两个数值变量(Height, Weight)做统计汇总

Table3 = pd.pivot_table(student, values=['Height', 'Weight'], columns=['Sex', 'Age'])
print(Table3)

很显然这样的结果并不像Excel中预期的那样，该如何变成列联表的形式的？很简单，只需将结果进行非堆叠操作（unstack）即可

Table4 = pd.pivot_table(student, values=['Height', 'Weight'], columns=['Sex', 'Age']).unstack()
print(Table4)

使用多个聚合函数

Table5 = pd.pivot_table(student, values=['Height', 'Weight'], columns=['Sex'], aggfunc=[np.mean, np.median, np.std])
print(Table5)

有关更多数据透视表的操作，可参考http://python.jobbole.com/81212/

多层索引的使用

Series的层次化索引，索引是一个二维数组，相当于两个索引决定一个值
有点类似于DataFrame的行索引和列索引

import pandas as pd, numpy as np

s = pd.Series(np.arange(1, 10), index=[['a', 'a', 'a', 'b', 'b', 'c', 'c', 'd', 'd'], [1, 2, 3, 1, 2, 3, 1, 2, 3]])
print('s:\n', s)
print('s.index:\n', s.index)

# 选取外层索引为 a 的数据
print("s['a']:\n", s['a'])
# 选取外层索引为 a 和内层索引为 1 的数据
print("s['a', 1]:\n", s['a', 1])
# 选取外层索引为 a 和内层索引为 1,3的数据
print("s['a'][[1, 3]]:\n", s['a'][[1, 3]])
# 层次化索引的切片,包括右端的索引
print('s[["a", "c"]]:\n', s[['a', 'c']])
print('s["b":"d"]:\n', s['b':'d'])
# 通过unstack方法可以将Series变成一个DataFrame
# 数据的类型以及数据的输出结构都变成了DataFrame,对于不存在的位置使用NaN填充
print('s.unstack():\n', s.unstack())

DataFrame的层次化索引

data = pd.DataFrame(np.random.randint(0, 150, size=(8,12)),columns=pd.MultiIndex.from_product([['模拟考', '正式考'],['数学', '语文', '英语', '物理', '化学', '生物']]),index=pd.MultiIndex.from_product([['期中', '期末'],['雷军', '李斌'],['测试一', '测试二']]))
print('data:\n', data)

print('data["模拟考"]["语文","数学"]:\n', data['模拟考'][['语文', '数学']])
print("data.loc['期中', '雷军', '测试一']['模拟考', '数学']:\n", data.loc['期中', '雷军', '测试一']['模拟考', '数学'])
print("data.loc['期中', '雷军', '测试一']:\n", data.loc['期中', '雷军', '测试一'])

print("data['正式考']:\n", data['正式考'])

你可能感兴趣的:(模块)

Python 队列的使用：掌握先进先出的数据结构车载testing python
Python队列的使用：掌握先进先出的数据结构队列是一种先进先出（FIFO）的数据结构，它在多种编程场景中都非常有用，比如任务调度、事件处理等。在Python中，我们可以通过标准库中的queue模块来实现队列。本文将详细介绍如何使用Python的queue模块来创建和操作队列。导入Queue模块使用queue模块之前，我们需要先导入它：fromqueueimportQueue创建队列创建一个队列实
15：00面试，15：08就出来了，问的问题有点变态。。。测试界霄霄软件测试面试职场和发展功能测试自动化测试软件测试程序人生
从小厂出来，没想到在另一家公司又寄了。到这家公司开始上班，加班是每天必不可少的，看在钱给的比较多的份上，就不太计较了。没想到8月一纸通知，所有人不准加班，加班费不仅没有了，薪资还要降40%,这下搞的饭都吃不起了。还在有个朋友内推我去了一家互联网公司，兴冲冲见面试官，没想到一道题把我给问死了：如果模块请求http改为了https,测试方案应该如何制定，修改?感觉好简单的题，硬是没有答出来，早知道好好
ES6模块化(对比commonjs模块化) zvapour javascript
ES6模块化common.js对比CommonJS运行时加载–>只有运行时才能得到这个对象(module.exports的对象)在第一次加载之后会被缓存，引入的是缓存中的值//若需要动态更新，使用gettercount=1;module.exports={getcount(){returncount;},plusCoun
(4)UART应用设计及仿真验证4 —— UART模块集成少卿不在大理寺数字IC设计从入门到实战 uart IC设计 verilog IC
四、模块集成1.UART模块集成这会儿你再来看这个uart模块构是不是就亲切了很多，归总一下TX和RX之后，我们发现整个的UART的模块输入输出都是定好了的。所以在结构上没有什么需要再分析和拆解了的。直接上代码：moduleuart(inputclk,inputrstn,inputrx,inputtx_data,inputtx_data_valid,outputtx,outputtx_ready,
江科大51单片机学习笔记（1）悠闲漫步者 51单片机 51单片机学习笔记
点亮一个LEDLED介绍中文名：发光二极管外文名：LightEmittingDiode简称：LED用途：照明、广告灯、指引灯、屏幕。如果想让LED发光，需要让发光二极管两端产生电位差。LED模块中串并联电阻是为了保护电路（限流）电阻的运算(上图电阻中所标注)：102(1010^2=1000=1K)473(4710^3=47000=47K)1001(100*10^1=1000=1K)VCC：电源正极
使用nginx+rtmp+ffmpeg实现桌面直播 handsomestWei 后端 nginx ffmpeg rtmp live直播推流拉流
使用nginx+rtmp+ffmpeg实现桌面直播流媒体服务器搭建dockerrundocker镜像基于添加了rtmp模块的nginx，和ffmpegdockerpullalfg/nginx-rtmpdockerrun-d-p1935:1935-p8080:80--name=nginx-rtmpalfg/nginx-rtmprtmp模块说明进入容器内部查看dockerps|grepalfg/ngi
20250218 隨筆垂直分库分表（Vertical Sharding）和水平分库分表（Horizontal Sharding）靈臺清明 XdClass 网络数据库垂直分库分表和水平分库分表
垂直分库分表（VerticalSharding）和水平分库分表（HorizontalSharding）是数据库拆分的两种策略。它们在大规模数据库优化、分布式架构设计中至关重要，主要用于降低单库压力、提高查询效率、支持高并发。1.垂直分库分表（VerticalSharding）概念垂直分库和垂直分表的核心思想是按业务模块或功能拆分数据库，即：垂直分库（VerticalDatabasePartitio
STM32F103C8T6 USB寄存器开发详解(3)-中断云汐独渺 STM32 USB开发单片机嵌入式硬件
对于USB模块,因为其通讯流程比较复杂,因此配置硬件中断就显得很重要了.STM32F103的中断寄存器位于另一个手册中,也就是下方蓝色标题的链接地址.NVIC寄存器用于启用中断,中断向量表中有两个USB相关中断,从机设备仅需要RX中断,也就是表项20.因此只需要配置NVIC_ISER0寄存器的位20即可开启USB模块中断,至于中断优先级分组等情况,可以直接使用默认配置,若有需要可以手动配置其余NV
小爱音箱控制手机和电视听歌的尝试 wjcroom 智能音箱 python 智能手机
最近买了小爱音箱pro，老婆让我扔了，吃灰多年的旧音箱。当然舍不得，比小爱还贵，刚好还有一台红米手机，能插音箱，为了让音箱更加灵活，买了个2元的蓝牙接收模块Type-c供电3.5接口。这就是本次尝试起因和硬件组成。前文介绍了小爱音箱结合xiaomusic实现尘封的NAS音乐不自由那个文章实现小爱同学声控xiaomusic这就是本次尝试的软件基础。本文最终目的是，小爱声控xiaomusic通过红米（
十四、python使用MySQL数据库 weixin_45460686 python笔记 mysql 数据库 python
（一）pymsql模块pymsql是Python3中操作MySQL的模块，其使用方法和py2的MySQLdb几乎相同。1、模块安装pipinstallpymysql2、使用模块步骤：导入pymysql库。调用pymysql.connect()方法建立与数据库的连接。在connect()方法中，传入数据库的主机名、用户名、密码和数据库名称等连接参数。importpymysql#创建数据库连接conn
【layui】layui表格过滤 weixin_43250628 layui 前端 layui javascript 前端
1.除了引用必要的layui的js和css，还需引入tableFilter.js。2.然后就是代码展示部分；layui.config({base:'../../layui/plugins2/',//扩展路径version:'v1.0.0'}).extend({tableFilter:'tableFilter'//模块别名});functionsetGridData(data){layui.use(
Rook-ceph(1.92最新版) 野猪佩挤 k8s 存储 ceph
安装前准备#确认安装lvm2yuminstalllvm2-y#启用rbd模块modproberbdcat>/etc/rc.sysinit/etc/sysconfig/modules/rbd.modulesfilesystem.yaml<
自动化运维工具ansible theo.wu 运维自动化
Ansible批处理工具Ansible批处理工具功能图Ansible项目架构图一、Ansible介绍1、Ansible简介简介ansible是一种自动化运维工具，基于paramiko模块开发，实现了批量系统配置、批量程序部署、批量运行命令功能。ansible是基于模块工作的，本身没有批量部署的能力。真正具有批量部署的是ansible所运行的模块，ansible只提供一种框架。ansible这个框架
【开源免费】基于Vue和SpringBoot的医院后台管理系统（附论文）杨荧 vue.js spring boot 前端开源 spring cloud javascript
本文项目编号T170，文末自助获取源码\color{red}{T170，文末自助获取源码}T170，文末自助获取源码目录一、系统介绍二、数据库设计三、配套教程3.1启动教程3.2讲解视频3.3二次开发教程四、功能截图五、文案资料5.1选题背景5.2国内外研究现状六、核心代码6.1查询数据6.2新增数据6.3删除数据一、系统介绍在管理员功能模块确定下来的基础上，对管理员各个功能进行设计，确定管理员功
【鸿蒙系统APP开发实践案例】--第1课时：新闻阅读类行业实践青少年编程作品集 HarmonyOS Next应用开发案例 harmonyos 华为 json javascript html5 前端 html
简介本设计为新闻日报类应用APP的鸿蒙化架构设计实践，应用设备形态只有手机端，提供新闻日报类应用常见的新闻资讯展示，新闻视频播放，用户评论互动等应用功能。Stage开发模型+声明式UI开发方式。按照应用设备形态，规划一个手机设备Entry类型HAP包。本实践性能优先，应用程序包大小可控，且无单独加载模块场景，业务模块包类型采用HAR包。应用布局说明实践应用框架代码运行图，开发者可以基于框架代码替换
C语言基础18：函数的概述、分类、定义以及形参和实参 k要开心 c语言开发语言
函数函数的概述函数：实现一定功能的，独立的代码模块。我们的函数一定是先定义，后使用。使用函数的优势：①我们可以通过函数提供功能给别人使用。当然我们也可以使用别人提供的函数，减少代码量。②借助函数可以减少重复性的代码。③实现结构化（模块化）程序设计思想。关于结构化设计思想：将大型的任务功能划分为相互独立的小型的任务模块来设计。函数是C语言程序的基本组成单元：C语言程序是由一个（必然是main函数）或
[从零开始的 Vue3 系列]：第四章——Vue3 中常用组件通信全解析花信少年plus 从零开始的vue3 系列 vue.js javascript 前端
前言本系列将从零开始，系统性地介绍Vue3的常用API，逐步深入每个核心概念与功能模块。通过详尽的讲解与实战演示，帮助大家掌握Vue3的基础与进阶知识，最终具备独立搭建完整Vue3项目的能力。vue3中的组件通信Vue3提供了多种方式来进行组件之间的通信。根据场景的不同，开发者可以选择最合适的方式进行数据的传递与事件的处理。1.通过Props传递数据（父->子）父组件：importChildCom
python获取金融数据_使用Python获取金融数据 weixin_39545102 python获取金融数据
俗话说，“巧媳妇难为无米之炊”。做金融数据研究，首先要有可用的数据源。Python下，pandas_datareader模块可以用于获取研究数据。例子如下：>>>frompandas_datareader.dataimportDataReader>>>>>>datas=DataReader(name='AAPL',data_source='yahoo',start='2018-01-01')>>>
国密算法SM1 SM2 SM3 SM4 SM9 象话算法国密算法 SM2 SM3 SM4
一、概述SM1-无具体实现SM1作为一种对称加密算法，由于其算法细节并未公开，且主要在中国国内使用，因此在国际通用的加密库（如BouncyCastle）中并不直接支持SM1算法。SM1算法的具体实现涉及国家密码管理局的规范，通常需要使用国家指定的安全模块（如SSF33、SC1/SC2卡）或通过国家认证的加密硬件/软件产品来实现。不过，如果你有合法授权并且在合规的环境下需要使用SM1算法，可能需要依
如何使用qt开发一个xml发票浏览器，实现按发票样式显示 zhencon-com qt xml c++python 经验分享学习金融
使用Qt开发一个按发票样式显示的XML发票浏览器，如下图所示样式：一、需求：1、按税务发票样式显示。2、拖入即可显示。3、正确解析xml文件。二、实现可以按照以下步骤进行：1.创建Qt项目打开QtCreator，创建一个新的QtWidgetsApplication项目。设置项目名称和路径，选择合适的Qt版本。2.导入必要的模块在项目的.pro文件中，确保导入了xml模块，以便使用Qt的XML解析功
springboot里classpath与classpath*的区别是什么? javascript
在SpringBoot中，classpath和classpath*是用于资源加载的两个关键概念，它们的主要区别在于资源查找的范围和方式。以下是它们的详细区别：1.classpath定义：classpath表示从当前类路径（Classpath）中查找资源。查找范围：它只会从当前类加载器的类路径中查找资源，不会递归查找子模块或依赖中的资源。使用场景：适用于明确知道资源位于当前模块或应用的类路径中的情况
pytest--测试的参数化可爱又迷人的反派角色 pytest
导言实际测试过程中，测试用例可能需要支持多种场景，可以把场景强相关的部分抽象为参数，通过对参数赋值来驱动用例的执行。参数化对的行为表现在不同的层级上：fixture的参数化测试用例的参数化：使用@pytest.mark.parametrize可以在测试用例、测试类甚至是测试模块中标记多个参数或者fixture的组合也可以通过pytest_generate_tests这个钩子方法自定义参数化的方案。
Android 第四十二章 Fragment 漂泊的蚂蚁 Android android
一、简介Fragment(碎片)主要用于对ActivityUI模块化，依托Activity存在，当Activity销毁时，Fragment随之销毁二、生命周期onAttach()Fragment和Activity绑定onCreate()初始化onCreateView()创建视图onActivityCreated()Activity已初始化完成onStart()界面可见onResume()获得焦点o
青稞RISC-V通用系列 ws137517175 risc-v
青稞RISC-V通用系列的特点：高性能与低功耗：青稞系列处理器针对不同应用场景进行了优化，能够在提供高性能的同时保持低功耗，适合电池供电的设备和物联网终端。模块化设计：青稞系列采用模块化设计，用户可以根据需求选择不同的功能模块，如浮点运算单元（FPU）、数字信号处理（DSP）扩展、向量处理单元等。可扩展性：基于RISC-V的开放架构，青稞系列处理器支持用户自定义指令集扩展，能够满足特定应用场景的需
QT移植，交叉编译至泰山派RK3566开发板，.pro文件解析大象荒野嵌入式QT开发笔记 qt 开发语言
配置文件丢这里，后面有空整理下。说下大概的注意点，安装路径(qtcreator远程部署的路径)、动态库路径和头文件路径、运行时动态库路径和头文件路径($$pwd在编译后会被换成绝对路径，因此需要指定运行时动态库路径)#指定使用的Qt模块QT+=coreguiwidgets#配置选项CONFIG+=c++11#警告和弃用APIDEFINES+=QT_DEPRECATED_WARNINGS#如果需要禁
PHP网站常见的架构有哪些？使用场景是什么？底层原理是什么？快点好好学习吧 PHP php 架构开发语言
PHP网站的架构设计对于确保网站的性能、可扩展性和可维护性至关重要。根据不同的业务需求和规模，可以选择不同的架构模式。1.单体架构（MonolithicArchitecture）1.1定义单体架构：将整个应用程序作为一个单一的单元进行开发、部署和运行。所有的功能模块都在同一个代码库中，共享同一个数据库。1.2使用场景小型项目：适合功能简单、用户量较少的小型网站。快速原型开发：适合快速开发和测试原型
在 Python 中生成随机数字有多种方法，具体取决于需求场景（如整数/浮点数、安全要求、分布类型等）梦幻南瓜 python python 安全开发语言
在Python中生成随机数字有多种方法，具体取决于需求场景（如整数/浮点数、安全要求、分布类型等）。以下是全面的实现方案及代码示例：一、基础场景：标准库random模块适用于大多数非安全敏感的随机数生成需求。生成随机整数importrandom#生成[a,b]范围内的随机整数random_int=random.randint(1,100)print(random_int)#示例输出：57#生成[0
python文件操作相关（csv） Colin♛ python python 开发语言学习笔记
python文件操作相关（csv）1.csv模块读取CSV文件读取CSV文件并转换为字典写入CSV文件写入CSV文件并使用字典2.pandas库读取CSV文件读取特定列写入CSV文件写入CSV文件并指定分隔符3.其他高级功能处理大文件读取数据数据清洗参考资料在Python中，操作CSV文件通常使用csv模块和pandas库，这两个工具提供了丰富的功能，可以方便地读取、写入和处理CSV文件1.csv
Go语言标准库之regexp aaronthon Golang
regexp是go支持正则表达式的相关内置模块。一、引入import"regexp"二、使用2.1regexp.MatchString使用正则表达式匹配字符串match,_:=regexp.MatchString("H(.*)!","Helloworld!")fmt.Println(match)//true2.2regexp.Match使用正则表达式匹配字符串match,_:=regexp.Mat
python高效使用16---sort_values排序需要万分警惕的问题云金杞 python高效使用方法 python 开发语言
sort_values函数需要万分警惕的问题背景今天在优化empyrical模块的时候，发现在win11上测试通过的测试用例，在ubuntu18.04上测试失败了，通过定位发现是sort_values惹得祸。在使用pandas.sort_values(by=“value1”)的时候，value1如果有相同值，在默认排序算法下，排序后的结果在windows上和ubuntu上结果可能不一样。例子git
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$