maligebilaowang

Pandas库的基础入门（二）

!承接上文：Pandas库的基础入门（一）

前文链接

Pandas库的基础入门（一）

四、Pandas入门常用

基于Pandas的缺失值处理方法

重建索引，重构数据帧

#读入大车的单车源强数据
df = pd.read_excel('C:/Users/13109/desktop/单车源强数据2.xlsx','大车',na_vlues=['NA'])
# #重建横坐标索引
df.index = (range(1,len(df)+1))
# # 根据索引重新构建数据
df1 = df.reindex(index=(range(400,405)),columns=list(df.columns)+['声压级(mean)'])
df1['声压级(mean)'] = (df1['Sound_pressure_level_1 ']+df['Sound_pressure_level_1 '])/2
df1 = df1.iloc[:,[0,5,6,7]]#选取后续试验数据列
print(df1)

#打印输出结果
(noise_data) D:\CloudMusic\virtualenv\noise_data\traffic_noise>python test.py
      id  Radar_speed   Number_of_axes  声压级(mean)
400  400            48             3.0       88.3
401  401            79             NaN       90.7
402  402            71             NaN       89.4
403  403            45             NaN       87.7
404  404            53             NaN       87.3

删除，填充缺失值

# 表示删除任何带有缺失值的行
print(df1.dropna(how='any'))
# 表示删除全为空值的行
print(df1.dropna(how='all'))

# #填充缺失值部分
print(df1.fillna(value=5))

#表示删除列，任何带有缺失值的行
print(df1.dropna(axis=1,how='any'))

# 传入thresh=n保留至少有n个非NaN数据的行
print(df1.dropna(thresh=4))

#打印输出结果如下
      id  Radar_speed   Number_of_axes  声压级(mean)
400  400            48             3.0       88.3
      id  Radar_speed   Number_of_axes  声压级(mean)
400  400            48             3.0       88.3
401  401            79             NaN       90.7
402  402            71             NaN       89.4
403  403            45             NaN       87.7
404  404            53             NaN       87.3
      id  Radar_speed   Number_of_axes  声压级(mean)
400  400            48             3.0       88.3
401  401            79             5.0       90.7
402  402            71             5.0       89.4
403  403            45             5.0       87.7
404  404            53             5.0       87.3
      id  Radar_speed   声压级(mean)
400  400            48       88.3
401  401            79       90.7
402  402            71       89.4
403  403            45       87.7
404  404            53       87.3
      id  Radar_speed   Number_of_axes  声压级(mean)
400  400            48             3.0       88.3

常用统计函数（调用方法会自动排除缺失值）

#统计数据帧列均值
print(df1.mean())

#统计数据帧行均值
print(df1.mean(1))
# 随机生成0-7的10个数,并且统计每个数字的出现频率
s = pd.Series(np.random.randint(0,7,size=10))
print(s)
print(s.value_counts())

#打印输出
id                402.00
Radar_speed        59.20
Number_of_axes      3.00
声压级(mean)          88.68
dtype: float64
400    134.825000
401    190.233333
402    187.466667
403    178.566667
404    181.433333
dtype: float64

0    5
1    0
2    4
3    0
4    6
5    2
6    1
7    5
8    4
9    2
dtype: int32
5    2
4    2
2    2
0    2
6    1
1    1
dtype: int64

合并，追加相关，concat，merge，append

#使用 concat()连接Pandas对象：

df2 = pd.DataFrame(np.random.randn(10,4))

pieces = [df2[:3],df2[3:7]]

print(pd.concat(pieces))

# 打印输出
          0         1         2         3
0  0.479241  0.893495 -0.693154 -0.852424
1  0.026010 -0.545286 -0.770675 -0.878548
2 -0.202394  0.578639  0.881338  0.395578
3  0.325128  0.548995 -0.101962 -0.461443
4 -0.802353 -0.299208 -0.348705  0.679093
5 -0.249706 -0.886568  1.233265  0.436658
6  1.453547  1.510276 -1.610860 -0.551154

#SQL风格的合并对象

left = pd.DataFrame({
     'key': ['foo', 'bar'], 'lval': [1, 2]})
right = pd.DataFrame({
     'key': ['foo', 'bar'], 'rval': [4, 5]})
print(pd.merge(left, right))

#打印输出
   key  lval  rval
0  foo     1     4
1  bar     2     5

#追加append，在原有数据帧上面追加一行
df1 = pd.DataFrame(np.random.randn(4,4),columns=['a','b','c','d'])
# print(df1)
s = df1.iloc[3,:]
print(s)
print(df1.append(s,ignore_index=True))

#打印输出
a   -0.921758
b    1.279065
c    0.586039
d   -1.163983
Name: 3, dtype: float64
          a         b         c         d
0 -2.128083  1.791574 -0.689094 -1.149643
1 -1.355857  0.953556  0.617027 -1.586289
2  0.047451 -1.135767 -2.232663 -0.094852
3 -0.921758  1.279065  0.586039 -1.163983
4 -0.921758  1.279065  0.586039 -1.163983

分组(Grouping),数据分组后的处理

'''
我们所说的“group by“是指涉及下列一项或多项步骤的程序：

Splitting：根据一些标准将数据分解成组
Applying：将函数独立地应用于每个组
Combining：将结果组合成数据结构
'''
df1 = pd.DataFrame({
      'A' : ['foo', 'bar', 'foo', 'bar',
                         'foo', 'bar', 'foo', 'foo'],
                    'B' : ['one', 'one', 'two', 'three',
                           'two', 'two', 'one', 'three'],
                    'C' : np.random.randn(8),
                    'D' : np.random.randn(8)})
# 按照A列标签分组，然后将mean（）函数应用于C,D数据列分组结果：
print(df1.groupby('A').mean())
#多列分组形成层次索引
print(df1.groupby(['A','B']).sum())

#打印输出
            C         D
A
bar -0.259116  1.004532
foo  0.198292  0.002419
                  C         D
A   B
bar one    0.870513  1.548039
    three -0.577857  0.560252
    two   -1.070003  0.905304
foo one    0.056086  0.216536
    three  0.967545  0.636640
    two   -0.032170 -0.841082

数据透视表，时间序列数据帧生成

#根据数据帧生成相应的数据透视表
df1 = pd.DataFrame({
     'A' : ['one', 'one', 'two', 'three'] * 3,
                   'B' : ['A', 'B', 'C'] * 4,
                   'C' : ['foo', 'foo', 'foo', 'bar', 'bar', 'bar'] * 2,
                   'D' : np.random.randn(12),
                   'E' : np.random.randn(12)})

print(df1)
s = pd.pivot_table(df1,values='D',index=['A','B'],columns='C')
print(s)

分类（Categoricals）

改换数据类型（category数据类型）

df = df.iloc[100:200,4:7]
# 将轴数列转换为category数据类型：
df['cat'] = df['Number_of_axes'].astype('category')
print(df.cat)

#打印输出
(noise_data) D:\CloudMusic\virtualenv\noise_data\traffic_noise>python test.py
100    3.0
101    4.0
102    4.0
103    4.0
104    3.0
      ...
195    2.0
196    6.0
197    4.0
198    3.0
199    3.0
Name: cat, Length: 100, dtype: category
Categories (5, float64): [2.0, 3.0, 4.0, 5.0, 6.0]

类别重命名（Series.cat.categories属性分配新值或使用以下 rename_categories()方法）

#选取样本数据，主要是用轴数作为分类标签
df = df.iloc[100:200,4:7]
df=df[df.Number_of_axes.notnull()]#布尔索引，找出所有轴数不为空的行
# df = df.dropna(how='any')#布尔索引，删除任何为空值的行
# 将轴数列转换为category数据类型：
df['cat'] = df['Number_of_axes'].astype('category')


#类别重命名
df['cat'].cat.categories = ['轴1','轴2','轴3','轴4','轴5']
df['cat'].cat.categories = ['%s'%g for g in df['cat'].cat.categories]#与上述写法一样
# df['cat'] = df['cat'].cat.rename_categories([1,2,3,4,5]) #另外一种重命名方法

#追加新类别

df['cat']=df['cat'].cat.add_categories(['新增轴'])
print(df['cat'])

#打印输出
100    轴2
101    轴3
102    轴3
103    轴3
104    轴2
       ..
195    轴1
196    轴5
197    轴3
198    轴2
199    轴2
Name: cat, Length: 99, dtype: category
Categories (5, object): [轴1, 轴2, 轴3, 轴4, 轴5]
     Rear_speed  Radar_speed   Number_of_axes cat
100        81.2            84             3.0  轴2
101        35.3            54             4.0  轴3
102        57.8            61             4.0  轴3
103        86.7            90             4.0  轴3
104        72.3            73             3.0  轴2
..          ...           ...             ...  ..
195        40.4            43             2.0  轴1
196        68.7            71             6.0  轴5
197        44.7            47             4.0  轴3
198        62.2            65             3.0  轴2
199        52.4            55             3.0  轴2

[99 rows x 4 columns]

追加，删除，设定一个新的类别

#追加新类别

df['cat']=df['cat'].cat.add_categories(['新增轴'])
print(df['cat'])

#删除一个类别

df['cat']=df['cat'].cat.remove_categories(['新增轴'])#删除固定类别
df['cat']=df['cat'].cat.remove_unused_categories()#删除未使用的类别
print(df['cat'])

#设定一个类别，categories重新排序并同时添加缺少的category
df['cat'] = df['cat'].cat.set_categories(['轴1','轴2','轴3','轴4','轴5'])
print(df.sort_values(by='cat',ascending=False))#降序排序
print(df.groupby('cat').size())#按分好类的列分组(groupby),统计出想用类别的样本数据量

# 打印输出
(noise_data) D:\CloudMusic\virtualenv\noise_data\traffic_noise>python test.py
100    轴2
101    轴3
102    轴3
103    轴3
104    轴2
       ..
195    轴1
196    轴5
197    轴3
198    轴2
199    轴2
Name: cat, Length: 99, dtype: category
Categories (6, object): [轴1, 轴2, 轴3, 轴4, 轴5, 新增轴]
100    轴2
101    轴3
102    轴3
103    轴3
104    轴2
       ..
195    轴1
196    轴5
197    轴3
198    轴2
199    轴2
Name: cat, Length: 99, dtype: category
Categories (5, object): [轴1, 轴2, 轴3, 轴4, 轴5]
     Rear_speed  Radar_speed   Number_of_axes cat
133        57.4            60             6.0  轴5
155        55.6            57             6.0  轴5
176        76.1            79             6.0  轴5
196        68.7            71             6.0  轴5
109        92.0            97             6.0  轴5
..          ...           ...             ...  ..
139        58.3            61             2.0  轴1
151        45.7            64             2.0  轴1
128        80.1            93             2.0  轴1
137        50.8            56             2.0  轴1
157        66.5            69             2.0  轴1

[99 rows x 4 columns]
cat
轴1    16
轴2    27
轴3    38
轴4     7
轴5    11
dtype: int64

可视化部分需要重点研究，后续会写matplotlib相关的文章

绘图（pandas与matplotlib 联合使用）

简单的折线图

import xlrd
import numpy as np
import pandas as pd
# print(pd.__version__)
import matplotlib.pyplot as plt
# 这两句代码用来正确显示图中的中文字体，后续都要加上
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号

#读入大车的单车源强数据
df = pd.read_excel('C:/Users/13109/desktop/单车源强数据2.xlsx','大车',na_vlues=['NA'])
'''
绘图相关内容

'''
#索引出实验样本
df = df.iloc[:,2:6]
df = df.dropna(how='any')#删除任何带有空值的行
x = df['Rear_speed']
y = df['Soundlevel_2']
'''
绘制折线图,在DataFrame上，plot()可以方便地使用标签绘制所有列
'''
x.plot(color='#e29c45')
plt.title('折线图')
plt.xlabel('序号')
plt.ylabel('雷达测速')

df1 = df.iloc[:,0:2]
df1.plot()
# df.plot(color='#e29c45')
plt.title('折线图')
plt.xlabel('序号')
plt.ylabel('声压值')
plt.show()
plt.close('all')

简单的散点图(使用以下x和y关键字绘制一列与另一列的关系)

df['声压级(mean)'] = (df['Soundlevel ']+df['Soundlevel_2'])/2
df['大车平均车速(mean)'] = (df['Rear_speed']+df['Radar_speed '])/2
df.plot.scatter(y='声压级(mean)',x='大车平均车速(mean)',color='#44cef6')
# print(df.columns),print(df)
# plt.legend()
plt.title('散点图')
plt.show()
plt.close('all')

各种简单的条形图

#选取一行数据，列标签作为x轴标签的单一条形图
df.iloc[0].plot(kind='bar',color='#e29c45')
plt.ylabel('数值')
plt.show()

#选取多行数据，调用DataFrame的plot.bar()方法会产生一个多条形图：
df.iloc[0:5,0:4].plot(kind='bar')
df.iloc[0:5,0:4].plot.bar()#两种方法都可以实现绘制条形图
plt.ylabel('数值')
plt.xlabel('样本记录')
plt.show()

#选取多行数据，plot.bar()生成堆积条形图
# df.iloc[0:5,0:4].plot(kind='bar')
df.iloc[0:5,0:4].plot.bar(stacked=True)

简单的直方图

#选取声压级1对应的数据作为样本（效果好）
df = df.iloc[:,2]
df = df.dropna(how='any')#删除任何带有空值的行
print(df)
df.plot.hist(alpha=0.5,color='#725e82')
plt.ylabel('频率')
plt.xlabel('样本值')
plt.legend(loc='best')

箱线图绘制

#箱线图，是一种用作显示一组数据分散情况资料的统计图，箱形图最大的优点就是不受异常值的影响，能够准确稳定地描绘出数据的离散分布情况，同时也利于数据的清洗。
df = df.iloc[:,2:6]
df = df.dropna(how='any')#删除任何带有空值的行
print(df)
df.plot.box(sym='r+')

热力图绘制

#关键字c可以作为列的名称给出，以便为每个点提供颜色
df.plot.scatter(x='Rear_speed', y='Soundlevel ',c ='Rear_speed', s=50)

气泡热力图绘制

'''
气泡图主要是用来直观的感受数据点的大小，还有比较美观
'''
df = df.iloc[100:120,2:7]
df = df.dropna(how='any')#删除任何带有空值的行
z=df['Soundlevel ']#调整点大小的数据
cm = plt.cm.get_cmap('RdYlBu')#获取各个点的颜色数据
# print(cm)
df.plot.scatter(x='Rear_speed', y='Soundlevel ',s=(z - np.min(z) + 0.1)*50,c = z, cmap = cm, linewidth = 0.5, alpha = 0.5)

六边形分级图

'''
六边形分级图可以主观的感受数据点分布状况，数据太密集而无法单独绘制每个点，则Hexbin图可能是散点图的有用替代方法，可以给出散点分布的直方图效果，也就是直观的观察出数据点的集中位置
'''
df.plot.scatter(x='Rear_speed', y='Soundlevel ')#原始的散点图绘制
df.plot.hexbin(x='Rear_speed', y='Soundlevel ', gridsize=25)#六边形分级图绘制
plt.show()

两张图片的对比如下:

!基于pandas的matplotlib的使用告一段落

五、总结

1、要重点掌握文件的导入导出以及数据帧的索引切片等内容
2、pandas一般用于数据清洗以及机器学习之前的数据预处理工作
3、基于pandas的绘图要重点研究，后续会写matplotlib的专题

参考文章内容链接

Pandas中文网、Pandas官方中文文档
Pandas官方英文文档
Panda 0.25.0文档
Pandas可视化-气泡图

高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
如何解决 NPM proxy，当我们在终端nodejs应用程序时出现代理相关报错
Thisisaproblemrelatedtonetworkconnectivity.npmERR!networkInmostcasesyouarebehindaproxyorhavebadnetworksettings.在使用npminstall下载包的时候总是报以下错误:在控制台或VisualStudioCode终端中运行以下命令：npmconfigrmproxynpmconfigrmhttp
C++ 设计模式：抽象工厂（Abstract Factory）冀晓武 C++设计模式 c++设计模式抽象工厂模式
链接：C++设计模式链接：C++设计模式-工厂方法链接：C++设计模式-原型模式链接：C++设计模式-建造者模式抽象工厂（AbstractFactory）是一种创建型设计模式，它提供一个接口，用于创建一系列相关或相互依赖的对象，而无需指定它们的具体类。抽象工厂模式通常用于创建一组相关的产品对象，例如不同类型的机器人和它们的配件。1.问题分析在某些情况下，我们需要创建一组相关或相互依赖的对象，但我们
centos7安装 mysql5.7(安装包) heiPony linux mysql mariadb centos mysql
一.卸载centos7自带数据库查看系统自带的Mariadbrpm-qa|grepmariadbmariadb-libs-5.5.44-2.el7.centos.x86_64卸载rpm-e--nodepsmariadb-libs-5.5.44-2.el7.centos.x86_64删除etc目录下的my.cnfrm/etc/my.cnf二.检查mysql是否存在(有就卸载,删除相关文件)rpm-q
kube-scheduler 抢占机制分享放大价值 kubernetes源码分析 kubernetes kube-scheduler 抢占
当pod调度失败后，会在PostFilter扩展点执行抢占流程，下面分析相关的代码实现抢占接口//PodNominatorabstractsoperationstomaintainnominatedPods.typePodNominatorinterface{//将pod加入抢占成功的node中AddNominatedPod(pod*PodInfo,nodeNamestring)//将pod从no
Shader面试题100道之（81-100）还是大剑师兰特 #Shader 综合教程100+大剑师 shader面试题 shader教程
Shader面试题（第81-100题）以下是第81到第100道Shader相关的面试题及答案：81.Unity中如何实现屏幕空间的热扭曲效果（HeatDistortion）？热扭曲效果可以通过GrabPass抓取当前屏幕图像，然后在片段着色器中使用噪声或动态UV偏移模拟空气扰动，再结合一个透明通道控制扭曲强度来实现。82.Shader中如何实现物体轮廓高亮（OutlineHighlight）？轮廓
前端 NPM 包的依赖可视化分析工具推荐前端视界前端艺匠馆前端 npm arcgis ai
前端NPM包的依赖可视化分析工具推荐关键词：NPM、依赖管理、可视化分析、前端工程、包管理、依赖冲突、性能优化摘要：本文将深入探讨前端开发中NPM包依赖可视化分析的重要性，介绍5款主流工具的使用方法和特点，并通过实际案例展示如何利用这些工具优化项目依赖结构、解决版本冲突问题以及提升构建性能。文章将帮助开发者更好地理解和掌控项目依赖关系，提高开发效率和项目可维护性。背景介绍目的和范围本文旨在为前端开
计算机网络技术 CZZDg 计算机网络
目录一.网络概述1.网络的概念2.网络发展是3.网络的四要素4.网络功能5.网络类型6.网络协议与标准7.网络中常见的概念8.网络拓补结构二.网络模型1.分层思想2.OSI七层模型3.TCP/IP五层模型4.数据的封装与解封装过程三.IP地址1.进制转换2.IP地址定义3.IP地址组成成分4.IP地址分类5.地址划分6、相关概念一.网络概述1.网络的概念两个主机通过传输介质和通信协议实现通信和资源
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
react-native android 环境搭建
环境：macjava版本：Java11最重要：一定要一定要一定要react涉及到很多的依赖下载，gradle和react相关的，第一次安装环境时有外网环境会快速很多。安装nodejs安装react-nativenpminstallreact-native-clinpminstallreact-native创建一个新项目react-nativeinitfirstReact替换gradle下载源rep
[特殊字符] 实时数据洪流突围战：Flink+Paimon实现毫秒级分析的架构革命（附压测报告）——日均百亿级数据处理成本降低60%的工业级方案 Lucas55555555 flink 大数据
引言：流批一体的时代拐点据阿里云2025白皮书显示，实时数据处理需求年增速达240%，但传统Lambda架构资源消耗占比超运维成本的70%。某电商平台借助Flink+Paimon重构实时数仓后，端到端延迟从分钟级压缩至800ms，计算资源节省5.6万核/月。技术红利窗口期：2025年ApachePaimon1.0正式发布，支持秒级快照与湖仓一体，成为替代Iceberg的新范式一、痛点深挖：实时数仓
matlab卷积矩阵绝对值,MATLAB矩阵分析和计算 weixin_39928736 matlab卷积矩阵绝对值
MATLAB矩阵分析和计算编辑锁定讨论上传视频本词条缺少概述图，补充相关内容使词条更完整，还能快速升级，赶紧来编辑吧！《MATLAB矩阵分析和计算》是清华大学出版社出版的一本图书。[1]书名MATLAB矩阵分析和计算作者杜树春出版社清华大学出版社出版时间2019年6月1日定价59元ISBN9787302524816印次1-1印刷日期2019.04.23MATLAB矩阵分析和计算图书内容编辑本书侧重
LVM逻辑卷扩容
目录1.逻辑卷的简介2.逻辑卷的概念3.相关命令4.建立逻辑卷1.逻辑卷的简介1.LVM是逻辑卷管理(LogicalVolumeManager)的简称,它是Linux环境下对磁盘分区进行管理的一种机制,LVM是建立在硬盘和分区之上的一个逻辑层,来提高磁盘分区管理的灵活性。2.LVM最大的特点就是可以对磁盘进行动态管理。使用了LVM管理分区,动态的调整分区的大小,标准分区是做不到的。2.逻辑卷的概念
NGS测序基础梳理01-文库构建（Library Preparation） qq_21478261 #生物信息生物学
本文介绍Illumina测序平台文库构建（LibraryPreparation）步骤，文库结构。写作时间：2020.05。推荐阅读：10W字《Python可视化教程1.0》来了！一份由公众号「pythonic生物人」精心制作的PythonMatplotlib可视化系统教程，105页PDFhttps://mp.weixin.qq.com/s/QaSmucuVsS_DR-klfpE3-Q10W字《Rg
JavaScript 基础09：Web APIs——日期对象、DOM节点梦想当全栈 JavaScript javascript 前端开发语言
JavaScript基础09：WebAPIs——日期对象、DOM节点进一步学习DOM相关知识，实现可交互的网页特效能够插入、删除和替换元素节点。能够依据元素节点关系查找节点。一、日期对象掌握Date日期对象的使用，动态获取当前计算机的时间。ECMAScript中内置了获取系统时间的对象Date，使用Date时与之前学习的内置对象console和Math不同，它需要借助new关键字才能使用。1.实例
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（Advanced RAG[1]）其他Query优化相关策略？ 985小水博一枚呀 AI大模型学习路线人工智能学习 langchain
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？文章目录【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？一
GoView 强势入驻 GitCode：拖拽低代码，打造高颜值数据大屏 GitCode 代码君 gitcode 低代码开源
信息可视化时代，数字大屏日益成为展示核心KPI、运营状态、监控预警的主流形式。然而，用传统方式开发一个定制化数字大屏需要解决多少问题？1.繁复的数据源集成，各种不同的协议和格式……2.让人晕头转向的可视化逻辑，调动艰难的样式、布局、动画，和往往难以统一的风格3.牵一发而动全身的代码结构，就想换个主题色结果开启的全局CSS大冒险……现在，一个开源项目即可搞定上述问题——拖拽式低代码数字可视化平台Go
.NET 程序的强名称签名与安全防护技术干货深盾科技安全
在.NET开发领域，保障程序的安全性和完整性至关重要。强名称签名和有效的安全防护措施是实现这一目标的关键手段。下面将详细介绍.NET程序的强名称签名以及相关的安全防护方法。一、什么是强名称签名强名称签名是.NET框架提供的一种安全机制，其主要作用是唯一标识程序集、验证程序集的完整性以及解决版本冲突问题。它本质上是通过加密技术为程序集创建数字签名，确保程序集在分发和运行过程中的安全性。二、签名文件要
提升企业级数据处理效率！TDengine 四个集群优化点详解 TDengine （老段） TDengine 运维大数据数据库物联网时序数据库服务器运维 tdengine
为了帮助企业更好地进行大数据处理，我们在此前TDengine3.x系列版本中进行了几项与集群相关的优化和新功能开发，以提升集群的稳定性和在异常情况下的恢复能力。这些优化包括clusterID隔离、leaderrebalance、raftlearner和restorednode。本文将对这几项重要优化进行详细阐述，以解答企业在此领域的疑问，并帮助大家更好地应对相关挑战。clusterID隔离问题fi
python相关内容二湫默 python 开发语言
1.技术面试题（1）详细描述单调栈的工作原理和应用场景答：工作原理：维护一个栈结构，栈中元素保持单调递增或单调递减的顺序。遍历数据时，新元素入栈前，弹出栈顶所有不满足单调关系的元素，再将新元素入栈，确保栈的单调性。应用场景：解决下一个元素更大的问题，如数组中后面一个元素比前面一个入栈的元素大，则需要上一个元素出栈，然后大的那个元素入栈。（2）详细描述单调队列的工作原理和应用场景答：工作原理：维护队
swagger【个人笔记】撰卢笔记 java
文章目录swagger导入mave坐标在配置类(WebMvcConfiguration)中加入knife4j相关配置设置静态资源映射，主要是让拦截器放行swagger常用注解@Api(tags="\[描述这个类的作用]")@ApiModel(description="\[描述这个类的作用]")@ApiModelProPerty("描述这个类的作用")@ApiOperation("\[描述方法的作用
redis中什么是bigkey？会有什么影响？ Vic2334 redis
什么是bigkey？会有什么影响？bigkey是指key对应的value所占的内存空间比较大，例如一个字符串类型的value可以最大存到512MB，一个列表类型的value最多可以存储23-1个元素。如果按照数据结构来细分的话，一般分为字符串类型bigkey和非字符串类型bigkey。字符串类型：体现在单个value值很大，一般认为超过10KB就是bigkey，但这个值和具体的OPS相关。非字符串
android去除gps漂移代码,GPS漂移过滤算法扇贝君
GPS漂移过滤算法基本思想：逐点过滤，再经过基础过滤后，进行判断运动状态，静止状态和运动中。如果静止，则使用电子围栏；如果运动，则先过滤大速度，再过滤加速度，然后过滤距离(包括超大距离，和速度相关距离)。对于要过滤的点，采用之前最近的可靠点，进行替换，同时，无效次数+1，如果后面是有效点，则无效次数-1，如果无效次数归0，认为这个点才是真正可靠点(无效次数为正时，都为要被替换的点)。如果遇到不定点
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
ETL可视化工具 DataX -- 简介( 一) dazhong2012 软件工具数据仓库 datax ETL
引言DataX系列文章：ETL可视化工具DataX–安装部署(二)ETL可视化工具DataX–DataX-Web安装(三)1.1DataX1.1.1DataX概览DataX是阿里云DataWorks数据集成的开源版本，在阿里巴巴集团内被广泛使用的离线数据同步工具/平台。DataX实现了包括MySQL、Oracle、OceanBase、SqlServer、Postgre、HDFS、Hive、ADS、
Ubuntu 服务器虚拟主机,ubuntu云服务器虚拟机 Gamer42 Ubuntu 服务器虚拟主机
ubuntu云服务器虚拟机内容精选换一换通过云服务器或者外部镜像文件创建私有镜像时，如果云服务器或镜像文件所在虚拟机的网络配置是静态IP地址时，您需要修改网卡属性为DHCP，以使私有镜像发放的新云服务器可以动态获取IP地址。本节以WindowsServer2008R2操作系统为例。其他操作系统配置方法略有区别，请参考对应操作系统的相关资料进行操作，文档中不对此进行详细说明后端虚拟机绑定EIP。登录
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
桌面上有多个球在同时运动，怎么实现球之间不交叉，即碰撞？换个号韩国红果果 html 小球碰撞
稍微想了一下，然后解决了很多bug，最后终于把它实现了。其实原理很简单。在每改变一个小球的x y坐标后，遍历整个在dom树中的其他小球，看一下它们与当前小球的距离是否小于球半径的两倍？若小于说明下一次绘制该小球（设为a）前要把他的方向变为原来相反方向（与a要碰撞的小球设为b），即假如当前小球的距离小于球半径的两倍的话，马上改变当前小球方向。那么下一次绘制也是先绘制b，再绘制a，由于a的方向已经改变
《高性能HTML5》读后整理的Web性能优化内容白糖_ html5
读后感先说说《高性能HTML5》这本书的读后感吧，个人觉得这本书前两章跟书的标题完全搭不上关系，或者说只能算是讲解了“高性能”这三个字，HTML5完全不见踪影。个人觉得作者应该首先把HTML5的大菜拿出来讲一讲，再去分析性能优化的内容，这样才会有吸引力。因为只是在线试读，没有机会看后面的内容，所以不胡乱评价了。
[JShop]Spring MVC的RequestContextHolder使用误区 dinguangx jeeshop 商城系统 jshop 电商系统
在spring mvc中，为了随时都能取到当前请求的request对象，可以通过RequestContextHolder的静态方法getRequestAttributes()获取Request相关的变量，如request, response等。在jshop中，对RequestContextHolder的
算法之时间复杂度周凡杨 java 算法时间复杂度效率
在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。这样用大写O()来体现算法时间复杂度的记法，
Java事务处理 g21121 java
一、什么是Java事务通常的观念认为，事务仅与数据库相关。事务必须服从ISO/IEC所制定的ACID原则。ACID是原子性（atomicity）、一致性（consistency）、隔离性（isolation）和持久性（durability）的缩写。事务的原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状
Linux awk命令详解 510888780 linux
一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到
android permission 布衣凌宇 Permission
<uses-permission android:name="android.permission.ACCESS_CHECKIN_PROPERTIES" ></uses-permission>允许读写访问"properties"表在checkin数据库中，改值可以修改上传 <uses-permission android:na
Oracle和谷歌Java Android官司将推迟 aijuans java oracle
北京时间 10 月 7 日，据国外媒体报道，Oracle 和谷歌之间一场等待已久的官司可能会推迟至 10 月 17 日以后进行，这场官司的内容是 Android 操作系统所谓的 Java 专利权之争。本案法官 William Alsup 称根据专利权专家 Florian Mueller 的预测，谷歌 Oracle 案很可能会被推迟。　　该案中的第二波辩护被安排在 10 月 17 日出庭，从目前看来
linux shell 常用命令 antlove linux shell command
grep [options] [regex] [files] /var/root # grep -n "o" * hello.c:1:/* This C source can be compiled with:
Java解析XML配置数据库连接(DOM技术连接 SAX技术连接) 百合不是茶 sax技术 Java解析xml文档 dom技术 XML配置数据库连接
XML配置数据库文件的连接其实是个很简单的问题,为什么到现在才写出来主要是昨天在网上看了别人写的,然后一直陷入其中,最后发现不能自拔所以今天决定自己完成 ,,,,现将代码与思路贴出来供大家一起学习 XML配置数据库的连接主要技术点的博客; JDBC编程 : JDBC连接数据库 DOM解析XML: DOM解析XML文件 SA
underscore.js 学习（二） bijian1013 JavaScript underscore
Array Functions 所有数组函数对参数对象一样适用。1.first _.first(array, [n]) 别名: head, take 返回array的第一个元素，设置了参数n，就
plSql介绍 bijian1013 oracle 数据库 plsql
/* * PL/SQL 程序设计学习笔记 * 学习plSql介绍.pdf * 时间：2010-10-05 */ --创建DEPT表 create table DEPT ( DEPTNO NUMBER(10), DNAME NVARCHAR2(255), LOC NVARCHAR2(255) ) delete dept; select
【Nginx一】Nginx安装与总体介绍 bit1129 nginx
启动、停止、重新加载Nginx nginx 启动Nginx服务器，不需要任何参数u nginx -s stop 快速(强制)关系Nginx服务器 nginx -s quit 优雅的关闭Nginx服务器 nginx -s reload 重新加载Nginx服务器的配置文件 nginx -s reopen 重新打开Nginx日志文件
spring mvc开发中浏览器兼容的奇怪问题 bitray jquery Ajax springMVC 浏览器上传文件
最近个人开发一个小的OA项目,属于复习阶段.使用的技术主要是spring mvc作为前端框架,mybatis作为数据库持久化技术.前台使用jquery和一些jquery的插件. 在开发到中间阶段时候发现自己好像忽略了一个小问题,整个项目一直在firefox下测试,没有在IE下测试,不确定是否会出现兼容问题.由于jquer
Lua的io库函数列表 ronin47 lua io
1、io表调用方式：使用io表，io.open将返回指定文件的描述，并且所有的操作将围绕这个文件描述　　io表同样提供三种预定义的文件描述io.stdin,io.stdout,io.stderr 　　2、文件句柄直接调用方式,即使用file:XXX()函数方式进行操作,其中file为io.open()返回的文件句柄　　多数I/O函数调用失败时返回nil加错误信息,有些函数成功时返回nil
java-26-左旋转字符串 bylijinnan java
public class LeftRotateString { /** * Q 26 左旋转字符串 * 题目：定义字符串的左旋转操作：把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n)，辅助内存为O(1)。 */ pu
《vi中的替换艺术》-linux命令五分钟系列之十一 cfyme linux命令
vi方面的内容不知道分类到哪里好，就放到《Linux命令五分钟系列》里吧！今天编程，关于栈的一个小例子，其间我需要把”S.”替换为”S->”(替换不包括双引号)。其实这个不难，不过我觉得应该总结一下vi里的替换技术了，以备以后查阅。 1 所有替换方案都要在冒号“:”状态下书写。 2 如果想将abc替换为xyz，那么就这样 :s/abc/xyz/ 不过要特别
[轨道与计算]新的并行计算架构 comsci 并行计算
我在进行流程引擎循环反馈试验的过程中，发现一个有趣的事情。。。如果我们在流程图的每个节点中嵌入一个双向循环代码段，而整个流程中又充满着很多并行路由，每个并行路由中又包含着一些并行节点，那么当整个流程图开始循环反馈过程的时候，这个流程图的运行过程是否变成一个并行计算的架构呢？
重复执行某段代码 dai_lm android
用handler就可以了 private Handler handler = new Handler(); private Runnable runnable = new Runnable() { public void run() { update(); handler.postDelayed(this, 5000); } }; 开始计时 h
Java实现堆栈（list实现） datageek 数据结构——堆栈
public interface IStack<T> { //元素出栈，并返回出栈元素 public T pop(); //元素入栈 public void push(T element); //获取栈顶元素 public T peek(); //判断栈是否为空 public boolean isEmpty
四大备份MySql数据库方法及可能遇到的问题 dcj3sjt126com DB backup
一：通过备份王等软件进行备份前台进不去？用备份王等软件进行备份是大多老站长的选择，这种方法方便快捷，只要上传备份软件到空间一步步操作就可以，但是许多刚接触备份王软件的客用户来说还原后会出现一个问题：因为新老空间数据库用户名和密码不统一，网站文件打包过来后因没有修改连接文件，还原数据库是好了，可是前台会提示数据库连接错误，网站从而出现打不开的情况。解决方法：学会修改网站配置文件，大多是由co
github做webhooks：[1]钩子触发是否成功测试 dcj3sjt126com github git webhook
转自: http://jingyan.baidu.com/article/5d6edee228c88899ebdeec47.html github和svn一样有钩子的功能，而且更加强大。例如我做的是最常见的push操作触发的钩子操作，则每次更新之后的钩子操作记录都会在github的控制板可以看到！工具/原料 github 方法/步骤
">的作用" target="_blank">JSP中的作用蕃薯耀
JSP中<base href="<%=basePath%>">的作用 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
linux下SAMBA服务安装与配置 hanqunfeng linux
局域网使用的文件共享服务。一.安装包： rpm -qa | grep samba samba-3.6.9-151.el6.x86_64 samba-common-3.6.9-151.el6.x86_64 samba-winbind-3.6.9-151.el6.x86_64 samba-client-3.6.9-151.el6.x86_64 samba-winbind-clients
guava cache IXHONG cache
缓存，在我们日常开发中是必不可少的一种解决性能问题的方法。简单的说，cache 就是为了提升系统性能而开辟的一块内存空间。　　缓存的主要作用是暂时在内存中保存业务系统的数据处理结果，并且等待下次访问使用。在日常开发的很多场合，由于受限于硬盘IO的性能或者我们自身业务系统的数据处理和获取可能非常费时，当我们发现我们的系统这个数据请求量很大的时候，频繁的IO和频繁的逻辑处理会导致硬盘和CPU资源的
Query的开始--全局变量,noconflict和兼容各种js的初始化方法 kvhur JavaScript jquery css
这个是整个jQuery代码的开始，里面包含了对不同环境的js进行的处理，例如普通环境，Nodejs，和requiredJs的处理方法。还有jQuery生成$, jQuery全局变量的代码和noConflict代码详解完整资源： http://www.gbtags.com/gb/share/5640.htm jQuery 源码： (
美国人的福利和中国人的储蓄 nannan408
今天看了篇文章，震动很大，说的是美国的福利。美国医院的无偿入院真的是个好措施。小小的改善，对于社会是大大的信心。小孩，税费等，政府不收反补，真的体现了人文主义。美国这么高的社会保障会不会使人变懒？答案是否定的。正因为政府解决了后顾之忧，人们才得以倾尽精力去做一些有创造力，更造福社会的事情，这竟成了美国社会思想、人
N阶行列式计算(JAVA) qiuwanchi N阶行列式计算
package gaodai; import java.util.List; /** * N阶行列式计算 * @author 邱万迟 * */ public class DeterminantCalculation { public DeterminantCalculation(List<List<Double>> determina
C语言算法之打渔晒网问题 qiufeihu c 算法
如果一个渔夫从2011年1月1日开始每三天打一次渔，两天晒一次网，编程实现当输入2011年1月1日以后任意一天，输出该渔夫是在打渔还是在晒网。代码如下： #include <stdio.h> int leap(int a) /*自定义函数leap()用来指定输入的年份是否为闰年*/ { if((a%4 == 0 && a%100 != 0
XML中DOCTYPE字段的解析 wyzuomumu xml
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称,如果是内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容. 而对于外部DTD,则又分为私有DTD与公共DTD,私有DTD使用SYSTEM表示,接着是外部DTD的URL. 而公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL. 私有DTD <!DOCTYPErootSYST

Pandas库的基础入门（二）

前文链接

四、Pandas入门常用

基于Pandas的缺失值处理方法

合并，追加相关，concat，merge，append

分组(Grouping),数据分组后的处理

数据透视表，时间序列数据帧生成

分类（Categoricals）

绘图（pandas与matplotlib 联合使用）

五、总结

参考文章内容链接

你可能感兴趣的:(数据处理-特征工程相关,pandas,可视化)