bitcarmanlee

pandas常见用法总结：数据筛选，过滤，插入，删除，排序，分组聚合等

pandas里面的用法相对非常灵活，经常会有一种需求可以采用多种方式实现的情况。为了方便查找与记忆，特此对pandas里面常见的一些用法

1.选择指定列

选择指定列是常见的需求，同样的实现方式也非常多。

1.1 pd.read_csv

常用的pd.read_csv方法，如果文件中包含有表头信息，可以直接读取指定列。

pd.read_csv("file",  header=0, usecols=['c1', 'c2', 'c3'])

1.2 pd.DataFrame

可以使用pd.DataFrame重新构建一个新的dataframe

c1 = ['a', 'b', 'c', 'd']
c2 = [1, 2, 3, 4]
c3 = ['0.1', '0.3', '0.5', '0.7']

data = pd.DataFrame({'c1': c1, 'c2': c2, 'c3': c3})
newdata = pd.DataFrame(data, columns=['c1', 'c2'])
print(newdata)

1.3 中括号索引

data = pd.DataFrame({'c1': c1, 'c2': c2, 'c3': c3})
newdata = data[['c1', 'c2']]
print(newdata)

1.4 loc方法

data = pd.DataFrame({'c1': c1, 'c2': c2, 'c3': c3})
newdata = data.loc[:, ['c1', 'c2']]
print(newdata)

5.iloc方法

data = pd.DataFrame({'c1': c1, 'c2': c2, 'c3': c3})
newdata = data.iloc[:, [0, 1]]
print(newdata)

2.根据列内元素过滤数据

根据列中元素过滤数据，平时也使用非常多。下面我们看看如何根据列中元素来过滤数据。

2.1 根据[]过滤数据

pandas中[]是一个boolean表达式，[]里面被计算为true的行都会被选取，可以用来过滤数据。

c1 = ['a', 'a', 'c', 'd']
c2 = [1, 2, 3, 4]
c3 = ['0.1', '0.3', '0.5', '0.7']

data = pd.DataFrame({'c1': c1, 'c2': c2, 'c3': c3})
data1 = data[data.c1=='a']
print(data1)
print()

data2 = data[data.c2 > 2]
print(data2)
print()

data1用来选择c1列值为a的行
data2用来选择c2列值大于2的行。
最后的结果为

  c1  c2   c3
0  a   1  0.1
1  a   2  0.3

  c1  c2   c3
2  c   3  0.5
3  d   4  0.7

先选取前面三行，再根据c2列过滤

data_head = data.loc[0:2]
data3 = data_head[data_head.c2 < 3]
print(data3)
print()

  c1  c2   c3
0  a   1  0.1
1  a   2  0.3

还可以使用apply方法，构造一个返回值为true的更复杂的过滤方法：

data4 = data[data.apply(lambda x: x.c2 < 10 * float(x.c3), axis=1)]
print(data4)
print()

  c1  c2   c3
1  a   2  0.3
2  c   3  0.5
3  d   4  0.7

2.2 使用isin过滤

isin方法也可以对列进行过滤，方法名就说明了他是做啥的，不解释。

data5 = data[data.c1.isin(['a'])]
print(data5)

  c1  c2   c3
0  a   1  0.1
1  a   2  0.3

3.删除数据

删除数据可以使用drop方法。

最常见的为删除某一列，示例如下

c1 = ['a', 'a', 'c', 'd']
c2 = [1, 2, 3, 4]
c3 = ['0.1', '0.3', '0.5', '0.7']

data = pd.DataFrame({'c1': c1, 'c2': c2, 'c3': c3})

data.drop('c3', axis=1)
print(data)
print()

  c1  c2   c3
0  a   1  0.1
1  a   2  0.3
2  c   3  0.5
3  d   4  0.7

如果想要在原数据上直接删除，可以将inplace参数设置为True。

data.drop('c3', axis=1, inplace=True)
print(data)
print()

axis=1指定为按列操作。如果想删除几行，将该参数去掉，默认就是axis=0，按行删除。

data.drop([0, 1], axis=0, inplace=True)
print(data)
print()

  c1  c2
2  c   3
3  d   4

4.插入数据

有的时候我们需要在现有数据中插入数据。下面我们按行与列的方式来分情况讨论。

4.1 按列插入

import pandas as pd

c1 = ['a', 'a', 'c', 'd']
c2 = [1, 2, 3, 4]
c3 = ['0.1', '0.3', '0.5', '0.7']

data = pd.DataFrame({'c1': c1, 'c2': c2, 'c3': c3})


# 在最后插入一列
data.insert(data.shape[1], 'c4', [10, 20, 30, 40])
print(data)
print()

# 在最前面插入一列
data.insert(0, 'c0', ['a0', 'a1', 'a2', 'a3'])
print(data)
print()

# 将c3列插入到最前面
data.insert(0, 'c3', data.pop('c3'))
print(data)

insert方法可以方便用来插入行列数据，具体使用方式为insert(columnindex, columnname, data)。
data.insert(0, 'c3', data.pop('c3')) 是将c3列删除，然后插入到最前面。
pop方法与drop方法的不同在于，pop只能删除指定的列，并且会返回Series，所以我们才能使用insert方法继续插入被pop的Series。而drop可以删除指定的行或者列，默认删除行，并且方法无返回值，可以通过axis=1指定删除列。

代码运行的最后结果为

  c1  c2   c3  c4
0  a   1  0.1  10
1  a   2  0.3  20
2  c   3  0.5  30
3  d   4  0.7  40

   c0 c1  c2   c3  c4
0  a0  a   1  0.1  10
1  a1  a   2  0.3  20
2  a2  c   3  0.5  30
3  a3  d   4  0.7  40

    c3  c0 c1  c2  c4
0  0.1  a0  a   1  10
1  0.3  a1  a   2  20
2  0.5  a2  c   3  30
3  0.7  a3  d   4  40

4.2 交换两列位置

如果我们想交换两列的位置，比如将c1, c3列互换位置，可以按如下操作。

c1 = ['a', 'a', 'c', 'd']
c2 = [1, 2, 3, 4]
c3 = ['0.1', '0.3', '0.5', '0.7']

data = pd.DataFrame({'c1': c1, 'c2': c2, 'c3': c3})

print(data)
print()
data[['c1', 'c3']] = data[['c3', 'c1']]
print(data)
print()
data.rename(columns={'c1': 'c3', 'c3': 'c1'}, inplace=True)
print(data)

  c1  c2   c3
0  a   1  0.1
1  a   2  0.3
2  c   3  0.5
3  d   4  0.7

    c1  c2 c3
0  0.1   1  a
1  0.3   2  a
2  0.5   3  c
3  0.7   4  d

    c3  c2 c1
0  0.1   1  a
1  0.3   2  a
2  0.5   3  c
3  0.7   4  d

上面的方法主要是两个步骤：
1.首先通过[]直接进行列数据的交换。
2.对columns进行重命名，恢复到原来的名称。

4.3 按行插入

如果我们想在dataframe最后添加一行，如下两种方式都可以

c1 = ['a', 'a', 'c', 'd']
c2 = [1, 2, 3, 4]
c3 = ['0.1', '0.3', '0.5', '0.7']
data = pd.DataFrame({'c1': c1, 'c2': c2, 'c3': c3})

# 末尾添加一行
row = {'c1': 'e', 'c2': 5, 'c3': '0.9'}
data = data.append(row, ignore_index=True)

data.loc[data.shape[0]] = row

如果想在起始位置添加一行，可以使用如下方式

c1 = ['a', 'a', 'c', 'd']
c2 = [1, 2, 3, 4]
c3 = ['0.1', '0.3', '0.5', '0.7']
data = pd.DataFrame({'c1': c1, 'c2': c2, 'c3': c3})

row = {'c1': 'e', 'c2': 5, 'c3': '0.9'}
data.loc[-1] = row
data.index = data.index + 1
data = data.sort_index()
print(data)

输出结果为

  c1  c2   c3
0  e   5  0.9
1  a   1  0.1
2  a   2  0.3
3  c   3  0.5
4  d   4  0.7

5.排序

pandas中的排序可以使用sort_values方法，该方法简洁实用，谁用谁知道。

c1 = ['a', 'a', 'c', 'd']
c2 = [1, 2, 3, 4]
c3 = ['0.1', '0.3', '0.5', '0.7']
data = pd.DataFrame({'c1': c1, 'c2': c2, 'c3': c3})

data.sort_values(by=['c2'], ascending=False, inplace=True)
data.reset_index(drop=True, inplace=True)
print(data)

  c1  c2   c3
0  d   4  0.7
1  c   3  0.5
2  a   2  0.3
3  a   1  0.1

其中by是指用来排序的列名，可以传入多个。排序完毕以后，为了后面方便使用，我们对index进行了重置。

如果我们想对多列进行排序

country = ['Chi', 'Chi', 'Chi', 'Jp', 'Jp', 'Aus']
city = ['bj', 'bj', 'sh', 'ty', 'ty', 'sy']
num = [200, 300, 100, 50, 60, 70]
data = pd.DataFrame({'country': country, 'city': city, 'num': num})

data.sort_values(by=['country', 'rate'], ascending=[True, False], inplace=True)
print(data)

上面的代码，即对data先按country降序排列，再按rate进行升序排列。

看个更复杂的例子

country = ['Chi', 'Chi', 'Chi', 'Jp', 'Jp', 'Aus']
city = ['1_bj', '5_bj', '4_sh', '3_ty', '6_ty', '2_sy']
data = pd.DataFrame({'country': country, 'city': city})
data.sort_values(by=['city'], inplace=True)
print(data)
data['newcity'] = data['city'].map(lambda x: x.split('_')[1])
data.sort_values(by=['newcity'], inplace=True)
data.drop('newcity', inplace=True, axis=1)
print(data)

上面的例子中，我们想对city列先按’_'进行分割，分割完毕后取第二个字段进行排序。我们可以先添加一列对整个dataframe进行排序，排序完毕以后再将该列删除。

6.对某列进行wordcount

很多时候我们拿到一个数据，想对其分布情况进行查看，做类似wordcount操作，pandas中的value_counts方法就可以方便进行上述操作。

c1 = ['a', 'a', 'c', 'd']
c2 = [1, 2, 3, 4]
c3 = ['0.1', '0.3', '0.5', '0.7']
data = pd.DataFrame({'c1': c1, 'c2': c2, 'c3': c3})

print(data.c1.value_counts())
print(type(data.c1.value_counts()))

输出结果为

a    2
d    1
c    1
Name: c1, dtype: int64

返回的数据类型为Series结构。

7.计算占比

计算占比，是日常数据分析中的常见需求。下面我们通过一个实例来看一下如何计算占比。

import pandas as pd

country = ['Chi', 'Chi', 'Chi', 'Jp', 'Jp', 'Aus']
city = ['bj', 'bj', 'sh', 'ty', 'ty', 'sy']
num = [200, 300, 100, 50, 60, 70]
data = pd.DataFrame({'country': country, 'city': city, 'num': num})

data有三列：country,city,num。我们想计算，每个city在他所在country的num中占比。

涉及到占比，肯定离不开groupby分组操作，先稍微看一下groupby操作。

ret = data.groupby(['country', 'city']).count()
print(ret)

输出如下

              num
country city     
Aus     sy      1
Chi     bj      2
        sh      1
Jp      ty      2

很多时候，我们想要的输出为

country city    num
Aus    sy     1
Chi     bj      2
Chi     sh     1
Jp      ty      2

为什么上面的结果不是我们想要的？
如果我们查看一下ret的index

print(ret.index)

发现结果如下

MultiIndex([('Aus', 'sy'),
            ('Chi', 'bj'),
            ('Chi', 'sh'),
            ( 'Jp', 'ty')],
           names=['country', 'city'])

此时ret的index包含两列，分别为country与city。为了达到我们想要的结果，只需要重新reset_index即可

ret.reset_index(inplace=True)
print(ret)

下面我们实现一下最初计算占比的需求。

country = ['Chi', 'Chi', 'Chi', 'Jp', 'Jp', 'Aus']
city = ['bj', 'bj', 'sh', 'ty', 'ty', 'sy']
num = [200, 300, 100, 50, 60, 70]
data = pd.DataFrame({'country': country, 'city': city, 'num': num})


data['rate'] = data['num'] / data.groupby('country')['num'].transform('sum')
print(data)

上面的代码，按country分组，然后对num进行sum操作，注意sum操作是包含在transform中，这样能保证索引对齐最后按预期输出。

8.根据一列新生成一列

如果我们想根据现有列生成新的列，可以使用map方法来完成。

import pandas as pd

country = ['Chi', 'Chi', 'Chi', 'Jp', 'Jp', 'Aus']
city = ['bj', 'bj', 'sh', 'ty', 'ty', 'sy']
num = [200, 300, 100, 50, 60, 70]
data = pd.DataFrame({'country': country, 'city': city, 'num': num})

data['num2'] = data['num'].map(lambda x:  x * 2 if x >= 100 else x + 1 )
print(data)

num2列根据num列生成。如果num列中的数值大于等于100，则乘以2；否则加1。
最后的输出结果为

  country city  num  num2
0     Chi   bj  200   400
1     Chi   bj  300   600
2     Chi   sh  100   200
3      Jp   ty   50    51
4      Jp   ty   60    61
5     Aus   sy   70    71

9.计算分位数

分位数是统计学中的概念，一般用q表示比较多，q可以是0到1之间的任意数值，常用的四分位数比较出名。
四分位数，是指将数值从小到大排列分成四等份，处于三个分割点位置的数值就是四分位数。
计算分位数位置的方法有两种：
method1: position = (n + 1) * q
method2: pos = 1 + (n-1) * q
pandas中，使用的就是第二种方法。

import pandas as pd
import random
import numpy as np

n1 = [random.randint(1, 10) for _ in range(10)]
n2 = [random.randint(50, 60) for _ in range(10)]
data = pd.DataFrame({'n1': n1, 'n2': n2})
print(data)
print()

r1 = data['n1'].quantile(q = 0.25)
print(r1)
r2 = data['n2'].quantile(q = 0.4)
print(r2)
print()

a = np.array(data['n1'])
b = np.array(data['n2'])
print(np.percentile(a, 25))
print(np.percentile(b, 40))

上面的代码某次运行结果

可以看到，pandas中的quantile方法与numpy中的percentile方法计算结果是一致的。
稍微需要注意的是，quantile传的q值是0-1之间的浮点数，而percentile中的q值为0-100之间的浮点数。

你可能感兴趣的:(python,pandas,数据筛选,过滤,插入,求占比)

python 开放的通讯系统高保密性张小秦命令模式算法 python
优点1.点对点（P2P）加密通信：•采用点对点通信模式，消息直接在客户端之间传输，无需通过中央服务器。•提高隐私性，避免中央服务器成为单点故障或攻击目标。•降低通信延迟，消息传输更高效。2.强大的加密机制：•使用AES（高级加密标准）对消息进行加密，确保通信内容的安全性。•每个会话生成唯一的加密密钥，确保密钥的安全性。•使用AES的EAX模式，支持加密和消息认证，防止消息被篡改。3.临时数据存储：
pytorch实现cifar10多分类总结 L_pyu 人工智能 pytorch 分类
cifar-10简介：CIFAR-10是一个常用的图像分类数据集，每张图片都是3×32×32，3通道彩色图片，分辨率32×32。它包含了10个不同类别，每个类别有6000张图像，其中5000张用于训练，1000张用于测试。这10个类别分别为：飞机、汽车、鸟类、猫、鹿、狗、青蛙、马、船和卡车。CIFAR-10分类任务是将这些图像正确地分类到它们所属的类别中。对于这个任务，可以使用深度学习模型，如卷积
Mybatis的基本使用学c真好玩 mybatis
MyBatis简介MyBatis用于持久层框架,持久层是对数据库操作的部分，前版本iBatis由Apache软件基金组织进行更名并维护。特点:简化数据库的操作SQL映射灵活(半ORM框架)支持高级映射易于集成维护配置动态SQL缓存机制功能：替代JDBC,JDBC是java中提供的用于操作数据库的技术及方案数据库的连接控制难。连接池SQL语句硬编码。将sql语句存放到xml配置文件中参数传递问题。提
Python的pywt库的安装赵孝正 Python标准库使用 #python和pip安装 python 数据库开发语言
目录pywt库的全称是PyWavelets，https://pywavelets.readthedocs.io/en/latest/。安装pywt库：pipinstallPyWavelets而不是VS2017中默认的pipinstallpywt，真是坑啊。>>>importpywt>>>x=[3,7,1,1,-2,5,4,6]>>>cA,cD=pywt.dwt(x,‘db2′)>>>printcA
Python漂浮爱心代码 Want595 趣味编程 python 开发语言
目录系列文章前言小海龟漂浮爱心完整代码尾声系列文章序号直达链接表白系列1Python无法拒绝的表白界面（完整代码）_python玫瑰花雨编程-CSDN博客2Python满屏飘字表白代码（完整代码）_抖音同款满屏飘字表白代码(python版)-CSDN博客3Python无限弹窗满屏表白代码（完整代码）_python弹窗满屏幕-CSDN博客4Python李峋同款跳动的爱心（完整代码）_python绘制
React 和 Vue _使用区别开心小老虎 react知识点+组件 vue3知识点+组件前端知识点 vue.js react.js 前端
目录一、框架介绍1.Vue2.React二、框架结构1.创建应用2.框架结构三、使用区别1.单页面组成2.样式3.显示响应式数据4.响应式html标签属性5.控制元素显隐6.条件渲染7.渲染列表react和vue是目前前端比较流行的两大框架，前端程序员应该将两种框架都掌握，本文总结一些基本知识点的使用区别。一、框架介绍1.VueVue是一个框架，也是一个生态。其功能覆盖了大部分前端开发常见的需求。
王道数据结构第三章（二）- 栈和队列的应用 int型码农数据结构算法
王道数据结构第三章（二）栈和队列的应用一、栈在括号匹配中的应用1.括号匹配2.实现2.前、中、后缀表达式二、栈在表达式求值中的应用1.后缀表达式（重要）1.1中缀转后缀1.2后缀表达式的计算1.2.1手算1.2.2机算2.前缀表达式2.1中缀转前缀2.2前缀表达式的计算3.中缀表达式3.1中缀转后缀的机算（用栈实现）3.2中缀表达式的计算三、栈在递归中的应用1.阶乘2.斐波那契数列四、队列的应用总
html5使用本地sqlite数据库小祁爱编程 sqlite html5 big data
html5使用本地sqlite数据库本地数据库概述在HTML5中，大大丰富了客户端本地可以存储的内容，添加了很多功能将原本必须要保存在服务器上的数据转为保存在客户端本地，从而大大提高了Web应用程序性能，减轻了服务器的负担，使用Web时代重新回到了“客户端为重、服务器端为轻”的时代。HTML5中内置了两种本地数据库，一种是SQLite,一种是indexedDBSQLite数据库使用操作本地数据库的
VSCode 2025最新后端开发必备插件汇总（必备插件合集，Python、Java、Go等语言） Code_流苏实用软件与高效工具 vscode python java 后端开发必备插件合集
前言:作为微软推出的轻量级跨平台编辑器，VSCode凭借智能代码补全、远程开发、Git集成等核心功能，已成为后端开发者首选工具。其强大的插件生态更是覆盖了主流后端语言支持、代码质量优化、性能分析等全场景需求。名人说：博观而约取，厚积而薄发。——苏轼《稼说送张琥》创作者：Code_流苏(CSDN)（一个喜欢古诗词和编程的Coder）目录一、语言支持类插件二、代码质量和格式化工具三、数据库工具四、AP
2025年Python后端开发指南：从基础到云原生实践 ctrl_cv工程师￥云原生 django flask pycharm
在2025年，Python后端开发已全面进入云原生与智能化时代。开发者不仅需要掌握传统后端技术栈，还需融合容器化、AI辅助编程等新兴技术。本文基于行业最新趋势与最佳实践，系统梳理Python后端开发的核心要点与进阶方向，涵盖开发环境、架构设计、性能优化等关键领域。一、开发环境与工具链1.环境配置标准化Python版本：推荐Python3.12+，支持模式匹配（PatternMatching）和更优
MySQL 事务的隔离级别重生之我在成电转码 java mysql 事务
MySQL事务的隔离级别定义了多个事务并发执行时，如何防止相互影响。隔离级别越高，数据一致性越强，但并发性能可能降低。四种事务隔离级别MySQL提供4种事务隔离级别（从低到高）：隔离级别脏读（DirtyRead）不可重复读（Non-repeatableRead）幻读（PhantomRead）1.读未提交（ReadUncommitted）❌可能发生❌可能发生❌可能发生2.读已提交（ReadCommi
shell脚本重启python脚本 mzgong python
#!/bin/bashwhiletrue#循环检测脚本是否停止doprocnum=$(ps-ef|grep"run.py"|grep-vgrep|wc-l)#记录正在运行run.py的数量echo"ps-efgrepreturn:"${procnum}#信息输出if[[${procnum}==0]];then#如果run.py正在运行数量等于0，脚本中断，需要重启filename=$(date+%
C语言从入门到精通李鲶鱼 c++学习 python
主要内容1.基础知识C语言概述：介绍C语言的历史、特点和发展。数据类型：讲解基本数据类型、常量、变量及其存储类别。运算符与表达达：涵盖赋值、算术、关系、逻辑等运算符和表达式。输入输出函数：介绍字符、字符串和格式化的输入输出方法。2.核心技术控制语句：包括选择结构（if、switch）和循环结构（while、for）。数组与指针：详细讲解一维数组、二维数组、字符数组和指针的使用。函数：函数的定义、声
使用Python的 multiprocessing 模块实现多进程并行计算（上完整代码）小码小李开发语言 python 数据库
使用Python的multiprocessing模块实现多进程并行计算的较为详细复杂的示例代码，用于计算一个较大范围内数字的平方，并将结果汇总。以下是一个更具体、复杂且详尽的多进程并行计算代码示例，用于分析多个大型文本文件中单词出现的频率：importmultiprocessingimporttimeimportrefromcollectionsimportCounter#函数用于读取单个文件内容
多分类—微调DistilBERT对生物医学文本进行实验方法多分类：Automated Text Mining of Experimental Methodologies from Biomedical 小小帅AIGC information extraction 人工智能自然语言处理语言模型多分类学术领域生物医学
AutomatedTextMiningofExperimentalMethodologiesfromBiomedicalLiterature从生物医学文献中自动挖掘实验方法文本paper：https://arxiv.org/abs/2404.13779github：本文做的就是微调DistilBERT去做多分类任务，训练自己的数据集，分类每个句子对应的实验方法。没有什么讲的。文章目录～1.背景动机
数据挖掘技术介绍柒柒钏数据挖掘数据挖掘人工智能
数据挖掘技术介绍分类聚类关联规则挖掘预测异常检测特征选择与降维文本挖掘序列模式挖掘深度学习集成学习数据挖掘（DataMining）是一种从大量数据中提取有用信息和模式的技术，旨在从数据中发现隐藏的规律、趋势或关系，从而为决策提供支持。分类定义：是一种监督学习方法，用于将数据分为不同的类别。功能：根据已标记的训练数据，学习一个模型，用于预测新数据的类别。方法：决策树、支持向量机、神经网络、逻辑回归、
You are using pip version 10.0.1, however version 20.0.2 is available.的解决方案柒柒钏小知识点 python
在安装第三方库时出现以下提示：Youareusingpipversion10.0.1,howeverversion20.0.2isavailable.输入：python-mpipinstall--upgradepip结果：还是提示上述错误输入：python-mpipinstall--Upip结果：如下所示，更新完成之后继续安装第三库即可。
【Python】全局解释器锁（Global Interpreter Lock，GIL）彬彬侠 Python基础全局解释器锁 GIL CPython 多进程 C 扩展 python
全局解释器锁（GlobalInterpreterLock，简称GIL）是CPython（Python的标准实现）中的一个机制，它确保同一时刻只有一个线程在执行Python字节码。GIL的主要作用是保护Python内部的数据结构，避免多线程访问共享数据时发生竞争条件，导致数据损坏。GIL的工作原理在Python的多线程环境中，GIL会限制多个线程同时执行Python字节码。尽管操作系统可以调度多个线
深度学习在医疗影像诊断中的应用与实现 Evaporator Core #DeepSeek快速入门人工智能 #深度学习深度学习人工智能
引言随着人工智能技术的快速发展，深度学习在医疗领域的应用日益广泛，尤其是在医疗影像诊断方面。医疗影像数据量大、复杂度高，传统的诊断方法往往依赖于医生的经验，容易受到主观因素的影响。而深度学习通过自动学习特征，能够从海量数据中提取出有用的信息，辅助医生进行更精准的诊断。本文将探讨深度学习在医疗影像诊断中的应用，并通过代码示例展示如何实现一个简单的医疗影像分类模型。深度学习在医疗影像诊断中的应用1.图
PINN物理信息网络 | 基于物理信息神经网络PINN求解Burger方程算法如诗物理信息网络（PINN）神经网络人工智能深度学习物理信息网络
基于物理信息神经网络（PINN）求解Burger方程的研究背景源于对非线性偏微分方程（PDE）求解方法的不断探索和改进。传统的数值方法，如有限差分法和有限元法，通常需要进行网格离散化和迭代求解，对于复杂的非线性问题计算成本较高。因此，研究人员开始探索基于机器学习和神经网络的新方法来求解PDEs。神经网络在近年来取得了显著的发展，能够通过学习大量数据来建立输入和输出之间的复杂映射关系。然而，将神经网
PINN物理信息网络 | 利用物理信息神经网络进行流体动力学建模算法如诗物理信息网络（PINN）神经网络机器学习人工智能流体动力学建模 PINN物理信息网络
背景物理信息神经网络（Physics-InformedNeuralNetworks，PINN）是一种结合了神经网络和物理方程的方法，用于建模和求解物理问题。传统的基于物理方程的数值方法在处理复杂的非线性偏微分方程时可能面临数值稳定性、高计算复杂度和网格依赖性等问题。而PINN作为一种数据驱动的方法，通过使用神经网络来近似物理方程，能够有效地解决这些问题。在流体动力学建模中，PINN可以应用于求解N
C++调用Python程序方法超级大反派@_@ C++c++python 开发语言
前言：在之前做的一个项目中，要使用一段Python的代码。一般来讲可以将Python代码中的功能在C++项目中重构，但是如果Python项目太大，或者这部分是别人写的，自己不清楚整个项目的逻辑，这样重构起来就比较麻烦。这里给出了另外一种实现方法，即利用Python的API使得C++项目可以直接启动Python程序，快速在PC端验证代码功能。急性子可直接看：2.2C++调用python有参有返回值函
图神经网络学习笔记—高级小批量处理（专题十四） AI专题精讲图神经网络入门到精通人工智能
小批量（mini-batch）的创建对于让深度学习模型的训练扩展到海量数据至关重要。与逐条处理样本不同，小批量将一组样本组合成一个统一的表示形式，从而可以高效地并行处理。在图像或语言领域，这一过程通常通过将每个样本缩放或填充为相同大小的形状来实现，然后将样本在一个额外的维度中分组。该维度的长度等于小批量中分组的样本数量，通常称为batch_size。由于图是能够容纳任意数量节点或边的最通用的数据结
1985-2024年地级市人工智能专利数据经管数据库人工智能
《地级市人工智能专利数据（1985-2024）》于2025年1月完成最新更新。数据聚焦于中国各地级市，时间跨度设定为1985年至2024年。在数据整理过程中，参照《关键数字技术专利分类体系（2023）》，依据其中“人工智能”类技术的专利分类号，结合国家知识产权局所提供的信息，对各地每年的专利申请展开搜索与匹配。在此基础上，从众多专利申请中精准筛选出属于“人工智能”类别的专利，并进行数量统计，数据涵
医学文本分析中的命名实体识别：从理论到实践软件职业规划语言模型 unity 人工智能
1.数据预处理数据预处理是医学命名实体识别系统的基础步骤，其质量直接影响模型的训练效果和最终性能。数据预处理主要包括医学文本的标注、清洗以及数据增强三个方面。1.1医学文本的标注标注是数据预处理中的关键环节，其目的是将医学文本中的实体明确标记出来，以便模型能够学习到实体的特征和边界。标注的方式通常采用BIO标注法。1.1.1BIO标注法BIO标注法是一种广泛应用于命名实体识别任务的标注方式，它通过
每天五分钟玩转深度学习PyTorch：基于GoogLeNet完成CAFIR10分类每天五分钟玩转人工智能深度学习框架pytorch 深度学习 pytorch 分类 GoogLeNet 人工智能 CAFIR10
本文重点前面我们终于使用pytorch搭建了GoogLeNet，本文我们使用该网络模型解决一个实际问题，也就是使用它完成CAFIR10分类，其实就这些任务而言，我们只要搭建好模型，然后把数据喂进去就行了，其它的地方都是一样的，就是网络模型不一样。代码
【零基础JavaScript入门 | Day1】从“消费记账“案例学编程基础 ⭐表格制作+数据类型转换全解析 helbyYoung JavaScrip学习 javascript 学习
【零基础JavaScript入门|Day1】从"消费记账"案例学编程基础⭐表格制作+数据类型转换全解析今日学习重点：✅数据与现实的映射关系→网页表格如何承载生活数据✅变量容器的本质→用let管理三大消费支出✅隐式类型转换技巧→+prompt()输入处理的妙用✅模板字符串实战→动态生成消费报表案例亮点：1️⃣用户交互三部曲：通过prompt()实现饮食/交通/娱乐费用的分步输入2️⃣自动统计系统：t
主流架构模式全景解析：微服务 vs SOA vs 单体架构的终极抉择指南 Eqwaak00 分布式系统设计实战科技微服务架构
一、架构演进史：从巨石到微粒的进化之路（图示：1970s单体→2000sSOA→2010s微服务→2020s云原生）二、三大架构模式深度拆解2.1单体架构（MonolithicArchitecture）核心特征graphTDA[单体应用]-->B[用户界面]A-->C[业务逻辑]A-->D[数据访问]B-->E[Web/移动端]C-->F[订单处理]C-->G[支付处理]D-->H[MySQL]D
C# Dictionary使用详解 Daniel的万事通杂货铺 Winform应用开发 c#开发语言
在C#中，Dictionary是一个非常常用的数据结构，用于存储键值对。Dictionary类实现了IDictionary接口，并且提供了许多有用的方法和属性来操作键值对集合。下面是一些关于如何使用Dictionary的详细说明：1.基本用法创建DictionaryCsharp深色版本1DictionarymyDictionary=newDictionary();或者使用字面量语法：Csharp深
vscode中调试Python和C++的混合代码 destiny44123 vscode python c++
文章目录使用流程参考一些差异使用流程参考ExampledebuggingmixedPythonC++inVSCode一些差异这里假设的项目是通过python调用c++的相应共享库(so)文件。首先，新建文件夹.vscode，在其中添加文件配置launch.json.示例如下：{"version":"0.2.0","configurations":[{"name":"(gdb)附加","type":
mondb入手木zi_鸣 mongodb
windows 启动mongodb 编写bat文件， mongod --dbpath D:\software\MongoDBDATA mongod --help 查询各种配置配置在mongob 打开批处理，即可启动，27017原生端口，shell操作监控端口扩展28017，web端操作端口启动配置文件配置，数据更灵活
大型高并发高负载网站的系统架构 bijian1013 高并发负载均衡
扩展Web应用程序一.概念简单的来说，如果一个系统可扩展，那么你可以通过扩展来提供系统的性能。这代表着系统能够容纳更高的负载、更大的数据集，并且系统是可维护的。扩展和语言、某项具体的技术都是无关的。扩展可以分为两种： 1.
DISPLAY变量和xhost(原创) czmmiao display
DISPLAY 在Linux/Unix类操作系统上, DISPLAY用来设置将图形显示到何处. 直接登陆图形界面或者登陆命令行界面后使用startx启动图形, DISPLAY环境变量将自动设置为:0:0, 此时可以打开终端, 输出图形程序的名称(比如xclock)来启动程序, 图形将显示在本地窗口上, 在终端上输入printenv查看当前环境变量, 输出结果中有如下内容:DISPLAY=:0.0
获取B/S客户端IP 周凡杨 java 编程 jsp Web 浏览器
最近想写个B/S架构的聊天系统，因为以前做过C/S架构的QQ聊天系统，所以对于Socket通信编程只是一个巩固。对于C/S架构的聊天系统，由于存在客户端Java应用，所以直接在代码中获取客户端的IP，应用的方法为： String ip = InetAddress.getLocalHost().getHostAddress(); 然而对于WEB
浅谈类和对象朱辉辉33 编程
类是对一类事物的总称，对象是描述一个物体的特征，类是对象的抽象。简单来说，类是抽象的，不占用内存，对象是具体的，占用存储空间。类是由属性和方法构成的，基本格式是public class 类名{ //定义属性 private/public 数据类型属性名； //定义方法 publ
android activity与viewpager+fragment的生命周期问题肆无忌惮_ viewpager
有一个Activity里面是ViewPager，ViewPager里面放了两个Fragment。第一次进入这个Activity。开启了服务，并在onResume方法中绑定服务后，对Service进行了一定的初始化，其中调用了Fragment中的一个属性。 super.onResume(); bindService(intent, conn, BIND_AUTO_CREATE);
base64Encode对图片进行编码 843977358 base64 图片 encoder
/** * 对图片进行base64encoder编码 * * @author mrZhang * @param path * @return */ public static String encodeImage(String path) { BASE64Encoder encoder = null; byte[] b = null; I
Request Header简介 aigo servlet
当一个客户端(通常是浏览器)向Web服务器发送一个请求是，它要发送一个请求的命令行，一般是GET或POST命令，当发送POST命令时，它还必须向服务器发送一个叫“Content-Length”的请求头(Request Header) 用以指明请求数据的长度，除了Content-Length之外，它还可以向服务器发送其它一些Headers，如：
HttpClient4.3 创建SSL协议的HttpClient对象 alleni123 httpclient 爬虫 ssl
public class HttpClientUtils { public static CloseableHttpClient createSSLClientDefault(CookieStore cookies){ SSLContext sslContext=null; try { sslContext=new SSLContextBuilder().l
java取反 -右移-左移-无符号右移的探讨百合不是茶位运算符位移
取反：在二进制中第一位，1表示符数，0表示正数 byte a = -1; 原码：10000001 反码：11111110 补码：11111111 //异或: 00000000 byte b = -2; 原码：10000010 反码：11111101 补码：11111110 //异或: 00000001
java多线程join的作用与用法 bijian1013 java 多线程
对于JAVA的join，JDK 是这样说的：join public final void join （long millis ）throws InterruptedException Waits at most millis milliseconds for this thread to die. A timeout of 0 means t
Java发送http请求(get 与post方法请求) bijian1013 java spring
PostRequest.java package com.bijian.study; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURL
【Struts2二】struts.xml中package下的action配置项默认值 bit1129 struts.xml
在第一部份，定义了struts.xml文件，如下所示： <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts
【Kafka十三】Kafka Simple Consumer bit1129 simple
代码中关于Host和Port是割裂开的，这会导致单机环境下的伪分布式Kafka集群环境下，这个例子没法运行。实际情况是需要将host和port绑定到一起， package kafka.examples.lowlevel; import kafka.api.FetchRequest; import kafka.api.FetchRequestBuilder; impo
nodejs学习api ronin47 nodejs api
NodeJS基础什么是NodeJS JS是脚本语言，脚本语言都需要一个解析器才能运行。对于写在HTML页面里的JS，浏览器充当了解析器的角色。而对于需要独立运行的JS，NodeJS就是一个解析器。每一种解析器都是一个运行环境，不但允许JS定义各种数据结构，进行各种计算，还允许JS使用运行环境提供的内置对象和方法做一些事情。例如运行在浏览器中的JS的用途是操作DOM，浏览器就提供了docum
java-64.寻找第N个丑数 bylijinnan java
public class UglyNumber { /** * 64.查找第N个丑数具体思路可参考 [url] http://zhedahht.blog.163.com/blog/static/2541117420094245366965/[/url] * 题目：我们把只包含因子 2、3和5的数称作丑数（Ugly Number）。例如6、8都是丑数，但14
二维数组（矩阵）对角线输出 bylijinnan 二维数组
/** 二维数组对角线输出两个方向例如对于数组： { 1, 2, 3, 4 }, { 5, 6, 7, 8 }, { 9, 10, 11, 12 }, { 13, 14, 15, 16 }, slash方向输出： 1 5 2 9 6 3 13 10 7 4 14 11 8 15 12 16 backslash输出： 4 3
[JWFD开源工作流设计]工作流跳跃模式开发关键点(今日更新) comsci 工作流
既然是做开源软件的,我们的宗旨就是给大家分享设计和代码,那么现在我就用很简单扼要的语言来透露这个跳跃模式的设计原理大家如果用过JWFD的ARC-自动运行控制器,或者看过代码,应该知道在ARC算法模块中有一个函数叫做SAN(),这个函数就是ARC的核心控制器,要实现跳跃模式,在SAN函数中一定要对LN链表数据结构进行操作,首先写一段代码,把
redis常见使用 cuityang redis 常见使用
redis 通常被认为是一个数据结构服务器，主要是因为其有着丰富的数据结构 strings、map、 list、sets、 sorted sets 引入jar包 jedis-2.1.0.jar (本文下方提供下载) package redistest; import redis.clients.jedis.Jedis; public class Listtest
配置多个redis dalan_123 redis
配置多个redis客户端 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&quo
attrib命令 dcj3sjt126com attr
attrib指令用于修改文件的属性.文件的常见属性有:只读.存档.隐藏和系统. 只读属性是指文件只可以做读的操作.不能对文件进行写的操作.就是文件的写保护. 存档属性是用来标记文件改动的.即在上一次备份后文件有所改动.一些备份软件在备份的时候会只去备份带有存档属性的文件.
Yii使用公共函数 dcj3sjt126com yii
在网站项目中，没必要把公用的函数写成一个工具类，有时候面向过程其实更方便。在入口文件index.php里添加 require_once('protected/function.php'); 即可对其引用，成为公用的函数集合。 function.php如下： <?php /** * This is the shortcut to D
linux 系统资源的查看（free、uname、uptime、netstat） eksliang netstat linux uname linux uptime linux free
linux 系统资源的查看转载请出自出处：http://eksliang.iteye.com/blog/2167081 http://eksliang.iteye.com 一、free查看内存的使用情况语法如下： free [-b][-k][-m][-g] [-t] 参数含义 -b:直接输入free时，显示的单位是kb我们可以使用b(bytes),m
JAVA的位操作符 greemranqq 位运算 JAVA位移 <<>>>
最近几种进制，加上各种位操作符，发现都比较模糊，不能完全掌握，这里就再熟悉熟悉。 1.按位操作符：按位操作符是用来操作基本数据类型中的单个bit,即二进制位，会对两个参数执行布尔代数运算，获得结果。与（&）运算： 1&1 = 1, 1&0 = 0, 0&0 &
Web前段学习网站 ihuning Web
Web前段学习网站菜鸟学习：http://www.w3cschool.cc/ JQuery中文网：http://www.jquerycn.cn/ 内存溢出：http://outofmemory.cn/#csdn.blog http://www.icoolxue.com/ http://www.jikexue
强强联合：FluxBB 作者加盟 Flarum justjavac r
原文：FluxBB Joins Forces With Flarum作者：Toby Zerner译文：强强联合：FluxBB 作者加盟 Flarum译者：justjavac FluxBB 是一个快速、轻量级论坛软件，它的开发者是一名德国的 PHP 天才 Franz Liedke。FluxBB 的下一个版本(2.0)将被完全重写，并已经开发了一段时间。FluxBB 看起来非常有前途的，
java统计在线人数（session存储信息的） macroli java Web
这篇日志是我写的第三次了前两次都发布失败！郁闷极了！由于在web开发中常常用到这一部分所以在此记录一下，呵呵，就到备忘录了！我对于登录信息时使用session存储的，所以我这里是通过实现HttpSessionAttributeListener这个接口完成的。 1、实现接口类，在web.xml文件中配置监听类，从而可以使该类完成其工作。 public class Ses
bootstrp carousel初体验快速构建图片播放 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
img{ border: 1px solid white; box-shadow: 2px 2px 12px #333; _width: expression(this.width > 600 ? "600px" : this.width + "px"); _height: expression(this.width &
SparkSQL读取HBase数据，通过自定义外部数据源 superlxw1234 spark sparksql sparksql读取hbase sparksql外部数据源
关键字：SparkSQL读取HBase、SparkSQL自定义外部数据源前面文章介绍了SparSQL通过Hive操作HBase表。 SparkSQL从1.2开始支持自定义外部数据源(External DataSource)，这样就可以通过API接口来实现自己的外部数据源。这里基于Spark1.4.0，简单介绍SparkSQL自定义外部数据源，访
Spring Boot 1.3.0.M1发布 wiselyman spring boot
Spring Boot 1.3.0.M1于6.12日发布，现在可以从Spring milestone repository下载。这个版本是基于Spring Framework 4.2.0.RC1,并在Spring Boot 1.2之上提供了大量的新特性improvements and new features。主要包含以下： 1.提供一个新的sprin

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他