XYQLTX

Task 2 pandas基础

一、作业

1.1

df = pd.read_csv('../joyful-pandas-master/data/pokemon.csv')
df.head()
#1.对 HP, Attack, Defense, Sp. Atk, Sp. Def, Speed 进行加总，验证是否为 Total 值。
total1 = df[['HP','Attack','Defense','Sp. Atk','Sp. Def','Speed']].sum(1)
(total1 == df['Total']).sum() == df['Total'].shape[0]#True
# 2 对于 # 重复的妖怪只保留第一条记录，解决以下问题：
#a. 求第一属性的种类数量和前三多数量对应的种类
df_demo = df.drop_duplicates(['#'])
df_demo['Type 1'].nunique()#第一属性的种类数量为18
df_demo['Type 1'].value_counts()[:3]
#Water     105
#Normal     93
#Grass      66
#Name: Type 1, dtype: int64
#前三多数量对应的种类为：Water,Normal,Grass
#b.求第一属性和第二属性的组合种类
df_demo[['Type 1','Type 2']].drop_duplicates().shape[0]#143
#c.求尚未出现过的属性组合

1.2

#按照下述要求，构造 Series ：
#a 取出物攻，超过120的替换为 high ，不足50的替换为 low ，否则设为 mid
s = df['Attack']
s.mask(s>120,'high').mask(s<=50,'low').mask((50<s) &(s<=120),'mid')

#b 取出第一属性，分别用 replace 和 apply 替换所有字母为大写
s1 = df['Type 1']
s1.apply(lambda x : x.upper())
s1.replace(s1.values,[i.upper() for i in list(s1)])

#c 求每个妖怪六项能力的离差，即所有能力中偏离中位数最大的值，添加到 df 并从大到小排序
df_demo1 = df[['HP','Attack','Defense','Sp. Atk','Sp. Def','Speed']]
df_mid = df_demo1.median(1)#为什么不能先算这个，然后直接相减呢，
#df_demo1 - df_demo1.median(1)的值为什么会是800*800的NAN值
df['Licha'] = df_demo1.apply(lambda x: ((x - df_demo1.median())).abs().max(),axis=1)
df.sort_values('Licha', ascending=False)

np.random.seed(0)
s = pd.Series(np.random.randint(-1,2,30).cumsum())
s.head()
s.ewm(alpha=0.2).mean()
## 用expanding
def ewm_func(x,alpha=0.2):
    win = (1-alpha)**np.arange(x.shape[0])[::-1]
    res = (win*x).sum()/win.sum()
    return res
s.expanding().apply(ewm_func)
s.rolling(window=4).apply(ewm_func)

二、pandas基础

2.1 文件的读取和写入

1 文件读取

df_csv = pd.read_csv('../joyful-pandas-master/data/my_csv.csv')#相对路径，..表示返回上一层，后面的路径为进入的路径名
df_csv#路径不能有中文名
df_txt = pd.read_table('../joyful-pandas-master/data/my_table.txt')
df_txt
df_excel = pd.read_excel('../joyful-pandas-master/data/my_excel.xlsx')
print(df_excel)

header=None 表示第一行不作为列名,列名而是以序号表示， index_col表示把某一列或几列作为索引，
usecols 表示读取列的集合,默认读取所有的列，parse_dates 表示需要转化为时间序列，
nrows 表示读取的数据行数。上面这些参数在上述的三个函数里都可以

df_excel1 = pd.read_excel('../joyful-pandas-master/data/my_excel.xlsx',header=None)
df_excel1
df_excel2 = pd.read_excel('../joyful-pandas-master/data/my_excel.xlsx',index_col=[0,3])

#可以直接用序号，也可用第一行的内容索引
df_excel2
#df_excel3 = pd.read_excel('../joyful-pandas-master/data/my_excel.xlsx',index_col=['col1','col2'])
#df_excel3#报错了
df_excel4 = pd.read_excel('../joyful-pandas-master/data/my_excel.xlsx',usecols=[0,3])
df_excel4#只显示读取的列
df_excel5 = pd.read_excel('../joyful-pandas-master/data/my_excel.xlsx',parse_dates=[4])
df_excel5#转换时间的格式
df_excel6 = pd.read_excel('../joyful-pandas-master/data/my_excel.xlsx',nrows=2)
df_excel6#格式为nrows=2这种，数为几就会读取前几行。

在读取 txt 文件时，经常遇到分隔符非空格的情况，例如，下面的读取的表以 |||| 为分割

df_txt1 = pd.read_table('../joyful-pandas-master/data/my_table_special_sep.txt')
df_txt1#col1 |||| col2
#0	TS |||| This is an apple.
#上面的结果显然不是理想的，这时可以使用 sep ，同时需要指定引擎为 python ：
df_txt2 = pd.read_table('../joyful-pandas-master/data/my_table_special_sep.txt',sep='\|\|\|\|',engine='python')
df_txt2#col1	col2
#0	TS	This is an apple.如果少了一个\|就还会留下一个|
#sep 是正则参数,在使用 read_table 的时候需要注意,参数sep中使用的是正则表达式，
#因此需要对\进行转义变成\| ，否则无法读取到正确的结果。

2 数据写入即把变量内容进行保存，一般在数据写入中，最常用的操作是把index设置为False，
特别当索引没有特殊意义的时候，这样的行为能把索引在保存的时候去除。

df_excel1.to_csv('../joyful-pandas-master/data/myexcel1.csv',index=False)
#pandas中没有定义to_table函数，但是to_csv可以保存为txt文件，并且允许自定义分隔符，常用制表符 \t 分割
df_txt2.to_csv('../joyful-pandas-master/data/my_txt2.txt',sep='\t',index=False)

2.2 基本数据结构

Pandas中具有两种基本的数据存储结构，存储一维values的Series和存储二维values的DataFrame,在这两种结构上定义了很多的属性和方法。

Series,一般由四个部分组成，分别是序列的值data、索引index、存储类型dtype、序列的名字name。其中索引也可以指定它的名字，默认为空。

s = pd.Series(data = [100, 'a', {'dic1':5}],
            index = pd.Index(['id1', 20, 'third'], name='my_idx'),
              dtype = 'object',
              name = 'my_name')
s#my_idx
#id1              100
#20                 a
#third    {'dic1': 5}#对于这些属性，可以通过 . 的方式来获取
#Name: my_name, dtype: object

object代表了一种混合类型，正如上面的例子中存储了整数、字符串以及 Python 的字典数据结构.
此外，目前 pandas 把纯字符串序列也默认认为是一种object类型的序列，但它也可以用 string 类型存储，
对于这些属性，可以通过 . 的方式来获取

s.index#Index(['id1', 20, 'third'], dtype='object', name='my_idx')

利用 .shape 可以获取序列的长度：

#利用 .shape 可以获取序列的长度：
print(s.values)#[100 'a' {'dic1': 5}],注意值是values
s.shape#(3,)
#如果想要取出单个索引对应的值，可以通过 [index_item] 可以取出。
s['third']#{'dic1': 5}

DataFrame,在Series的基础上增加了列索引,一个数据框可以由二维的data与行列索引来构造,没有dtype和name.

data = [[1,'a',1.2],[2,'b',2.2],[3,'c',3.2]]
DF = pd.DataFrame(data,index=['row_%d'%i for i in range(3)],
                  columns= ['col_%d'%i for i in range(3)])
DF

更多的时候会采用从列索引名到数据的映射来构造数据框，同时再加上行索引：

DF1 = pd.DataFrame(data={'col_0':[1,2,3],'col_1':list('abc'),'col_2':[1.2,2.2,3.2]},
                  index=['row_%d'%i for i in range(3)])#注意此时data为字典
DF1
DF['col_0']#为Series
DF[['col_0','col_1']]

与 Series 类似，在数据框中同样可以取出相应的属性：

DF.values#array([[1, 'a', 1.2],
      # [2, 'b', 2.2],
     #  [3, 'c', 3.2]], dtype=object)
DF.columns#Index(['col_0', 'col_1', 'col_2'], dtype='object')
DF.dtypes#col_0      int64## 返回的是值为相应列数据类型的Series
#col_1     object
#col_2    float64
#dtype: object
DF.shape#(3, 3)
#通过.T可以进行转置
DF.T

2.3 常用基本函数

PS：

df = pd.read_csv('../joyful-pandas-master/data/learn_pandas.csv')
df.columns#Index(['School', 'Grade', 'Name', 'Gender', 'Height', 'Weight', 'Transfer'], dtype='object')
df = df[df.columns[:7]]
df#使用前7列
df1 = pd.read_csv('../joyful-pandas-master/data/learn_pandas.csv',usecols=range(7))
df1.columns#与df.columns一致

1 汇总函数
head, tail 函数分别表示返回表或者序列的前 n 行和后 n 行，其中 n 默认为5：

df.head()#0-4
df.head(2)
df.tail()
df.tail(3)

info, describe 分别返回表的信息概况和表中数值列float对应的主要统计量：

df.info()
df.describe()

2 特征统计函数
在 Series 和 DataFrame 上定义了许多统计函数，最常见的是 sum, mean, median, var, std, max, min

df_demo = df[['Height','Weight']]
df_demo.mean()
df_demo.std()
# quantile, count, idxmax 这三个函数，它们分别返回的是分位数、非缺失值个数、最大值对应的索引
df_demo.quantile(0.5)#Height    161.9
#Weight     51.0
#Name: 0.5, dtype: float64
df_demo.count()#Height    183
#Weight    189
#dtype: int64
df_demo.idxmax()#Height    193
#Weight      2
#dtype: int64

上面这些所有的函数，由于操作后返回的是标量，所以又称为聚合函数，它们有一个公共参数 axis ，
默认为0代表逐列聚合，如果设置为1则表示逐行聚合：

df_demo.quantile(0.5,axis=1)
df_demo.mean(axis=1).head()

3 唯一值函数
对序列使用 unique 和 nunique 可以分别得到其唯一值组成的列表(去重的意思)和唯一值的个数：

df['School'].unique()#array(['Shanghai Jiao Tong University', 'Peking University',
 #      'Fudan University', 'Tsinghua University'], dtype=object)
df['School'].nunique()#4
#value_counts 可以得到唯一值和其对应出现的频数：
df['School'].value_counts()
#Tsinghua University              69
#Shanghai Jiao Tong University    57
#Fudan University                 40
#Peking University                34
#Name: School, dtype: int64

如果想要观察多个列组合的唯一值，可以使用 drop_duplicates 。其中的关键参数是 keep ，
默认值first表示每个组合保留第一次出现的所在行,last表示保留最后一次出现的所在行,False表示把所有重复组合所在的行剔除。

df_demo1 = df[['Gender','Transfer','Name']]
df_demo1.drop_duplicates(['Gender','Transfer'])
df_demo1.drop_duplicates(['Gender','Transfer'],keep='last')
df_demo1.drop_duplicates(['Gender','Name'],keep=False)
df_demo1[['Gender','Name']].duplicated()#等价于
df_demo1.duplicated(['Gender','Name'])

4 替换函数
替换操作是针对某一个列进行的，因此下面的例子都以 Series 举例。 pandas 中的替换函数可以归纳为三类：映射替换、逻辑替换、数值替换
在 replace 中，可以通过字典构造，或者传入两个列表来进行替换：

df['Gender'].replace({'Female':0,'Male':1})
df['Gender'].replace(['Female','Male'],[0,1])
#df['School']['Fudan University'].replace(['ZhongShan University'])#报错，只想替换一个人的信息怎么弄？？？？

replace还有一种特殊的方向替换，指定method参数为ffill则为用前面一个最近的未被替换的值进行替换，bfill 则使用后面最近的未被替换的值进行替换

s = pd.Series(['a', 1, 'b', 2, 1, 1, 'a'])
print(s)
s.replace([1,2],method='ffill')#pd.Series(['a','a','b','b','b','b','a'])，
#1要被替换，前面没被替换最#近的是‘a’,而后2要被替换。它前面没被替换最近的是‘b’,后面两个1也是‘b’，
s.replace([1,2],method='bfill')#pd.Series(['a','b','b','a','a','a','a'])

逻辑替换包括了 where 和 mask ，这两个函数是完全对称的： where 函数在传入条件为 False 的对应行进行替换，而 mask 在传入条件为 True 的对应行进行替换，当不指定替换值时，替换为缺失值。

s1 = pd.Series([-1,2,2.5,-0.8,3.7])
s1.where(s1<0,0)#pd.Series([-1,0,0.0,-0.8,0])
s1.mask(s1<0,0)#pd.Series([-0,2,2.5,0,3.7])
s1.mask(s1<0)#pd.Series([ NaN,2,2.5, NaN,3.7])
#需要注意的是，传入的条件只需是与被调用的 Series 索引一致的布尔序列即可
s_condition= pd.Series([True,False,False,True])
s1.mask(s_condition)#pd.Series([ NaN,2,2.5, NaN,NaN])
#数值替换包含了round, abs, clip 方法，它们分别表示按照给定精度四舍五入、取绝对值和截断：
s2 = pd.Series([1,2.353,-59.530,68.429,-2.10])
s2.round(2)#括号能参数表示保留几位小数,pd.Series([1.00,2.35,-59.53,68.43,-2.10])
s2.abs()#pd.Series([1,2.353,59.530,68.429,2.10])
s2.clip(-10,10)#pd.Series([1,2.353,-10,10,-2.10])

5 排序函数
排序共有两种方式，其一为值排序，其二为索引排序，对应的函数是 sort_values 和 sort_index

df_demo = df[['Grade','Name','Height','Weight']].set_index(['Grade','Name'])
#sort_values中默认参数 ascending=True 为升序：
df_demo.sort_values('Height').head()
df_demo.sort_values('Height',ascending=False).head()
#在排序中，经常遇到多列排序的问题，比如在体重相同的情况下，对身高进行排序，并且保持身高降序排列，体重升序排列：
df_demo.sort_values(['Weight','Height'],ascending=[True,False]).head()
#按列表索引的先后顺序来，先是weight,因此先按weight，而weight中有相同的，而后再根据height排序，而且
#weight中相同时，height按降序排
#索引排序的用法和值排序完全一致，只不过元素的值在索引中，此时需要指定索引层的名字或者层号，用参数 level 表示。
#另外，需要注意的是字符串的排列顺序由字母顺序决定。
df_demo.sort_index(level=['Grade','Name'],ascending=[True,False]).head()

6 apply方法
apply 方法常用于 DataFrame 的行迭代或者列迭代，apply 的参数往往是一个以序列为输入的函数。
参数axis = 0 默认为列传入。axis = 1，传入函数的就是行元素组成的 Series

df_demo = df[['Height', 'Weight']]
df_demo.apply(lambda x:x.mean())
#Height    163.218033
#Weight     55.015873
#dtype: float64

2.4 窗口对象

所谓的窗口其实可以理解为平滑的长度。我的理解是，原来的数据，我们都是以一个值作为一个对象整体，而滑窗对象是以一个窗口长度所包含的值作为一个对象整体。

滑窗对象
要使用滑窗函数，就必须先要对一个序列使用 .rolling 得到滑窗对象，其最重要的参数为窗口大小 window 。

 s = pd.Series([1,2,3,4,5])
 roller = s.rolling(window = 3)
roller
#Rolling [window=3,center=False,axis=0]

在得到了滑窗对象后，能够使用相应的聚合函数进行计算，需要注意的是窗口包含当前行所在的元素，例如在第四个位置进行均值运算时，应当计算(2+3+4)/3，而不是(1+2+3)/3：

roller.mean()
#0    NaN
#1    NaN
#2    2.0
#3    3.0
#4    4.0
#dtype: float64

roller.sum()
#0     NaN
#1     NaN
#2     6.0
#3     9.0
#4    12.0
#dtype: float64

支持使用 apply 传入自定义函数，其传入值是对应窗口的 Series ，例如上述的均值函数可以等效表示：

roller.apply(lambda x:x.mean())
#0    NaN
#1    NaN
#2    2.0
#3    3.0
#4    4.0
#dtype: float64

shift, diff, pct_change 是一组类滑窗函数，它们的公共参数为 periods=n ，默认为1，分别表示取向前第 n 个元素的值、与向前第 n 个元素做差（与 Numpy 中不同，后者表示 n 阶差分）、与向前第 n 个元素相比计算增长率。这里的 n 可以为负，表示反方向的类似操作。

s = pd.Series([1,3,6,10,15])
s.shift(2)
#0    NaN # 第一个取前面2个的值，没有值
#1    NaN #第2个取前面2个的值，没有值
#2    1.0 #第3个为6取前面2个值也就是1
#3    3.0
#4    6.0
#dtype: float64

 s.diff(3)
#0     NaN # 第一个减前面3个的值，没有值
#1     NaN # 第2个减前面3个的值，没有值
#2     NaN # 第3个减前面3个的值，没有值
#3     9.0 # 第4个减前面3个的值，为10-1=9
#4    12.0
#dtype: float64

In [107]: s.pct_change()
#0         NaN
#1    2.000000
#2    1.000000
#3    0.666667
#4    0.500000
#dtype: float64 

In [108]: s.shift(-1)
#0     3.0
#1     6.0
#2    10.0
#3    15.0
#4     NaN
#dtype: float64

#s.diff(-2)
#0   -5.0
#1   -7.0
#2   -9.0
#3    NaN
#4    NaN
#dtype: float64

将其视作类滑窗函数的原因是，它们的功能可以用窗口大小为 n+1 (因为都是往前n个，再加上自己本身，所以是n+1)的 rolling 方法等价代替：

s.rolling(3).apply(lambda x:list(x)[0]) # s.shift(2)
#0    NaN
#1    NaN
#2    1.0
#3    3.0
#4    6.0
#dtype: float64

扩张窗口
扩张窗口又称累计窗口，可以理解为一个动态长度的窗口，其窗口的大小就是从序列开始处到具体操作的对应位置，其使用的聚合函数会作用于这些逐步扩张的窗口上。具体地说，设序列为a1, a2, a3, a4，则其每个位置对应的窗口即[a1]、[a1, a2]、[a1, a2, a3]、[a1, a2, a3, a4]。

s = pd.Series([1, 3, 6, 10])
s.expanding().mean()
#0    1.000000
#1    2.000000
#2    3.333333
#3    5.000000
#dtype: float64

React环境搭建及语法简介
React是目前最流行的前端框架之一，其核心是组件化开发和虚拟DOM。以下从基础语法到高级特性，为你提供系统化的学习路径和代码示例。一、基础环境搭建首先需要安装Node.js（包含npm或yarn），然后创建React项目：#使用create-react-app脚手架npxcreate-react-appmy-react-appcdmy-react-appnpmstart#启动开发服务器二、核心语
学习java基础：java开发常用技术 molihuaya 学习java java开发技术
基础部分1.线程和进程的区别线程三个基本状态：就绪、执行、阻塞线程五个基本操作：创建、就绪、运行、阻塞、终止进程四种形式：主从式、会话式、消息或邮箱机制、共享存储区方式进程是具有一定功能的程序关于某次数据集合上的一次运行活动，是系统进行资源分配和调度的一个独立单位。一个进程包含多个线程。线程是进程的一个实体，是CPU调度和分配的基本单元。2.JSP四大域对象和九大内置对象四大域对象：PageCon
如何高效记录并整理编程学习笔记？ FrostedLotus·霜莲数据挖掘
如何高效记录并整理编程学习笔记？在编程学习的海洋中，高效的笔记记录和整理方法就像一张珍贵的航海图，能够帮助我们在浩瀚的知识中找到方向。如何建立一个既能快速记录又易于回顾的笔记系统？如何在繁忙的学习中保持笔记的条理性？让我们一起探讨如何打造属于自己的编程学习“知识宝库”!方向一：笔记工具选择选择合适的笔记工具是高效记录编程学习笔记的第一步。不同的工具有其独特的优势，适合不同的学习风格和需求。以下是一
vue入门学习时，按照官方的教程生成的vue3项目后，命令行运行npm install出现一堆warn，然后运行npm run dev报错，项目启动失败 67号人生 vue小白学习 vue.js 学习 npm crypto.hash vue官方示例项目失败
日期：2025年6月27日星期五农历六月初三VUE版本：vue3IDE：vscodevue入门学习时，按照官方的教程生成的vue3项目后，命令行运行npminstall出现一堆warn，然后运行npmrundev报错，项目启动失败运行npminstall出现一堆warn运行npmrundev报错解决办法通过nvm安装较高版本的nodejs，或者手动冲nodejs官网下载。虽然vue官方推荐node
人脸识别接口&sdk，两张人脸相似度比对
人工智能时代，人脸识别技术正在被广泛应用于金融支付、安防监控、身份验证等多个领域，基于深度学习算法于海量样本训练，人脸识别接口以高精度、低延迟的特性出现在大众视野，成为开发者和企业用户集成人脸识别功能的首要选择之一。人脸识别接口技术服务原理：格式转换：支持BMP、JPG、PNG、TIF等多种常见图像格式；尺寸调整与压缩：建议图像大小控制在200KB左右，确保传输效率与识别质量；图像增强：自动旋转、
Kotlin 函数与 Lambda 表达式 Devil枫安卓 kotlin 开发语言 android
今天继续分享Kotlin学习内容。目标：掌握函数定义、调用、参数传递，以及Lambda表达式的基础用法1.函数：Kotlin的代码模块化工具定义：函数是可重复调用的代码块，用于封装逻辑。语法：fun函数名(参数列表):返回类型{//函数体return结果//可省略（若表达式函数或返回类型可推断）}示例1：基础函数fungreet(name:String):String{return"Hello,$
为什么 Python 是 AI 的首选语言？
文章目录一、简洁优雅，易于上手二、丰富的库和框架1.数据处理与分析2.数据可视化3.机器学习与深度学习框架三、强大的社区支持四、跨平台性和可移植性五、与其他语言的互操作性文章配套代码已上传，点击查看：https://download.csdn.net/download/2501_92578370/91180848在人工智能（AI）技术飞速发展的今天，编程语言的选择对AI开发者来说至关重要。当你翻开
Unity学习（C#）——字符串的方法 concamy c#
例1：创建字符串，求字符串长度，判断字符串是否为，取字符串中的字母，字符串相加。namespace_622字符串string{classProgram{staticvoidMain(string[]args){strings="sfdkgnd";
TypeScript基本类型
一、前言TypeScript是JavaScript的一个超集，它通过添加静态类型系统帮助开发者写出更健壮、可维护性更强的代码。而理解TypeScript的基本类型是学习TypeScript的第一步。本文将带你全面了解TypeScript中的常用基本类型，包括：✅数值类型✅字符串类型✅布尔类型✅null与undefined✅any与unknown✅never与void✅数组类型✅元组类型并通过大量代
【AI Infra】基础学习汇总篇逆羽飘扬 AI基础知识人工智能学习
系列综述：目的：本系列是个人整理为了学习训练框架优化的，整理期间苛求每个知识点，平衡理解简易度与深入程度。来源：材料主要源于【DeepEP官方介绍】进行的，每个知识点的修正和深入主要参考各平台大佬的文章，其中也可能含有少量的个人实验自证。结语：如果有帮到你的地方，就点个赞和关注一下呗，谢谢！！！请先收藏！！！，后续继续完善和扩充(●’◡’●)文章目录一、分布式与并行基础分布式计算高性能并行GPU硬
【教程4＞第7章＞第26节】基于FPGA的RS(204,188)译码verilog实现10——RS译码模块整体实现与性能仿真评估 fpga和matlab #第7章·通信—信道编译码 fpga开发 RS verilog RS译码教程4
本课程学习成果预览目录1.软件版本2.RS译码模块整体实现介绍2.1伴随式计算（SyndromeCalculation）2.2擦除位置处理（ErasureHandling）2.3多项式乘法（PolynomialMultiplication）2.4欧几里得算法（EuclideanAlgorithm）2.5钱搜索（ChienSearch）3.RS译码模块整体FPGA实现4.RS译码仿真测试5.视频操作
python有哪些函数怎么用_必须掌握的常用python函数有哪些？
必须掌握的常用python函数有哪些？更新时间：2020年11月02日作者：spoto必须掌握的常用Python的安装设置过程中需要注意的事项，今天我们就另一个学员们经常询问的问题进行解答。我们都知道Python有许多函数，但是因为数量庞大，难以全部掌握，所以今天我们帮助大家删繁就简，下面罗列了大家在学习过程中必须掌握的一些常用Python函数及其用途功能，希望大家认真学习，熟练应用。1.prin
强化学习贝尔曼方程推导愤怒的可乐强化学习人工智能概率论机器学习算法
引言强化学习中贝尔曼方程的重要性就不说了，本文利用高中生都能看懂的数学知识推导贝尔曼方程。回报折扣回报GtG_tGt的定义为：Gt=Rt+1+γRt+2+γ2Rt+3+⋯=∑k=0∞γkRt+k+1(1)G_t=R_{t+1}+\gammaR_{t+2}+\gamma^2R_{t+3}+\cdots=\sum_{k=0}^\infty\gamma^kR_{t+k+1}\tag1Gt=Rt+1+γR
Llama改进之——均方根层归一化RMSNorm 愤怒的可乐 NLP项目实战 #llama
引言在学习完GPT2之后，从本文开始进入Llama模型系列。本文介绍Llama模型的改进之RMSNorm(均方根层归一化)。它是由RootMeanSquareLayerNormalization论文提出来的，可以参阅其论文笔记1。LayerNorm层归一化(LayerNorm)对Transformer等模型来说非常重要，它可以帮助稳定训练并提升模型收敛性。LayerNorm针对一个样本所有特征计算
强化学习RLHF详解贝塔西塔强化学习大模型人工智能深度学习机器学习算法语言模型
RLHF（ReinforcementLearningfromHumanFeedback）模型详解一、背景1.传统强化学习的局限性传统的强化学习（ReinforcementLearning,RL）依赖于预定义的奖励函数（RewardFunction），但在复杂任务（如自然语言生成、机器人控制）中，设计精确的奖励函数极为困难。例如：模糊目标：生成“高质量文本”难以量化，无法用简单的指标（如BLEU、R
[学习]M-QAM的数学原理与调制解调原理详解（仿真示例）
M-QAM的数学原理与调制解调原理详解QAM（正交幅度调制）作为现代数字通信的核心技术，其数学原理和实现方法值得深入探讨。本文将分为数学原理、调制解调原理和实现要点三个部分进行系统阐述。文章目录M-QAM的数学原理与调制解调原理详解一、数学原理二、调制原理三、解调原理四、实现要点五、16QAM的Python仿真实现5.1完整仿真代码5.2关键代码解析5.3仿真结果分析六、性能优化方向七、MATLA
lesson1：Python入门知识你的电影很有趣 python 开发语言
目录文章目录前言一、python的语言特性1、语法简练2、解释型语言2.1解释型语言特点2.2编译型语言特点2.3执行效率比较3、标准库/第三方库4、支持面向对象二、windows常用命令三、程序的基本组成1、输入input2、运算3、输出print总结前言开始学习python的第一课一、python的语言特性1、语法简练变量不需要声明类型2、解释型语言2.1解释型语言特点需要解释器通过解释器逐行
学习笔记-JVM GC 绝不秃头的L君学习笔记 jvm jvm.gc
1.GC分类PartialGC并不会收集整个堆空间，仅仅包括新生代和老年代，不包含永久代（元空间）。YoungGC:只收集YoungGen的垃圾收集过程。OldGC：只收集OldGen的垃圾收集过程。（只有CMS的并发收集是这个模式）MixedGC：收集整个YoungGen以及部分OldGen的垃圾收集过程。（只有G1有这个模式）FullGC收集整个堆，包括YoungGen、OldGen以及Per
spring bean生命周期学习记录不会吃萝卜的兔子 spring 学习 java
在SimpleAutowareConfig??中1，第三级缓存存放createBean的lambda表达式（BeanFactory采用函数式接口，使用时才会创建），当获取循环引用获取早期对象时（只实例化的bean），这个早期对象不知道有没有被AOP修饰，但AOP代理，要拿到完整的对象，才能正确代理，但是代理在beanAfterPostProcessor发生在popularBean属性填充之前。2，
从入门到精通：YashanDB数据库学习指南数据库
在现代的数据库技术领域，性能瓶颈和数据一致性问题是开发人员和数据库管理员（DBA）面临的重要挑战。随着数据量的激增和对实时分析的需求上升，如何有效管理和利用数据库显得尤为重要。YashanDB作为一款新兴数据库，提供了一系列功能以应对这些挑战，适合希望深入理解数据库体系结构的开发者和DBA。本文旨在提供一份全面的YashanDB学习指南，内容涵盖系统架构、核心功能，并为实际应用提供具体建议，使读者
【学习笔记】jvm liu1251303815 学习笔记 jvm
1、jvm基础1.1什么是jvm?jvm是一种规范。jvm是一种什么样的规范？具体实现：hotspot2classFileFormat3：类加载-初始化3.1、loading加载class文件到内存中3.1.1引起类加载的情况new对象时调用静态属性，静态方法时。(访问staticfinal变量除外staticfinal修饰的是基本数据类型,或者字符串类型时,会替换为常量。比如有一个类A{stat
JVM GC学习记录不会吃萝卜的兔子 JVM GC jvm 学习 java GC
垃圾标记算法：引用计数：解决不了垃圾对象循环引用问题。root扫描（可达性分析）：从根对象（线程、main函数、静态变量、常量）扫描。三色标记：黑：其下所有子树，引用均被标记完成，是存活的最终状态。灰：其下所有子树，但引用的对象尚未完全检查，是存活的过渡状态。白：对象未被标记，默认初始状态，标记结束后仍为白色的对象将被回收。标记时会STW扫描根节点，然后标记线程与业务线程并行存在；会产生情况2，业
解密GPT工作原理：Transformer架构详解与自注意力机制剖析 AI智能应用 gpt transformer 架构 ai
解密GPT工作原理：Transformer架构详解与自注意力机制剖析关键词：GPT、Transformer、自注意力机制、神经网络、语言模型、深度学习、人工智能摘要：本文将深入浅出地解析GPT模型的核心架构——Transformer，重点剖析其革命性的自注意力机制。我们将从基本概念出发，通过生活化的比喻解释复杂的技术原理，并用Python代码示例展示实现细节，最后探讨这一技术的应用场景和未来发展方
ChatGPT、DeepSeek等大语言模型技术教程
随着人工智能技术的快速发展，大语言模型如ChatGPT和DeepSeek在科研领域的应用正在为科研人员提供强大的支持。这些模型通过深度学习和大规模语料库训练，能够帮助科研人员高效地筛选文献、生成论文内容、进行数据分析和优化机器学习模型。ChatGPT和DeepSeek能够快速理解和生成复杂的语言，帮助研究人员在撰写论文时提高效率，不仅生成高质量的文章内容，还能优化论文结构和语言表达。在数据分析方面
C++编程：打造角色扮演游戏夏勇兴
本文还有配套的精品资源，点击获取简介：本项目“C++实现的角色扮演游戏”通过构建一个游戏示例，帮助学习者掌握C++编程，特别是C++17特性。项目涵盖了类、对象、继承、多态、模板、异常处理、文件操作、动态内存管理、STL、函数与运算符重载、构造和析构函数等关键概念。参与者将通过实际操作，加深对面向对象编程的理解，并为复杂项目开发打下基础。1.C++编程基础和C++17特性1.1C++编程的起源与优
提升学习能力(一) 如果决定要走又何必挽留学习方法学习
前言:在学习一项技能在时候,通常会感到学了一遍,,没有任何的头绪,一直在通过做的时候通过来总结来去干,这样往往在学习的时候,不能事半功倍,在学习的时候也没有任何方法,毫无头绪,于是想写点关于提升学习能力的东西,刚才在前面的介绍说了,对于别人的教学没有任何头绪,下面的学习四步骤通过借鉴别人的学习经验,每个人的学习技巧,方法,都不一样,适合自己的才是做好的。一.学习方法1:兴趣法，有很多不感兴趣的东西
Vue学习之路04----响应式基础利刃之灵 #Vue基础 vue.js 前端
响应式基础ref()（基本类型的响应式数据）在组合式API中，推荐使用ref()函数来声明响应式状态，ref能定义基本类型的，也能定义对象类型的：import{ref}from'vue'letcount=ref(0)ref()接收参数，并将其包裹在一个带有.value属性的ref对象中返回，在模版中则不需要：{{count}}按钮1按钮2import{ref}from"vue";exportdef
强化学习【chapter0】-学习路线图明朝百晓生算法人工智能机器学习
前言：主要总结一下西湖大学赵老师的课程【强化学习的数学原理】课程：从零开始到透彻理解（完结）_哔哩哔哩_bilibili1️⃣基础阶段（Ch1-Ch7）：掌握表格型算法，理解TD误差与贝尔曼方程2️⃣进阶阶段（Ch8-Ch9）：动手实现DQN/策略梯度，熟悉PyTorch/TensorFlow3️⃣前沿阶段（Ch10：阅读论文（OpenAISpinningUp/RLlib文档）Chapter1：基
GtkSharp跨平台WinForm实现
文章目录跨平台架构设计跨平台项目配置GtkSharp串口通讯实现跨平台部署配置Linux系统配置macOS系统配置相关学习资源GTK#跨平台开发跨平台.NET开发Linux开发环境macOS开发环境跨平台UI框架对比容器化部署开源项目参考性能优化与调试跨平台架构设计基于GTKSystem.Windows.Forms框架，我们可以实现真正的跨平台WinForm串口通讯应用：共享代码层macOS环境L
docker容器学习基础篇
docker容器学习基础篇为什么要学docker在开发工作中，都是团队协作开发的，不同开发人员的代码运行环境，配置环境等等都不同，这回在整合过程中浪费太多时间，降低开发效率，而docker容器可以模拟配置环境等，解决了代码’'水土不服”的问题，对于要就业的小伙伴，docker是一项必须要掌握的技术。什么是dockerDocker是基于Go语言实现的云开源项目，Docker容器在任何操作系统上都是一
js动画html标签（持续更新中） 843977358 html js 动画 media opacity
1.jQuery 效果 - animate() 方法改变 "div" 元素的高度： $(".btn1").click(function(){ $("#box").animate({height:"300px
springMVC学习笔记 caoyong springMVC
1、搭建开发环境 a>、添加jar文件，在ioc所需jar包的基础上添加spring-web.jar,spring-webmvc.jar b>、在web.xml中配置前端控制器 <servlet> &nbs
POI中设置Excel单元格格式 107x poi style 列宽合并单元格自动换行
引用：http://apps.hi.baidu.com/share/detail/17249059 POI中可能会用到一些需要设置EXCEL单元格格式的操作小结：先获取工作薄对象: HSSFWorkbook wb = new HSSFWorkbook(); HSSFSheet sheet = wb.createSheet(); HSSFCellStyle setBorder = wb.
jquery 获取A href 触发js方法的this参数无效的情况一炮送你回车库 jquery
html如下： <td class=\"bord-r-n bord-l-n c-333\"> <a class=\"table-icon edit\" onclick=\"editTrValues(this);\">修改</a> </td>" j
md5 3213213333332132 MD5
import java.security.MessageDigest; import java.security.NoSuchAlgorithmException; public class MDFive { public static void main(String[] args) { String md5Str = "cq
完全卸载干净Oracle11g sophia天雪 orale数据库卸载干净清理注册表
完全卸载干净Oracle11g A、存在OUI卸载工具的情况下：第一步：停用所有Oracle相关的已启动的服务；第二步：找到OUI卸载工具：在“开始”菜单中找到“oracle_OraDb11g_home”文件夹中 &
apache 的access.log 日志文件太大如何解决 darkranger apache
CustomLog logs/access.log common 此写法导致日志数据一致自增变大。直接注释上面的语法 #CustomLog logs/access.log common 增加： CustomLog "|bin/rotatelogs.exe -l logs/access-%Y-%m-d.log
Hadoop单机模式环境搭建关键步骤 aijuans 分布式
Hadoop环境需要sshd服务一直开启，故，在服务器上需要按照ssh服务，以Ubuntu Linux为例，按照ssh服务如下： sudo apt-get install ssh sudo apt-get install rsync 编辑HADOOP_HOME/conf/hadoop-env.sh文件，将JAVA_HOME设置为Java
PL/SQL DEVELOPER 使用的一些技巧 atongyeye java sql
1 记住密码这是个有争议的功能，因为记住密码会给带来数据安全的问题。但假如是开发用的库，密码甚至可以和用户名相同，每次输入密码实在没什么意义，可以考虑让PLSQL Developer记住密码。位置：Tools菜单－－Preferences－－Oracle－－Logon HIstory－－Store with password 2 特殊Copy 在SQL Window
PHP：在对象上动态添加一个新的方法 bardo 方法动态添加闭包
有关在一个对象上动态添加方法，如果你来自Ruby语言或您熟悉这门语言，你已经知道它是什么...... Ruby提供给你一种方式来获得一个instancied对象，并给这个对象添加一个额外的方法。好！不说Ruby了，让我们来谈谈PHP PHP未提供一个“标准的方式”做这样的事情，这也是没有核心的一部分... 但无论如何，它并没有说我们不能做这样
ThreadLocal与线程安全 bijian1013 java java多线程 threadLocal
首先来看一下线程安全问题产生的两个前提条件： 1.数据共享，多个线程访问同样的数据。 2.共享数据是可变的，多个线程对访问的共享数据作出了修改。实例：定义一个共享数据： public static int a = 0;
Tomcat 架包冲突解决征客丶 tomcat Web
环境： Tomcat 7.0.6 win7 x64 错误表象：【我的冲突的架包是：catalina.jar 与 tomcat-catalina-7.0.61.jar 冲突，不知道其他架包冲突时是不是也报这个错误】严重: End event threw exception java.lang.NoSuchMethodException: org.apache.catalina.dep
【Scala三】分析Spark源代码总结的Scala语法一 bit1129 scala
Scala语法 1. classOf运算符 Scala中的classOf[T]是一个class对象，等价于Java的T.class,比如classOf[TextInputFormat]等价于TextInputFormat.class 2. 方法默认值 defaultMinPartitions就是一个默认值，类似C++的方法默认值
java 线程池管理机制 BlueSkator java线程池管理机制
编辑 Add Tools jdk线程池一、引言第一：降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。第二：提高响应速度。当任务到达时，任务可以不需要等到线程创建就能立即执行。第三：提高线程的可管理性。线程是稀缺资源，如果无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性，使用线程池可以进行统一的分配，调优和监控。
关于hql中使用本地sql函数的问题（问-答） BreakingBad HQL 存储函数
转自于：http://www.iteye.com/problems/23775 问：我在开发过程中，使用hql进行查询（mysql5）使用到了mysql自带的函数find_in_set()这个函数作为匹配字符串的来讲效率非常好，但是我直接把它写在hql语句里面（from ForumMemberInfo fm,ForumArea fa where find_in_set(fm.userId,f
读《研磨设计模式》-代码笔记-迭代器模式-Iterator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.Arrays; import java.util.List; /** * Iterator模式提供一种方法顺序访问一个聚合对象中各个元素，而又不暴露该对象内部表示 * * 个人觉得，为了不暴露该
常用SQL chenjunt3 oracle sql C++c C#
--NC建库 CREATE TABLESPACE NNC_DATA01 DATAFILE 'E:\oracle\product\10.2.0\oradata\orcl\nnc_data01.dbf' SIZE 500M AUTOEXTEND ON NEXT 50M EXTENT MANAGEMENT LOCAL UNIFORM SIZE 256K ; CREATE TABLESPA
数学是科学技术的语言 comsci 工作活动领域模型
从小学到大学都在学习数学，从小学开始了解数字的概念和背诵九九表到大学学习复变函数和离散数学，看起来好像掌握了这些数学知识，但是在工作中却很少真正用到这些知识，为什么？最近在研究一种开源软件-CARROT2的源代码的时候，又一次感觉到数学在计算机技术中的不可动摇的基础作用，CARROT2是一种用于自动语言分类（聚类）的工具性软件，用JAVA语言编写，它
Linux系统手动安装rzsz 软件包 daizj linux sz rz
1、下载软件 rzsz-3.34.tar.gz。登录linux，用命令 wget http://freeware.sgi.com/source/rzsz/rzsz-3.48.tar.gz下载。 2、解压 tar zxvf rzsz-3.34.tar.gz 3、安装 cd rzsz-3.34 ; make posix 。注意：这个软件安装与常规的GNU软件不
读源码之:ArrayBlockingQueue dieslrae java
ArrayBlockingQueue是concurrent包提供的一个线程安全的队列,由一个数组来保存队列元素.通过 takeIndex和 putIndex来分别记录出队列和入队列的下标,以保证在出队列时不进行元素移动. //在出队列或者入队列的时候对takeIndex或者putIndex进行累加,如果已经到了数组末尾就又从0开始,保证数
C语言学习九枚举的定义和应用 dcj3sjt126com c
枚举的定义 # include <stdio.h> enum WeekDay { MonDay, TuesDay, WednesDay, ThursDay, FriDay, SaturDay, SunDay }; int main(void) { //int day; //day定义成int类型不合适 enum WeekDay day = Wedne
Vagrant 三种网络配置详解 dcj3sjt126com vagrant
Forwarded port Private network Public network Vagrant 中一共有三种网络配置，下面我们将会详解三种网络配置各自优缺点。端口映射(Forwarded port)，顾名思义是指把宿主计算机的端口映射到虚拟机的某一个端口上，访问宿主计算机端口时，请求实际是被转发到虚拟机上指定端口的。Vagrantfile中设定语法为： c
16.性能优化-完结 frank1234 性能优化
性能调优是一个宏大的工程，需要从宏观架构(比如拆分，冗余，读写分离，集群，缓存等)，软件设计（比如多线程并行化，选择合适的数据结构），数据库设计层面（合理的表设计，汇总表，索引，分区，拆分，冗余等）以及微观（软件的配置，SQL语句的编写，操作系统配置等）根据软件的应用场景做综合的考虑和权衡，并经验实际测试验证才能达到最优。性能水很深，笔者经验尚浅，赶脚也就了解了点皮毛而已，我觉得
Word Search hcx2013 search
Given a 2D board and a word, find if the word exists in the grid. The word can be constructed from letters of sequentially adjacent cell, where "adjacent" cells are those horizontally or ve
Spring4新特性——Web开发的增强 jinnianshilongnian spring spring mvc spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装配置tengine并设置开机启动 liuxingguome centos
yum install gcc-c++ yum install pcre pcre-devel yum install zlib zlib-devel yum install openssl openssl-devel Ubuntu上可以这样安装 sudo aptitude install libdmalloc-dev libcurl4-opens
第14章工具函数（上） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Xelsius 2008 and SAP BW at a glance blueoxygen BO Xelsius
Xelsius提供了丰富多样的数据连接方式，其中为SAP BW专属提供的是BICS。那么Xelsius的各种连接的优缺点比较以及Xelsius是如何直接连接到BEx Query的呢？以下Wiki文章应该提供了全面的概览。 http://wiki.sdn.sap.com/wiki/display/BOBJ/Xcelsius+2008+and+SAP+NetWeaver+BW+Co
oracle表空间相关 tongsh6 oracle
在oracle数据库中，一个用户对应一个表空间，当表空间不足时，可以采用增加表空间的数据文件容量，也可以增加数据文件，方法有如下几种： 1.给表空间增加数据文件 ALTER TABLESPACE "表空间的名字" ADD DATAFILE '表空间的数据文件路径' SIZE 50M; &nb
.Net framework4.0安装失败 yangjuanjava .net windows
上午的.net framework 4.0，各种失败，查了好多答案，各种不靠谱，最后终于找到答案了和Windows Update有关系，给目录名重命名一下再次安装，即安装成功了！下载地址：http://www.microsoft.com/en-us/download/details.aspx?id=17113 方法： 1.运行cmd，输入net stop WuAuServ 2.点击开