weixin_39896617

huggingface实操_百度NLP预训练模型ERNIE2.0最强实操课程来袭！【附教程】

2019年3月，百度正式发布NLP模型ERNIE，其在中文任务中全面超越BERT一度引发业界广泛关注和探讨。经过短短几个月时间，百度ERNIE再升级，发布持续学习的语义理解框架ERNIE 2.0，及基于此框架的ERNIE 2.0预训练模型。继1.0后，ERNIE英文任务方面取得全新突破，在共计16个中英文任务上超越了BERT和XLNet, 取得了SOTA效果。

本篇内容可以说是史上最强实操课程，由浅入深完整带大家试跑ERNIE，大家可前往AI Studio fork代码 (https://aistudio.baidu.com/aistudio/projectdetail/117030)，运行即可获赠12小时GPU算力，每天都有哦~

一、基础部分

1.1 准备代码、数据、模型

step1：下载ERNIE代码。温馨提示：如果下载慢，暂停重试

!git clone --depth 1 https://github.com/PaddlePaddle/ERNIE.git

step2：下载并解压finetune数据

!wget --no-check-certificate https://ernie.bj.bcebos.com/task_data_zh.tgz

!tar xf task_data_zh.tgz

step3：下载预训模型

!wget --no-check-certificate https://ernie.bj.bcebos.com/ERNIE_1.0_max-len-512.tar.gz

!mkdir -p ERNIE1.0

!tar zxf ERNIE_1.0_max-len-512.tar.gz -C ERNIE1.0

备用方案，如果下载慢的话，可以用我们预先下载好的代码和数据

%cd ~

!cp -r work/ERNIE1.0 ERNIE1.0

!cp -r work/task_data task_data

!cp -r work/lesson/ERNIE ERNIE

完成ERNIE代码部分的准备之后，让我们一起以一个序列标注任务来举例。

什么是序列标注任务？

下面这张图可以概括性的让大家理解序列标注任务：

序列标注的任务可以用来做什么？

可以：信息抽取、数据结构化，帮助搜索引擎搜索的更精准

可以：…

序列标注任务: 一起来看看这个任务的数据长什么样子吧？

序列标注任务输入数据包含2部分：

1)标签映射文件：存储标签到ID的映射。

2)训练测试数据：2列，文本、标签(文本中每个字之间使用隐藏字符\2分割，标签同理。)

# 标签映射文件

!cat task_data/msra_ner/label_map.json

{

"B-PER": 0,

"I-PER": 1,

"B-ORG": 2,

"I-ORG": 3,

"B-LOC": 4,

"I-LOC": 5,

"O": 6

}

# 测试数据

!head task_data/msra_ner/dev.tsv

B: Begin

I: Inside

O: Outside

ERNIE应用于序列化标注

1.2 利用ERNIE做Finetune

step1：设置环境变量

%cd ERNIE

!ln -s ../task_data

!ln -s ../ERNIE1.0

%env TASK_DATA_PATH=task_data

%env MODEL_PATH=ERNIE1.0

!echo "task_data_path: ${TASK_DATA_PATH}"

!echo "model_path: ${MODEL_PATH}"

step2：运行finetune脚本

!sh script/zh_task/ernie_base/run_msra_ner.sh

1.3将Finetune结果打印

在finetune过程中，会自动保存对test集的预测结果，我们可以查看预测结果是否符合预期。

由于Finetune需要一些时间，所以不等Finetune完了，直接查看我们之前已经Finetune收敛后的模型与test集的预测结果

%cd ~

show_ner_prediction('work/lesson/test_result.5.final')

二、进阶部分

2.1 GPU显存过小，如何使用ERNIE？

脚本进阶：模型太大，无法完全放进显存的情况下，如何只使用前3层参数热启Finetune？

如果能只加载几层模型就好了！

方法：只需要修改一行配置文件ernie_config.json，就能自动的使用前3层参数热启Finetune。

提示：ernie_config.json在ERNIE1.0发布的预训练模型中

TODO 结合“终端”标签，运行一下吧

提示：您可以需要用到sed与pwd命令

step1：设置环境变量

%cd ~%cd ERNIE

!ln -s ../task_data

!ln -s ../ERNIE1.0

%env TASK_DATA_PATH=task_data

%env MODEL_PATH=ERNIE1.0

!echo "task_data_path: ${TASK_DATA_PATH}"

!echo "model_path: ${MODEL_PATH}"

!pwd

!sh script/zh_task/ernie_base/run_msra_ner.sh

2.2如何将ERNIE适配我的业务数据？

数据进阶：如何修改输入格式？

假设msra ner任务的输入数据格式变了，每条样本不是以行式保存，而是以列式保存。列式保存是指，每条样本由多行组成，每行包含一个字符和对应的label，不同样本间以空行分割，具体样例如下：

text_a label

海 O

钓 O

比 O

赛 O

地 O

点 O

在 O

厦 B-LOC

门 I-LOC

与 O

金 B-LOC

门 I-LOC

之 O

间 O

的 O

海 O

域 O

。 O

当输入数据为列式时，我们如何修改ERNIE的数据处理代码，以适应新的数据格式。

首先，我们先大致了解一下ERNIE的数据处理流程：

ERNIE对于finetune任务的所有数据处理代码都在reader/task_reader.py中，里面已经预先写好了适合多种不同类型任务的Reader类，ERNIE通过Reader读取并处理数据给后续模型使用。

Reader类对数据处理流程做了以下几步抽象：

step 1. 从文件中逐条读取样本，通过_read_tsv等方法，读取不同格式的文件，并将读取的每条样本存入一个list

step 2. 逐一将读取的样本转化为Record。Record中包含了一条样本经过数据处理后，模型所需要的所有features。处理成Record的流程一般又分以下几步：

1. 将文本tokenize，超过最大长度时截断；

2. 加入'[CLS]'、'[SEP]'等标记符后，将文本ID化；

3. 生成每个token对应的position和token_type信息。

step 3. 将多个Record组成batch，同一个batch内feature长度不一致时，padding至batch内最大的feature长度。

了解了ERNIE的数据处理流程以后，我们发现当输入数据格式变了，我们只需要修改第1步的代码，保持其他代码不变，就能适应新的数据格式。具体来说，只需要在reader/task_reader.py的 SequenceLabelReader 类中，加入下面的 _read_tsv 函数(重写基类 BaseReader 的 _read_tsv)。

def _read_tsv(self, input_file, quotechar=None):

with open(input_file, 'r', encoding='utf8') as f:

reader = csv_reader(f)

headers = next(reader)

text_indices = [

index for index, h in enumerate(headers) if h != 'label'

]

Example = namedtuple('Example', headers)

examples = []

buf_t, buf_l = [], []

for line in reader:

if len(line) != 2:

assert len(buf_t) == len(buf_l)

example = Example(u'^B'.join(buf_t), u'^B'.join(buf_l))

examples.append(example)

buf_t, buf_l = [], []

continue

if line[0].strip() == '':

continue

buf_t.append(line[0])

buf_l.append(line[1])

if len(buf_t) > 0:

assert len(buf_t) == len(buf_l)

example = Example(u'^B'.join(buf_t), u'^B'.join(buf_l))

examples.append(example)

buf_t, buf_l = [], []

return examples

我们将已经修改好的数据和代码，预先放在work/lesson/2目录中，可以替换掉ERNIE项目中对应的文件，然后尝试运行

%cd ~

!cp -r work/lesson/2/msra_ner_columnwise task_data/msra_ner_columnwise

!cp -r work/lesson/2/task_reader.py ERNIE/reader/task_reader.py

!cp -r work/lesson/2/run_msra_ner.sh ERNIE/script/zh_task/ernie_base/run_msra_ner_columnwise.sh

%cd ERNIE

!ln -s ../task_data

!ln -s ../ERNIE1.0

%env TASK_DATA_PATH=task_data

%env MODEL_PATH=ERNIE1.0 !sh script/zh_task/ernie_base/run_msra_ner_columnwise.sh

2.3在哪里改模型结构？

模型进阶：如何将序列标注任务的损失函数替换为CRF？

目前序列标注任务的finetune代码中，以 softmax ce 作为损失函数，该损失函数较为简单，没有考虑到序列中词与词之间的联系，如何替换一个更优秀的损失函数呢？

我们只需要修改其中的create_model函数，将 softmax ce 损失函数部分，替换为 linear_chain_crf 即可，具体代码如下：

def create_model(args, pyreader_name, ernie_config, is_prediction=False):

pyreader = fluid.layers.py_reader(

capacity=50,

shapes=[[-1, args.max_seq_len, 1], [-1, args.max_seq_len, 1],

[-1, args.max_seq_len, 1], [-1, args.max_seq_len, 1],

[-1, args.max_seq_len, 1], [-1, args.max_seq_len, 1], [-1, 1]],

dtypes=[

'int64', 'int64', 'int64', 'int64', 'float32', 'int64', 'int64'

lod_levels=[0, 0, 0, 0, 0, 0, 0],

name=pyreader_name,

use_double_buffer=True)

(src_ids, sent_ids, pos_ids, task_ids, input_mask, labels,

seq_lens) = fluid.layers.read_file(pyreader)

ernie = ErnieModel(

src_ids=src_ids,

position_ids=pos_ids,

sentence_ids=sent_ids,

task_ids=task_ids,

input_mask=input_mask,

config=ernie_config,

use_fp16=args.use_fp16)

enc_out = ernie.get_sequence_output()

enc_out = fluid.layers.dropout(

x=enc_out, dropout_prob=0.1, dropout_implementation="upscale_in_train")

logits = fluid.layers.fc(

input=enc_out,

size=args.num_labels,

num_flatten_dims=2,

param_attr=fluid.ParamAttr(

name="cls_seq_label_out_w",

initializer=fluid.initializer.TruncatedNormal(scale=0.02)),

bias_attr=fluid.ParamAttr(

name="cls_seq_label_out_b",

initializer=fluid.initializer.Constant(0.)))

infers = fluid.layers.argmax(logits, axis=2)

ret_infers = fluid.layers.reshape(x=infers, shape=[-1, 1])

lod_labels = fluid.layers.sequence_unpad(labels, seq_lens)

lod_infers = fluid.layers.sequence_unpad(infers, seq_lens)

lod_logits = fluid.layers.sequence_unpad(logits, seq_lens)

(_, _, _, num_infer, num_label, num_correct) = fluid.layers.chunk_eval(

input=lod_infers,

label=lod_labels,

chunk_scheme=args.chunk_scheme,

num_chunk_types=((args.num_labels-1)//(len(args.chunk_scheme)-1)))

probs = fluid.layers.softmax(logits)

crf_loss = fluid.layers.linear_chain_crf(

input=lod_logits,

label=lod_labels,

param_attr=fluid.ParamAttr(

name='crf_w',

initializer=fluid.initializer.TruncatedNormal(scale=0.02)))

loss = fluid.layers.mean(x=crf_loss)

graph_vars = {

"inputs": src_ids,

"loss": loss,

"probs": probs,

"seqlen": seq_lens,

"num_infer": num_infer,

"num_label": num_label,

"num_correct": num_correct,

}

for k, v in graph_vars.items():

v.persistable = True

return pyreader, graph_vars

我们将已经修改好的数据和代码，预先放在work/lesson/3 目录中，可以替换掉ERNIE项目中对应的文件，然后尝试运行

%cd ~

!cp -r work/lesson/3/sequence_label.py ERNIE/finetune/sequence_label.py

%cd ERNIE

!ln -s ../task_data

!ln -s ../ERNIE1.0

%env TASK_DATA_PATH=task_data

%env MODEL_PATH=ERNIE1.0

!sh script/zh_task/ernie_base/run_msra_ner_columnwise.sh

修改后重新运行finetune脚本：

sh script/zh_task/ernie_base/run_msra_ner.sh等待运行完后，取最后一次评估结果，对比如下:

划重点！

查看ERNIE模型使用的完整内容和教程，请点击下方链接，建议Star收藏到个人主页，方便后续查看。

GitHub：https://github.com/PaddlePaddle/ERNIE

版本迭代、最新进展都会在GitHub第一时间发布，欢迎持续关注！

也邀请大家加入ERNIE官方技术交流**QQ群：760439550**，可在群内交流技术问题，会有ERNIE的研发同学为大家及时答疑解惑。

中文预训练模型ERNIE2.0模型下载及安装

2019年7月,百度ERNIE再升级,发布持续学习的语义理解框架ERNIE 2.0,及基于此框架的ERNIE 2.0预训练模型, 它利用百度海量数据和飞桨(PaddlePaddle)多机多卡高效训练优 ...

NLP预训练模型-百度ERNIE2.0的效果到底有多好【附用户点评】

ERNIE是百度自研的持续学习语义理解框架,该框架支持增量引入词汇(lexical).语法 (syntactic) .语义(semantic)等3个层次的自定义预训练任务,能够全面捕捉训练语料中的词法 ...

最强中文NLP预训练模型艾尼ERNIE官方揭秘【附视频】

“最近刚好在用ERNIE写毕业论文” “感觉还挺厉害的” “为什么叫ERNIE啊,这名字有什么深意吗?” “我想让艾尼帮我写作业” 看了上面火热的讨论,你一定很好奇“艾尼”.“ERNIE”到底是个啥? ...

【转载】最强NLP预训练模型！谷歌BERT横扫11项NLP任务记录

本文介绍了一种新的语言表征模型 BERT--来自 Transformer 的双向编码器表征.与最近的语言表征模型不同,BERT 旨在基于所有层的左.右语境来预训练深度双向表征.BERT 是首个在大批句 ...

最强 NLP 预训练模型库 PyTorch-Transformers 正式开源：支持 6 个预训练框架，27 个预训练模型

先上开源地址: https://github.com/huggingface/pytorch-transformers#quick-tour 官网: https://huggingface.co/py ...

自然语言处理(三) 预训练模型：XLNet 和他的先辈们

预训练模型在CV中,预训练模型如ImagNet取得很大的成功,而在NLP中之前一直没有一个可以承担此角色的模型,目前,预训练模型如雨后春笋,是当今NLP领域最热的研究领域之一. 预训练模型属于迁移学 ...

我的Keras使用总结(4)——Application中五款预训练模型学习及其应用

本节主要学习Keras的应用模块 Application提供的带有预训练权重的模型,这些模型可以用来进行预测,特征提取和 finetune,上一篇文章我们使用了VGG16进行特征提取和微调,下面尝试一 ...

BERT预训练模型的演进过程！(附代码)

1. 什么是BERT BERT的全称是Bidirectional Encoder Representation from Transformers,是Google2018年提出的预训练模型,即双向Tr ...

XLNet预训练模型，看这篇就够了！(代码实现)

1. 什么是XLNet XLNet 是一个类似 BERT 的模型,而不是完全不同的模型.总之,XLNet是一种通用的自回归预训练方法.它是CMU和Google Brain团队在2019年6月份发布的模 ...

随机推荐

PDO防sql注入原理分析

使用pdo的预处理方式可以避免sql注入. 在php手册中'PDO--预处理语句与存储过程'下的说明: 很多更成熟的数据库都支持预处理语句的概念.什么是预处理语句?可以把它看作是想要运行的 SQL 的 ...

SQL Server 分区表

分区表可以提高查询效率但是如果是分区表的话,表数据就会按照你指定的规则分放到不同的文件里,把一个大的数据文件拆分为多个小文件,还可以把这些小文件放在不同的磁盘下由多个cpu进行处理.这样文件的大小随 ...

【Android】Android内存机制，了解Android堆和栈

1.dalvik的Heap和Stack 这里说的只是dalvik java部分的内存,实际上除了dalvik部分,还有native. 下面针对上面列出的数据类型进行说明,只有了解了我们申请的数 ...

Codeforces Round #147 (Div. 2)

A. Free Cash 判断值相同的最长长度. B. Young Table 按从上到下,从左到右排序,每个位置最多交换一次. C. Primes on Interval $p_i$表示位置\( ...

zedboard--Opencv移植和zedboard测试(十一)

继上次生成了ARM架构的链接库之后,我们要把他们拷贝到装载有文件系统的SD卡中即可,在拷贝时,最好是/usr/lib下实践一:将那些lib拷贝到U盘里面,因为之前跑过demo,里面就是一个简易的li ...

总结JAVA----IO流中的File类

对于IO流中File类的总结 File类的基本概念 File类只能用于完成对于文件属性(是否存在.可读性.长度)的一些操作,不能用于文件的访问. File类的对象 File类的对象存储的是文件的绝对路 ...

Perl解除引用：从引用还原到数据对象

使用引用可以指向数据对象,这似乎很简单. @name1=qw(longshuai wugui); @name2=qw(xiaofang tuner); $ref_name=\@name1; push ...

ViewPager Fragment 懒加载可见总结 MD

Markdown版本笔记我的GitHub首页我的博客我的微信我的邮箱 MyAndroidBlogs baiqiantao baiqiantao bqt20094 baiqiantao@sina ...

Struts2 Intercepter 笔记

以前一直对Struts2的自定义拦截器(intercepter)不是很清楚,今天仔细研究了下,终于搞懂了,现在记录对拦截器的总结如下: 1:自定义拦截器的作用一般就是用来实现系统权限控制比较多: 2: ...

IDEA教程之导入maven项目

通过从网上的开源项目下载源码,一般都是maven管理的项目,此类项目可以通过导入快捷运行项目,如图为下载的一个项目: 2 打开IDEA,点击第二个选项“Import Porject”,然后选择源码根目 ...

你可能感兴趣的:(huggingface实操)

node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
钟汉良日记：自媒体写作要向古代拜师学艺的人取经钟汉良日记
2022年9月8日周四晴朗的天前几天晚上，和实操班的学员谈了很多为什么要写日记的原因。前后两个多小时，推荐了好几本书，隔了一天再回忆竟然不能把所有的书籍都列出来。是自己年龄大了，记忆力衰退了？我觉得不是。而是谈话这种氛围，比起文字写作更容易激发我们的潜能。一些灵光乍现的想法，会在那种特别融洽的时候突然涌现出来。有的想法和总结，你平时就是绞尽脑汁也想不出来，但就是在那种你侃侃而谈的时候，思想会像流水
ComfyUI AnimateDiff-Lightning 教程 jayli517 ComfyUI AIGC
介绍项目主页：https://huggingface.co/ByteDance/AnimateDiff-Lightning在线测试（有墙）：https://huggingface.co/spaces/ByteDance/AnimateDiff-Lightning国内镜像：https://hf-mirror.com/ByteDance/AnimateDiff-LightningAnimateDiff
2023-01-08 d8f93a389a3c
走进心时代马上一年了，这一年中上了三次线上实操班和三次导师班课，六月份上了一次线下导师班。如果要问实操班和导师班有什么不同，有哪些不一样的收获？我的感觉是实操班更多的是方法，遇到问题可以直接拿来用的，是技术层面的。导师班是修个人成长的、向内的、寻根问底的，解决我们为什么会在生活中遇到的这样那样的问题，原因出在哪里。通过一次次的学习，改变我的认知，又重建了认知，打破了固有思维的墙，窗户纸层层的被捅破
外卖会员卡项目怎么做？外卖会员卡项目实操讲解鲸天千流微信小程序
外卖会员卡项目实操外卖会员卡项目是吃喝玩乐集于一身的一款平台，它是提供个性化优惠，积分，储值及其他服务的一项推广计划，简单来说就是你通过推广外卖会员卡获得佣金，用户通过你的会员卡获得更多的优惠与权益，从而实现互利互赢。简单来说就是小程序推广功能：领外卖优惠券，看电影，交话费，打车等一系列都可以省钱，用户只要在小程序里消费，都可以拿到一笔官定的佣金。项目详细讲说：一、小程序中有什么优惠的地方可以吸引
5条实操干货有效打造你的个人品牌长安行动派
这是ZerK的第46篇原创相信大家对个人品牌这个词已经不在陌生。尤其是在知识付费的年代，你的个人品牌，就是你的标签！在《深度工作》中说到，在未来有三种人会越来越贵第一种人:能与机器对话，操纵机器的人。人工智能时代的到来，机器毕竟部分取代人类。第二种人:IP，知识产权或者文学潜在财产就像有些网上课程一周卖出的钱和一个机构卖一年一样多。价值99元的课程，10万人购买，是很常见的。爱产出大概就是10万✖
《输出力》——输出实操1 根本不酷璇
一、少量输入之后，立即输出二、“诵《诗》三百，授之以政，不达；使于四方，不能专对；虽多，亦奚以为？”三、将经典语录自然融入闲谈中。在透露自己学识的时候，不要刻意炫技，一定要不漏声色的。今天读到34页
开微信公众号怎么赚钱？解析盈利策略与实操指南氧惠_飞智666999
微信公众号成为了人们获取信息、交流思想的重要平台。越来越多的人选择开设自己的微信公众号，希望通过这一平台实现个人价值或创造经济效益。那么，开微信公众号怎么赚钱呢？本文将为您详细解析微信公众号的盈利策略与实操指南。公众号流量主就找善士导师（shanshi2024）公众号：「善士笔记」主理人，《我的亲身经历，四个月公众号流量主从0到日入过万！》公司旗下管理800+公众号矩阵账号。代表案例如：爸妈领域、
年薪80w起！零成本快速入门大模型指南 AI产品经理语言模型人工智能自然语言处理机器学习
今年招聘市场确实是好点了，我发现群友都在讨论，得赶快学点AI大模型。他们有的是想正式转到一些新兴的AI行业，需要系统的学习训练。更多的是想跟已有的技能结合，辅助编程提效，或上手实操应用，增加自己的职场竞争力。这也可以理解，ChatGPT推出仅一年半的时间，就将生成式AI推向主流。从谷歌到亚马逊，从百度到阿里，几乎所有科技巨头都在布局AI，也直接影响到了招聘市场，大模型相关的岗位数量多了不少，年薪甚
Linux实操篇_实用指令_压缩和解压类指令 Shaw_Young
压缩和解压缩类gzip/gunzip指令gzip用于压缩文件,gunzip用于解压的基本语法语法功能描述gzip文件压缩文件,只能将文件压缩成为*.gz文件gunzip文件.gz解压缩文件命令应用实例案例1:gzip压缩,将/home下的hello.txt文件进行压缩[root@localhosthome]#gziphello.txt案例2:gunzip压缩,将/home下的hello.txt.g
Python浏览器指纹反爬详解（包含案例）——blog10 总得跑一个 python 网络爬虫 selenium
目录概述案例实操目标分析补充开始由此可以得到方法一：直接从api拿数据方法二：伪装selenium.webdriver测试测试用HTML如下：爬取失败——分析与思考改进最后附上使用selenium破解目标网站浏览器指纹的完整代码：觉得有帮助的小伙伴还请点个关注概述浏览器指纹是由浏览器类型、版本号、操作系统、屏幕分辨率、时区、插件、字体等信息组合而成的唯一标识，可以用于区分不同的用户。通过比对请求中
AI学习笔记：pdf-document-layout-analysis hillstream3 人工智能学习笔记 pdf AI编程 nlp
一直在学AI，但没有连续的时间来尝试。现在终于失业了，有大把连续的时间来动手。之前准备了一台I5-1400F+RTX360012G的电脑，现在终于派上用场了。由于一直在从事无线通信相关的工作，所以，拿到一份很长的AI可能与通信在哪些方面，能够结合的pdf文档。所以，打算从这份文档开始入手。第一个找到的项目的是这个：https://huggingface.co/HURIDOCS/pdf-docume
东3.6工作日报王少东0206
东3.6工作日报：1~今天我觉得最有意义的事就是：下午开小组会，大家对我们制定OKR进度评价达到54%，接下来就是大家的实操和进一步培训，可能时间有点赶，情况有点特殊，但是大家都在尽全力做好它吧。2~学习心得:今天分享新的书《复杂》，樊登总结非常好：“对于我们每个人个人的成长。就是你自己这一生事实上也是一个复杂的过程。你与其去做那么多的计算，算计，你不如把你能做的事尽量地做好，然后不断的自我更新迭
《原则》中五步骤实操钱晓缺
有明确的目标a．排列优先顺序：尽管你几乎可以得到你想要的任何东西，但你不可能得到你想要的所有东西。b．不要混淆目标和欲望。c．调和你的目标和欲望，以明确你在生活中真正想要的东西d．不要把成功的装饰误认为成功本身。e．永远不要因为你觉得某个目标无法实现就否决它。f．谨记伟大的期望创造伟大的能力。g．如果你拥有灵活性并自我归责，那么几乎没有什么能阻止你成功。h．知道如何对待挫折和知道如何前进一样重要。
QLoRa使用教程云帆@ 训练 peft 人工智能
一、定义定义案例1二、实现定义QLoRa:量化+LoRa.网址：https://huggingface.co/docs/peft/main/en/developer_guides/quantization案例11.4bit量化+LoRaimporttorchfromtransformersimportBitsAndBytesConfigconfig=BitsAndBytesConfig(load_
实操搭建battery-historian平台 romc android
1在D盘新建一个文件夹：gosrc2gitclonehttps://github.com/google/battery-historian.git3cd到D:\gosrc\battery-historian>gomodinitgosrc初始化模块名为gosrc，你可以自定义自己的名字4//执行该命令，更换为国内代理地址goenv-wGOPROXY=https://goproxy.cn,direct
Python软件编程等级考试三级——20210905 青岛少儿编程-王老师 python软件编程等级考试 python 等级考试
Python软件编程等级考试三级——20210905理论单选题判断题实操第一题第二题第三题理论单选题1、使用map函数可以实现列表数据元素类型的转换，而无需通过循环。则将列表L=[‘1’,‘3’,‘5’,‘7’,‘9’]转换为列表[1,3,5,7,9]的函数写法为？A、map(int,L)B、list(map(int,L))C、map(L,int)D、list(map(L,int))2、以下关于(
学习笔记：新媒体运营系统学习（二）山山而川_Y
本阶段主要学习了新媒体应用传播学和着陆页实战课程。新媒体应用传播学：重点学习了线性传播的线性视角、非线性视角、文化视角、影响力六原则。新媒体着陆页实战：在此门课程中学习了着陆页经典的八大结构：价值定位、行动呼唤、产品特征、信用背书、用户评价、风险承诺、常见问题、终极呼唤。使用“上线了”实操制作着陆页，并且学习了标题写作的DM法公式、落差公式以及人性法则。通过两门课程的学习以及已完成的项目考试，我更
4.3万字详解PHP+RabbitMQ（AMQP协议、通讯架构、6大模式、交换机队列消息持久化、死信队列、延时队列、消息丢失、重复消费、消息应答、消息应答、发布确认、故障转移、不公平分发、优先级、等）小松聊PHP进阶 laravel PHP php 架构服务器中间件后端 laravel rabbitmq
理论（后半部分有实操详解）哲学思考易经思维：向各国人讲述一种动物叫乌龟，要学很久的各国语言，但是随手画一个乌龟，全世界的人都能看得懂。道家思维：努力没有用（指劳神费心的机械性重复、肢体受累、刻意行为），要用心（深度思考、去感悟、透过现象看本质）才有用。举例：类似中学做不出来的几何题的底层原理：不是不知道xx定理或公式（招式），而是不知道画辅助线的思路（内功）。总结：万事万物、用道家思维思考本质与规
亲子实操课第七讲忆星云
合理地唤醒孩子美好的一天从起床开始思考:1.过去一周里，孩子自己起床？被喊起？2.何种方式叫起来？春困秋乏夏打盹，睡不醒的冬三月。叫孩子起床很痛苦。“起床气”:情绪不佳（睡眠与清醒之间切换时间长0.5-1小时）原因:①睡眠不够（负面情绪）生活规律，睡眠质量②被叫起，睡不醒，一脸懵的状态专家监测:无论何处，睡眠惯性都要在几个小时内才消失。消除起床气:有足够的睡眠睡眠重要性:晚睡会影响身高发育。（30
Python教学 | 有备无患！详解 Python 异常处理（try-except）企研数据 python Python 异常处理 try-except 语法错误程序异常
更多详情请点击查看原文：Python教学|有备无患！详解Python异常处理（try-except）Python教学专栏，旨在为初学者提供系统、全面的Python编程学习体验。通过逐步讲解Python基础语言和编程逻辑，结合实操案例，让小白也能轻松搞懂Python！>>>点击此处查看往期Python教学内容本文目录引言一、关于异常二、try-except用法三、哪些情况下需要使用try-excep
llama.cpp本地部署大模型张兆坤的那些事大模型 llama.cpp
llama.cpp是一个C++库，用于简化LLM推理的设置，它使得在本地机器上运行大模型（GGUF格式）成为可能。官网：https://github.com/ggerganov/llama.cpp模型库：https://huggingface.co/HF-Mirror魔搭社区安装并且使用llama.cpp0.安装llama.cpp官方文档：https://github.com/ggerganov/
氧惠怎么赚钱?实操氧惠月入10万+的方法秘诀全网优惠分享
氧惠怎么赚钱?实操氧惠月入10万+的方法秘诀，加入我的团队手把手教学。下面告诉大家怎么加入到氧惠手机应用商店搜索「氧惠」下载，注册时填写邀请码：222999注册时填写邀请码：222999（此码注册可直接享受V8权益）氧惠是与以往完全不同的抖客+淘客app！全新模式，我的直推也会放到你下面，我曾经1年做到百万团队，现在加入我也会帮你做到百万团队。【氧惠】百度有几百万篇报道，也期待你的加入。氧惠邀请码
【python】最新版小红书js逆向拿到数据，非常详细教程（附完整代码）景天科技苑爬虫副业实战零基础进阶教学 python js逆向小红书逆向 python爬虫
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，前后端开发，人工智能，js逆向，App逆向，网络系统安全，数据分析，Django，fastapi，flask等框架，linux，shell脚本等实操经验，网站搭
Deepspeed 结合huggingface Trainer实现多机分布式训练 ningzhao 分布式
目前工作中只使用了单机多卡做微调训练，为了提升训练效率，特实验多机多卡分布式训练。一、环境准备本试验使用两台机器（manager，worker），操作系统ubuntu22.4，每台机器有4个GPU为了使安装配置统一，使用docker容器，docker的安装这里不做介绍。1.网络配置-创建overlay共享网络初始化集群，在manager机器上运行:dockerswarminit#输出结果:Swar
django实操：换用自建mysql用户表（一次失败的经历） EelBarb python django mysql python
前言别想了，基础不扎实的话，还是老老实实用django自带的用户模块吧！这是一次耗时而且失败了的经历。因为是一次失败的经历，这里我给出一些残酷的经验。实操重写用户模型这是我唯一成功的案例，你需要建一个类似如下的django-orm模型mysql_models.pyfromdjango.dbimportmodelsfromdjango.contrib.auth.modelsimportAbstrac
解决Can‘t load tokenizer for ‘bert-base-chinese‘.问题 CSDNhdlg NLP bert 人工智能深度学习自然语言处理
报错提示：OSError:Can'tloadtokenizerfor'bert-base-chinese'.Ifyouweretryingtoloaditfrom'https://huggingface.co/models',makesureyoudon'thavealocaldirectorywiththesamename.Otherwise,makesure'bert-base-chinese
如何使用ChatGPT写学术论文？从论文综述写作全攻略避坑指南智写AI AI学术写作指南 chatgpt AI写作人工智能
大家好，感谢关注。我是七哥，一个在高校里不务正业，折腾学术科研AI实操的学术人。关于使用ChatGPT等AI学术科研的相关问题可以和作者七哥（yida985）交流，多多交流，相互成就，共同进步，为大家带来最酷最有效的智能AI学术科研写作攻略。经过数月爆肝，终于完成学术AI使用教程，估计也有个50万字的详细操作指南。跟着一步一步操作，借助ChatGPT做学术、干科研、写论文、课题申报都变得超简单。欢
conda进行transformers安装大多_C conda
首先建立新环境condacreate-nmyenvpython=3.8安装numpy和pytorchcondainstallnumpycondainstallpytorchtorchvisiontorchaudiocpuonly-cpytorch-cconda-forge其余的一些环境配置huggingface_hub0.16.4py_0huggingfaceimportlib-metadata6
时间序列分析技巧（二）：ARIMA模型建模步骤总结小墨&晓末时间序列分析算法机器学习人工智能程序人生
CSDN小墨&晓末:https://blog.csdn.net/jd1813346972 个人介绍:研一｜统计学｜干货分享擅长Python、Matlab、R等主流编程软件累计十余项国家级比赛奖项，参与研究经费10w、40w级横向文章目录1目的2ARIMA模型建模流程图解3ARIMA模型建模实操1目的该篇为针对时间序列ARIMA模型建模系列技巧：ARIMA模型
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源