错过整个世界

bert下游_原来你是这样的BERT，i了i了！ —— 超详细BERT介绍（三）BERT下游任务...

原来你是这样的BERT，i了i了！ —— 超详细BERT介绍(三)BERT下游任务

BERT(Bidirectional Encoder Representations from Transformers)是谷歌在2018年10月推出的深度语言表示模型。

一经推出便席卷整个NLP领域，带来了革命性的进步。

从此，无数英雄好汉竞相投身于这场追剧(芝麻街)运动。

只听得这边G家110亿，那边M家又1750亿，真是好不热闹！

然而大家真的了解BERT的具体构造，以及使用细节吗？

本文就带大家来细品一下。

前言

本系列文章分成三篇介绍BERT，上两篇分别介绍了BERT主模型的结构及其组件相关和BERT预训练相关，这一篇是最终话，介绍如何将BERT应用到不同的下游任务。

文章中的一些缩写：NLP(natural language processing)自然语言处理；CV(computer vision)计算机视觉；DL(deep learning)深度学习；NLP&DL 自然语言处理和深度学习的交叉领域；CV&DL 计算机视觉和深度学习的交叉领域。

文章公式中的向量均为行向量，矩阵或张量的形状均按照PyTorch的方式描述。

向量、矩阵或张量后的括号表示其形状。

本系列文章的代码均是基于transformers库(v2.11.0)的代码(基于Python语言、PyTorch框架)。

为便于理解，简化了原代码中不必要的部分，并保持主要功能等价。

阅读本系列文章需要一些背景知识，包括Word2Vec、LSTM、Transformer-Base、ELMo、GPT等，由于本文不想过于冗长(其实是懒)，以及相信来看本文的读者们也都是冲着BERT来的，所以这部分内容还请读者们自行学习。

本文假设读者们均已有相关背景知识。

序列分类任务就是输入一个序列，输出整个序列的标签。

输入的序列可以是单句也可以是双句。

单句序列分类任务就是文本分类(text classification)任务，包括主题(topic)、情感(sentiment)、垃圾邮件(spam)等的分类任务；双句序列分类任务包括相似度(similarity)、释义(paraphrase)、蕴含(entailment)等的分类任务。

根据标签数量分，可以分成单标签和多标签(multi-label)的分类任务。

根据标签的类别数量分，可以分成二分类或三分类、五分类等多分类任务。

BERT中的序列分类任务包括单句和双句的单标签回归或分类任务，涉及到语言可接受性(linguistic acceptability)、情感、相似度、释义、蕴含等特征的分类，即GLUE(General Language Understanding Evaluation)中的任务。

如下为一个相似度回归任务的例子(来自transformers库的示例)：

5.000A plane is taking off. ||| An air plane is taking off.

3.800A man is playing a large flute. ||| A man is playing a flute.

3.800A man is spreading shreded cheese on a pizza. ||| A man is spreading shredded cheese on an uncooked pizza.

其中，最左边的是标签，表示两句话的相似度分数，分数越高，相似度越高，分数的取值范围是$[0, 5]$。

再如下为一个双句释义二分类任务的例子(来自transformers库的示例)：

1He said the foodservice pie business ... ||| The foodservice pie business ...

0Magnarelli said Racicot hated ... ||| His wife said he was ...

0The dollar was at 116.92 yen against the yen ... ||| The dollar was at 116.78 yen JPY ...

其中，最左边的是标签，如果后句是前句的释义，即解释说明，那么标签为1，否则为0。

序列分类代码如下：

代码

# BERT之序列分类

class BertForSeqCls(BertPreTrainedModel):

def __init__(self, config):

super().__init__(config)

self.config = config

# 标签的类别数量

self.num_labels = config.num_labels

# 主模型

self.bert = BertModel(config)

self.dropout = nn.Dropout(config.hidden_dropout_prob)

# 线性回归或分类器

self.cls = nn.Linear(config.hidden_size, config.num_labels)

# 回归或分类损失函数

self.loss_fct = LossRgrsCls(config.num_labels)

self.init_weights()

def forward(self,

tok_ids, # 标记编码(batch_size * seq_length)

pos_ids=None, # 位置编码(batch_size * seq_length)

sent_pos_ids=None, # 句子位置编码(batch_size * seq_length)

att_masks=None, # 注意力掩码(batch_size * seq_length)

labels=None, # 标签(batch_size)

_, pooled_outputs = self.bert(

tok_ids,

pos_ids=pos_ids,

sent_pos_ids=sent_pos_ids,

att_masks=att_masks,

)

pooled_outputs = self.dropout(pooled_outputs)

logits = self.cls(pooled_outputs)

if labels is None:

return logits # 对数几率(batch_size * num_labels)

loss = self.loss_fct(logits, labels)

return loss

其中，

num_labels是标签的类别数量(注意：并不是标签数量，BERT的序列分类任务均为单标签分类任务)，=1时为回归任务。

标记分类任务就是输入一个序列，输出序列中每个标记的标签。

输入的序列一般是单句。

标记分类任务就是序列标注(sequence tagging)任务，包括中文分词(Chinese word segmentation)、词性标注(Part-of-Speech tagging，POS tagging)、命名实体识别(named entity recognition，NER)等。

序列标注任务常规的做法是BIO标注，B表示需要标注的片段的开头标记，I表示非开头标记，O表示不需要标注的标记。

如下为一个NER任务的例子(来自transformers库的示例)：

例子

Schartau B-PER

sagte O

dem O

" O

Tagesspiegel B-ORG

" O

vom O

Freitag O

, O

Fischer B-PER

sei O

" O

in O

einer O

Weise O

aufgetreten O

, O

die O

alles O

andere O

als O

überzeugend O

war O

" O

. O

Firmengründer O

Wolf B-PER

Peter I-PER

Bree I-PER

arbeitete O

Anfang O

der O

siebziger O

Jahre O

als O

Möbelvertreter O

, O

als O

er O

einen O

fliegenden O

Händler O

aus O

dem O

Libanon B-LOC

traf O

. O

Ob O

sie O

dabei O

nach O

dem O

Runden O

Tisch O

am O

23. O

April O

in O

Berlin B-LOC

durch O

ein O

pädagogisches O

Konzept O

unterstützt O

wird O

, O

ist O

allerdings O

zu O

bezweifeln O

. O

其中，每一行为一个标记和其标签，空行分隔不同的句子；PER是人名、ORG是组织名、LOC是地名。

标记分类代码如下：

代码

# BERT之标记分类

class BertForTokCls(BertPreTrainedModel):

def __init__(self, config):

super().__init__(config)

self.config = config

# 标签的类别数量

self.num_labels = config.num_labels

# 主模型

self.bert = BertModel(config)

self.dropout = nn.Dropout(config.hidden_dropout_prob)

# 线性分类器

self.cls = nn.Linear(config.hidden_size, config.num_labels)

# 分类损失函数

self.loss_fct = LossCls(config.num_labels)

self.init_weights()

def forward(self,

tok_ids, # 标记编码(batch_size * seq_length)

pos_ids=None, # 位置编码(batch_size * seq_length)

sent_pos_ids=None, # 句子位置编码(batch_size * seq_length)

att_masks=None, # 注意力掩码(batch_size * seq_length)

labels=None, # 标签(batch_size * seq_length)

outputs, _ = self.bert(

tok_ids,

pos_ids=pos_ids,

sent_pos_ids=sent_pos_ids,

att_masks=att_masks,

)

outputs = self.dropout(outputs)

logits = self.cls(outputs)

if labels is None:

return logits # 对数几率(batch_size * seq_length * num_labels)

# 只计算非填充标记的损失

if att_masks is not None:

active = att_masks.view(-1)>0

logits = logits.view(-1, self.num_labels)[active]

labels = labels.view(-1)[active]

loss = self.loss_fct(logits, labels)

return loss

BERT中的选择题是给出前句以及num_choices个后句，选择最优的后句。

如下(来自SWAG数据集)：

Students lower their eyes nervously. She

pats her shoulder, then saunters toward someone.

turns with two students.

walks slowly towards someone.

wheels around as her dog thunders out.

其中，第一行是标签，第二行是前句，第三行到最后是四个后句；标签数字从0开始计数，即标签为2表示第三个(walks slowly towards someone.)为正确选项。

BERT将每个样本转换成num_choices个双句：

Students lower their eyes nervously. ||| She pats her shoulder, then saunters toward someone.

Students lower their eyes nervously. ||| She turns with two students.

Students lower their eyes nervously. ||| She walks slowly towards someone.

Students lower their eyes nervously. ||| She wheels around as her dog thunders out.

然后每个双句的序列表示产生一个对数几率，num_choices个双句就得到一个长度为num_choices的对数几率向量，最后将这个向量作为这个样本的输出，计算损失即可。

选择题代码如下：

代码

# BERT之选择题

class BertForMultiChoice(BertPreTrainedModel):

def __init__(self, config):

super().__init__(config)

self.config = config

# 选项个数

self.num_choices = config.num_choices

# 主模型

self.bert = BertModel(config)

self.dropout = nn.Dropout(config.hidden_dropout_prob)

# 线性分类器

self.cls = nn.Linear(config.hidden_size, 1)

# 分类损失函数

self.loss_fct = LossCls(1)

self.init_weights()

def forward(self,

tok_ids, # 标记编码(batch_size * num_choices * seq_length)

pos_ids=None, # 位置编码(batch_size * num_choices * seq_length)

sent_pos_ids=None, # 句子位置编码(batch_size * num_choices * seq_length)

att_masks=None, # 注意力掩码(batch_size * num_choices * seq_length)

labels=None, # 标签(batch_size)

seq_length = tok_ids.shape[-1]

# 调整形状，每个前句-后句选项对看作一个双句输入

tok_ids = tok_ids.view(-1, seq_length)

if pos_ids is not None: pos_ids = pos_ids.view(-1, seq_length)

if sent_pos_ids is not None: sent_pos_ids = sent_pos_ids.view(-1, seq_length)

if att_masks is not None: att_masks = att_masks.view(-1, seq_length)

_, pooled_outputs = self.bert(

tok_ids,

pos_ids=pos_ids,

sent_pos_ids=sent_pos_ids,

att_masks=att_masks,

)

pooled_outputs = self.dropout(pooled_outputs)

logits = self.cls(pooled_outputs)

# 调整形状，每num_choices个对数几率看作一个样本的输出

logits = logits.view(-1, self.num_choices)

if labels is None:

return logits # 对数几率(batch_size * num_choices)

loss = self.loss_fct(logits, labels)

return loss

其中，

num_choices是选项个数。

BERT中的问答任务其实是抽取式的机器阅读理解(machine reading comprehension)任务，即给定一段话，给定一个问题，问题的答案来自这段话的某个连续的片段。

如下(来自transformers库的示例)：

0Computational complexity theory

What branch of theoretical computer science deals with broadly classifying computational problems by difficulty and class of relationship?

Computational complexity theory is a branch of the theory of computation in theoretical computer science that focuses on classifying computational problems according to their inherent difficulty ...

其中，第一行是答案，答案左边的数字表示这个答案在给定的这段话的起始位置(从0开始计数)，第二行是问题，第三行是给定的一段话。

BERT将这个抽取式任务转化为一个预测答案起始和结束位置的分类任务，标签的类别数量是seq_length，起始位置和结束位置分别预测，即相当于两个标签。

注意：这个起始和结束位置是标记化等预处理后答案在输入的编码向量里的位置。

BERT将所有的标记表示转化成两个对数几率，然后横向切片，得到两个长度为seq_length的对数几率向量，分别作为起始和结束位置的预测，最后计算损失即可。

问答代码如下：

代码

# BERT之问答

class BertForQustAns(BertPreTrainedModel):

def __init__(self, config):

super().__init__(config)

self.config = config

# 主模型

self.bert = BertModel(config)

# 线性分类器

self.cls = nn.Linear(config.hidden_size, 2)

self.init_weights()

def forward(self,

tok_ids, # 标记编码(batch_size * seq_length)

pos_ids=None, # 位置编码(batch_size * seq_length)

sent_pos_ids=None, # 句子位置编码(batch_size * seq_length)

att_masks=None, # 注意力掩码(batch_size * seq_length)

start_pos=None, # 起始位置标签(batch_size)

end_pos=None, # 结束位置标签(batch_size)

seq_length = tok_ids.shape[-1]

outputs, _ = self.bert(

tok_ids,

pos_ids=pos_ids,

sent_pos_ids=sent_pos_ids,

att_masks=att_masks,

)

logits = self.cls(outputs)

# 拆分起始和结束位置对数几率

start_logits, end_logits = logits.split(1, dim=-1)

start_logits = start_logits.view(-1, seq_length)

end_logits = end_logits.view(-1, seq_length)

if start_pos is None or end_pos is None:

return (

start_logits, # 起始位置对数几率(batch_size * seq_length)

end_logits, # 结束位置对数几率(batch_size * seq_length)

)

# 标签值裁剪，使值 (- [0, seq_length]，

# 其中合法值 (- [0, seq_length-1]，非法值 = seq_length

start_pos = start_pos.clamp(0, seq_length)

end_pos = end_pos.clamp(0, seq_length)

# ignore_index=seq_length：忽略标签值 = seq_length对应的损失

loss_fct = LossCls(seq_length, ignore_index=seq_length)

start_loss = loss_fct(start_logits, start_pos)

end_loss = loss_fct(end_logits, end_pos)

loss = (start_loss + end_loss) / 2

return loss

后记

本文作为系列的最后一篇文章，详细地介绍了BERT下游任务，BERT的通用性就体现在只需要添加少量模块就能应用到各种不同的下游任务。

BERT充分地利用了主模型输出的标记表示和序列表示，并对其进行一定地修改，从而可以应用到各种不同的下游任务中。

其中应用到选择题和问答任务的方式特别巧妙，分别活用了序列和标记表示。

然而，如同预训练，标记分类任务每个标记的标签是独立产生的，以及问答任务的起始和结束位置也是独立产生的，这其实不是非常合理。

你可能感兴趣的:(bert下游)

高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
BART&BERT Ambition_LAO 深度学习
BART和BERT都是基于Transformer架构的预训练语言模型。模型架构：BERT(BidirectionalEncoderRepresentationsfromTransformers)主要是一个编码器（Encoder）模型，它使用了Transformer的编码器部分来处理输入的文本，并生成文本的表示。BERT特别擅长理解语言的上下文，因为它在预训练阶段使用了掩码语言模型（MLM）任务，即
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
go语言安装快速入门吉祥鸟hu
[TOC]go语言是什么Go是一个开源的编程语言，它能让构造简单、可靠且高效的软件变得容易。Go是从2007年末由RobertGriesemer,RobPike,KenThompson主持开发，后来还加入了IanLanceTaylor,RussCox等人，并最终于2009年11月开源，在2012年早些时候发布了Go1稳定版本。现在Go的开发已经是完全开放的，并且拥有一个活跃的社区如何安装环境笔者这
解决BERT模型bert-base-chinese报错（无法自动联网下载）搬砖修狗 bert 人工智能深度学习 python
一、下载问题hugging-face是访问BERT模型的最初网站，但是目前hugging-face在中国多地不可达，在代码中涉及到该网站的模型都会报错，本文我们就以bert-base-chinese报错为例，提供一个下载到本地的方法来解决问题。二、网站google-bert(BERTcommunity)Thisorganizationismaintainedbythetransformerstea
TinyReplaySystem回放系统设计和开发 W8023Y2014 Unity Unity
TinyReplaySystem回放系统设计和开发简单探讨和分析下游戏回放系统的设计和针对特定需求回放功能的TinyReplaySystem设计和具体实现需求分析在屏幕舞台中，玩家操控动画角色通过手势缩放，移动，修改角色颜色等属性，用户操控所需要的角色进行PlayAnimation，角色扮演。扮演结束，保存到本地，可以回放用户所扮演的动画。相当于录制屏幕指定区域，存储成视频，加载回放。记录用户通过
公司的Swot分析莉莉安蓁妮
目前公司处于战略转型，从单一专注于轨道交通建设设计领域，开始从上下游衍生，打通整个产业链。一方面整合上游的资金融资问题，另一方面解决轨道交通运营和资源整合。它所具备的优势就是20多年的行业积累，具备了丰富的设计经验，对轨道交通的研究从线延伸至线网，并且成功的实现了广通商业务的开展。不足是，在融资资金操作方面经验不足，还处于试验阶段。机遇：从外部整个行业发展状态来看，国内一线城市都在从整个线网发展城
ROS yaml参数文件的使用 Sun Shiteng ROS
举个例子，若在params.yaml文件中定义如下参数LidarImageFusion:points_src:"/hilbert_h/deskew/cloud_info"image_src:"/usb_cam0/image_raw"camera_info_src:"/home/hdj/fusion_slam/Color_SLAM_ws/src/hilbert_h/config/firefly_8s
如何将JSON字符串里面的某些的json字符串格式转成json对象？无休居士 Java基础 json python 数据库 json字符串转换
目录标题背景临时方案最好的方案背景下游传过来的数据是一个json字符串，这个json字符串里面有的字段又套着json字符串！还有一些字段直接是null传过来的！现在要去掉null，且将一些json字符串！尽可能的换成json对象！如何将JSON字符串里面的某些的json字符串格式转成json对象？升级版{"id":null,"type":null,"content":"{\"marketCardI
《昇思 25 天学习打卡营第 25 天 | 基于 MindSpore 实现 BERT 对话情绪识别》 Sam9029 Mindscope模型学习深度学习
《昇思25天学习打卡营第25天|基于MindSpore实现BERT对话情绪识别》活动地址：https://xihe.mindspore.cn/events/mindspore-training-camp签名：Sam9029环境配置确保安装了正确版本的MindSpore和MindNLP库。!pipuninstallmindspore-y!pipinstall-ihttps://pypi.mirror
Go的学习路线 JSU-YSJ Golang基础学习 golang 学习开发语言
Golang简介go语言Go（又称Golang）是Google的RobertGriesemer，RobPike及KenThompson开发的一种静态强类型、编译型语言。Go语言语法与C相近，但功能上有：内存安全，GC（垃圾回收），结构形态及CSP-style并发计算。为什么要学习Go现有的编程语言风格各异，不能完全的运动好电脑的硬件，不高效，及各种优势于一身的语言Golang(谷歌创建)兼容静态编
爱无常，恨无常，珍惜好时光爱博文学翻译社
爱无常，恨无常，珍惜好时光编辑:AlbertXu片尾曲《匆匆那年》很好听，看的过程中感觉美好、惊醒、奇妙、困惑和无常：1.美好的是青春，是逝去的时光，是那些已经改变又从未改变的人，也是那些深深刻在脑海中的爱的印记，甚至是后悔，那些证明我们存在于世的全部经历。当人们从一个原点出发，相逢又散去，投入到各自的生活洪流中时，片刻的驻足，怀念起过去，几乎很多人都在习惯性美化它们。长大后觉得甜蜜的回忆，在经历
大规模语言模型的书籍分享，从零基础入门到精通非常详细收藏我这一篇就够了黑客-雨语言模型人工智能自然语言处理学习大模型学习大模型入门大模型教程
在当今人工智能领域，大规模语言模型成为了研究和应用的热点之一。它们以其大规模的参数和强大的性能表现，推动着机器学习和深度学习技术的发展。对于GPT系列大规模语言模型的发展历程，有两点令人印象深刻。第一点是可拓展的训练架构与学习范式:Transformer架构能够拓展到百亿、千亿甚至万亿参数规模，并且将预训练任务统一为预测下一个词这一通用学习范式;第二点是对于数据质量与数据规模的重视:不同于BERT
浩天奇缘OL怎么才能当托？浩天奇缘OL如何才能申请内部号？诸葛村夫123
今天给大家揭露一下游戏行业里不可告人的事情，可能很多朋友的都是听说过手游内部号的事吧，还有手游充值怎么来的返利？今天就给大家仔细解读一下什么内部号！说起内部号可能很多朋友都是见过的，只是分辨不出来而已，以往大家在游戏都会看见一些，刚进游戏就充值几百几千的玩家，我告诉大家，这些可能就是内部号而已，毕竟谁的钱都不是大风刮来的，在以前想要拿到内部号是不可能的，都是因为现在的手游市场下沉，游戏运营商压力过
从高中班级倒数第三，到成功逆袭升入本科，是如何做到的？赵午戌
01过去我的学习成绩从小学到初中一直处于班级中游水平。考高中的时候没考上，那个年代没考上是可以拿钱去上高中的。于是父母把辛苦攒下来的钱拿出来，我就进入了高中！可想而知在高中的班级里成绩立刻处于下游状态，自己呢也就更加没有信心，老师也不会去管你，只要你上课不捣乱就行了，因为考核老师的是班级里有多少人能考上本科！所以高一高二基本上不去学习，成绩自然是班级里的倒数，我记得考的最差的一次是班级倒数第三！0
【Tools】大模型中的BERT概念音乐学家方大刚工具 bert 人工智能深度学习
摇来摇去摇碎点点的金黄伸手牵来一片梦的霞光南方的小巷推开多情的门窗年轻和我们歌唱摇来摇去摇着温柔的阳光轻轻托起一件梦的衣裳古老的都市每天都改变模样方芳《摇太阳》BERT（BidirectionalEncoderRepresentationsfromTransformers）是一种基于Transformer的预训练语言模型，由Google于2018年发布。BERT的目标是通过大规模无监督预训练学习来
水库一片羽
在我的老家的下游有一个大水库，是下游村庄的，不过源头在我们村，它似乎是两个村庄的分界线。小的时候每到夏天，为了防止下大雨淹了地，都会提前放水，每到放了水，我跟小伙伴就带上水桶、自制的简易捕鱼设备、渔网等，下到水库的浅滩上，捡河蚌螺丝，在细水下游的沟壑里放上自制的简易兜网，然后拿着铁丝绑制的棍子，我们叫做锤鱼神器，纵使鱼儿在水里游得飞快，但也难逃铁棍的锤击，即使逃过了铁棍，但也无法逃脱下游的兜网，每
钓鱼台下游动的红蛇付朝兰
钓鱼台下水里的红蛇在这样祥和的天气你为何出现在这里它是花鸭子放宝宝的天地因为雨水的堆积花鸭子不得已临时放弃没想到，你也这么喜欢这里让我也给你留下份记忆手机相框放大些你的身躯我好把你的样子，放进里让更多的人，欣赏到你的悠闲身姿钓鱼台下水里的红蛇
详述Python环境下配置AI大模型Qwen-72B的步骤 Play_Sai #Python开发 python AI大模型人工智能
随着人工智能技术的发展，大规模预训练模型如Qwen-72B等逐渐成为研究和应用的重点。本篇博客旨在提供一份详细的指南，帮助Python开发者们在自己的环境中顺利配置并使用Qwen-72B大模型。请注意：由于Qwen-72B这一模型目前并未公开存在，所以以下内容仅为假设性描述，实际上你需要替换为你想要配置的真实存在的大模型，例如GPT-3、BERT等。一、环境准备1.安装必要的库首先确保你已经安装了
突发奇想，玩家用《我的世界》重现美术大师画作，还原度很高爱游戏的萌博士
如果你喜欢绘画，在其中又特别钟情风景画的话，你可能听说过鲍伯·鲁斯（BobRoss）。这其实是罗伯特·诺曼·鲁斯（RobertNormanRoss）的艺名，他是位美国画家，同时也是一位艺术指导与电视节目主持人。鲁斯以他温柔且和乐的语气为特色，在他著名的电视节目“欢乐画室（TheJoyofPainting）”中担任即席教学画家兼主持人，这个节目活跃于上世纪八九十年代。博士为什么要提上面这位顶着爆炸头
题围城（古体）宋玉兰原创文学
题围城（古体）文/宋玉兰一本围城解孤寂，醉心痴笑何忧愁。此生之志艰辛苦，幸得钟书笔下游。2018年3月30日
逆境之下，如何涅槃？轩妈爱阅读
跟着一群有能量的人，自己也变的有力量了，往常清晨的六点还在补觉的时刻，今天竟然自然醒，准时来听小艾老师的赋能！十大关键字：看脚下不断行莫存顺逆️看脚下：当下我们面临的最大逆境莫过于疫情所带来的压力，大到国家、企业，小到家庭、个人，我们每个人都在面临着各种各样的问题，首要的呢就是我们要清楚我们个人及家庭所需要的现金流，看自己核心的上下游，其实这件事对于我们每个家庭来说最好的就是开源节流，开源就是用副
行业趋势|揭秘益生菌产业链上下游现状趋势洞察
益生菌产业链上游主要可分为国际益生菌专利申请、益生菌原料销售与益生菌产品技术解决方案提供三类，全球益生菌产业链上游具有以下特点：国际专利多为发酵菌种。数据显示，1985-2004年间全球益生菌专利申请主要集中在植物乳杆菌（80件）、干酪乳杆菌（68件）和嗜酸乳杆菌（113件）三种，均属于发酵用菌种。这一数据从侧面反映出发酵食品是益生菌产业中的开发重心。从应用层面来看，益生菌专利多集中在乳制品加工制
大模型落地指南：从下载到本地化部署全流程解析网安猫叔人工智能自然语言处理语言模型 AIGC 深度学习
一、引言随着人工智能技术的迅猛发展，大规模预训练模型（如GPT-4、BERT等）在自然语言处理、图像识别等领域展现出了卓越的性能。然而，如何将这些强大的模型从理论落地到实际应用中，仍然是许多技术从业者面临的挑战。本篇文章旨在为读者提供一份详尽的大模型落地指南，从模型的下载、文件结构的解析，到本地化部署的具体步骤，全面覆盖整个流程。无论你是初次接触大模型的新手，还是希望深入了解部署细节的资深开发者，
解决Can‘t load tokenizer for ‘bert-base-chinese‘.问题 CSDNhdlg NLP bert 人工智能深度学习自然语言处理
报错提示：OSError:Can'tloadtokenizerfor'bert-base-chinese'.Ifyouweretryingtoloaditfrom'https://huggingface.co/models',makesureyoudon'thavealocaldirectorywiththesamename.Otherwise,makesure'bert-base-chinese
如何用RoBERTa高效提取事件文本结构特征：多层次上下文建模与特征融合大多_C 人工智能
基于RoBERTa-BASE的特征提取器，提取事件文本数据的结构特征（如段落和篇章结构）涉及多个步骤。RoBERTa作为一种预训练语言模型，可以很好地捕捉输入文本的上下文和依赖关系。具体步骤如下：1.文本预处理在提取事件文本的结构特征之前，需要对文本进行适当的预处理。这一步包括：分句和分段处理：将事件文本拆分为不同的句子或段落，并对每个句子/段落进行标记。每个段落可以视为一个独立的输入序列。Tok
2020-04-02 傻小子
摘抄一段《四季炒股歌》冬炒煤来夏炒电，五一十一旅游见，逢年过节有烟酒，两会环保新能源；航空造纸升值币，通胀保值就买地，再炒黄金和军工，加息银行最受益；地震灾害炒水泥，工程机械亦可取，市场商品热追捧，上下游厂寻踪迹；资源长线不败地，稀土萤石锗钼锑，偶尔爆炒高科技，超细纤维石墨烯；重组向来都无敌，定增注资也给力，牛市买入大蓝筹，弱市就玩ST；年报季报细分析，其中自有颜如玉，高送转股先潜伏，每逢四月涨积
这样的电影都骂烂，是我握不动刀还是有人太飘 Sir电影
年度最WTF电影来了！年度最争议电影来了！威尼斯电影节首映，有的观众起立鼓掌，有的观众恨不得朝屏幕丢鞋。观众这样，更别说影评人……迷之又迷的，比如《RogerEbert.com》：恐怖、勾人、迷惑……这是一部刷新你认知的电影。恨之入骨的，比如《纽约观察者报》——我不愿给它贴上“年度最差电影”标签，因为“世纪最差电影”更适合它。评分网站呢，一个比一个不给面子：IMDb7.0，烂番茄68%，豆瓣6.7
阳明祠游孤独中成长_2922
王守仁（1472年－1528年），字伯安，号阳明，谥文成，中国浙江余姚人。明代最著名的思想家、哲学家、书法家和军事家、教育家、文学家，官至南京兵部尚书、都察院左都御史。陆王心学之集大成者，非但精通儒家、佛家、道家，而且能够统军征战，是中国历史上罕见的全能大儒。今天我们在老师的带领下游了阳明祠阳明祠是后人为了纪念明代著名的哲学家、军事家和文学家，心学的创始人王守仁（字伯安，号阳明）而建立的祠堂。王阳
Transformer、BERT、GPT、T5、LLM（大语言模型），以及它们在实际行业中的运用 Funhpc_huachen transformer bert gpt 语言模型深度学习
作为AI智能大模型的专家训练师，我将从主流模型框架的角度来分析其核心技术特点及其在不同实际行业中的应用。我们重点讨论以下几个主流模型框架：Transformer、BERT、GPT、T5、LLM（大语言模型），以及它们在实际行业中的运用。1.Transformer框架Transformer是一种基础的深度学习模型架构，由Google于2017年提出。它引入了注意力机制（Self-Attention）
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它