NLP历史突破！谷歌BERT模型狂破11项纪录，全面超越人类！

来源：新智元（AI_era）

（来源：arXiv、知乎；编辑：新智元编辑部）

今天，NLP 领域取得最重大突破！谷歌 AI 团队新发布的 BERT 模型，在机器阅读理解顶级水平测试 SQuAD1.1 中表现出惊人的成绩：全部两个衡量指标上全面超越人类，并且还在 11 种不同 NLP 测试中创出最佳成绩。毋庸置疑，BERT 模型开启了 NLP 的新时代！

今天请记住 BERT 模型这个名字。

谷歌 AI 团队新发布的 BERT 模型，在机器阅读理解顶级水平测试 SQuAD1.1 中表现出惊人的成绩：全部两个衡量指标上全面超越人类！并且还在 11 种不同 NLP 测试中创出最佳成绩，包括将 GLUE 基准推至 80.4％（绝对改进 7.6％），MultiNLI 准确度达到 86.7%（绝对改进率 5.6％）等。

谷歌团队的 Thang Luong 直接定义：BERT 模型开启了 NLP 的新时代！

本文从论文解读、BERT 模型的成绩以及业界的评价三方面做介绍。

硬核阅读：认识 BERT 的新语言表示模型

首先来看下谷歌 AI 团队做的这篇论文（论文地址： https://arxiv.org/abs/1810.04805）。

BERT 的新语言表示模型，它代表 Transformer 的双向编码器表示。与最近的其他语言表示模型不同，BERT 旨在通过联合调节所有层中的上下文来预先训练深度双向表示。因此，预训练的 BERT 表示可以通过一个额外的输出层进行微调，适用于广泛任务的最先进模型的构建，比如问答任务和语言推理，无需针对具体任务做大幅架构修改。

论文作者认为现有的技术严重制约了预训练表示的能力。其主要局限在于标准语言模型是单向的，这使得在模型的预训练中可以使用的架构类型很有限。

在论文中，作者通过提出 BERT：即 Transformer 的双向编码表示来改进基于架构微调的方法。

BERT 提出一种新的预训练目标：遮蔽语言模型（masked language model，MLM），来克服上文提到的单向性局限。MLM 的灵感来自 Cloze 任务（Taylor, 1953）。MLM 随机遮蔽模型输入中的一些 token，目标在于仅基于遮蔽词的语境来预测其原始词汇 id。

与从左到右的语言模型预训练不同，MLM 目标允许表征融合左右两侧的语境，从而预训练一个深度双向 Transformer。除了遮蔽语言模型之外，本文作者还引入了一个“下一句预测”（next sentence prediction）任务，可以和 MLM 共同预训练文本对的表示。

论文的核心：详解 BERT 模型架构

本节介绍 BERT 模型架构和具体实现，并介绍预训练任务，这是这篇论文的核心创新。

模型架构

BERT 的模型架构是基于 Vaswani et al. (2017) 中描述的原始实现 multi-layer bidirectional Transformer 编码器，并在 tensor2tensor 库中发布。由于 Transformer 的使用最近变得无处不在，论文中的实现与原始实现完全相同，因此这里将省略对模型结构的详细描述。

在这项工作中，论文将层数（即 Transformer blocks）表示为L，将隐藏大小表示为H，将 self-attention heads 的数量表示为A。在所有情况下，将 feed-forward/filter 的大小设置为 4H，即 H = 768 时为 3072，H = 1024 时为 4096。论文主要报告了两种模型大小的结果：

- BERT _BASE: L=12, H=768, A=12, Total Parameters=110M

- BERT _LARGE: L=24, H=1024, A=16, Total Parameters=340M

为了进行比较，论文选择 BERT _LARGE，它与 OpenAI GPT 具有相同的模型大小。然而，重要的是，BERT Transformer 使用双向 self-attention，而 GPT Transformer 使用受限制的 self-attention，其中每个 token 只能处理其左侧的上下文。研究团队注意到，在文献中，双向 Transformer 通常被称为“Transformer encoder”，而左侧上下文被称为“Transformer decoder”，因为它可以用于文本生成。BERT，OpenAI GPT 和 ELMo 之间的比较如图 1 所示。

图1：预训练模型架构的差异。BERT 使用双向 Transformer。OpenAI GPT 使用从左到右的 Transformer。ELMo 使用经过独立训练的从左到右和从右到左 LSTM 的串联来生成下游任务的特征。三个模型中，只有 BERT 表示在所有层中共同依赖于左右上下文。

输入表示（input representation）

论文的输入表示（input representation）能够在一个 token 序列中明确地表示单个文本句子或一对文本句子（例如， [Question, Answer]）。对于给定 token，其输入表示通过对相应的 token、segment 和 position embeddings 进行求和来构造。图 2 是输入表示的直观表示：

图2：BERT 输入表示。输入嵌入是 token embeddings, segmentation embeddings 和 position embeddings 的总和。

具体如下：

- 使用 WordPiece 嵌入（Wu et al.， 2016）和 30,000 个 token 的词汇表。用##表示分词。

- 使用学习的 positional embeddings，支持的序列长度最多为 512 个 token。

- 每个序列的第一个 token 始终是特殊分类嵌入（[CLS]）。对应于该 token 的最终隐藏状态（即，Transformer 的输出）被用作分类任务的聚合序列表示。对于非分类任务，将忽略此向量。

- 句子对被打包成一个序列。以两种方式区分句子。首先，用特殊标记（[SEP]）将它们分开。其次，添加一个 learned sentence A 嵌入到第一个句子的每个 token 中，一个 sentence B 嵌入到第二个句子的每个 token 中。

- 对于单个句子输入，只使用 sentence A 嵌入。

关键创新：预训练任务

与 Peters et al. (2018) 和 Radford et al. (2018) 不同，论文不使用传统的从左到右或从右到左的语言模型来预训练 BERT。相反，使用两个新的无监督预测任务对 BERT 进行预训练。

任务1：Masked LM

从直觉上看，研究团队有理由相信，深度双向模型比 left-to-right 模型或 left-to-right and right-to-left 模型的浅层连接更强大。遗憾的是，标准条件语言模型只能从左到右或从右到左进行训练，因为双向条件作用将允许每个单词在多层上下文中间接地“see itself”。

为了训练一个深度双向表示（deep bidirectional representation），研究团队采用了一种简单的方法，即随机屏蔽（masking）部分输入 token，然后只预测那些被屏蔽的 token。论文将这个过程称为“masked LM”(MLM)，尽管在文献中它经常被称为 Cloze 任务(Taylor, 1953)。

在这个例子中，与 masked token 对应的最终隐藏向量被输入到词汇表上的输出 softmax 中，就像在标准 LM 中一样。在团队所有实验中，随机地屏蔽了每个序列中 15% 的 WordPiece token。与去噪的自动编码器（Vincent et al.， 2008）相反，只预测 masked words 而不是重建整个输入。

虽然这确实能让团队获得双向预训练模型，但这种方法有两个缺点。首先，预训练和 finetuning 之间不匹配，因为在 finetuning 期间从未看到[MASK]token。为了解决这个问题，团队并不总是用实际的[MASK]token 替换被“masked”的词汇。相反，训练数据生成器随机选择 15％的 token。例如在这个句子“my dog is hairy”中，它选择的 token 是“hairy”。然后，执行以下过程：

数据生成器将执行以下操作，而不是始终用[MASK]替换所选单词：

- 80％的时间：用[MASK]标记替换单词，例如，my dog is hairy → my dog is [MASK]

- 10％的时间：用一个随机的单词替换该单词，例如，my dog is hairy → my dog is apple

- 10％的时间：保持单词不变，例如，my dog is hairy → my dog is hairy. 这样做的目的是将表示偏向于实际观察到的单词。

Transformer encoder 不知道它将被要求预测哪些单词或哪些单词已被随机单词替换，因此它被迫保持每个输入 token 的分布式上下文表示。此外，因为随机替换只发生在所有 token 的 1.5％（即 15％的 10％），这似乎不会损害模型的语言理解能力。

使用 MLM 的第二个缺点是每个 batch 只预测了 15％的 token，这表明模型可能需要更多的预训练步骤才能收敛。团队证明 MLM 的收敛速度略慢于 left-to-right 的模型（预测每个 token），但 MLM 模型在实验上获得的提升远远超过增加的训练成本。

任务2：下一句预测

许多重要的下游任务，如问答（QA）和自然语言推理（NLI）都是基于理解两个句子之间的关系，这并没有通过语言建模直接获得。

在为了训练一个理解句子的模型关系，预先训练一个二进制化的下一句测任务，这一任务可以从任何单语语料库中生成。具体地说，当选择句子A和B作为预训练样本时，B有 50％的可能是A的下一个句子，也有 50％的可能是来自语料库的随机句子。例如：

Input = [CLS] the man went to [MASK] store [SEP]

he bought a gallon [MASK] milk [SEP]

Label = IsNext

Input = [CLS] the man [MASK] to the store [SEP]

penguin [MASK] are flight ##less birds [SEP]

Label = NotNext

团队完全随机地选择了 NotNext 语句，最终的预训练模型在此任务上实现了 97％-98％的准确率。

实验结果

如前文所述，BERT 在 11 项 NLP 任务中刷新了性能表现记录！在这一节中，团队直观呈现 BERT 在这些任务的实验结果，具体的实验设置和比较请阅读原论文。

图3：我们的面向特定任务的模型是将 BERT 与一个额外的输出层结合而形成的，因此需要从头开始学习最小数量的参数。在这些任务中，（a）和（b）是序列级任务，而（c）和（d）是 token 级任务。在图中，E表示输入嵌入，Ti 表示 tokeni 的上下文表示，[CLS]是用于分类输出的特殊符号，[SEP]是用于分隔非连续 token 序列的特殊符号。

图4：GLUE 测试结果，由 GLUE 评估服务器给出。每个任务下方的数字表示训练样例的数量。“平均”一栏中的数据与 GLUE 官方评分稍有不同，因为我们排除了有问题的 WNLI 集。BERT 和 OpenAI GPT 的结果是单模型、单任务下的数据。所有结果来自 https://gluebenchmark.com/leaderboard 和 https://blog.openai.com/language-unsupervised/

图5：SQuAD 结果。BERT 集成是使用不同预训练检查点和微调种子（fine-tuning seed）的 7x 系统。

图6：CoNLL-2003 命名实体识别结果。超参数由开发集选择，得出的开发和测试分数是使用这些超参数进行五次随机重启的平均值。

超过人类表现，BERT 刷新了 11 项 NLP 任务的性能记录

论文的主要贡献在于：

- 证明了双向预训练对语言表示的重要性。与之前使用的单向语言模型进行预训练不同，BERT 使用遮蔽语言模型来实现预训练的深度双向表示。

- 论文表明，预先训练的表示免去了许多工程任务需要针对特定任务修改体系架构的需求。BERT 是第一个基于微调的表示模型，它在大量的句子级和 token 级任务上实现了最先进的性能，强于许多面向特定任务体系架构的系统。

- BERT 刷新了 11 项 NLP 任务的性能记录。本文还报告了 BERT 的模型简化研究（ablation study），表明模型的双向性是一项重要的新成果。相关代码和预先训练的模型将会公布在 goo.gl/language/bert 上。

BERT 目前已经刷新的 11 项自然语言处理任务的最新记录包括：将 GLUE 基准推至 80.4％（绝对改进 7.6％），MultiNLI 准确度达到 86.7%（绝对改进率 5.6％），将 SQuAD v1.1 问答测试 F1 得分纪录刷新为 93.2 分（绝对提升 1.5 分），超过人类表现 2.0 分。

BERT 模型重要意义：宣告 NLP 范式的改变

北京航空航天大学计算机专业博士吴俣在知乎上写道：BERT 模型的地位类似于 ResNet 在图像，这是里程碑式的工作，宣告着 NLP 范式的改变。以后研究工作估计很多都要使用他初始化，就像之前大家使用 word2vec 一样自然。

BERT 一出，那几个他论文里做实验的数据集全被轰平了，大家洗洗睡了。心疼 swag 一秒钟，出现 3 月，第一篇做这个数据集的算法，在超了 baseline 20 多点的同时也超过人了。

通过 BERT 模型，吴俣有三个认识：

1、Jacob 在细节上是一等一的高手

这个模型的双向和 Elmo 不一样，大部分人对论文作者之一 Jacob 的双向在 novelty 上的 contribution 的大小有误解，我觉得这个细节可能是他比 Elmo 显著提升的原因。Elmo 是拼一个左到右和一个右到左，他这个是训练中直接开一个窗口，用了个有顺序的 cbow。

2、Reddit 对跑一次 BERT 的价格讨论

For TPU pods:

4 TPUs * ~$2/h (preemptible) * 24 h/day * 4 days = $768 (base model)

16 TPUs = ~$3k (large model)

For TPU:

16 tpus * $8/hr * 24 h/day * 4 days = 12k

64 tpus * $8/hr * 24 h/day * 4 days = 50k

For GPU:

"BERT-Large is 24-layer, 1024-hidden and was trained for 40 epochs over a 3.3 billion word corpus. So maybe 1 year to train on 8 P100s? "

3、不幸的是，基本无法复现，所以模型和数据谁更有用也不好说。

BERT 的成功也说明，好的深度学习研究工作的三大条件：数据，计算资源，工程技能点很高的研究员（Jacob 在微软时候，就以单枪匹马搭大系统，而中外闻名）。

本文链接

【AI大模型】LLM模型架构深度解析：BERT vs. GPT vs. T5 我爱一条柴ya 学习AI记录 ai 人工智能 AI编程 python
引言Transformer架构的诞生（Vaswanietal.,2017）彻底改变了自然语言处理（NLP）。在其基础上，BERT、GPT和T5分别代表了三种不同的模型范式，主导了预训练语言模型的演进。理解它们的差异是LLM开发和学习的基石。一、核心架构对比特性BERT(BidirectionalEncoder)GPT(GenerativePre-trainedTransformer)T5(Text
关于香橙派系统烧录，1.1.8或者1.1.10两个版本都无法启动Orangepi5 lindsayshuo ubuntu
先执行gitclonehttps://github.com/orangepi-xunlong/orangepi-build.gitgitlog默认会显示较新的提交记录。如果你需要查看更多的提交记录，可以使用以下方法：gitlog--oneline--graph--all这会以简洁的方式显示所有分支的提交记录，并以图形化的方式展示提交历史。输出如下：*7ebb9a0(HEAD->next,origi
2025年UDP洪水攻击防护实战全解析：从T级流量清洗到AI智能防御上海云盾商务经理杨杨 udp 人工智能网络协议
一、2025年UDP洪水攻击的新特征AI驱动的自适应攻击攻击者利用生成式AI动态调整UDP报文特征（如载荷内容、发送频率），攻击流量与正常业务流量差异率低至0.5%，传统指纹过滤规则失效。反射放大攻击升级黑客通过劫持物联网设备（如摄像头、传感器）构建僵尸网络，利用DNS/NTP协议漏洞发起反射攻击，1Gbps请求可放大至50-500倍流量，峰值突破8Tbps。混合协议打击70%的UDP攻击伴随TC
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
思维链革命：让大模型突破“机器思考”的边界 John Song AI 人工智能思维链2.0 CoT 多模态思维链元认知优化
以下是对LilianWeng思维链技术深度解析文章（原文链接）的博客化重构，融合技术本质与应用实践：思维链革命：让大模型突破“机器思考”的边界——解析ChainofThought技术体系与下一代推理架构一、从黑箱到透明思考：CoT的核心突破传统LLM困境：“大模型如同天才自闭症患者——知识渊博却无法展示思考路径”CoT解决方案：#标准CoT提示模板prompt="""问题：小明有5个苹果，吃掉2个
同城搭子交友小程序：千亿级社交市场的下一个风口？
传统婚恋网站式微，Z世代“轻社交”需求爆发！搭子经济正成为新蓝海：1.市场规模与增长潜力数据：2023年中国陌生人社交市场规模达1500亿元，年复合增长率超20%；趋势：搭子类小程序用户规模突破8000万，预计2025年将占社交市场30%份额。2.竞争格局与差异化机会头部平台：Soul、探探聚焦泛社交，搭子类小程序仍属蓝海；细分场景：运动、美食、游戏等垂直领域搭子需求未被充分满足；下沉市场：三四线
短剧小程序开发全攻略：从0到1打造爆款内容平台 weixin_lynhgworld 小程序短剧
核心内容：行业趋势分析：短剧市场年增长率超300%，用户规模突破5亿，抖音、快手等平台加速布局。小程序成为短剧分发核心渠道：轻量化、低成本、社交裂变优势显著。开发核心功能模块：内容管理：支持多格式上传、分集管理、标签分类。播放体验优化：弹幕互动、倍速播放、清晰度切换、离线缓存。付费系统：单集付费、会员订阅、广告解锁等多元化盈利模式。社交裂变：分享奖励、邀请排行榜、拼团观影功能。技术实现难点：视频流
《打破预设的编码逻辑：Ruby元编程的动态方法艺术》后端
代码从来不是冰冷的字符堆砌，而是具备自我演化能力的动态实体。元编程技术如同这一实体的核心神经系统，让方法突破静态定义的桎梏，在运行时完成从需求捕捉到逻辑生成的完整闭环。MethodMissing与DefineMethod作为元编程的两大支柱，以近乎隐形的方式重塑着代码的行为边界，为开发者提供了一套驾驭变化的底层逻辑。MethodMissing的本质，是Ruby赋予程序的“需求感知能力”。当一个未被
低版本hive(1.2.1)UDF实现清除历史分区数据 ༺水墨石༻ hive hive UDF hive hadoop 数据仓库
目标：通过UDF实现对表历史数据清除入参：表名、保留天数N一、pom文件4.0.0com.examplehive-udf-example1.0-SNAPSHOTjarhive-udf-exampleHiveUDFfordeletingpartitionsbydateUTF-81.81.8org.apache.hivehive-exec1.2.1org.apache.hivehive-metasto
IP与“谷子”齐飞，阅文“乘势而上”？
爆火的“谷子经济”，又捧出一只“潜力股”。近日，阅文集团股价持续上涨，5日累计涨幅达13.20%。这其中，周三股价一度大涨约15%至29.15港元，强势突破20日、30日、120日等多根均线，市值突破280亿港元关口。股价持续大涨的背后，阅文集团领投卡牌潮流文化品牌Hitcard发出来新的信号。显然，这是“阅文好物”商业化提速的一次关键布局。预计阅文好物后续将与Hitcard拓展IP商业化合作范围
Linux常用命令
今天开始介绍Linux的常用命令，通过学习了解Shell命令的基本格式，可以掌握常用的Shell基础命令、命名历史、名称补全的方法，及联机帮助命令的使用方法；理解文件操作命令、目录及其操作的方法；熟练运用Linux常用命令完成对系统的基本操作。全长近两万字，欢迎关注、点赞、收藏本文足够严谨，非常适合学习与回顾Linux的常用命令一、shell与shell命令在Linux和Unix系统中，Shell
医疗金融预测与语音识别中的模型优化及可解释性技术突破智能计算研究中心其他
内容概要随着人工智能技术的纵深发展，模型优化与可解释性技术正在重塑医疗诊断、金融预测及语音识别领域的应用范式。在医疗领域，基于自适应学习的动态参数调整机制，结合迁移学习的跨场景知识复用，显著提升了疾病筛查模型的泛化能力；而金融预测场景中，联邦学习框架通过分布式数据协作，在保障隐私安全的前提下，实现了风险预测模型的多维度优化。语音识别领域则依托边缘计算架构，将模型压缩技术与实时推理引擎结合，有效解决
专题：2025云计算与AI技术研究趋势报告|附200+份报告PDF、原数据表汇总下载
原文链接：https://tecdat.cn/?p=42935关键词：2025,云计算，AI技术，市场趋势，深度学习，公有云，研究报告云计算和AI技术正以肉眼可见的速度重塑商业世界。过去十年，全球云服务收入激增8倍，中国云计算市场规模突破6000亿元，而深度学习算法的应用量更是暴涨400倍。这些数字背后，是企业从“自建机房”到“云原生开发”的转型，是AI从“实验室”走向“产业级应用”的跨越。本报告
稀土-高分子复合材料：新一代功能材料的突破 DeepCeLa 稀土稀土科技磷酸镧
稀土元素（镧系及钪、钇）凭借其特殊的4f电子构型，在高分子材料改性中展现出独特价值。通过配位键合、物理掺杂或纳米复合等技术，稀土与聚合物基体结合可显著提升材料综合性能，并赋予多种特殊功能。一、核心优势稳定性升级：稀土离子（如Ce³⁺/Ce⁴⁺）通过捕获自由基和紫外光子，使材料热分解温度提升30-50℃，紫外耐受性提高5-8倍，适用于极端环境下的工程塑料。力学强化：稀土配合物可诱导聚合物结晶度提升，
Vite 权威技术指南：新一代前端构建工具
第一部分：Vite的理念与架构本部分旨在阐明Vite存在的根本“原因”。它超越了简单的功能罗列，深入剖析了定义Vite的历史背景与架构革新，为后续所有技术细节的探讨奠定理论基础。第1章：Vite简介：重新定义开发者体验核心定义Vite（法语，意为“快速”，发音/vit/）是一款旨在显著提升现代Web项目开发体验的新一代前端构建工具1。其核心由两个主要部分构成：一个利用原生ES模块（ESM）提供丰富
Golang defer 的编译器实现细节 Golang编程笔记 golang 开发语言后端 ai
Golangdefer的编译器实现细节：从语法糖到运行时的全链路解析关键词：Go语言、defer、编译器优化、运行时、延迟执行摘要：本文将深入解析Go语言中defer关键字的底层实现细节。我们将从defer的基础用法出发，逐步拆解编译器如何将defer语法转换为机器可执行的代码，并结合Go编译器的优化历史（如开放编码优化）、运行时关键结构体（_defer）以及实际汇编代码，揭示defer从“语法糖
突破传统：Dell R730服务器RAID 5配置与智能监控全解析芯作者 D2：ubuntu 服务器 linux ubuntu
在现代数据中心运维中，合理的存储配置是保障业务连续性的基石。今天，我们将深入探索DellPowerEdgeR730服务器的RAID5配置技巧，并结合热备盘策略、自动化监控脚本以及性能调优方案，为您呈现一份别开生面的技术指南。一、为什么RAID5+热备盘是企业级存储的黄金组合？RAID5通过分布式奇偶校验实现数据冗余，允许单块硬盘故障时不丢失数据。其存储效率公式为：Efficiency=\frac{
街道垃圾识别难？陌讯视觉算法实测准确率突破95% 2501_92487900 算法边缘计算目标检测视觉检测计算机视觉
开篇痛点：街道垃圾识别的技术挑战在智慧城市和环保监管场景中，街道垃圾的实时检测一直是个难题。传统视觉算法（如YOLOv5、FasterR-CNN）在复杂街道场景下表现不佳，主要面临以下问题：光照干扰：早晚光线变化导致误检（如阴影被识别为垃圾）小目标漏检：饮料瓶、烟头等小物体在640x640输入下仅占10x10像素遮挡问题：垃圾桶周边堆积物造成特征混淆某环保科技公司实测数据显示，开源模型在真实场景中
深入理解Unix进程控制与网络通信机制
背景简介Unix系统是计算机历史上重要的操作系统之一，其设计哲学和实现细节对现代操作系统产生了深远的影响。Unix系统中的进程控制和网络通信机制是其核心功能之一。通过阅读和理解相关的系统调用和编程实践，我们可以深入探索Unix的内部工作机制。标题1：进程控制的核心——fork()和setsid()Unix系统中，每个进程都由另一个进程创建，这通常是通过fork()系统调用来完成的。fork()调用
重型机械识别漏检率高？陌讯算法实测降 35%
在重型机械作业场景中，传统视觉识别系统常面临三大痛点：大型设备遮挡严重导致漏检率超20%、金属表面反光使特征提取失效、多机型混合作业时模型泛化能力不足。某港口集团曾反馈，其基于开源YOLOv5部署的机械监控系统，在暴雨天气下误报率飙升至37%，直接影响作业调度效率[实测数据来源：某港口2024年Q1运维报告]。技术解析：陌讯算法的三重突破陌讯视觉算法针对重型机械识别的特殊性，采用了创新的"动态注意
网络安全核心技术解析：权限提升（Privilege Escalation）攻防全景
引言在网络安全攻防对抗中，权限提升（PrivilegeEscalation）是攻击链条中关键的「破局点」。攻击者通过突破系统权限壁垒，往往能以有限权限为跳板，最终掌控整个系统控制权。本文将从攻击原理、技术路径、实战案例到防御体系，全方位解析这一网络空间的「钥匙窃取」艺术。一、权限提升的本质与分类1.1核心定义权限提升指攻击者通过技术手段，将当前运行进程或用户的权限等级突破系统预设的访问控制机制，获
jpeg2k jpeg2000 jp2图像的编码和解码封装丁金金_chihiro_修行 jpeg2k jpeg2k jpeg2000 jp2 图像编码
以下是针对PDFCoreJPEG2000Manager类的介绍大纲，采用技术文档的标准结构，突出核心功能和设计要点：PDFCoreJPEG2000Manager模块技术文档大纲1.模块概述定位：专业级JPEG2000编解码功能封装核心能力：高性能JPEG2000图像解码（支持RGB/RGBA）可配置质量的图像编码（JP2/J2K/JPX）零内存拷贝的元数据提取设计目标：兼容历史接口（Compres
langgraph的ReAct应用 fishjar100 langgraph 人工智能 ai
一、什么是langgraph的ReActLangGraph中的ReAct（Reasoning+Acting）代理是一种结合推理与行动能力的AI代理架构，通过动态决策链实现复杂任务处理。以下是其核心要点及实践指南。1、ReAct代理的核心原理1.1工作流程：ReAct代理通过循环迭代完成任务：推理（Reason）：模型分析输入和历史上下文，生成思考步骤。行动（Act）：选择工具并调用，或直接响应用户
7月11日 “丹娜丝”残余涡旋持续发威华南强降雨进入“车轮战”模式非著名架构师大模型知识文档 7月11日天气预报
昨日（7月10日），受台风“丹娜丝”残余涡旋和西南季风共同影响，我国华南、东南沿海遭遇强降雨“狙击”，福建沿海、广东沿海、香港、台湾岛中南部等地部分地区出现暴雨或大暴雨，其中广东揭阳局地更是录得特大暴雨，单日降雨量突破400毫米，短时强降水导致部分城镇内涝严重，低洼路段积水过膝，居民生活与交通出行受到显著影响。强降雨持续“控场”粤闽等地再迎考验今日（7月11日），暴雨带仍盘踞在华南上空。中央气象台
深度学习交互式图像分割技术演进与突破 wang1776866571 深度学习交互式分割深度学习人工智能交互式分割
说明本文为作者读研期间基于交互式图像分割领域公开文献的系统梳理与个人理解总结，所有内容均为原创撰写（ai辅助创作），未直接复制或抄袭他人成果。文中涉及的算法、模型及实验结论均参考自领域内公开发表的学术论文（具体文献见文末参考文献列表）。本文旨在为交互式图像分割领域的学习者提供一份结构化的综述参考，内容涵盖技术演进、核心方法、关键技术优化及应用前景，希望能为相关研究提供启发。摘要：本文系统综述了基于
TikTok短视频引爆代购：单条视频日销1.2万单的底层逻辑 Joe13265449558 电商跨境电商代购系统无货源自建站
TikTok+代购系统：如何通过短视频引流实现日销万单？引言：TikTok电商的“流量核弹”与代购新机遇2025年，TikTok全球月活跃用户突破15亿，覆盖200+国家和地区，其短视频+直播的电商模式成为跨境代购的“流量核弹”。数据显示，通过TikTok短视频引流的代购订单占比从2023年的12%飙升至2025年的47%，单条爆款视频可带来超10万次商品点击，转化率高达8.3%。本文将拆解Tik
Spring Boot 与消息队列：使用 RabbitMQ 进行消息的生产与消费！ bug菌¹ 滚雪球学SpringBoot java-rabbitmq spring boot rabbitmq springboot集成消息队列
本文精选收录于《滚雪球学SpringBoot》专栏，专为零基础学习者量身打造。从Spring基础到项目实战，手把手带你掌握核心技术，助力你快速提升，迈向职场巅峰，开启财富自由之路！无论你是刚入门的小白，还是已有基础的开发者，都能在这里找到适合自己的学习路径！关注、收藏、订阅，持续更新中！和我们一起高速成长，突破自我！全文目录：前言目录1.SpringBoot与消息队列概述1.1什么是消息队列？
保护板测试仪厂家：电池安全的技术基石电池保护板测试仪厂家能源制造
在锂电池产业链中，保护板测试仪作为保障电池安全的核心设备，其技术迭代与市场应用正深刻影响着新能源、消费电子等领域的发展。随着电池能量密度提升与应用场景扩展，鑫达能测试仪厂家通过高精度检测与智能化升级，成为推动产业升级的关键力量。技术突破：从基础检测到智能分析现代保护板测试仪的核心功能已从单一参数测量，发展为覆盖全工况模拟的智能化系统。主流设备可实现过充、过放、短路、过流等保护功能的自动化验证，精度
数据安全审计平台的三大关键技术：日志分析、行为监测与智能告警 KKKlucifer 安全算法
在数字化浪潮中，数据安全审计是企业守护核心资产的“瞭望塔”。通过日志分析、行为监测、智能告警三大技术，数据安全审计平台构建起“全流程监控-异常识别-快速响应”的闭环，为数据安全筑牢防线。以下从技术原理、实践价值与行业应用展开解析。日志分析：数据安全的“DNA图谱”1.多源日志融合技术实现：通过Agent采集操作系统、数据库、网络设备等200+日志源，利用正则表达式、NLP技术解析非结构化日志（如“
9.7 国产代码生成神器CodeGeex2实测：效率提升300%，免费平替Copilot！少林码僧掌握先机！从 0 起步实战 AI 大模型微调打造核心竞争力 copilot langchain llama 语言模型
国产代码生成神器CodeGeex2实测：效率提升300%，免费平替Copilot！代码生成模型CodeGeex2：智能编程的国产之光智谱AI推出的CodeGeex2是当前国产代码生成模型的标杆之作，其技术架构与训练策略展现了中国在代码大模型领域的突破性进展。本章将深入解析CodeGeex2的技术原理，并通过实战演示如何构建智能编程助手。一、CodeGeex2技术架构解析1.1模型底座与训练数据
jsonp 常用util方法 hw1287789687 jsonp jsonp常用方法 jsonp callback
jsonp 常用java方法 (1)以jsonp的形式返回:函数名(json字符串) /*** * 用于jsonp调用 * @param map : 用于构造json数据 * @param callback : 回调的javascript方法名 * @param filters : <code>SimpleBeanPropertyFilter theFilt
多线程场景 alafqq 多线程
0 能不能简单描述一下你在java web开发中需要用到多线程编程的场景？0 对多线程有些了解，但是不太清楚具体的应用场景，能简单说一下你遇到的多线程编程的场景吗？ Java多线程 2012年11月23日 15:41 Young9007 Young9007 4 0 0 4 Comment添加评论关注(2) 3个答案按时间排序按投票排序 0 0 最典型的如： 1、
Maven学习——修改Maven的本地仓库路径 Kai_Ge maven
安装Maven后我们会在用户目录下发现.m2 文件夹。默认情况下，该文件夹下放置了Maven本地仓库.m2/repository。所有的Maven构件(artifact)都被存储到该仓库中，以方便重用。但是windows用户的操作系统都安装在C盘，把Maven仓库放到C盘是很危险的，为此我们需要修改Maven的本地仓库路径。
placeholder的浏览器兼容 120153216 placeholder
【前言】自从html5引入placeholder后，问题就来了，不支持html5的浏览器也先有这样的效果，各种兼容，之前考虑，今天测试人员逮住不放，想了个解决办法，看样子还行，记录一下。【原理】不使用placeholder，而是模拟placeholder的效果，大概就是用focus和focusout效果。【代码】 <scrip
debian_用iso文件创建本地apt源 2002wmj Debian
1.将N个debian-506-amd64-DVD-N.iso存放于本地或其他媒介内，本例是放在本机/iso/目录下 2.创建N个挂载点目录如下： debian:~#mkdir –r /media/dvd1 debian:~#mkdir –r /media/dvd2 debian:~#mkdir –r /media/dvd3 …. debian:~#mkdir –r /media
SQLSERVER耗时最长的SQL 357029540 SQL Server
对于DBA来说，经常要知道存储过程的某些信息： 1. 执行了多少次 2. 执行的执行计划如何 3. 执行的平均读写如何 4. 执行平均需要多少时间列名 &
com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 7454103 eclipse
今天eclipse突然报了com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 错误，并且工程文件打不开了，在网上找了一下资料，然后按照方法操作了一遍，好了，解决方法如下：错误提示信息： An error has occurred.See error log for more details. Reason: com/genuitec/
用正则删除文本中的html标签 adminjun java html 正则表达式去掉html标签
使用文本编辑器录入文章存入数据中的文本是HTML标签格式，由于业务需要对HTML标签进行去除只保留纯净的文本内容，于是乎Java实现自动过滤。如下： public static String Html2Text(String inputString) { String htmlStr = inputString; // 含html标签的字符串 String textSt
嵌入式系统设计中常用总线和接口 aijuans linux 基础
嵌入式系统设计中常用总线和接口任何一个微处理器都要与一定数量的部件和外围设备连接，但如果将各部件和每一种外围设备都分别用一组线路与CPU直接连接，那么连线
Java函数调用方式——按值传递 ayaoxinchao java 按值传递对象基础数据类型
Java使用按值传递的函数调用方式，这往往使我感到迷惑。因为在基础数据类型和对象的传递上，我就会纠结于到底是按值传递，还是按引用传递。其实经过学习，Java在任何地方，都一直发挥着按值传递的本色。首先，让我们看一看基础数据类型是如何按值传递的。 public static void main(String[] args) { int a = 2;
ios音量线性下降 bewithme ios音量
直接上代码吧 //second 几秒内下降为0 - (void)reduceVolume:(int)second { KGVoicePlayer *player = [KGVoicePlayer defaultPlayer]; if (!_flag) { _tempVolume = player.volume;
与其怨它不如爱它 bijian1013 选择理想职业规划
抱怨工作是年轻人的常态，但爱工作才是积极的心态，与其怨它不如爱它。一般来说，在公司干了一两年后，不少年轻人容易产生怨言，除了具体的埋怨公司“扭门”，埋怨上司无能以外，也有许多人是因为根本不爱自已的那份工作，工作完全成了谋生的手段，跟自已的性格、专业、爱好都相差甚远。
一边时间不够用一边浪费时间 bingyingao 工作时间浪费
一方面感觉时间严重不够用，另一方面又在不停的浪费时间。每一个周末，晚上熬夜看电影到凌晨一点，早上起不来一直睡到10点钟，10点钟起床，吃饭后玩手机到下午一点。精神还是很差，下午像一直野鬼在城市里晃荡。为何不尝试晚上10点钟就睡，早上7点就起，时间完全是一样的，把看电影的时间换到早上，精神好，气色好，一天好状态。控制让自己周末早睡早起，你就成功了一半。有多少个工作
【Scala八】Scala核心二：隐式转换 bit1129 scala
Implicits work like this: if you call a method on a Scala object, and the Scala compiler does not see a definition for that method in the class definition for that object, the compiler will try to con
sudoku slover in Haskell (2) bookjovi haskell sudoku
继续精简haskell版的sudoku程序，稍微改了一下，这次用了8行，同时性能也提高了很多，对每个空格的所有解不是通过尝试算出来的，而是直接得出。 board = [0,3,4,1,7,0,5,0,0, 0,6,0,0,0,8,3,0,1, 7,0,0,3,0,0,0,0,6, 5,0,0,6,4,0,8,0,7,
Java-Collections Framework学习与总结-HashSet和LinkedHashSet BrokenDreams linkedhashset
本篇总结一下两个常用的集合类HashSet和LinkedHashSet。它们都实现了相同接口java.util.Set。Set表示一种元素无序且不可重复的集合；之前总结过的java.util.List表示一种元素可重复且有序
读《研磨设计模式》-代码笔记-备忘录模式-Memento bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; /* * 备忘录模式的功能是，在不破坏封装性的前提下，捕获一个对象的内部状态，并在对象之外保存这个状态，为以后的状态恢复作“备忘”
《RAW格式照片处理专业技法》笔记 cherishLC PS
注意，这不是教程！仅记录楼主之前不太了解的一、色彩（空间）管理作者建议采用ProRGB（色域最广），但camera raw中设为ProRGB，而PS中则在ProRGB的基础上，将gamma值设为了1.8（更符合人眼）注意：bridge、camera raw怎么设置显示、输出的颜色都是正确的（会读取文件内的颜色配置文件），但用PS输出jpg文件时，必须先用Edit->conv
使用 Git 下载 Spring 源码编译 for Eclipse crabdave eclipse
使用 Git 下载 Spring 源码编译 for Eclipse 1、安装gradle，下载 http://www.gradle.org/downloads 配置环境变量GRADLE_HOME，配置PATH %GRADLE_HOME%/bin，cmd，gradle -v 2、spring4 用jdk8 下载 https://jdk8.java.
mysql连接拒绝问题 daizj mysql 登录权限
mysql中在其它机器连接mysql服务器时报错问题汇总一、[running][email protected]:~$mysql -uroot -h 192.168.9.108 -p //带-p参数，在下一步进行密码输入 Enter password: //无字符串输入 ERROR 1045 (28000): Access
Google Chrome 为何打压 H.264 dsjt apple html5 chrome Google
Google 今天在 Chromium 官方博客宣布由于 H.264 编解码器并非开放标准，Chrome 将在几个月后正式停止对 H.264 视频解码的支持，全面采用开放的 WebM 和 Theora 格式。 Google 在博客上表示，自从 WebM 视频编解码器推出以后，在性能、厂商支持以及独立性方面已经取得了很大的进步，为了与 Chromium 现有支持的編解码器保持一致，Chrome
yii 获取控制器名和方法名 dcj3sjt126com yii framework
1. 获取控制器名在控制器中获取控制器名: $name = $this->getId(); 在视图中获取控制器名: $name = Yii::app()->controller->id; 2. 获取动作名在控制器beforeAction()回调函数中获取动作名: $name =
Android知识总结（二） come_for_dream android
明天要考试了，速速总结如下 1、Activity的启动模式 standard：每次调用Activity的时候都创建一个（可以有多个相同的实例，也允许多个相同Activity叠加。） singleTop：可以有多个实例，但是不允许多个相同Activity叠加。即，如果Ac
高洛峰收徒第二期：寻找未来的“技术大牛” ——折腾一年，奖励20万元 gcq511120594 工作项目管理
高洛峰，兄弟连IT教育合伙人、猿代码创始人、PHP培训第一人、《细说PHP》作者、软件开发工程师、《IT峰播》主创人、PHP讲师的鼻祖！首期现在的进程刚刚过半，徒弟们真的很棒，人品都没的说，团结互助，学习刻苦，工作认真积极，灵活上进。我几乎会把他们全部留下来，现在已有一多半安排了实际的工作，并取得了很好的成绩。等他们出徒之日，凭他们的能力一定能够拿到高薪，而且我还承诺过一个徒弟，当他拿到大学毕
linux expect heipark expect
1. 创建、编辑文件go.sh #!/usr/bin/expect spawn sudo su admin expect "*password*" { send "13456\r\n" } interact 2. 设置权限 chmod u+x go.sh 3.
Spring4.1新特性——静态资源处理增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
idea ubuntuxia 乱码 liyonghui160com
1.首先需要在windows字体目录下或者其它地方找到simsun.ttf 这个字体文件。 2.在ubuntu 下可以执行下面操作安装该字体： sudo mkdir /usr/share/fonts/truetype/simsun sudo cp simsun.ttf /usr/share/fonts/truetype/simsun fc-cache -f -v
改良程序的11技巧 pda158 技巧
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短永远永远不要把同一个变量用于多个不同的
300个涵盖IT各方面的免费资源（下）——工作与学习篇 shoothao 创业免费资源学习课程远程工作
工作与生产效率: A. 背景声音 Noisli:背景噪音与颜色生成器。 Noizio:环境声均衡器。 Defonic:世界上任何的声响都可混合成美丽的旋律。 Designers.mx:设计者为设计者所准备的播放列表。 Coffitivity:这里的声音就像咖啡馆里放的一样。 B. 避免注意力分散 Self Co
深入浅出RPC uule rpc
深入浅出RPC-浅出篇深入浅出RPC-深入篇 RPC Remote Procedure Call Protocol 远程过程调用协议它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在，如TCP或UDP，为通信程序之间携带信息数据。在OSI网络通信模型中，RPC跨越了传输层和应用层。RPC使得开发

NLP历史突破！谷歌BERT模型狂破11项纪录，全面超越人类！

你可能感兴趣的:(nlp,历史,突破)