无水先生

大型语言模型，第 1 部分：BERT

一、介绍

2017是机器学习中具有历史意义的一年，当变形金刚模型首次出现在现场时。它在许多基准测试上都表现出色，并且适用于数据科学中的许多问题。由于其高效的架构，后来开发了许多其他基于变压器的模型，这些模型更专注于特定任务。

其中一个模型是BERT。它主要以能够构建嵌入而闻名，这些嵌入可以非常准确地表示文本信息并存储长文本序列的语义含义。因此，BERT嵌入在机器学习中得到了广泛的应用。理解BERT如何构建文本表示至关重要，因为它为处理NLP中的大量任务打开了大门。

在本文中，我们将参考原始的BERT论文，并查看BERT架构并了解其背后的核心机制。在第一节中，我们将对BERT进行高级概述。之后，我们将逐步深入了解其内部工作流程以及如何在整个模型中传递信息。最后，我们将学习如何微调BERT以解决NLP中的特定问题。

二、高级概述

Transformer的架构由两个主要部分组成：编码器和解码器。堆叠编码器的目标是为输入构造有意义的嵌入，以保留其主要上下文。最后一个编码器的输出将传递给所有尝试生成新信息的解码器的输入。

BERT是变压器的后继产品，继承了其堆叠式双向编码器。BERT中的大多数架构原理与原始变压器中的架构原理相同。

变压器架构

三、Bert版本

BERT有两个主要版本：基本版本和大型版本。它们的架构是完全相同的，除了它们使用不同数量的参数。总体而言，与BERT基础相比，BERT large需要调整的参数多3.09倍。

BERT基底和BERT大基的比较

四、双向表示

从BERT名称中的字母“B”开始，重要的是要记住BERT是一个双向模型，这意味着由于信息是双向传递的（从左到右和从右到左），它可以更好地捕获单词连接。显然，与单向模型相比，这会产生更多的训练资源，但同时会导致更好的预测准确性。

为了更好地理解，我们可以将BERT架构与其他流行的NLP模型进行比较。

比较来自 ogirinal 论文的 BERT、OpenAI GPT 和 ElMo 架构。作者采纳。

五、输入标记化

小说在官方论文中，作者使用术语“句子”来表示传递给输入的文本。为了指定相同的术语，在本系列文章中，我们将使用术语“序列”。这样做是为了避免混淆，因为“句子”通常意味着由一个点分隔的单个短语，并且由于在许多其他NLP研究论文中，术语“序列”在类似情况下使用。

在深入研究如何训练BERT之前，有必要了解它接受数据的格式。对于输入，BERT采用单个序列或一对序列。每个序列被拆分为令牌。此外，两个特殊令牌将传递给输入：

小说官方论文使用术语“句子”，它表示传递给BERT的输入序列，该序列实际上可以由几个句子组成。为简单起见，我们将遵循符号并在本文中使用相同的术语。

[CLS] — 在指示其开始的第一个序列之前传递。同时，[CLS] 还用于训练期间的分类目标（在以下部分中讨论）。
[SEP] — 在序列之间传递，以指示第一个序列的结束和第二个序列的开始。

传递两个序列使BERT可以处理输入包含一对序列的各种任务（例如问题和答案，假设和前提等）。

六、输入嵌入

标记化后，将为每个令牌构建一个嵌入。为了使输入嵌入更具代表性，BERT为每个令牌构造了三种类型的嵌入：

令牌嵌入捕获令牌的语义含义。
段嵌入具有两个可能的值之一，并指示令牌属于哪个序列。
位置嵌入包含有关序列中令牌的相对位置的信息。

输入处理

对这些嵌入进行汇总，并将结果传递给BERT模型的第一个编码器。

七、输出

每个编码器将 n 个嵌入作为输入，然后输出相同数量的相同维度的已处理嵌入。最终，整个BERT输出还包含n个嵌入，每个嵌入对应于其初始令牌。

八、训练

BERT培训包括两个阶段：

预培训。BERT在两个预测任务中对未标记的序列对进行训练：掩蔽语言建模（MLM）和自然语言推理（NLI）。对于每对序列，模型对这两个任务进行预测，并根据损失值执行反向传播以更新权重。
微调。BERT使用预先训练的权重进行初始化，然后针对标记数据上的特定问题进行优化。

九、预培训

与微调相比，预训练通常需要相当大比例的时间，因为模型是在大量数据语料库上进行训练的。这就是为什么存在许多预先训练模型的在线存储库，然后可以相对较快地对其进行微调以解决特定任务。

我们将详细研究BERT在预训练期间解决的两个问题。

9.1 遮罩语言建模

作者建议通过在初始文本中屏蔽一定数量的标记并预测它们来训练BERT。这使BERT能够构建弹性嵌入，该嵌入可以使用周围的上下文来猜测某个单词，这也导致为遗漏的单词构建适当的嵌入。此过程的工作方式如下：

标记化后，随机选择15%的令牌进行屏蔽。然后，所选令牌将在迭代结束时进行预测。
所选令牌以以下三种方式之一替换：
- 80% 的令牌由 [MASK] 令牌替换。
示例：我买了一本书→买了一个[MASK]
- 10%的代币被随机代币取代。
示例：他正在吃一个水果→他正在抽一个水果
- 10%的代币保持不变。
示例：房子在我附近 → 房子在我附近
所有令牌都传递给BERT模型，该模型为其作为输入接收的每个令牌输出嵌入。

4. 与步骤 2 中处理的令牌对应的输出嵌入独立用于预测屏蔽的令牌。每个预测的结果是词汇表中所有标记的概率分布。

5. 交叉熵损失是通过将概率分布与真实掩蔽令牌进行比较来计算的。

6. 使用反向传播更新模型权重。

9.2 自然语言推理

对于此分类任务，BERT尝试预测第二个序列是否遵循第一个序列。整个预测是通过仅使用 [CLS] 令牌的最终隐藏状态的嵌入来进行的，该令牌应该包含来自两个序列的聚合信息。

与MLM类似，构造的概率分布（在本例中为二进制）用于计算模型的损失并通过反向传播更新模型的权重。

对于NLI，作者建议选择50%的序列对，这些序列在语料库中相互跟随（正对）和50%的序列对，其中序列是从语料库中随机获取的（负对）。

伯特预培训

9.3 培训详情

根据该论文，BERT在BooksCorpus（800亿字）和英语维基百科（2，500M字）上进行了预训练。为了提取较长的连续文本，作者从维基百科中只阅读了忽略表格，标题和列表的段落。

BERT在256万个批次上训练，大小等于40个序列，相当于3亿个单词的3个epoch。每个序列最多包含 128（90% 的时间）或 512（10% 的时间）令牌。

根据原论文，训练参数如下：

优化器：亚当（学习率 l = 1e-4，权重衰减 L₂ = 0.01，β₁ = 0.9，β₂ = 0.999，ε = 1e-6）。
学习率预热在前 10 步内执行，然后线性降低。
所有图层都使用压差（α = 0.1）图层。
激活功能：格鲁。
训练损失是平均MLM和平均下一句预测可能性的总和。

9.4 微调

一旦预训练完成，BERT就可以从字面上理解单词的语义含义，并构建几乎可以完全表示其含义的嵌入。微调的目标是逐步修改BERT权重以解决特定的下游任务。

十、数据格式

由于自我注意机制的稳健性，BERT可以很容易地针对特定的下游任务进行微调。BERT的另一个优点是能够构建双向文本表示。这提供了在处理对时发现两个序列之间正确关系的更高机会。以前的方法包括独立编码两个序列，然后对它们应用双向交叉注意力。BERT统一了这两个阶段。

根据某个问题，BERT接受多种输入格式。使用BERT解决所有下游任务的框架是相同的：通过将文本序列作为输入，BERT输出一组令牌嵌入，然后将其馈送到模型。大多数情况下，并非所有输出嵌入都使用。

让我们看一下常见问题以及通过微调BERT解决它们的方法。

句子对分类

句子对分类的目标是了解给定序列对之间的关系。大多数常见的任务类型是：

自然语言推理：确定第二个序列是否遵循第一个序列。
相似性分析：查找序列之间的相似程度。

Sentence pair classification

为了进行微调，两个序列都传递给BERT。根据经验，[CLS] 令牌的输出嵌入随后将用于分类任务。根据研究人员的说法，[CLS]令牌应该包含有关句子关系的主要信息。

当然，也可以使用其他输出嵌入，但在实践中通常会省略它们。

问答任务

问答的目的是在与特定问题对应的文本段落中找到答案。大多数时候，答案以两个数字的形式给出：通道的开始和结束令牌位置。

问答任务

对于输入，BERT接受问题和段落，并为它们输出一组嵌入。由于答案包含在段落中，因此我们只对与段落标记对应的输出嵌入感兴趣。

为了查找段落中开始答案标记的位置，计算每个输出嵌入与特殊可训练向量 Tstₐrt 之间的标量积。对于大多数情况下，当模型和向量 Tstₐrt 经过相应训练时，标量积应与相应令牌实际上是起始答案令牌的可能性成正比。为了规范化标量积，然后将它们传递给softmax函数，并且可以将其视为概率。与最高概率对应的令牌嵌入被预测为开始答案令牌。基于真实概率分布，计算损失值并执行反向传播。使用向量 Tₑnd 执行类似的过程来预测结束标记。

单句分类

与以前的下游任务相比，不同之处在于这里只传递了一个句子 BERT。此配置解决的典型问题如下：

情感分析：了解一个句子是积极的态度还是消极的态度。
主题分类：根据句子的内容将句子分类为几个类别之一。

单句分类

预测工作流与句子对分类相同：[CLS] 标记的输出嵌入用作分类模型的输入。

单句标记

命名实体识别（NER）是一个机器学习问题，旨在将序列的每个标记映射到相应的实体之一。

单句标记

为此，像往常一样计算输入句子标记的嵌入。然后，每个嵌入（[CLS] 和 [SEP] 除外）都独立地传递给一个模型，该模型将它们中的每一个映射到给定的 NER 类（或者不是，如果不能）。

十一、特征提取

获取最后一个BERT层并将其用作嵌入并不是从输入文本中提取特征的唯一方法。事实上，研究人员完成了几个以不同方式聚合嵌入的实验，以解决CoNLL-2003数据集上的NER任务。为了进行实验，他们在应用分类层之前使用提取的嵌入作为随机初始化的双层 768 维 BiLSTM 的输入。

下图演示了嵌入（从BERT基中提取）的方式。如图所示，性能最高的方法是连接最后四个BERT隐藏层。

基于进行的实验，重要的是要记住，隐藏层的聚合是改善嵌入表示的潜在方法，以便在各种NLP任务上获得更好的结果。

左图显示了带有隐藏层的扩展BERT结构。右表说明了嵌入的构造方式以及通过应用相应策略获得的相应分数。

十二、将BERT与其他功能相结合

例如，有时我们不仅处理文本，还处理数字特征。构建可以合并来自文本和其他非文本特征的信息的嵌入是自然可取的。以下是建议的应用策略：

文本与非文本功能的串联。例如，如果我们以文本形式处理有关人员的个人资料描述，并且还有其他单独的功能，例如他们的姓名或年龄，则可以以以下形式获得新的文本描述：“我的名字是<姓名>。<个人资料描述>。我<岁>”。最后，这样的文本描述可以输入到BERT模型中。
嵌入与特征的串联。如上所述，可以构建BERT嵌入，然后将它们与其他功能连接起来。配置中唯一更改的是下游任务的分类模型现在必须接受更高维度的输入向量。

维亚切斯拉夫·叶菲莫夫

十三、结论

在本文中，我们深入探讨了BERT训练和微调的过程。事实上，这些知识足以解决NLP中的大多数任务，值得庆幸的是，BERT允许几乎完全将文本数据合并到嵌入中。

最近，出现了其他类似BERT的模型（SBERT，RoBERTa等）。甚至还有一个名为“BERTology”的特殊研究领域，它深入分析BERT功能，以推导出新的高性能模型。这些事实强化了这样一个事实，即BERT指定了机器学习的一场革命，并使NLP的显着进步成为可能

C++使用Onnxruntime/TensorRT模型推理奇华智能 AI c++开发语言人工智能 AI 计算机视觉
onnxruntime和tensorrt是我们常用的两种推理方式，下面整理了两个推理示例，仅供参考。步骤流程模型训练，python下生成pytorch的模型.pth，并基于.pth模型进行推理python下依据模型推理实现从.pth转向.onnxpython下基于.onnx进行推理，与后续两种推理方式种的推理结果进行比较环境windows10+RTX308015GB显存cuda11.3onnxru
数据挖掘data mining Wlq0415 学习5 数据挖掘人工智能
数据挖掘是从大量数据集中提取有用信息和知识的过程。它通常涉及使用算法和技术来分析数据，以发现数据中的模式、趋势和关联。数据挖掘可以帮助企业和组织理解客户行为，预测市场趋势，优化运营流程等。数据挖掘的过程大致可以分为以下几个步骤：定义问题：明确数据挖掘的目的和需要解决的问题。数据收集：从各种数据源中收集相关的数据。数据预处理：清洗和整理数据，处理缺失值、异常值等问题。数据转换：将原始数据转换成适合挖
测试是如何跟进和管理 bug 易成技术团队 bug
测试在跟进和管理Bug定位精确、问题反馈及时、修复闭环高效三大关键环节中起到了至关重要的作用。Bug定位精确是整个流程的基础，通过详细记录和复现问题，可以帮助开发团队迅速找出缺陷根源；而及时有效的反馈机制则确保问题不会被遗漏；闭环管理则让每个问题都有迹可循、最终解决。这里我们重点展开讲解Bug定位精确的重要性，通过不断优化测试用例和环境搭建，能显著提高问题定位的准确率和效率，从而大幅降低项目风险和
GitLab 密钥详解：如何安全地使用 SSH 密钥进行身份验证 Crazy learner Linux基本命令 gitlab 安全 ssh
目录一、什么是GitLabSSH密钥？二、为什么要使用SSH密钥？三、如何生成SSH密钥？1.Linux/macOS2.Windows四、将公钥添加到GitLab五、配置SSH客户端六、常见问题及解决方案七、总结GitLab是一个功能强大的Git仓库管理平台，它支持通过SSH密钥进行身份验证，提供了比传统的用户名和密码登录方式更安全的认证机制。本文将深入探讨GitLab的SSH密钥，包括如何生成、
如何评估测试团队的绩效？ blues_C 软件测试&项目管理测试工具功能测试软件测试
测试团队的绩效评估目的一、软件测试工程师职责二、测试的不确定性三、考核内容四、绩效评估的误区五、绩效评估模板六、绩效评估等级与激励方式目的绩效评估不仅仅是为了衡量团队的工作成果，更重要的是通过评估找到改进点，提升团队的整体效率和质量。其主要目的如下：激励团队成员：通过公正的绩效评估，激励团队成员努力工作，提升个人和团队的工作绩效。发现问题：通过绩效评估，发现团队在工作过程中存在的问题，及时采取措施
数据分类分级：如何用AI自动打标签（附Python代码示例）活力板蓝根数据治理人工智能分类 python
数据分类分级：如何用AI自动打标签（附Python代码示例）1.引言在当今数字化时代，数据的安全管理变得越来越重要。数据分类分级不仅是合规要求，更是保护核心资产的重要手段。然而，随着数据量的激增，传统的人工分类方式已经难以应对这个问题。本文将介绍如何利用AI技术实现数据的自动分类分级。希望大家享用愉快！2.技术方案概述2.1问题定义目标：将数据按照敏感度（公开、内部、机密）和业务类型（财务、人事、
SpringBoot篇之集成Jedis、Lettuce、Redisson AK@ springboot spring boot 后端 java
目录前言一、详解Jedis、Lettuce和Redisson的区别二、SpringBoot集成2.1集成Jedis2.2集成Lettuce2.3集成Redisson总结前言大家好，我是AK，最近在做新项目，基于旧项目框架修改，正好最近也在整理springboot相关知识，项目中用到Redis，因此整理出来，帮助需要的小伙伴搞清楚到底选择哪个Redis客户端库。一、详解Jedis、Lettuce和R
java poi居中_使用apache poi在合并单元格中水平居中图像爱军习武 java poi居中
将图片放置在Excel表格中是一件棘手的事情，因为图片被锚定在两个单元格上。左上角的锚点单元加上delta-x和delta-y来确定图片左上角的位置。右下角锚点单元格加上delta-x和delta-y来确定大小。单元格是否合并对此过程并不重要。因此，为了水平居中，我们需要计算哪一个是左上角的锚点单元加上delta-x。幸运的是，右下角锚点单元格加上delta-x和delta-y，可以通过在设置左上
在手机制造行业中应用大语言模型推进智能制造 txzq AIGC 大数据人工智能智能制造大语言模型
(Harnessingthepoweroflargelanguagemodelsformanufacturing|WorldEconomicForum)智能制造工厂中的机器人臂和工程师协同工作，大语言模型等AI技术正帮助提升生产效率和质量(Harnessingthepoweroflargelanguagemodelsformanufacturing|WorldEconomicForum)。应用场景
Node.js学习分享（上） miraculous111 node.js 学习笔记 javascript
Node.jsfs文件系统模块fs.readFile()fs.writeFile()path路径模块路径拼接path.join()获取路径中的文件名path.basename()的语法格式获取路径中的文件扩展名path.extname()的语法格式http模块服务器相关概念IP地址域名和域名服务器端口号创建最基本的web服务器创建web服务器的基本步骤request请求对象解决中文乱码问题根据不同
Databend 产品月报（2025年2月）数据库
很高兴为您带来Databend2025年2月的最新更新、新功能和改进！我们希望这些增强功能对您有所帮助，并期待您的反馈。从MySQL迁移到DatabendDatabend推荐使用db-archiver进行MySQL批量迁移，使用FlinkCDC进行实时变更数据捕获（CDC）迁移。教程已更新：使用db-archiver从MySQL迁移使用FlinkCDC从MySQL迁移设置会话标签现在，您可以为会话
郑州人工智能计算中心成果发布会成功举办埃文科技共建AI生态人工智能
2024年3月1日，由郑州市科学技术局主办，郑州联通、华为技术有限公司联合承办的郑州人工智能计算中心成果发布会在郑州隆重举行，郑州埃文科技有限公司（以下简称“埃文科技”）作为河南省人工智能领军企业受邀参会。大会以“全面拥抱智能化，共筑算力新底座”为主题，郑州市委副书记、代市长庄建球，河南联通党委书记、总经理华豫民等领导，以及300余位行业专家、企业代表齐聚一堂，共同见证中部地区首个政府主导的智能算
基于K8S设计实现机器学习管理调度平台 richenlin 机器学习
设计和实现一套基于Kubernetes(K8s)的机器学习管理调度平台，目标是利用K8s的容器化和调度能力，提供高效的资源管理、任务调度、可扩展性及灵活性，适应机器学习（ML）训练、推理等不同场景的需求。以下是平台设计的主要模块和实施步骤：1.系统架构概述该平台需要一个多层架构，其中K8s作为底层容器调度和资源管理平台，机器学习任务管理与调度层作为平台的核心模块。平台应具备高可用、弹性伸缩、任务监
DeepSeek×博云AIOS：突破算力桎梏，开启AI普惠新纪元 deepseek
背景在全球人工智能技术高速迭代的背景下，算力成本高企、异构资源适配复杂、模型部署效率低下等问题，始终是制约企业AI规模化应用的关键。DeepSeek以创新技术直击产业痛点，而博云先进算力管理平台AIOS的全面适配，则为这一技术落地提供了坚实底座。两者的深度融合，正在重塑AI产业化的技术范式。DeepSeek：算法创新定义AI新范式DeepSeek凭借技术突破，为AI领域树立了新标杆：DeepSee
React Hooks 完全指南：从入门到精通斯~内克 react知识点 react.js javascript 前端
一、Hooks的革命性意义1.1为什么需要Hooks？类组件痛点：根据2024年React开发者调查报告，87%的开发者认为生命周期方法难以理解，尤其是componentDidUpdate的复杂逻辑逻辑复用困境：传统HOC和RenderProps模式导致组件嵌套地狱（NestingHell）性能优化难题：类组件难以精细控制重渲染，shouldComponentUpdate优化成本高代码组织混乱：相
LKT4202UGM新一代安全认证加密芯片，守护联网设备和服务安全 Zero_Era 安全物联网
LKT4202UGM是提供身份验证、机密性和平台完整性服务的安全元件产品，可保护原始设备制造商免受克隆、伪造、恶意软件注入和未经授权生产的侵害。LKT安全元件经过最为严格的安全认证，可提供一站式解决方案。为满足市场对LKT产品的需求，凌科芯安也在不断更新迭代LKT系列的产品。LKT4202UGM芯片作为新一代安全认证加密芯片，可为本地或远程主机提供身份验证和安全数据管理服务，还提供哈希、加密和解密
【Python 开发网络爬虫抓取客户订单网站数据】局外人_Jia python 爬虫数据库开发语言字符串正则表达式
以下是使用Python开发网络爬虫抓取客户订单网站数据的完整指南，包含技术实现、注意事项和法律合规性说明：一、准备工作：法律与合规性确认合法性：检查目标网站的robots.txt文件（如https://example.com/robots.txt）。确保遵守网站的《服务条款》（TermsofService）。如果涉及用户隐私数据（如订单详情），需获得明确授权。推荐替代方案：优先使用网站提供的API
普中51单片机和金沙滩51单片机的对比分析晓风伴月单片机开发 51单片机嵌入式硬件单片机
普中51单片机和金沙滩51单片机是国内常见的两种51单片机开发板品牌，各有特点，适合不同需求的用户。以下是两者的对比分析：1.价格与性价比普中51单片机价格相对较低（通常在几十元到百元之间），适合预算有限的初学者。开发板功能集成度高，外设丰富（如LED、数码管、按键、LCD接口等），性价比较高。金沙滩51单片机价格稍高（百元左右或更高），但硬件设计更注重稳定性和扩展性。配套的《手把手教你学51单片
【python数据挖掘之numpy】-数组及对象属性和数据转换 sc.溯琛 python 数据挖掘 numpy
Numpy是一个Python库，用于处理多维数组和矩阵，以及针对这些数组执行数学运算的函数。它提供了高效的数组对象和相关的操作，可以用于快速处理大量数据。Numpy的主要功能包括：创建数组、数组运算、数组索引和切片、线性代数、随机数生成等。Numpy在科学计算、数据分析、机器学习等领域都广泛应用。tips：（本博文在jupyter中实训）目录一、创建数组对象1.array（）函数来创建数组的对象2
【前端】Node.js使用教程 m0_74825172 面试学习路线阿里巴巴前端 node.js vim
目录一、?Node.js开发环境和编译1.1安装Node.js1.2创建一个Node.js项目1.3编写Node.js程序1.4运行Node.js程序1.5使用Node.js模块二、高级的Node.js编程概念和示例2.1异步编程2.2错误处理2.3网络请求2.4构建Web服务器2.5数据库交互三、Node.js开发中重要方面和概念3.1环境变量和配置文件3.1.1使用环境变量3.1.2使用配置文
Jedis那么低性能，还在用？赶紧换上 lettuce 吧白露与泡影 java redis 数据库
最近有很多小伙伴在面大厂，经常遇到下面的问题：3大redis客户端：Jedis、Redisson、Lettuce，如何选型？今天就来深入聊聊这个问题Redis的3大Java客户端组件Redis官方推荐的Java客户端有Jedis、lettuce和Redisson。客户端组件1：JedisJedis是老牌的Redis的Java实现客户端，提供了比较全面的Redis命令的支持、Jedis在线网址：ht
解释 Node.js 中的异步编程模型，如何使用回调、Promise 和async / await 处理异步操作？程序员黄同学 node.js 前端开发 JavaScript node.js
一、Node.js异步模型基础Node.js采用单线程事件循环机制，通过libuv库实现非阻塞I/O操作。这种架构决定了异步编程是其核心特性。当遇到I/O操作（如文件读写、网络请求）时，主线程会将任务交给底层线程池处理，自己继续执行后续代码。操作完成后通过回调通知主线程。二、异步处理的三驾马车1.回调函数（Callback）最基础的异步处理方式，将函数作为参数传递给异步方法：constfs=req
使用Node.js的MySQL连接池进行数据库编程 PixelLogic 数据库 node.js mysql 编程
在Node.js应用程序中，与数据库进行交互是非常常见的任务。为了提高性能和可伸缩性，使用连接池来管理数据库连接是一个明智的选择。本文将介绍如何在Node.js中使用MySQL连接池进行数据库编程，并提供相应的源代码示例。步骤1：安装MySQL模块首先，我们需要安装Node.js的MySQL模块。可以使用npm（Node.js软件包管理器）执行以下命令来安装它：npminstallmysql步骤2
OPPO Find N5折叠手机：创新与实用的完美融合，FPC应用展现科技魅力【新立电子】珠海新立电子FPC 智能手机科技 OPPO Find N5 fpc柔性线路板新立电子
OPPOFindN5作为2025年新出世的折叠手机，以其卓越的设计、强大的性能以及创新的技术，为消费者带来了全新的使用体验。FPC（柔性电路板）在其中的运用，也进一步提升了手机的整体性能和用户体验。OPPOFindN5的最大亮点之一是其极致轻薄的机身设计。单边厚度仅为4mm，折叠状态下厚度也控制在9.2mm以内，这样的设计使得FindN5在便携性上达到了一定的高度。通过运用FPC精密布局各种电子元
带你深入了解前端【HTML+JavaScript】软件技术NINI 前端 html javascript
DeepSeek-R1满血版思考完成嗯，用户想要深入了解前端中的HTML和JavaScript，所以我需要整理相关的信息，参考提供的搜索结果，特别是‌和‌，因为它们直接提到了HTML和JavaScript的结合使用。首先，确定HTML和JavaScript的基本关系，然后看看各个搜索结果里的内容有什么可以整合的。比如，搜索结果‌详细介绍了src和href的区别，而‌则讲解了如何在HTML中使用sc
AI生成的web框架包含前后端 k8s管理等 LCY133 人工智能前端 kubernetes
好的，我现在需要根据用户提供的技术栈来设计一个Web平台的搭建方案。用户提到的技术包括前端、后端、算法，GitLab、Jenkins，阿里云ACK和ECS，MongoDB、Redis，Docker、K8s、Nginx。我需要综合考虑这些技术的整合，确保整个架构的高效、可靠和可扩展。首先，用户之前已经得到了一个架构方案，现在可能希望进一步细化或者调整。我需要回顾之前的方案，看看是否有遗漏或可以优化的
spaCy 入门：自然语言处理的高效工具 zru_9602 人工智能自然语言处理人工智能
spaCy入门：自然语言处理的高效工具引言spaCy是一个功能强大的开源Python库，专注于工业级的自然语言处理（NLP）。它以其高效的性能、简洁的API和对多种语言的支持而闻名。无论是进行文本分析、信息提取还是构建智能聊天机器人，spaCy都是一个不可或缺的工具。本文将从零开始，介绍spaCy的基本功能和使用方法，并通过示例代码帮助你快速上手。1.安装spaCy在开始之前，首先需要安装spaC
K8S学习之基础十：初始化容器和主容器云上艺旅 K8S学习 kubernetes 云原生容器
init容器和主容器init容器和主容器的区别初始化容器不支持Readinessprobe，因为他们必须在pod就绪之前运行完成每个init容器必须运行成功，下一个才能够运行#定义两个初始化容器，完成后再运行主容器vipod-init.yamlapiVersion:v1kind:Podmetadata:name:myapp-podlabels:app:myappspec:initContainer
Camera相关配置 wynn1123 时间同步自动驾驶
一、Purpose目的通常，感知模块使用雷达点云和相机图像来对物体进行检测和分类，感知数据分别来自雷达和相机，就传感器数据融合准确性，我们需要雷达和相机同一时间捕捉到同一物体(时间间隔尽可能短)，否则一个真实的物体可能被感知处理成两个，尤其是移动的物体。二、Measurementtimestamp所有雷达相机都以10fps工作，因此我们在每100ms循环中为每个相机/雷达设定一个触发时间.雷达me
SQL注入攻击 Wlq0415 数据库服务器运维
SQL注入攻击是指攻击者通过在输入字段中插入恶意SQL代码，以此来影响应用程序与数据库之间的交互，进而非法获取或篡改数据库中的数据。这种攻击利用了应用程序对用户输入缺乏充分验证或过滤的情况。抵御SQL注入攻击的两种常见方式包括：使用参数化查询（PreparedStatements）：参数化查询是一种编程技术，它将SQL语句和用户输入分开处理。这样可以确保用户输入的数据仅被视为数据，而不是SQL代码
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb