futurewq

Bert模型精讲

1.Autoregressive语言模型与Autoencoder语言模型

1.1 语言模型概念介绍

Autoregressice语言模型：指的是依据前面(或后面)出现的单词来预测当前时刻的单词，代表有ElMo, GPT等。

Autoencoder语言模型：通过上下文信息来预测被mask的单词，代表有BERT,Word2vec(CBOW)。

Bert模型精讲_第1张图片

1.2 二者各自的优缺点

Autoregressive语言模型:

-缺点：它只能利用单向语义而不能同时利用上下文信息。ELMo通过双向都做Autoregressive模型，然后进行拼接，但从结果来看，效果并不是太好。

-优点：对生成模型友好，天然符合生成式任务的生成过程。这也是为什么GPT能够编故事的原因。

Autoencoder语言模型:

-缺点：由于训练中采用了[MASK]标记，导致预训练数据与微调阶段数据不一致的问题。BERT独立性假设问题，即没有对被遮掩(MASK)的token之间的关系进行学习。此外对于生成式问题，Autencoder模型也显得捉襟见肘。

-优点：能够很好的编码上下文语义信息(即考虑句子的双向信息)，在自然语言理解相关的下游任务表现突出。

2.DAE与Masked Language Model

2.1 AutoEncoder

如下图所示，AutoEncoer框架包含两个模块：编码过程和解码过程。通过encoder(g)讲输入样本x映射到特征空间z，即编码过程；然后再通过decoder(f)将抽象特征z抽象会原始空间得到重构样本 �~ ，即解码过程。优化目标则是通过最小化重构误差来同事优化encoder和decoder，从而学习得到针对输入样本x的抽象特征表示z.

Bert模型精讲_第2张图片

这里我们可以看到，AutoEncoder在优化过程中无需使用样本的label,本质上是把样本的输入同时作为神经网络的输入和输出，通过最小化重构误差希望学习到样本的抽象特征表示z.这种无监督的优化方式大大提升了模型的通用性。

对于基于神经网络的AutoEncoder模型来说，则是encoder部分通过逐层降低神经元个数来对数据进行压缩;decoder部分基于数据的抽象表示逐层提升神经元数量，最终实现对输入样本的重构。

这里值得注意的是，由于autoencoder通过神经网络来学习每个样本的唯一抽象表示，这会带来一个问题：当神经网络的参数复杂到一定程度时AutoEncoder很容易存在过拟合的风险。

2.2 Denoising AutoEncoder(DAE)

为了缓解经典AutoEncoder容易过拟合的问题，一个办法时在输入中加入随机噪声，Vincent等人提出了Denoising AutoEncoder，即在传统AutoEncoder输入层加入随机噪声来增强模型的鲁棒性；另一个办法就是几何正则化思想，Rifai等人提出了Contractive AutoEncoder，通过在AutoEncoder目标函数中加上encoder的Jacobian矩阵范式来约束使得encoder能够学习具有抗干扰的抽象特征。

下图时Denoising AutoEncoder的模型框架。目前添加噪声的方式大多分为两种:

-添加服从特定分布的随机噪声；

-随机将输入x中特定比例的数值置为0

Bert模型精讲_第3张图片

DAE模型的优势：

-通过与非破损数据训练得对比，破损数据训练出来得Weight噪声较小。因为擦除数据得时候不小心把输入噪声给擦掉了。

-破损数据一定程度上减轻了训练数据与测试数据得代沟。由于数据得部分被擦掉了，因而这破损数据一定程度上比较接近测试数据。

2.3 DAE与Masked Language Model联系

-BERT模型是基于Transformer Encoder来构建一种模型。

-BERT模型基于ＤＡＥ(Denoising AutoEncoder，去噪自编码器)得，这部分在BERT中被称为Masked Language Model(MLM)

-MLM并不是严格意义上得语言模型，这仅仅是训练语言模型的一种方式。BERT随机把一些单词通过MASK标签来代替，并接着去预测被MASK得这个单词，过程其实就是DAE得过程。

3. Transformer模型回顾

Transformer模型使用经典得encoder-decoder架构，由encoder和decoder俩部分组成

-下图左侧用Nx框出来得，就是我们encoder得一层。encoder一共有6层这样得结构。

-下图右侧用Nx框出来得，就是我们把decoder得一层。decoder一共有6层这样得结构。

-输入序列经过Input Embedding和Positional Encoding相加后，输入到encoder中。

-输出序列经过Output Embedding和Positional Encoding相加后，输入到decoder中。

-最后，decoder输出得结果，经过一个线性层，然后计算softmax

Bert模型精讲_第4张图片

3.1 Encoder部分

输入到原始词表中词得ID。接着进行Input Embedding，把词ID转换成分布式得表示。在语言模型中词得顺序还是很重要得，因此Transformer加入了Positional Encoding，也就是加入了词得位置信息。encoder得输入是Input Embedding加上对应位置得Positional Encoding.

Input Embedding加上对应位置得Positional Encoding作为encoder得输入，首先会经过Multi-Head Attention，学习输入中词与词之间得相关性。接着是Add&Norm层，Add残差得方式对不同得输出相加，是借鉴CV中得残差网络思想解决梯度消失问题;Norm 用得是Layer Norm.然后进行Feed Forward得前向计算，这一层就是全连接得神经网络。最后在接一层Add & Norm,防止梯度消失。

Bert模型精讲_第5张图片

3.2 Decoder部分

通过encoder部分已经获得了所有输入得信息，把这些信息当作decoder后面Multi-Head Attention得输入，也就是self-attention得K，V来自输入得特征，Q来自decoder部分得输入。

decoder之前解码出得单词当作本次decoder得输入，也是通过Ouput Embedding加上对应位置得Positional Encoding输入到Masked Multi-Head Attention，再经过Add&Norm层，这里还把decoder输入和Masked Multi-head Attention输出做了残差连接，最后得到得输出就是我们上面提到得Q了。

把encoder部分获得得所有输入得信息和decoder前半部分得到得输入信息，一同送到后面这个Multi-head Attention中，它学习哪些输入信息和输出信息得特征更有利于解码，最后还经过了Add&Norm层、Feed Forward层和Add & Norm层，得到了decoder得最终输出。

解码这里要特别注意一下，编码可以并行计算，一次性全部encoding出来，但是解码不是一次把所有序列接出来得，而是像RNN一样一个一个解出来得，因为要用前几个位置单词得结果当作self-attention得query.

Bert模型精讲_第6张图片

3.3 Linear和Softmax

拿到decoder得输出做一个线性变换，最后通过一个softmax计算对应位置得输出词得概率。Transformer本次得输出当作下一次decoder得输入。

思考:为什么NLP中一般使用Layer Norm,而不是Batch Norm？

回答：

-在CV中，深度网络中一般会嵌入批归一化(BatchNorm,BN)单元，比如ResNet;而NLP中，则往往向深度网络中插入层归一化(LayerNorm, LN)单元，比如Transformer。为什么在归一化问题上会有分歧?一个最直接得理由就是，BN用在NLP任务实在太差了(相比LN)，此外，BN还难以直接用在RNN中，而RNN是前一个NLP时代得最流行模型。虽然有大量得实验观测，表面NLP任务里普遍BN比LN差太多，但是迄今为止，依然没有一个非常严谨得理论来正面LN相比BN在NLP任务里得优越性。

-基于文献，个人认为：BatchNorm就是通过对batch size这个维度归一化来让分布稳定下来，有助于训练深度神经网络，是因为它可以让loss曲面变得更加平滑。LayerNorm则是通过对Hidden Size这个维度归一化来让某层得分布稳定，主要作用是在训练初期缓解梯度消失和爆炸得问题，提升稳定性。

4. BERT模型

BERT得全称是Bidirectional Encoder Representation from Transformers，模型是基于Transformer中得Encoder并加上双向得结构，因此一定要熟练掌握Transformer得Encoder.BERT模型的主要创新点都在pre-train方法上，即用了Maksed Language Model和Next Sentence Prediction两种方法分别捕捉词语和句子级别得representation.

在用Masked Language Model方法训练BERT的时候，随机把语料库中15%的单词做Mask操作。对于这15%的单词做Mask操作分为三种情况:80%的单词直接用[Mask]替换，10%的单词直接替换成另一个新的单词，10%的单词保持不变。

因为涉及到Question Answering(QA)和Natural Language Inference(NLI)之类的任务，增加了Next Sentence Prediction预训练任务，目的是让模型理解两个句子之间的联系。与Masked Language Model任务相比，Next Sentence Prediction更简单些，训练的输入是句子A和B，B有一半的几率是A的下一句，输入这两个句子，BERT模型预测B是不是A的下一句。

因为注意力计算开销是输入序列长度的平方，较长的序列会影响训练速度，为了加快实验中的预训练速度，所以90%的steps都用序列长度为128进行预训练，余下10%的steps预训练为512长度的输入。

Bert模型精讲_第7张图片

BERT预训练之后，会保存它的Embedding table和12层Transformer权重(bert-base)或24层 Transformer权重(bert-large).使用预训练好的bert模型可以对下游任务进行fine-tuing,比如:文本分类，相似度判断，阅读理解等。

5.BERT模型在实际场景的应用

BERT模型在现实中的应用：

-情感分类：通过用户对商品评价来对商品质量问题进行分析，比如是否新鲜，服务问题等；

-意图识别；

-问题匹配；

-槽位提取：BERT后接CRF来做命名实体识别；

6.BERT模型的预训练及其改进

Bert模型精讲_第8张图片

7.BERT的fine-tuning不同训练方式及常见的改进策略

7.1 Fine-tuing的不同训练方式

Bert模型精讲_第9张图片

7.2 BERT的Fine-tuning中常见的改进策略

如果机器不足、预料不足、一般都会直接考虑用原始的BERT、Roberta、XLnet等在下游任务中微调，这样我们就不能在预训练阶段进行改进，只能在fine-tuning阶段进行改进。改进方案如下图所示：

Bert模型精讲_第10张图片

7.3 BERT在实践中的trick

-筛选训练数据，剔除过短或者过长的数据；

-尝试bert+conv,bert+conv+avg_max_pooling,best_last_layer_concat等方式；

-针对本场景数据，进行少步数的进一步预训练；

8.总结

BERT模型作为当今NLP应用大杀器，具有易于使用、稳定性强等诸多优点。本文深入了解BERT的原理，如何做到BERT的预训练改进以及Fine-tuning中所涉及到的常见改进策略。另外，本文也讲述了BERT模型在实际场景中的应用及在实践中的一些tricks.

Microstrong：BERT模型精讲

你可能感兴趣的:(AI,深度学习,nlp,bert)

AGI面临突破需要清除这两朵乌云：解码智能鸿沟的终极密码
1.物理学史的镜鉴：科学革命的预兆1900年英国物理学家开尔文勋爵宣称"物理学大厦已告完成"，却未料及那两朵"光速悖论"与"紫外灾难"的乌云，最终催生了相对论与量子力学。这段历史在AI领域重现：当算力呈指数级增长，模型参数突破万亿级，我们依然无法教会AI"水杯会掉落"的常识。这种历史重演揭示着深刻规律——任何科学体系的突破往往始于对既有范式的质疑。正如爱因斯坦推翻绝对时空观，当前AI研究需要重新审
语义分割模型的轻量化与准确率提升研究 pk_xz123456 仿真模型深度学习算法 transformer 深度学习人工智能算法数据结构
语义分割模型的轻量化与准确率提升研究1.引言语义分割是计算机视觉领域的核心任务之一，它要求模型为图像中的每个像素分配一个类别标签。随着深度学习的发展，语义分割模型在多个领域得到了广泛应用，如自动驾驶、医学影像分析、遥感图像解译等。然而，现有的语义分割模型往往面临两个主要挑战：模型复杂度高导致难以部署在资源受限的设备上，以及准确率仍有提升空间以满足实际应用需求。本文将从模型轻量化和准确率提升两个角度
Python包版本分析工具开发：从PyPI私有源快速提取元数据 YoungHong1992 python windows 开发语言
importsubprocessimportreimportosimportsysimporttempfileimportzipfilefromemail.parserimportParserfromtypingimportList,Dict,Optional,Anyfromjinja2importEnvironmentfrompackaging.versionimportparseasparse
AI 的出现，是否能替代 IT 从业者？敲代码的苦13 人工智能
在科技浪潮奔涌向前的时代，AI正以惊人的速度渗透进各个领域，IT行业首当其冲。当AI编写代码的效率不断提升，当智能算法能够快速完成系统故障诊断，当自动化工具可以处理大量数据运维工作，IT从业者们不禁心生疑虑：AI真的会成为“职业终结者”，将自己从岗位上彻底替代吗？这场关于AI与IT从业者未来的讨论，充满了争议与悬念，也关乎着无数人的职业命运。一、AI在IT领域的应用现状编程开发中的AIAI在编程开
AIGC领域AI作画：在数字雕塑中的应用实践 AI原生应用开发 AI 原生应用开发 AIGC AI作画 ai
AIGC领域AI作画：在数字雕塑中的应用实践关键词：AIGC、AI作画、数字雕塑、生成对抗网络、3D建模、艺术创作、深度学习摘要：本文深入探讨了AIGC(人工智能生成内容)技术在数字雕塑领域的创新应用。我们将从技术原理、算法实现到实际案例，全面解析AI如何赋能传统数字雕塑创作流程。文章首先介绍AIGC在艺术创作中的背景和发展现状，然后详细讲解核心算法原理和数学模型，接着通过实际项目案例展示AI作画
如何在 Android Framework层面控制高通（Qualcomm）芯片的 CPU 和 GPU。 YoungHong1992 android 高通芯片 CPU GPU
如何在AndroidFramework层面控制高通（Qualcomm）芯片的CPU和GPU。参考：https://blog.csdn.net/YoungHong1992/article/details/117047839?utm_source%20=%20uc_fansmsg作为一名Framework开发者，您拥有系统级的权限，可以直接与底层硬件接口交互。但这通常不被推荐，因为现代Android系
Python项目如何读取nacos配置 Tizzy JJ 服务器 python pycharm
目录一、nacos配置示例二、python读取nacos配置一、nacos配置示例在Nacos中创建yaml格式配置（DataID:your-data-id）#Nacos配置文件(your-data-id.yaml)app:env:productionversion:1.2.3apis:deepseek:api_key:"sk-your-deepseek-key-here"timeout:30da
PromptX 架构演进深度解析：从理念到实践的完整工程化之路步子哥智能涌现架构人工智能
核心理念：AIuseCLIgetpromptforAI-一场关于AI认知架构的全方位革命引言：当理想遇见现实的工程挑战当我们深入研究PromptX项目的完整文档体系时，会发现这不仅仅是一个技术项目，而是一个从哲学思考到工程实践的完整演进过程。今天，让我们通过这些核心文档，深度解析PromptX如何从革命性理念发展为可落地的工程架构。这些文档记录了一个真实的技术演进过程：从最初的理想化设计，到遇到实
SpringAIAlibaba正式版发布！小付爱coding ai
SpringAIAlibaba正式版发布！SpringAIAlibaba到底是个啥？没错！它还是以SpringAI为基础，深度集成阿里自己的百炼平台：支持ChatBot、工作流、多智能体应用开发模式的AI框架。简单来说就是将调用大模型抽象成一个API，可以直接调用来实现，只不过可选参数更多它的核心能力：抽象+简化+扩展SpringAIAlibaba最大的价值在于：它把调用大模型这件事，抽象成了一个
[ruby on rails] ActiveJob中 discard_on，retry_on和 rescue_from的应用微信-yangfansky ruby on rails 前端 javascript
job中discard_on，retry_on和rescue_from的应用#frozen_string_literal:trueclassOrdersRefundJob
阿里也出手了！十分钟接入Spring Cloud Alibaba AI 体验JAVA微服务AI人工智能，可接通义千问等模型， Java斌十分钟学会Java AI 人工智能 java 微服务
什么是SpringAISpringAI是从著名的Python项目LangChain和LlamaIndex中汲取灵感，它不是这些项目的直接移植，它的成立信念是，「下一波生成式人工智能应用程序将不仅适用于Python开发人员，而且将在许多编程语言中无处不在」。我们可以从SpringAI的官网描述中，总结出SpringAI的几个核心的关键词：提供抽象能力简化AI应用的开发模型与向量支持AI集成与自动配置
Raiden Network（一）—— Overview YzYzYzzzzz Raiden Network 区块链 Raiden Network
RaidenNetwork的优点：可扩展性：当前大多数区块链的容量都有固定或半固定的限制，而雷电网络的容量与参与者数量成正比快速地：可以在亚秒内确认转移私人的：个人转账不会出现在全球共享账本中可互操作：适用于任何遵循以太坊标准化令牌API(ERC20)的令牌低费用：转账费用可能比区块链低几个数量级小额付款：低交易费用允许有效地转移微小的价值RaidenNetwork的各种资料网址：RaidenNe
解密企业级大模型智能体Agentic AI 关键技术：MCP、A2A、Reasoning LLMs- GPT源代码解析大模型与Agent智能体 A2A MCP DeepSeek A2A MCP Manus ADK
解密企业级大模型智能体AgenticAI关键技术：MCP、A2A、ReasoningLLMs-GPT源代码解析我们可以稍微看一下，这是我们GPT的基于它的源代码产生的可视化的内容。这边是model，我们在谈这个sampling的时候，本身首先就是说它这个probabilitydistribution，会有很多的参数对它进行影响。例如temperature，如果你是hightemperature的话
【零基础学AI】第33讲：强化学习基础 - 游戏AI智能体 1989 0基础学AI 人工智能游戏 transformer 分类深度学习神经网络
本节课你将学到理解强化学习的基本概念和框架掌握Q-learning算法原理使用Python实现贪吃蛇游戏AI训练能够自主玩游戏的智能体开始之前环境要求Python3.8+PyTorch2.0+Gymnasium(原OpenAIGym)NumPyMatplotlib推荐使用JupyterNotebook进行实验前置知识Python基础编程（第1-8讲）基本数学概念（函数、导数）神经网络基础（第23讲
【AI与数据管理】基于AI大模型的企业元数据管理方案暴躁小师兄数据学院人工智能 ai 语言模型
基于AI大模型的元数据关键解决方案元数据（metadata）是描述数据的数据，例如数据的来源、结构、类型和质量信息。它在数据管理、分析和应用中至关重要。随着人工智能（AI）大模型（如基于Transformer的模型）的发展，这些模型凭借其强大的自然语言处理、模式识别和生成能力，为元数据处理提供了高效、自动化的解决方案。下面，我将逐步解释基于AI大模型的元数据关键解决方案，帮助您理解核心方法、挑战和
【unity游戏开发入门到精通——通用篇】在 Unity 6 中轻松实现播放随机游戏音效——AudioRandomContainer音频随机容器的使用向宇it ##推荐100个unity插件 unity 游戏音视频游戏引擎 c#
考虑到每个人基础可能不一样，且并不是所有人都有同时做2D、3D开发的需求，所以我把【零基础入门unity游戏开发】分为成了C#篇、unity通用篇、unity3D篇、unity2D篇。【C#篇】：主要讲解C#的基础语法，包括变量、数据类型、运算符、流程控制、面向对象等，适合没有编程基础的同学入门。【unity通用篇】：主要讲解unity的基础通用的知识，包括unity界面、unity脚本、unit
【人工智能之大模型】思维链（Chain of Thought，CoT）在大模型中是如何引导模型逐步推理的？ 985小水博一枚呀人工智能 pytorch 语言模型大模型
【人工智能之大模型】思维链（ChainofThought，CoT）在大模型中是如何引导模型逐步推理的？【人工智能之大模型】思维链（ChainofThought，CoT）在大模型中是如何引导模型逐步推理的？文章目录【人工智能之大模型】思维链（ChainofThought，CoT）在大模型中是如何引导模型逐步推理的？前言思维链（CoT）在大模型中的应用示例示例任务：应用思维链提示：模型输出：分析：思维
一张表就是一个智能业务系统，钉钉全新发布“AI表格” CSDN资讯钉钉人工智能
7月8日，钉钉全新发布AI表格，面向AI时代打造新应用的入口。在钉钉AI表格里，AI已成为原生能力，每一个单元格都是AI的入口，也是一个智能工作流。所有企业、用户都可以基于钉钉AI表格构建自己的业务系统，批量处理任务，让业务数据真正流动并产生价值。同时，钉钉AI表格创新推出“表格即文档”功能，首次将文档融入数据表。这意味着，表格每一行记录都是一个独立的文档，用户可以像平时写文档一样自由输入，查看信
一文读懂 AI 模型训练流程 AI赋能人工智能人工智能
一文读懂AI模型训练流程在当今数字化时代，AI技术发展得如火如荼，广泛应用于各个领域，而这背后离不开AI模型的训练。AI模型训练流程就像是一场精心策划的“智慧锻造之旅”，每一步都至关重要。今天，咱们就来深入了解一下这个神秘的过程。数据准备：夯实基础数据，堪称AI模型训练的“原材料”，其质量直接决定了最终模型的性能。这就好比建造一座高楼，只有用优质的砖块、钢筋等材料，才能让大楼稳固结实。数据收集我们
Android补全计划 TextView添加删除线、下划线、更新字体等效果 Greenland_12 Android补全计划 android
1可在布局中直接更新可在布局中直接更新的：加粗、斜体、字体;其中字体文件需要放在res/font/your_font.ttf下2java动态设置需动态设置的:删除线、下划线，加粗和字体也可动态设置，且需要放于app/src/main/assets/fonts/xxx.ttf下java中txt1=((TextView)findViewById(R.id.txt1));txt2=((TextView)
CosyVoice2.0整合包：免费一键启动，释放语音克隆的创意潜能 VXHAruanjian888 人工智能
引言语音克隆技术正在重塑内容创作与技术开发的边界，而CosyVoice2.0整合包以其简单易用和强大功能，成为语音合成领域的耀眼新星。无论你是短视频制作者、程序员，还是对AI语音技术感兴趣的探索者，这款完全免费的整合包都能让你轻松上手，体验专业级语音克隆的无限魅力。本文将详细介绍CosyVoice2.0整合包的特色、使用方法以及如何通过超链接免费下载，助你快速开启语音克隆的创意之旅！立即点击以下链
金山wps支持java接口开发吗_金山wps开放平台使用踩坑实录
使用接口/v1/3rd/file/info获取excel文件信息时，发生获取文件信息失败错误GetFileInfoFailed原因排查：一、开放平台没有回调到接口，原因是回调接口url被对接项目的登录过滤器拦截到，没有登录对接项目不让访问接口，但是对接项目返回的提示登录信息在wps平台没有显示，解决：将回调接口的url前缀添加到对接项目过滤器的例外url前缀配置列表中，不让登录过滤器拦截到，这样，
Python深度学习实践：建立端到端的自动驾驶系统 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Python深度学习实践：建立端到端的自动驾驶系统1.背景介绍自动驾驶系统是当今科技领域最具挑战性和前景的应用之一。它融合了计算机视觉、深度学习、规划与控制等多个领域的先进技术,旨在实现车辆的自主感知、决策和操控。随着人工智能技术的不断发展,越来越多的公司和研究机构投入了大量资源来开发自动驾驶系统。Python作为一种高效、易学且开源的编程语言,在这一领域扮演着重要角色。本文将探讨如何利用Pyth
【AI论文】Skywork-Reward-V2：通过人机协同实现偏好数据整理的规模化扩展
摘要：尽管奖励模型（RewardModels，RMs）在基于人类反馈的强化学习（ReinforcementLearningfromHumanFeedback，RLHF）中发挥着关键作用，但当前最先进的开源奖励模型在大多数现有评估基准上表现欠佳，无法捕捉人类复杂且微妙的偏好谱系。即便采用先进训练技术的方法也未能显著提升性能。我们推测，这种脆弱性主要源于偏好数据集的局限性——这些数据集往往范围狭窄、标
Springboot整合邮件发送（163邮箱为例）
一、添加spring-boot-starter-mailorg.springframework.bootspring-boot-starter-mail二、添加yml配置spring:mail:host:smtp.163.compassword:邮箱授权码不是密码username:163邮箱port:default-encoding:UTF-8protocol:smtpproperties:mai
数据库左连接、右连接、内连接、全连接 872792silence 数据库 mysql
在数据库增删改查中，数据通常不在同一张表中，涉及多表数据查询就需要表之间的连接方式，常用的数据库表连接方式有；1）内连接：innerjoin2）全连接：union3）右连接（右外连接）：rightjoin4）左连接（左外连接）：leftjoin例子：一、内连接内连接查询的是两张表（多表）的交集sql语句：select*fromAinnerjoinBonA.id=B.id也可以写成：select*f
数据标注问题【附解决方案】【持久更新】
视频转化错误对抽烟检测的数据准备标注，首先将视频进行转化，但是报错，尝试视频修复。1️⃣MP4Repair0.9.0FreeDownloadforWindowsDownloadMP4Repair0.9.0:ThisisawrapperorGUIarounduntrunc-w,theWindowsversionofuntrunc.UntruncisautilityforMP4videorepair.
Sider多模型AI助手平台深度评测：开发者高效编程的秘密武器梦玄海人工智能 copilot 自动化运维开源
一、为什么开发者需要多模型平台？当技术决策面临关键选择时：核心价值：避免被单一模型局限思维，通过横向对比获得最佳解决方案二、Sider核心功能全景图模块支持能力开发场景示例模型库GPT-4/Claude/Gemini/本地模型等`gitdiff智能编程实时补全/调试/注释生成VSCode中自动生成JSDoc文档处理PDF/Word/网页解析技术白皮书关键信息提取自动化定时任务+API集成每日自动生
AIGC空间智能在服装设计领域的颠覆性变革 AI天才研究院 ChatGPT 实战 ChatGPT AI大模型应用入门实战与进阶 AIGC ai
AIGC空间智能在服装设计领域的颠覆性变革关键词：AIGC、空间智能、服装设计、数字孪生、生成式AI、3D人体建模、智能设计系统摘要：本文深入探讨AIGC（人工智能生成内容）与空间智能技术在服装设计领域的融合创新，揭示其如何通过三维人体建模、场景模拟、智能生成算法重构传统设计流程。从技术原理层解析空间智能的核心模块，结合生成对抗网络（GAN）、Transformer模型等前沿算法，展示从创意生成到
FastAPI通用签名校验模块设计文档源滚滚AI编程 fastapi
作者:源滚滚AI编程创建时间:2025年07月08日版本:v1.0.0文档状态:设计阶段版权声明本文档由源滚滚AI编程创作，版权所有。未经作者书面许可，不得复制、分发或用于商业用途。免责声明本文档仅用于技术交流和学习目的。作者不对使用本文档内容导致的任何问题承担责任。在实际项目中应用时，请根据具体需求进行适当调整和测试。1.项目概述1.1项目目标开发一套基于FastAPI的独立签名校验模块，支持p
java的(PO,VO,TO,BO,DAO,POJO) Cb123456 VO TO BO POJO DAO
转: http://www.cnblogs.com/yxnchinahlj/archive/2012/02/24/2366110.html ------------------------------------------------------------------- O/R Mapping 是 Object Relational Mapping（对象关系映
spring ioc原理（看完后大家可以自己写一个spring） aijuans spring
最近，买了本Spring入门书：spring In Action 。大致浏览了下感觉还不错。就是入门了点。Manning的书还是不错的，我虽然不像哪些只看Manning书的人那样专注于Manning,但怀着崇敬的心情和激情通览了一遍。又一次接受了IOC 、DI、AOP等Spring核心概念。先就IOC和DI谈一点我的看法。IO
MyEclipse 2014中Customize Persperctive设置无效的解决方法 Kai_Ge MyEclipse2014
高高兴兴下载个MyEclipse2014，发现工具条上多了个手机开发的按钮，心生不爽就想弄掉他！结果发现Customize Persperctive失效！！有说更新下就好了，可是国内Myeclipse访问不了，何谈更新... so~这里提供了更新后的一下jar包，给大家使用！ 1、将9个jar复制到myeclipse安装目录\plugins中 2、删除和这9个jar同包名但是版本号较
SpringMvc上传 120153216 springMVC
@RequestMapping(value = WebUrlConstant.UPLOADFILE) @ResponseBody public Map<String, Object> uploadFile(HttpServletRequest request,HttpServletResponse httpresponse) { try { //
Javascript----HTML DOM 事件何必如此 JavaScript html Web
HTML DOM 事件允许Javascript在HTML文档元素中注册不同事件处理程序。事件通常与函数结合使用，函数不会在事件发生前被执行！注：DOM：指明使用的 DOM 属性级别。 1.鼠标事件属性
动态绑定和删除onclick事件 357029540 JavaScript jquery
因为对JQUERY和JS的动态绑定事件的不熟悉，今天花了好久的时间才把动态绑定和删除onclick事件搞定!现在分享下我的过程。在我的查询页面，我将我的onclick事件绑定到了tr标签上同时传入当前行(this值)参数，这样可以在点击行上的任意地方时可以选中checkbox，但是在我的某一列上也有一个onclick事件是用于下载附件的，当
HttpClient|HttpClient请求详解 7454103 apache 应用服务器网络协议网络应用 Security
HttpClient 是 Apache Jakarta Common 下的子项目，可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包，并且它支持 HTTP 协议最新的版本和建议。本文首先介绍 HTTPClient，然后根据作者实际工作经验给出了一些常见问题的解决方法。HTTP 协议可能是现在 Internet 上使用得最多、最重要的协议了，越来越多的 Java 应用程序需
递归逐层统计树形结构数据 darkranger 数据结构
将集合递归获取树形结构: /** * * 递归获取数据 * @param alist:所有分类 * @param subjname:对应统计的项目名称 * @param pk:对应项目主键 * @param reportList: 最后统计的结果集 * @param count:项目级别 */ public void getReportVO(Arr
访问WEB-INF下使用frameset标签页面出错的原因 aijuans struts2
<frameset rows="61,*,24" cols="*" framespacing="0" frameborder="no" border="0">
MAVEN常用命令 avords
Maven库： http://repo2.maven.org/maven2/ Maven依赖查询： http://mvnrepository.com/ Maven常用命令： 1. 创建Maven的普通java项目： mvn archetype:create -DgroupId=packageName
PHP如果自带一个小型的web服务器就好了 houxinyou apache 应用服务器 Web PHP 脚本
最近单位用PHP做网站，感觉PHP挺好的，不过有一些地方不太习惯，比如，环境搭建。PHP本身就是一个网站后台脚本，但用PHP做程序时还要下载apache，配置起来也不太很方便，虽然有好多配置好的apache+php+mysq的环境，但用起来总是心里不太舒服，因为我要的只是一个开发环境，如果是真实的运行环境，下个apahe也无所谓，但只是一个开发环境，总有一种杀鸡用牛刀的感觉。如果php自己的程序中
NoSQL数据库之Redis数据库管理(list类型) bijian1013 redis 数据库 NoSQL
3.list类型及操作 List是一个链表结构，主要功能是push、pop、获取一个范围的所有值等等，操作key理解为链表的名字。Redis的list类型其实就是一个每个子元素都是string类型的双向链表。我们可以通过push、pop操作从链表的头部或者尾部添加删除元素，这样list既可以作为栈，又可以作为队列。 &nbs
谁在用Hadoop？ bingyingao hadoop 数据挖掘公司应用场景
Hadoop技术的应用已经十分广泛了，而我是最近才开始对它有所了解，它在大数据领域的出色表现也让我产生了兴趣。浏览了他的官网，其中有一个页面专门介绍目前世界上有哪些公司在用Hadoop，这些公司涵盖各行各业，不乏一些大公司如alibaba,ebay,amazon,google,facebook,adobe等，主要用于日志分析、数据挖掘、机器学习、构建索引、业务报表等场景,这更加激发了学习它的热情。
【Spark七十六】Spark计算结果存到MySQL bit1129 mysql
package spark.examples.db import java.sql.{PreparedStatement, Connection, DriverManager} import com.mysql.jdbc.Driver import org.apache.spark.{SparkContext, SparkConf} object SparkMySQLInteg
Scala: JVM上的函数编程 bookjovi scala erlang haskell
说Scala是JVM上的函数编程一点也不为过，Scala把面向对象和函数型编程这两种主流编程范式结合了起来，对于熟悉各种编程范式的人而言Scala并没有带来太多革新的编程思想，scala主要的有点在于Java庞大的package优势，这样也就弥补了JVM平台上函数型编程的缺失，MS家.net上已经有了F#，JVM怎么能不跟上呢？对本人而言
jar打成exe bro_feng java jar exe
今天要把jar包打成exe，jsmooth和exe4j都用了。遇见几个问题。记录一下。两个软件都很好使，网上都有图片教程，都挺不错。首先肯定是要用自己的jre的，不然不能通用，其次别忘了把需要的lib放到classPath中。困扰我很久的一个问题是，我自己打包成功后，在一个同事的没有装jdk的电脑上运行，就是不行，报错jvm.dll为无效的windows映像，如截图最后发现
读《研磨设计模式》-代码笔记-策略模式-Strategy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 策略模式定义了一系列的算法，并将每一个算法封装起来，而且使它们还可以相互替换。策略模式让算法独立于使用它的客户而独立变化简单理解： 1、将不同的策略提炼出一个共同接口。这是容易的，因为不同的策略，只是算法不同，需要传递的参数
cmd命令值cvfM命令 chenyu19891124 cmd
cmd命令还真是强大啊。今天发现jar -cvfM aa.rar @aaalist 就这行命令可以根据aaalist取出相应的文件例如：在d：\workspace\prpall\test.java 有这样一个文件，现在想要将这个文件打成一个包。运行如下命令即可比如在d：\wor
OpenJWeb(1.8) Java Web应用快速开发平台 comsci java 框架 Web 项目管理企业应用
OpenJWeb(1.8) Java Web应用快速开发平台的作者是我们技术联盟的成员，他最近推出了新版本的快速应用开发平台 OpenJWeb(1.8)，我帮他做做宣传 OpenJWeb快速开发平台以快速开发为核心，整合先进的java 开源框架，本着自主开发+应用集成相结合的原则，旨在为政府、企事业单位、软件公司等平台用户提供一个架构透
Python 报错：IndentationError: unexpected indent daizj python tab 空格缩进
IndentationError: unexpected indent 是缩进的问题，也有可能是tab和空格混用啦 Python开发者有意让违反了缩进规则的程序不能通过编译，以此来强制程序员养成良好的编程习惯。并且在Python语言里，缩进而非花括号或者某种关键字，被用于表示语句块的开始和退出。增加缩进表示语句块的开
HttpClient 超时设置 dongwei_6688 httpclient
HttpClient中的超时设置包含两个部分： 1. 建立连接超时，是指在httpclient客户端和服务器端建立连接过程中允许的最大等待时间 2. 读取数据超时，是指在建立连接后，等待读取服务器端的响应数据时允许的最大等待时间在HttpClient 4.x中如下设置： HttpClient httpclient = new DefaultHttpC
小鱼与波浪 dcj3sjt126com
一条小鱼游出水面看蓝天，偶然间遇到了波浪。　　小鱼便与波浪在海面上游戏，随着波浪上下起伏、汹涌前进。　　小鱼在波浪里兴奋得大叫：“你每天都过着这么刺激的生活吗？简直太棒了。”　　波浪说：“岂只每天过这样的生活，几乎每一刻都这么刺激！还有更刺激的，要有潮汐变化，或者狂风暴雨，那才是兴奋得心脏都会跳出来。”　　小鱼说：“真希望我也能变成一个波浪，每天随着风雨、潮汐流动，不知道有多么好！”　　很快，小鱼
Error Code: 1175 You are using safe update mode and you tried to update a table dcj3sjt126com mysql
快速高效用：SET SQL_SAFE_UPDATES = 0；下面的就不要看了！今日用MySQL Workbench进行数据库的管理更新时，执行一个更新的语句碰到以下错误提示： Error Code: 1175 You are using safe update mode and you tried to update a table without a WHERE that
枚举类型详细介绍及方法定义 gaomysion enum javaee
转发 http://developer.51cto.com/art/201107/275031.htm 枚举其实就是一种类型，跟int, char 这种差不多，就是定义变量时限制输入的，你只能够赋enum里面规定的值。建议大家可以看看，这两篇文章，《java枚举类型入门》和《C++的中的结构体和枚举》，供大家参考。枚举类型是JDK5.0的新特征。Sun引进了一个全新的关键字enum
Merge Sorted Array hcx2013 array
Given two sorted integer arrays nums1 and nums2, merge nums2 into nums1 as one sorted array. Note:You may assume that nums1 has enough space (size that is
Expression Language 3.0新特性 jinnianshilongnian el 3.0
Expression Language 3.0表达式语言规范最终版从2013-4-29发布到现在已经非常久的时间了；目前如Tomcat 8、Jetty 9、GlasshFish 4已经支持EL 3.0。新特性包括：如字符串拼接操作符、赋值、分号操作符、对象方法调用、Lambda表达式、静态字段/方法调用、构造器调用、Java8集合操作。目前Glassfish 4/Jetty实现最好，对大多数新特性
超越算法来看待个性化推荐 liyonghui160com 超越算法来看待个性化推荐
一提到个性化推荐，大家一般会想到协同过滤、文本相似等推荐算法，或是更高阶的模型推荐算法，百度的张栋说过，推荐40%取决于UI、30%取决于数据、20%取决于背景知识，虽然本人不是很认同这种比例，但推荐系统中，推荐算法起的作用起的作用是非常有限的。就像任何
写给Javascript初学者的小小建议 pda158 JavaScript
　　一般初学JavaScript的时候最头痛的就是浏览器兼容问题。在Firefox下面好好的代码放到IE就不能显示了，又或者是在IE能正常显示的代码在firefox又报错了。　　如果你正初学JavaScript并有着一样的处境的话建议你：初学JavaScript的时候无视DOM和BOM的兼容性，将更多的时间花在了解语言本身（ECMAScript）。只在特定浏览器编写代码（Chrome/Fi
Java 枚举 ShihLei java enum 枚举
注：文章内容大量借鉴使用网上的资料，可惜没有记录参考地址，只能再传对作者说声抱歉并表示感谢！一基础 1）语法枚举类型只能有私有构造器（这样做可以保证客户代码没有办法新建一个enum的实例）枚举实例必须最先定义 2）特性 &nb
Java SE 6 HotSpot虚拟机的垃圾回收机制 uuhorse java HotSpot GC 垃圾回收 VM
官方资料，关于Java SE 6 HotSpot虚拟机的garbage Collection，非常全，英文。 http://www.oracle.com/technetwork/java/javase/gc-tuning-6-140523.html Java SE 6 HotSpot[tm] Virtual Machine Garbage Collection Tuning &

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他