不想动脑筋的亮亮

【AIGC入门一】Transformers 模型结构详解及代码解析

Transformers 开启了NLP一个新时代，注意力模块目前各类大模型的重要结构。作为刚入门LLM的新手，怎么能不感受一下这个“变形金刚的魅力”呢？

目录

Transformers ——Attention is all You Need

背景介绍

模型结构

位置编码

代码实现：

Attention

Scaled Dot-product Attention

Multi-head Attention

Position-Wise Feed-Forward Networks

Encoder and Decoder

Add & Norm

mask 机制

参考链接

论文链接：Attention Is All You Need

Transformers ——Attention is all You Need

背景介绍

在Transformer提出之前，NLP主要基于RNN、LSTM等算法解救相关问题。这些模型在处理长序列时面临梯度消失和梯度爆炸等问题，且这些模型是串行计算的，运行时间较长。

Transformer 模型的提出是为了摆脱序列模型的顺序依赖性，引入了注意力机制，使得模型能够在不同位置上同时关注输入序列的各个部分，且支持并行计算。该模型的提出对深度学习和自然语言处理领域产生了深远的影响，成为了现代NLP模型的基础架构，并推动了attention 机制在各种任务中的应用。

模型结构

位置编码

任何一门语言，单词在句子中的位置以及排列顺序是非常重要的。一个单词在句子的位置或者排列顺序不同，整个句子的意义就发生了偏差。举个例子:

小明欠小王500块

小王欠小明500块

顺序不同，债主关系就发生变化了

当采用了Attention之后，句子中的词序信息就会丢失，模型就没法知道每个词在句子中的相对和绝对的位置信息。目前位置编码有多种方法：

（1）整型值标记位置，即第一个token标记为1，第二个token标记为2。。。以此类推

可能存在的问题：

随着序列长度的增加，位置值会越来越大；
推理的序列长度比训练时所用的序列长度更长，不利于模型的泛化

（2）用[0,1] 范围标记位置

将位置值的范围限制在[0,1]之内，即在第一种的方法进行归一化操作（除以序列长度）。比如有4个token，那么位置信息就是[0, 0.33, 0.69, 1]。但这样产生的问题是，当序列长度不同时，token间的相对距离是不一样的。

因此，一个好的位置编码方法应该满足以下特性：

（1）可以表示一个token 在序列中的绝对位置；

（2）在序列长度不同的情况下，不同序列中token 的相对位置/ 距离要保持一直；

（3）可以扩展到更长的句子长度；

Transformers 中选择的是sincos编码法，其公式如下所示：

其中，pos 是token在sentence中的位置，i是维度。

代码实现：

假设句子长度是 s, embedding的维度是d，最终生成的PE的shape是(s, d)。公式的核心是计算 $pos /10000\tfrac{2i}{d_{model}}$ ，这里可以借助对数和指数的性质进行如下操作：

$a = e^{^{loga}}$

所以可以转换成 $1/ 10000^{^{2i/d_{model}}} = e^{ - log(10000) * 2i /d_{model})}$ （可对照代码进行推导理解）

class Position_Encoding(nn.Module):
    
    def __init__(self, max_length, d_model):
        self.max_length = max_length
        self.dim = d_model
        
        pe = torch.zeros(self.max_length, self.dim)
        
        position = torch.arange(0, self.max_length).unsqueeze(1)
        
        div_term = torch.exp( torch.arange(0, self.dim ,2) * (-1) *math.log(10000) / self.dim)
        
        
        pe[:, 0::2] = torch.sin(position * div_term)
        pe[:, 1::2] = torch.cos(position * div_term)
        

    def forward(self, x):
        
        #  input_embedding + position_encoding
        #....

Attention

Attention 是将query 和key、value映射为输出值，其中query 和 key 计算一个相似度，然后以这个相似度为权重，计算value的加权和，最终得到输出。

Scaled Dot-product Attention

论文中用的是放缩点乘注意力(scaled dot-product attention)，其公式是：

$Attention(Q, K, V) = softmax(\frac{QK^{}{T}}{sqrt(d_k))})$

其中，计算时需要用到的矩阵Q（查询），K（键值），V（值）是输入单词的embedding 变换或者上一个Encoder block的输出。注意Q、K、V的shape 会存在一定的联系（因为需要做矩阵乘法运算）。

公式中会除以dk的平方根，从而避免内积过大。还有解释是说 softmax 在绝对值较大的区域梯度较小，梯度下降的速度比较慢。因此希望softmax的点乘数值尽可能小。

论文中解释了为什么点积会变大。假设q 和 k中的元素满足独立分布，且均值是0，方差为1。点积 $q*k = \sum_{i=1}^{dk} q_i * k_i$ 的均值是0，方差是dk 。

Multi-head Attention

作者发现，相比直接在dmodel 维度上的 q、k、v进行attention计算，使用不同的、可学习的linear function 分别地对q、k、v 进行多次映射（映射的维度是dk， dk， dv），然后对每一组映射的q、k、v进行attention 并行计算，并concat得到最终输出。后一种方法更有效。就像卷积层可以用多个卷积核生成多个通道的特征，在Transformers中可以用多组self attention 生成多组注意力的结果，从而增加特征表示。其计算公式和流程图如下：

注意： head的数量 * 每一组head中q的维度 = dmodel （输入Q的维度）

Position-Wise Feed-Forward Networks

前馈网络比较简单，是一个两层的全连接层，第一层的激活函数是ReLU，第二层不使用激活函数，对应的公式如下所示：

Encoder and Decoder

Transformer 从结构上可以分为Encoder 和Decoder 两个部分，这两者结构上比较类似，但也存在一些差异。

上图红色区域对应的是Encoder部分，可以看出是由 Input Embedding 、Position Encoding 和6层的EncoderLayer组成。 EncoderLayer 主要包括Multi-head Attention， Add&Norm, Feed Forward ,Add&Norm。

上图绿色区域对应的是Decoder部分，相比Encoder，需要注意Decoder中的Multi-head Attention 有所不同。首先是Masked Multi-head Attention，是为了实现串行推理；第二个Multi-head Attention输入的Q、K、V来自不同的地方，其中Q是Masked Multi-head Attention 的输出， K和V是Encoder 的输出。

Add & Norm

这部分主要由Add 和 Norm 组成，其计算公式如下所示：

Add 是一种残差结构，和ResNet中的是一样的，可以帮助网络收敛。Norm 是指Layer Norm。

mask 机制

Transformers中比较重要的一个知识点就是mask设置。mask主要来源有两个：第一个是填充操作的空白字符（为了保证batch内句子的长度一样会进行padding操作）；第二个是因为模拟串行推理需要用到mask（Decoder部分）。

一般情况下， query 和 key都是一样的，但是在Decoder的第二个多头注意力层中，query 来自目标语言，key来自源语言。为了生成mask，首先要知道query 和 key中字符的分布情况，它们的形状为[n, seq_len]。如果某处是True，表明这个地方的字符是。

src_pad_mask = x == pad_idx
dst_pad_mask = y == pad_idx

为了实现串行推理，即某字符只能知道该字符以及该字符之前的内容，即一个下三角全1矩阵。mask矩阵需要取反，实现方式如下所示：

mask = 1 - torch.tril(torch.ones(mask_shape))

最后根据字符分布情况分别将mask对应的行或者列置1。

参考链接

GitHub - P3n9W31/transformer-pytorch: Transformer model for Chinese-English translation.
PyTorch Transformer 英中翻译超详细教程 - 知乎
Transformer模型详解（图解最完整版） - 知乎

你可能感兴趣的:(AIGC)

关于AIGC降重方法的总结 hjehheje AIGC
在当下信息如潮水般涌来的内容创作世界里，“小狗伪原创”这个独特的存在，犹如一颗投入平静湖面的石子，激起了层层涟漪。那么，小狗伪原创到底处于何种档次呢？这一问题如同神秘的宝藏，亟待我们去探索和剖析。一、小狗伪原创的定义小狗伪原创，说白了，就是借助特定手段，对原始内容进行一番“乔装打扮”。它对原文的语句结构进行巧妙变换，词汇也被替换成看似不同实则相近的表述，可其骨子里的核心思想以及大部分内容，依旧深深
维普AIGC降重方法有哪些？ hjehheje AIGC
在学术写作和论文创作中，重复率过高是许多人面临的一大难题。随着科技的发展，维普AIGC为我们提供了一系列有效的降重方法。那么，维普AIGC降重方法有哪些呢？接下来就为大家详细介绍。语义理解与改写维普AIGC具备强大的语义理解能力。例如，当我们面对一段论述市场趋势的文字时，它能精准把握核心含义。假设原文是“当前智能手机市场呈现出快速增长的趋势，消费者对高性能手机的需求日益旺盛”，维普AIGC可能会将
测试模板：Showcase规范和流程 iBigder 小测试管理软件测试全套常用模板测试管理
【测试资料】https://fzqxk86ywz.feishu.cn/share/base/view/shrcnp65x91aNEkF2REnU2VcmmH【AIGC和小红书】https://fzqxk86ywz.feishu.cn/sheets/GugIsI9zKhNaEwtJscbcgKFCn6bFiddler成功汉化完整过程和汉化补丁下载：https://zhuanlan.zhihu.com
企业微信机器人与DeepSeek结合实现交互的应用案例老胖闲聊办公自动化企业微信机器人交互
以下是一个结合企业微信机器人与深度求索（Deepseek）AIGC模型的交互式应用实现示例，包含完整代码及逐行注释：1.实现架构用户消息->企业微信服务器->自建服务端->DeepseekAPI->处理响应->返回企业微信群2.完整实现代码（deepseek_wechat_bot.py）#-*-coding:utf-8-*-importosimportjsonimportrequestsfromf
图生视频技术的发展与展望：从技术突破到未来图景 Liudef06 Stable Diffusion 音视频人工智能深度学习 stable diffusion
一、技术发展现状图生视频（Image-to-VideoGeneration）是生成式人工智能（AIGC）的重要分支，其核心是通过单张或多张静态图像生成动态视频序列。近年来，随着深度学习、多模态融合和计算硬件的进步，图生视频技术经历了从基础研究到商业落地的快速演进。早期探索与GAN的奠基早期图生视频技术主要基于生成对抗网络（GAN），通过对抗训练生成低分辨率的视频片段。例如，DeepMind的DVD
AIGC与教育行业的邂逅--其在数学领域的应用与实现想成为高手499 AIGC
引言在数学教学中，教师往往需要大量的时间准备练习题和答案解析，而学生则需要定制化的练习来满足不同的学习需求。AIGC技术可以通过自动生成数学题目、定制化学习内容、即时反馈等方式，极大地提升数学学习的效率与质量。本文将深入探讨AIGC在数学领域的几种应用场景，并通过Python代码展示具体实现方式。1.自动生成数学题目与解析数学题目生成是AIGC在数学教学中的主要应用之一。通过生成不同难度和类型的题
五、AIGC大模型_08Agent基础知识学不会lostfound AI 人工智能 agent 不同生命周期的知识用AI处理 AIGC
0、概述根据知识的生命周期分类，我们通常会采取不同的方法（微调、RAG、Agent）来将知识融入到AI中0.1长生命周期知识这类知识通常具有较高的稳定性和通用性，不会因时间的推移而轻易改变。它们是知识体系中的“基石”，在较长时间内保持有效性和价值。特点：稳定性强：如数学定理、物理公式等，这些知识经过长期验证，具有高度的确定性和普适性基础性强：往往是学习和研究其他知识的基础，例如教科书中的基础知识更
五、AIGC大模型_09手动实现ReAct_Agent 学不会lostfound AI 人工智能 react_agent LangGraph Multi-Agent PlanAndExecute AIGC
0、前言在上一章节中，我们了解到：create_react_agent是LangGraph提供的一个预构建方法（fromlanggraph.prebuiltimportcreate_react_agent），它可以将语言模型（LLM）和一组工具（Tools）结合起来，创建一个能够根据用户输入自动调用工具的智能代理，这个代理可以根据用户的请求，决定是否需要调用某个工具，并将工具的输出反馈给用户这个函
参加AIGC四级考试的，建议先看下我的备考经验 Tester_孙大壮 AI培训师 AIGC
写在前面这是我2024年末看到AI快速发展，自己也想入局AI而准备的一个考试，但是真正考试下来发现这个考试真的特别简单，除了政府补贴，其他可能对自己没有任何的用处，我觉得这个在面试的时候也很难成为一个加分项，但是备考过程中可能会对一些AI的知识有框架式的了解，以下是我的备考经验，希望对你有帮助。我参加的是广州本地宝推荐的人社部AIGC考试。整体而言，考试难度不算特别大。以我的工作年限，符合报考四级
【大模型科普】AIGC技术发展与应用实践（一文读懂AIGC）人工智能
【专栏介绍】⌈⌈⌈人工智能与大模型应用⌋⌋⌋人工智能（AI）通过算法模拟人类智能，利用机器学习、深度学习等技术驱动医疗、金融等领域的智能化。大模型是千亿参数的深度神经网络（如ChatGPT），经海量数据训练后能完成文本生成、图像创作等复杂任务，显著提升效率，但面临算力消耗、数据偏见等挑战。当前正加速与教育、科研融合，未来需平衡技术创新与伦理风险，推动可持续发展。文章目录一、AIGC概述（一）什么是
AIGC时代品牌突围战：10招玩转DeepSeek内容推荐（深度扩展版）白雪讲堂人工智能大数据机器学习
一、认知革命：从SEO到GEO的生死迭代案例对比：传统SEO困境：某家电品牌2023年投入200万SEO优化，关键词排名TOP3但流量下降42%（SEMrush数据）GEO突破案例：某母婴品牌通过结构化数据改造，AI推荐量从日均300次飙升至1.2万次（来源：DeepSeek官方案例库）实战要点：内容形态改造：将产品参数表升级为JSON-LD格式（某手机品牌实现参数类问题100%引用）流量分配逻辑
AIGC带来数据革命：R语言如何成为数据科学家的秘密武器？程序边界 AIGC r语言开发语言
文章目录一、R语言的基础特性1.1R语言的起源与发展1.2R语言的核心优势二、R语言在AIGC中的应用场景2.1数据预处理与清洗2.2文本分析与生成2.3机器学习与模型构建2.4数据可视化与报告生成三、R语言在AIGC中的具体案例3.1金融数据分析与预测3.2医疗数据分析与建模3.3社交媒体数据分析与情感分析四、R语言在AIGC中的未来展望4.1与深度学习框架的集成4.2与云计算平台的集成4.3与
五、AIGC大模型_05模型的vLLM部署与LangChain调用学不会lostfound AI 人工智能 langchain openai vLLM AIGC
0、概述要搭建一个大模型应用服务，通常需要包含以下五层结构，即：基础环境、模型层、推理层、对外接口、外挂应用在了解了模型的微调训练之后，本文将以vLLM、OpenAI、LangChain为例，介绍大模型的推理部署以及对外接口开放调用1、vLLM1.1定义vLLM（VirtualLargeLanguageModel）是一个开源的大语言模型高速推理框架，由加州大学伯克利分校的LMSYS组织开发，它旨在
毕业论文需要进行几次AIGC检测？ kexiaoya2013 人工智能 AIGC 论文阅读论文笔记
每到毕业季，许多同学都会面临论文查重的困扰。尤其是今年Deepseek的爆火，学校对论文AIGC检测也越来越严格。那么，毕业论文AIGC检测究竟需要做几次呢？一、检测次数受哪些因素影响1、学校政策部分高校提供1-2次免费检测机会，有的则要求自己检测合格后才能提交。检测前，务必提前了解所在院校的检测规则。若学校未明确，建议至少自查2次（初稿+定稿）。2、AI率波动如果首次AI率检测结果超过或接近学校
差异中寻找共识：浅析中美欧AIGC服务商的标识义务人工智能
2025年1月7日，西藏日喀则地震中一张被广泛传播的图片“被压在废墟下的小男孩”被证明是AI合成图片，[1]这随即引发了社会对于人工智能生成物（ArtificialIntelligenceGeneratedContent，以下简称“AIGC”）的广泛讨论。随着AI大模型生成逼真图像、音频与视频的能力日益增强，人类作品与AIGC之间的界限愈发模糊。如不加以管控，则会产生“真相侵蚀”（TruthDec
迷雾渐开：美国AIGC可版权性剖析及案例梳理人工智能
当地时间2025年1月29日，美国版权局（U.S.CopyrightOffice,USCO）发布了版权和人工智能相关法律和政策报告的第二部分——《版权和人工智能：可版权性》（以下简称“《USCO可版权性报告》”）[1]，旨在探讨人工智能生成内容（AIGC）的可版权性问题。该报告明确指出，美国版权局认为现有的版权法足以解决AIGC问题，因此无需制定新的立法。具体而言，该报告在此前美国版权局于2023
【AI】使用Python实现机器学习小项目教程丶2136 AI 人工智能 python 机器学习
引言在本教程中，我们将带领您使用Python编程语言实现一个经典的机器学习项目——鸢尾花（Iris）分类。通过这个项目，您将掌握机器学习的基本流程，包括数据加载、预处理、模型训练、评估和优化等步骤。论文AIGC检测，降AIGC检测，AI降重，三连私信免费获取：ReduceAIGC9折券！DetectAIGC立减2元券！AI降重9折券！目录引言一、项目背景与目标二、开发环境准备2.1所需工具2.2环
AIGC从入门到实战：可能消失的职业和新出现的机会 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AIGC从入门到实战：可能消失的职业和新出现的机会作者：禅与计算机程序设计艺术1.背景介绍人工智能生成内容（AIGC）正在迅速改变我们的世界。从文本、代码到图像和音乐，AIGC正在各个领域展示其强大的能力，并开始挑战传统的创意产业。本篇文章将深入探讨AIGC的概念、技术原理、应用场景以及其对未来职业的影响，并为读者提供入门AIGC的实用指南。1.1AIGC的兴起AIGC的兴起得益于近年来人工智能技
精选AI大模型读物：《从ChatGPT到AIGC：智能创作与应用赋能》——探索智能时代的创作力量 AGI大模型老王人工智能 chatgpt AIGC AI大模型大模型
自2023年以来，AI聊天机器人ChatGPT火爆互联网，其颠覆性的使用体验重塑了人们对于AI的认知。而ChatGPT背后的技术―AIGC也引起了互联网圈的关注，打开了人们对AI应用的想象空间。本书从ChatGPT入手，以AIGC为中心，对AIGC的理论知识、应用场景、未来发展等内容进行了全面的梳理。首先，本书对AIGC的概念、技术构成、产业生态、市场现状等进行了讲解，以便读者对AIGC形成一个清
展望 AIGC 前景：通义万相 2.1 与蓝耘智算平台共筑 AI 生产力高地 accurater AIGC 人工智能神经网络深度学习
喜欢可以到主页订阅专栏引言人工智能生成内容（AIGC）技术正在重塑内容创作、影视制作、广告设计等行业的底层逻辑。作为该领域的革命性技术代表，通义万相2.1凭借其开源特性、多模态生成能力和技术突破，成为全球视频生成模型的标杆。而蓝耘智算平台则通过高性能算力支持与分布式架构优化，为AIGC技术的规模化应用提供了基础设施保障。两者的协同不仅推动了AI生产力的跃迁，更开启了从技术研发到商业落地的全链条创新
RAG技术深度解析：从基础Agent到复杂推理Deep Search的架构实践小爷毛毛（卓寿杰）系统架构与解决方案搜索推荐架构语言模型人工智能自然语言处理
重磅推荐专栏：《大模型AIGC》《课程大纲》《知识星球》本专栏致力于探索和讨论当今最前沿的技术趋势和应用领域，包括但不限于ChatGPT和StableDiffusion等。我们将深入研究大型模型的开发和应用，以及与之相关的人工智能生成内容（AIGC）技术。通过深入的技术解析和实践经验分享，旨在帮助读者更好地理解和应用这些领域的最新进展一、什么是RAGAgent？1.从信息处理到智能生成在自然语言处
适合企业内训的AI工具实操培训教程（37页PPT）（文末有下载方式）极客11 数字化
详细资料请看本解读文章的最后内容。资料解读：适合企业内训的AI工具实操培训教程在当今数字化时代，人工智能（AI）技术迅速发展，深度融入到各个领域，AIGC（人工智能生成内容）更是成为内容创作的新趋势，为企业提升效率、创新发展带来了新契机。这份培训教程聚焦多种AI工具，尤其是DeepSeek，为企业员工提供了全面的实操指导。AIGC指利用人工智能技术自动生成文本、图像、音频、视频等内容，让AI协助甚
毕业论文AIGC高？5个方法有效降低AI率，消除AI痕迹！我是宝库 AIGC 人工智能经验分享论文抽检毕业论文 AIGC检测学习方法
现在很多学校要求毕业论文基本都要检测AIGC了。AIGC是指人工智能生成的内容，现在无论是毕业论文还是期刊投稿，都会检测论文是否由AI生成的，比如知网、维普、万方、Turnitin、MasterAI率检测等。如果你的论文使用了AI工具辅助写作，自己提前进行AIGC检测，必要时降低AIGC率是很有必要的，那么，如何降低AIGC率呢？分享5种方法：1、改写句子结构。AI生成的句子通常比较长，句子结构僵
第81期 | GPTSecurity周报 aigc网络安全
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.大语言模型与代码安
AIGC论文查重和传统论文查重有什么区别？真不二价825 论文查重 AI论文写作 AIGC 论文查重
AIGC论文查重和传统论文查重在多个方面存在显著区别，以下是对两者的详细比较：一、检测目标和技术原理AIGC论文查重检测目标：主要用于检测和分析文本内容是否由AI生成，特别是在要求提供真实人类经验的领域，如新闻发布、文学创作等。技术原理：主要利用自然语言处理和深度学习技术，分析文本的风格、语法结构和语义连贯性，以判断内容是否可能由AI模型产生。传统论文查重检测目标：主要检测论文中是否存在抄袭或剽窃
【AIGC】计算机视觉-YOLO系列家族 LeeZhao@ 计算机视觉 AIGC 计算机视觉 YOLO
YOLO系列家族（1）YOLO发展史（2）YOLOX（3）YOLOv6（4）YOLOv7（5）YOLOv8（6）YOLOv9（7）YOLOv10（8）YOLOv11（9）YOLOv12（1）YOLO发展史YOLO(YouOnlyLookOnce）是一种流行的物体检测和图像分割模型，由华盛顿大学的约瑟夫-雷德蒙（JosephRedmon）和阿里-法哈迪（AliFarhadi）开发。YOLO于2015
不同学科的论文，AIGC检测时有区别吗？ kexiaoya2013 AIGC 论文阅读论文笔记
不同学科的论文在写作风格、专业术语、逻辑结构上有着明显的差异，那么，不同学科的论文在AIGC检测时，检测结果会有区别吗？结果提前告诉你，当然有区别。一、学科特性决定检测难度1、理工科论文专业术语密集、实验步骤固定，在写作过程中很容易形成标准化的表达，这种规律性很强的文本，最容易被AIGC检测工具抓出破绽。2、人文社科论文注重思辨与逻辑推演，在写作中常常会带有个人的观点和批判性思考，这些人类特有的复
AI重构电商内容体系：企业如何突破生产、管理、分发三重门？ Tezign_space 人工智能重构 AIGC 科技数字资产管理内容数字化内容科技
在电商内容需求激增的2025年，AI技术已成为破解内容生产低效、管理混乱、分发粗放的核心工具。特赞科技服务案例显示，企业通过AIGC+数字资产管理方案可实现效率300%提升。内容科技驱动电商新范式电商内容已从"商品说明书"演变为体验经济载体。2025年数据显示，83%用户因短视频/3D内容完成购买决策，但企业普遍面临三大痛点：生产端：传统设计流程无法满足海量SKU需求管理端：数字资产利用率不足40
AIGC是怎么为拥有5000家门店的行业头部企业做内容分发？ Tezign_space AIGC 人工智能科技经验分享传媒音视频
在AI的发展过程中，我们也曾走过弯路。最初，我们都沉浸在通过海量数据训练出超级智能的幻想中，但随着时间的推移，我们逐渐意识到，在商业应用中，技术的稳定性和可靠性远比单纯的先进性更为重要。特别是在面向企业的应用场景中，客户需要的是稳定、可靠的服务，而不是可能出错的概率性结果。所以，我们现在需要做的是将工程技术与AI进行深度融合。通过工程手段来提升AI的稳定性和降低成本，这样我们才能在商业场景中更好地
AIGC视频生成模型：ByteDance的PixelDance模型好评笔记 AIGC 音视频机器学习人工智能深度学习计算机视觉 transformer
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍ByteDance的视频生成模型PixelDance，论文于2023年11月发布，模型上线于2024年9月，同时期上线的模型还有Seaweed（论文未发布）。热门专栏机器学习机器学习笔记合集深度学习深度学习笔记合集优质专栏回顾：机器学习笔记深度学习笔记多模态论文笔记AIGC—图像文章目录热门专栏机器学习深度学习
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他