大模型专栏博文汇总和索引

大模型专栏主要是汇总了我在学习大模型相关技术期间所做的一些总结和笔记,主要包括以下几个子专栏:

  1. DeepSeek-R1
  2. AIGC
  3. 大模型实践
  4. Transformer
  5. 多模态
  6. 系统
  7. 视频理解
  8. 对比学习
  9. 目标检测
  10. 目标跟踪
  11. 图神经网络

大模型专栏汇总了以上所有子专栏的论文,目前暂时先按照不同的技术领域划分子专栏,子专栏之间的内容可能会有交集,不完全是独立的。

为了方便查阅相关模块的内容,故以此文章进行汇总与索引。

一、DeepSeek-R1

专栏地址:https://blog.csdn.net/sinat_16020825/category_12901824.html?spm=1001.2014.3001.5482

主要介绍DeepSeek-R1模型涉及的相关技术原理、方法、部署和相关的开源项目。

博文:

  1. DeepSeek-R1大模型相关技术原理介绍
  1. 第1篇:混合专家模型(MoE)
  2. 第2篇:大模型知识蒸馏(Knowledge Distillation)
  3. 第3篇:强化学习(Reinforcement Learning, RL)
  4. 第4篇:本地部署DeepSeek,断网也能畅聊!
  5. 第5篇:DeepSeek-R1微调指南
  6. 第6篇:思维链(CoT)
  7. 第7篇:冷启动
  8. 第8篇:位置编码介绍(绝对位置编码、RoPE、ALiBi、YaRN)
  9. 第9篇:MLA(Multi-Head Latent Attention,多头潜在注意力)
  10. 第10篇:PEFT(参数高效微调——Adapter、Prefix Tuning、LoRA)
  11. 第11篇:RAG原理介绍和本地部署(DeepSeek+RAGFlow构建个人知识库)
  12. 第12篇:分词算法Tokenizer(WordPiece,Byte-Pair Encoding (BPE),Byte-level BPE(BBPE))
  13. 第13篇:归一化方式介绍(BatchNorm, LayerNorm, Instance Norm 和 GroupNorm)
  1. 跑通复现DeepSeek-R1的Open R1开源项目,介绍相关的技术原理、方法和源码分析
  1. 系列1:跑通SFT(一步步操作,手把手教学)
  2. 系列2:没有卡也能训模型!Colab跑OpenR1(附源码)
  3. 系列3:基础知识介绍
  4. 系列4:跑通GRPO!
  5. 系列5:SFT源码逐行深度解析
  6. 系列6:GRPO源码结构解析
  7. 系列7:GRPO原理介绍、训练流程和源码深度解析
  8. 系列8:混合精度训练、DeepSpeed、vLLM和LightEval介绍
  9. 系列9:有趣的现象——GRPO训练过程Loss从0开始慢慢变大

二、AIGC

专栏地址:https://blog.csdn.net/sinat_16020825/category_12822758.html

主要是介绍文生图、图生图、文生视频等相关技术。

博文:

  1. 技术原理介绍
  1. 【AIGC系列】1:自编码器(AutoEncoder, AE)
  2. 【AIGC系列】2:DALL·E 2模型介绍(内含扩散模型介绍)
  3. 【AIGC系列】3:Stable Diffusion模型介绍
  1. Stable Diffusion应用介绍
  1. 【Stable Diffusion】入门-01:原理简介+应用安装(Windows)+生成步骤
  2. 【Stable Diffusion】入门-02:AI绘画提示词+参数设置攻略
  3. 【Stable Diffusion】入门-03:图生图基本步骤+参数解读
  4. 【Stable Diffusion】入门-04:不同模型分类+代表作品+常用下载网站+使用技巧

三、大模型实践

专栏地址:https://blog.csdn.net/sinat_16020825/category_12834983.html

主要介绍一些实践的开源大模型项目。

博文:

  1. 预训练语言模型微调和部署——《动手学大模型》实践教程第一章
  2. 大模型提示学习与思维链——《动手学大模型》实践教程第二章
  3. 大模型知识编辑——《动手学大模型》实践教程第三章
  4. 大模型水印——《动手学大模型》实践教程第四章
  5. 大模型安全和越狱攻击——《动手学大模型》实践教程第五章
  6. 多模态大语言模型——《动手学大模型》实践教程第六章
  7. 大模型智能体安全——《动手学大模型》实践教程第七章
  8. 【LLaMa2入门】从零开始训练LLaMa2

四、Transformer

专栏地址:https://blog.csdn.net/sinat_16020825/category_12822715.html

主要介绍Transformer相关的模型结构和应用。

博文:

  1. Transformers在计算机视觉领域中的应用【第1篇:ViT——Transformer杀入CV界之开山之作】
  2. Transformers在计算机视觉领域中的应用【第2篇:MAE——BERT的CV版本】
  3. Transformers在计算机视觉领域中的应用【第3篇:Swin Transformer——多层次的Vision Transformer】

五、多模态

专栏地址:
https://blog.csdn.net/sinat_16020825/category_12822761.html

主要是介绍多模态大模型相关技术原理和应用。

博文:

  1. 【CLIP系列】1:CLIP【多模态领域开山之作】
  2. 【CLIP系列】2:如何用多GPU训练大模型(数据/模型/流水线/张量并行、MoE、混合精度训练、压缩、激活重新计算)
  3. 【CLIP系列】3:语义分割(LSeg、GroupViT)
  4. 【CLIP系列】4:目标检测(ViLD、GLIP)
  5. 【CLIP系列】5:CLIP图像生成——CLIPasso
  6. 【CLIP系列】6:视频(CLIP4CLIP、Action CLIP)、语音(audio CLIP)及其他(CLIP-ViL、PointCLIP、DepthCLIP)
  7. 【多模态大模型】系列1:Transformer Encoder——ViLT、ALBEF、VLMO
  8. 【多模态大模型】系列2:Transformer Encoder-Decoder——BLIP、CoCa、BEITv3

六、系统

专栏地址:https://blog.csdn.net/sinat_16020825/category_12822756.html

主要是介绍系统相关的论文和技术,例如并行技术等。

博文:

  1. 如何用多GPU训练大模型(数据/模型/流水线/张量并行、MoE、混合精度训练、压缩、激活重新计算)

七、视频理解

暂无更新。


八、对比学习

暂无更新。


九、目标检测

专栏地址:https://blog.csdn.net/sinat_16020825/category_12822763.html

主要是介绍目标检测领域相关论文、技术原理和代码分析等。

博文:

  1. YOLO系列论文综述(从YOLOv1到YOLOv11)
  1. 【第1篇:概述物体检测算法发展史、YOLO应用领域、评价指标和NMS】
  2. 【第2篇:YOLO系列论文、代码和主要优缺点汇总】
  3. 【第3篇:YOLOv1——YOLO的开山之作】
  4. 【第4篇:YOLOv2——更好、更快、更强】
  5. 【第5篇:YOLOv3——多尺度预测】
  6. 【第6篇:YOLOv4——最优速度和精度】
  7. 【第7篇:YOLOv5——使用Pytorch框架、AutoAnchor、多尺度预训练模型】
  8. 【第8篇:YOLOv6——更高的并行度、引入量化和蒸馏以提高性能加速推理】
  9. 【第9篇:YOLOv7——跨尺度特征融合】
  10. 【第10篇:YOLOv8——集成检测、分割和跟踪能力】
  11. 【第11篇:YOLO变体——YOLO+Transformers、DAMO、PP、NAS】
  12. 【第12篇:YOLOv9——可编程梯度信息(PGI)+广义高效层聚合网络(GELAN)】
  13. 【第13篇:YOLOv10——实时端到端物体检测】
  14. 【第14篇:YOLOv11——在速度和准确性方面具有无与伦比的性能】
  15. 【第15篇(完结):讨论和未来展望】

十、目标跟踪

暂无更新。


十一、图神经网络

暂无更新。


十二、其他

  1. 深度学习论文精读【持续更新中】

你可能感兴趣的:(大模型,transformer,深度学习,人工智能,语言模型)