ChatGPT实战与私有化大模型落地

文章目录

  • 大模型现状
    • baseline底座选择
    • 数据构造
    • 迁移方法
    • 评价
    • 思考
  • 领域大模型训练技巧
    • Tokenizer
    • 分布式深度学习
      • 数据并行
      • 管道并行
      • 向量并行
      • 分布式框架——Megatron-LM
      • 分布式深度学习框架——Colossal-AI
      • 分布式深度学习框架——DeepSpeed
      • P-tuning 微调
    • 资源消耗
    • 模型推理加速
      • 模型推理加速方法——FastLLM
      • 模型推理加速方法——VLLm
  • 领域大模型产品形态及落地场景
    • ChatGPT用户视角思考
    • ChatGPT企业视角思考
    • 企业级ChatGPT的建设要素
    • 选择优质的应用场景
    • ChatGPT场景设计-工业制造
    • ChatGPT场景设计-文案编写

大模型现状

baseline底座选择

ChatGPT实战与私有化大模型落地_第1张图片

数据构造

ChatGPT实战与私有化大模型落地_第2张图片

  • 领域数据
  • 书籍数据
  • 网站数据
  • 新闻内容
  • 指令微调数据

混合数据(公用数据+领域数据,比例1:5 )避免知识遗忘,导致通用能力下降。

迁移方法

ChatGPT实战与私有化大模型落地_第3张图片

  • 资源不充足的时候,在chat模型基础上训练
  • 资源充足的时候,在Base模型上训练
    千万级别的数据,在chat模型上不要用全量数据进行训练。

评价

ChatGPT实战与私有化大模型落地_第4张图片

思考

ChatGPT实战与私有化大模型落地_第5张图片


领域大模型训练技巧

ChatGPT实战与私有化大模型落地_第6张图片

  • ChatGPTBook:github.com/liucongg/ChatGPTBook

Tokenizer

ChatGPT实战与私有化大模型落地_第7张图片

分布式深度学习

ChatGPT实战与私有化大模型落地_第8张图片

数据并行

ChatGPT实战与私有化大模型落地_第9张图片

管道并行

ChatGPT实战与私有化大模型落地_第10张图片

向量并行

ChatGPT实战与私有化大模型落地_第11张图片
ChatGPT实战与私有化大模型落地_第12张图片

分布式框架——Megatron-LM

ChatGPT实战与私有化大模型落地_第13张图片

分布式深度学习框架——Colossal-AI

ChatGPT实战与私有化大模型落地_第14张图片

分布式深度学习框架——DeepSpeed

ChatGPT实战与私有化大模型落地_第15张图片
ChatGPT实战与私有化大模型落地_第16张图片
ChatGPT实战与私有化大模型落地_第17张图片
ChatGPT实战与私有化大模型落地_第18张图片

P-tuning 微调

ChatGPT实战与私有化大模型落地_第19张图片

资源消耗

ChatGPT实战与私有化大模型落地_第20张图片
ChatGPT实战与私有化大模型落地_第21张图片

模型推理加速

模型推理加速方法——FastLLM

ChatGPT实战与私有化大模型落地_第22张图片

模型推理加速方法——VLLm

ChatGPT实战与私有化大模型落地_第23张图片


领域大模型产品形态及落地场景

ChatGPT实战与私有化大模型落地_第24张图片

ChatGPT用户视角思考

ChatGPT实战与私有化大模型落地_第25张图片

ChatGPT企业视角思考

ChatGPT实战与私有化大模型落地_第26张图片

企业级ChatGPT的建设要素

ChatGPT实战与私有化大模型落地_第27张图片

选择优质的应用场景

ChatGPT实战与私有化大模型落地_第28张图片

ChatGPT场景设计-工业制造

ChatGPT实战与私有化大模型落地_第29张图片

ChatGPT场景设计-文案编写

ChatGPT实战与私有化大模型落地_第30张图片

你可能感兴趣的:(AIGC,#,技术分享,chatgpt,落地)