数据派THU

开源方案复现ChatGPT流程！1.62GB显存即可体验，单机训练提速7.73倍

来源：潞晨科技 
本文约4000字，建议阅读8分钟
Colossal-AI 快速跟进，首个开源低成本复现 ChatGPT 完整流程。

火爆全网的 ChatGPT，仿佛开启了第四次工业革命，让微软、谷歌等全球科技巨头打得昏天黑地，引得各路玩家纷纷入局，抢占赛道。

然而由于 OpenAI 没有开源 ChatGPT，如何有效复现 ChatGPT 已成为摆在大家面前的头号难题，急需可靠的开源共建方案。

Colossal-AI 快速跟进，首个开源低成本复现 ChatGPT 完整流程。作为当下最火热的开源 AI 大模型解决方案，Colossal-AI 已收获开源社区 GitHub Star 近万颗，此次开源亮点包括：

开源完整基于 PyTorch 的 ChatGPT 复现流程，涵盖全部 3 个阶段，可实现从预训练模型到 ChatGPT 的蜕变；
体验最小 demo 训练流程最低仅需 1.62GB 显存，任意单张消费级 GPU 即可满足，单卡模型容量最多提升 10.3 倍；
相比原生 PyTorch，最高可提升单机训练速度 7.73 倍，单卡推理速度 1.42 倍，一行代码即可使用；
对于微调任务，可最多提升单卡的微调模型容量 3.7 倍，同时保持高速运行，仅需一行代码；
提供单卡、单机多卡、1750 亿参数等多个版本，支持从 Hugging Face 导入 OPT，GPT-3，BLOOM 等多种预训练大模型；
收敛验证正在进行中，该项目也在吸引合作者共建生态。

开源地址：

https://github.com/hpcaitech/ColossalAI

ChatGPT——AIGC 引发的工业革命

如果问新年伊始，最火爆的科技热点是什么？非 ChatGPT 莫属。

它仿佛无所不能的六边形战士，可以聊天、写代码、修改 bug、做表格、发论文、写作业、做翻译、甚至代替 Google 搜索引擎等……

自发布以来，ChatGPT 便已摧枯拉朽之势席卷各个行业，不仅 5 天时间便突破百万用户，月活用户突破 1 亿更是仅用时 2 个月，成为史上增速最快的消费级应用，远超如今其他知名应用，如 Twitter 5 年、Meta（Facebook）4 年半，TikTok 9 个月等，而手机普及到 1 亿用户则用了 16 年。

1 亿用户月活用户耗时

比尔・盖茨盛赞 “ChatGPT 的意义不亚于 PC 和互联网诞生”，而微软 CEO 萨蒂亚・纳德拉（Satya Nadella）更是直言 “堪比工业革命，这辈子第一次见这么大的技术浪潮” 和 “AI 正在重塑互联网”。作为向 OpenAI 投资上百亿美元的大金主，微软已火速将 ChatGPT 整合进自家的搜索引擎必应 Bing 和 Edge 浏览器，还计划加入 Teams 以及 Office 等办公套件全家桶，股价一夜市值飙涨超 800 亿美元。

微软与谷歌发布会后股价对比

而隔壁需要担心被 ChatGPT 革命掉自家搜索引擎的谷歌，虽然拉响 “红色警报”，紧急发布对标竞品 Bard，却因 Demo 首秀翻车，股价市值瞬间蒸发 1000 亿美元。

一夜之间，全球的科技巨头们仿佛都回到了自己年轻时的样子，纷纷宣布要打造自己的 ChatGPT。

但 ChatGPT 发布已有数月，市面上不仅没有预训练权重开源，连可靠的完整开源训练流程都仍是空白，更无法实现基于千亿大模型的 ChatGPT 全流程高效搭建和应用。临时上线，号称 “对标 ChatGPT” 的一众新品们，因为闭源也难辨真伪。

为什么 ChatGPT 有如此魔力？复现它又有哪些难点？

ChatGPT 技术分析

ChatGPT 的惊人效果，重要特征是在训练过程引入人类反馈强化学习（RLHF），使得模型表现更符合人类价值观。

ChatGPT 的训练流程主要分为三个阶段：

1. 从 Prompt 库中采样，收集其人工回答，利用这些数据来微调预训练大语言模型。

2. 从 Prompt 库中采样，使用大语言模型生成多个回答，人工对这些回答进行排序后，训练奖励模型（RM），来拟合人类的价值判断。

3. 基于阶段 1 的监督微调模型和阶段 2 的奖励模型，利用强化学习算法对大语言模型进一步训练。

其中阶段 3 是 RLHF 训练的核心部分，OpenAI 采用了强化学习中的近端策略优化算法（PPO），借此引入奖励信号，使得语言模型生成内容更加符合人类评判标准。

RLHF 的三个阶段

ChatGPT 模型的复杂性在于强化学习的引入会带来更多模型的调用。例如，使用基于 Actor-Critic（AC）结构的 PPO 算法，需要在训练时进行 Actor、Critic 两个模型的前向推理和反向传播，以及监督微调模型、奖励模型的多次前向推理。在 ChatGPT 基础的 InstructGPT 的论文中，Actor 和监督微调模型都使用了 1750 亿参数的 GPT-3 系列模型，Critic 和奖励模型则使用了 60 亿参数的 GPT-3 系列模型。

对于如此多的模型参数，想要启动原始 ChatGPT 训练流程，需要数千 GB 的显存开销，显然远超单张 GPU 的容纳能力，常见的数据并行技术也无能为力。但即使引入张量并行、流水并行对参数进行划分，也仍需至少 64 张 80GB 的 A100 作为硬件基础。并且，其中的流水并行由于 bubble 和调度复杂，效率受限，不适合 AIGC 的生成式任务。阶段 3 涉及 4 个模型的复杂强化学习训练流程，进一步给 ChatGPT 的代码复现带来了困难和挑战。

使用 Colossal-AI 低成本复现 ChatGPT

Colossal-AI 以开源方式复现了 ChatGPT 训练的基本流程，包括阶段 1 预训练，阶段 2 的奖励模型的训练，以及最为复杂的阶段 3 的强化学习训练等。

同时，Colossal-AI 通过 ZeRO，Gemini， Chunk-based 内存管理等技术，极大地降低 ChatGPT 训练的显存开销，仅需一半硬件资源即可启动 1750 亿参数模型训练（64 卡 ->32 卡），显著降低应用成本。若使用上述相同硬件资源，Colossal-AI 则能以更短时间进行训练，节省训练成本，加速产品迭代。

为了让更多开发者体验复现 ChatGPT 模型，除 1750 亿参数版本外，Colossal-AI 还提供高效的单卡、单机 4/8 卡的类 ChatGPT 版本，以降低硬件限制。

在单机多卡服务器上，即便使用最高端的 A100 80GB 显卡，由于 ChatGPT 的复杂性和内存碎片，PyTorch 最大仅能启动基于 GPT-L（774M）这样的小模型的 ChatGPT。用 PyTorch 原生的 DistributedDataParallel (DDP) 进行多卡并行扩展至 4 卡或 8 卡，性能提升有限。

Colossal-AI 不仅在单卡训练和推理速度上优势明显，随着并行规模扩大还可进一步提升，最高可提升单机训练速度 7.73 倍，单卡推理速度 1.42 倍，还可继续扩展至大规模并行，显著降低 ChatGPT 复现成本。

为了尽可能降低训练成本和上手门槛，Colossal-AI 还提供了在单张 GPU 上即可尝试的 ChatGPT 训练流程。相比于 PyTorch 在约 10 万元的 A100 80GB 上，最大仅能启动 7.8 亿参数模型，Colossal-AI 将单卡容量提升 10.3 倍至 80 亿参数。对于基于 1.2 亿参数小模型的 ChatGPT 训练，最低仅需 1.62GB 显存，任意单张消费级 GPU 即可满足。

此外，Colossal-AI 也致力于降低基于预训练大模型的微调任务成本。以 ChatGPT 可选的开源基础模型 OPT 为例，相比 PyTorch，Colossal-AI 可将提升单卡微调模型容量 3.7 倍（原始计算量显著增大），同时保持高速运行。

一行代码快速上手

Colossal-AI 为 Hugging Face 社区的 GPT，OPT 和 BLOOM 等主流预训练模型，提供了开箱即用的 ChatGPT 复现代码。以 GPT 为例，仅需一行代码，指定使用 Colossal-AI 作为系统策略即可快速使用。

Python
from chatgpt.nn import GPTActor, GPTCritic, RewardModel
from chatgpt.trainer import PPOTrainer
from chatgpt.trainer.strategies import ColossalAIStrategy


strategy = ColossalAIStrategy(stage=3, placement_policy='cuda')


with strategy.model_init_context():
    actor = GPTActor().cuda()
    critic = GPTCritic().cuda()
    initial_model = deepcopy(actor).cuda()
    reward_model = RewardModel(deepcopy(critic.model)).cuda()


trainer = PPOTrainer(strategy, actor, critic, reward_model, initial_model, ...)
trainer.fit(prompts)

使用下列命令，即可快速启动单卡、单机多卡、1750 亿版本训练，并测试各种性能指标（包括最大显存占用、吞吐率和 TFLOPS 等）：

Python
# 使用单机单卡训练GPT2-S，使用最小的batch size，Colossal-AI Gemini CPU策略
torchrun --standalone --nproc_pero_node 1 benchmark_gpt_dummy.py --model s --strategy colossalai_gemini_cpu --experience_batch_size 1 --train_batch_size 1
# 使用单机4卡训练GPT2-XL，使用Colossal-AI Zero2策略
torchrun --standalone --nproc_per_node 4 benchmark_gpt_dummy.py --model xl --strategy colossalai_zero2
# 使用4机32卡训练GPT-3，使用Colossal-AI Gemini CPU策略
torchrun --nnodes 4 --nproc_per_node 8 \
 --rdzv_id=$JOB_ID --rdzv_backend=c10d --rdzv_endpoint=$HOST_NODE_ADDR \
 benchmark_gpt_dummy.py --model 175b --strategy colossalai_gemini_cpu --experience_batch_size 1 --train_batch_size 1

背后优化

核心系统 Colossal-AI

复现 ChatGPT 的背后，依赖面向大模型时代的通用深度学习系统 Colossal-AI，可基于 PyTorch 高效快速部署 AI 大模型训练和推理，降低 AI 大模型应用成本。

自开源以来，Colossal-AI 已经多次在 GitHub 热榜位列世界第一，获得 GitHub Star 超八千颗，并成功入选 SC、AAAI、PPoPP、CVPR 等国际 AI 与 HPC 顶级会议的官方教程。除上述优化外，Colossal-AI 还针对 AI 大模型趋势，提供最多样和高效的大规模多维并行分布式解决方案，此前已在 Stable Diffusion、OPT、AlphaFold 等前沿模型上展现卓越优势。

Colossal-AI 与当今主要开源项目同期开源数据对比

Colossal-AI 由加州伯克利大学杰出教授 James Demmel 和新加坡国立大学校长青年教授尤洋领导。相关解决方案已成功在自动驾驶、云计算、零售、医药、芯片等行业知名厂商落地应用，广受好评。Colossal-AI 已成功帮助某世界 500 强企业，开发具备在线搜索引擎能力增强的类 ChatGPT 聊天机器人模型。

低成本微调的 LoRA

Colossal-AI 支持使用低秩矩阵微调（LoRA）方法进行高效微调。LoRA 方法认为大语言模型是过参数化的，其在微调中的参数改变量是·一个低秩的矩阵，可以将其分解为两个更小的的矩阵的乘积，即。在微调时，固定大模型参数，只调整低秩矩阵参数，从而显著减小训练参数量。在微调之后，进行推理部署之前，只需要将参数加回原有矩阵即可，即，不增加模型的推理延迟。

LoRA 示意图，仅需训练 A、B

减少内存冗余的 ZeRO + Gemini

Colossal-AI 支持使用无冗余优化器 (ZeRO) 来优化内存使用，这种方法可以有效减少内存冗余，并且相比传统的数据并行策略，不会牺牲计算粒度和通信效率，同时可以大幅提高内存使用效率。为了进一步提升 ZeRO 的性能，Colossal-AI 引入了自动 Chunk 机制。通过将运算顺序上连续的一组参数存入同一个 Chunk 中（Chunk 是一段连续的内存空间），可以确保每个 Chunk 的大小相同，从而提高内存使用效率。使用 Chunk 方式组织内存可以保证 PCI-e 和 GPU-GPU 之间的网络带宽得到有效利用，减小通信次数，同时避免潜在的内存碎片。

Chunk 机制

此外，Colossal-AI 的异构内存空间管理器 Gemini 支持将优化器状态从 GPU 卸载到 CPU ，以节省 GPU 内存占用。可以同时利用 GPU 内存、CPU 内存（由 CPU DRAM 或 NVMe SSD 内存组成）来突破单 GPU 内存墙的限制，进一步扩展了可训练模型规模。

通过 ZeRO + Gemini 提升硬件的模型容量

开放协作

尽管此次开源包含了复现 ChatGPT 的完整算法流程和必要软件系统，但对于像 ChatGPT 这样的超大 AI 大模型，想要实际落地应用，还需要数据、算力至少 2 方面的努力。毕竟训练一个 1750 亿参数的 GPT-3 就需要数百万美元算力。因此，长期以来预训练大模型都由少数大型私营科技公司垄断。

好在开源社区已成功进行了新的尝试。例如，完全开放代码、数据集、权重的 1760 亿参数的 BLOOM 模型，共有来自全球 60 个国家、超过 250 个机构，以及超过 1000 名研究人员参与其中，其中包括以个人名义参加的 Meta、谷歌等大厂员工。而前段时间大火的开源图文生成模型 Stable Diffusion，也是由 Stability AI、EleutherAI 和 LAION 等组织共同完成的。

借鉴上述成功模式，该项目也在吸引更多的合作者：无论是个人开发者，还是算力、数据、模型等可能合作方，都有机会参与其中，大显身手，以复现 ChatGPT 为起点，拥抱大模型时代！

可通过以下方式联系或参与：

1. 在 GitHub 发布 issue 或提交 PR

2. 加入 Colossal-AI 用户微信或 Slack 群交流

3. 点击阅读原文填写合作提案

4. 发送合作提案到邮箱 [email protected]

开源地址：

https://github.com/hpcaitech/ColossalAI

参考链接：

https://www.hpc-ai.tech/blog/colossal-ai-chatgpt

编辑：于腾凯

校对：程安乐

数学与机器学习：共舞于智能时代的双璧每天五分钟玩转人工智能机器学习人工智能
随着人工智能的崛起，机器学习作为其核心技术之一，正引领着新一轮的科技革命。而在这场革命中，数学以其深邃的理论和精妙的工具，为机器学习提供了坚实的支撑。数学与机器学习之间的关系，如同琴瑟和鸣，共同编织出智能时代的华美乐章。数学，作为自然科学的皇后，以其严谨的逻辑和精确的推理，为机器学习提供了坚实的理论基础。机器学习算法的设计、优化和应用，都离不开数学的支持。无论是线性代数、概率统计，还是微积分、最优
动物产生式识别系统（人工智能实验）不爱编程的程序媛人工智能数据结构算法
1.实验原理首先，定义两个整数数组`base`和`temp`，分别用于存储特征值和临时存储输入的特征值。输出特征值代表的信息，包括每个特征值对应的动物类型。提示输入特征值的总数，并使用`Scanner`类从控制台读取输入。使用循环遍历输入的特征值，将其存储在`temp`数组中，并在`base`数组中将对应特征值的位置设为1。根据输入的特征值，设置`base`数组中其他位置的值。例如，如果输入的特征
大模型应用：探索AI大模型的50个应用场景：让科技改变生活。 AGI大模型资料分享员人工智能科技生活 agi 语言模型自然语言处理
随着人工智能技术的迅猛发展，AI大模型在各个领域的应用日益广泛。百度创始人、董事长兼首席执行官李彦宏在2024年世界人工智能大会上表示，目前AI技术发展路线发生了方向性改变，已从过去辨别式人工智能转向了未来生成式人工智能。他更是呼吁：“大家不要卷模型，要卷应用！”本文将为大家盘点AI大模型的50个应用场景，并按应用频率从高到低进行排列，带您了解AI如何深刻改变我们的工作与生活。1.自然语言处理(N
ChatGPT到底是什么？会给我们生活来这些改变↓ 大模型. chatgpt 生活 microsoft 语言模型人工智能架构大模型
2022年底，“ChatGPT”这个词悄然进入公众视野。如果你没听说过，或是只把它当成一个聊天机器人，那就太小看它了。很多行业，比如新闻、律师、教育、客服咨询等等，已经把ChatGPT应用在了生产、服务中。那么，ChatGPT究竟是什么？本期内容，我们就来了解ChatGPT和它背后的技术。我们先从它的名字说起。Chat，直译为“闲聊”，可以说ChatGPT是用起来如同微信或QQ的一个聊天应用。只不
盘点50个AI大模型企业和典型产品大模型玩家人工智能语言模型 ai 自然语言处理深度学习大模型
OpenAI：-ChatGPT：是OpenAI推出的非常具有影响力的聊天机器人程序，能够进行自然流畅的对话、文本创作、问题解答等，不断迭代升级，引发了全球对大模型的广泛关注。-GPT-4O：OpenAI的新一代AI模型，在语言理解和生成能力上有进一步提升，能够感知用户的情绪，并针对问题以带有情绪的“嗓音”做出反馈。-Sora：文生视频大模型，可根据文本指令生成复杂且具有一定时长的视频，具有多个镜头
从模型到实际：人工智能项目落地的关键要素 IT猫仔科技人工智能语言模型自然语言处理搜索引擎服务器机器学习
引言近年来，人工智能技术从实验室走向实际应用，其潜力在各行各业得到了初步的验证。然而，AI技术的落地并非一蹴而就，许多企业在尝试部署AI项目时，却发现自己陷入了“模型很好看，应用却难做”的困境。无论是数据准备不足、算法与场景的不匹配，还是缺乏持续优化的机制，这些问题都可能导致项目停滞，甚至功亏一篑。前排提示，文末有大模型AGI-CSDN独家资料包哦！对于企业来说，人工智能的价值不仅在于模型的高精度
大模型产品架构全景解读：从应用场景到技术支持的完整路径健忘的派大星架构人工智能语言模型 ai agi LLM AI大模型
前言随着人工智能技术的迅猛发展，大模型逐渐成为推动各行业智能化转型的核心动力之一。大模型不仅可以处理大量数据，进行复杂任务的自动化，还能通过微调、蒸馏等技术在特定场景中表现出色。本文将结合大模型产品架构图，详细解读每一个组成模块，帮助读者理解从应用场景到技术支持的完整路径，洞察大模型如何在实际业务中落地。一、落地场景：赋能业务的智能化解决方案大模型的实际价值首先体现在各个业务场景的落地应用中。在架
2000-2021年上市公司数字化转型数据（MD&A报告词频、文本统计） m0_71334485 数据 #上市公司上市公司数字化转型数字化转型上市公司
2000-2021年上市公司数字化转型数据（MD&A报告词频、文本统计）1、时间：2000-2021年2、来源：上市公司NB3、范围：上市公司4、指标：包括人工智能技术、大数据技术、云计算技术、区块链技术、数字技术运用和数字技术应用、互联网商业模式、智能制造、现代信息系统等9个维度175个词频类别、股票代码、股票简称、年报标题、年份、MD&A文本-文本总长度、MD&A文本仅中英文-文本总长度、人工
There was a problem confirming the ssl certificate: [SSL:CERTIFICATE_ VERIFY_ FAILED]certificate解决方案爱编程的喵喵 Python基础课程 python pip SSL certificate 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了Therewasaproblemco
chatgpt赋能python：Python怎么安装到U盘 vacvefito ChatGpt chatgpt 人工智能计算机
Python怎么安装到U盘在日常的编程工作中，Python是一门十分常用的编程语言。而有时候并非每个人都愿意在电脑上安装Python，或者在外出时需要借助一台非自己的电脑来进行Python编程。因此，将Python安装到U盘成为一个方便实用的选择。为什么要将Python安装到U盘将Python安装到U盘可以让我们在不同设备上进行Python编程，而不用担心设备内是否已经安装了Python。这样可以
chatgpt赋能python：在U盘上安装Python开发环境教程 tulingtest ChatGpt chatgpt python 开发语言计算机
在U盘上安装Python开发环境教程如果你是一位Python开发人员，那么你肯定知道，为了成功地开发和运行Python程序，需要安装Python开发环境。然而，对于很多人来说，它们的工作地点可能不支持安装软件，或者他们需要在多个设备上使用Python开发环境。针对这些情况，将Python开发环境安装到U盘上就成了必要的。优点使用U盘上Python开发环境的好处如下：灵活性：可以在任何地方使用Pyt
chatgpt赋能python：如何在U盘上下载安装Python？ sc17332889342 ChatGpt chatgpt python 开发语言计算机
如何在U盘上下载安装Python？随着Python语言在全球范围内的流行和广泛使用，越来越多的程序员、工程师和开发者需要从不同的设备上去下载Python，以便在其电脑上使用。然而，在某些环境下，电脑或工作站的管理权限受限，因此无法自由安装和使用Python。那么，如何在没有管理员权限和完整安装包的情况下，在U盘上下载并安装Python呢？步骤1：下载Python安装程序在任何电脑上都可以下载Pyt
chatgpt赋能python：U盘安装Python——一种简单高效的Python学习方式 findyi123 ChatGpt chatgpt python 学习计算机
U盘安装Python——一种简单高效的Python学习方式介绍Python作为一门实用性和易学性极高的脚本语言，在软件开发、数据分析等领域有着广泛的应用。很多初学者会选择安装Python解释器和相关IDE工具进行学习和实践。然而，如果你只是想快乐地学习Python，并且不想折腾复杂的环境配置和软件安装，那么可以考虑使用U盘安装Python，一种简单高效、随时随地可以学习Python的方式。步骤下载
chatgpt赋能python：将Python装进U盘：给程序员的便携指南 aijinglingchat ChatGpt chatgpt python 开发语言计算机
将Python装进U盘：给程序员的便携指南如果您是一个程序员或者开发人员，您可能经常需要在不同的电脑上使用Python。从编写代码到测试，您需要在不同的操作系统上运行和测试您的代码。因此，我们为您准备了一个便携式解决方案：将Python安装在U盘上。在本文中，我们将详细介绍如何在U盘上安装Python，并讨论其优点和缺点。步骤1：下载Python首先，您需要从Python官网（https://ww
（新春特辑）腾讯开源MimicMotion整合包，最强图片生成跳舞视频的动作视频模型，动作丝滑没有破绽 struggle2025 人工智能计算机视觉机器学习 AI作画腾讯云AI代码助手
一、项目介绍：（文末提供下载）腾讯图片生成跳舞视频的项目MimicMotion，高质量人类动作视频生成与置信感姿势。亮点：丰富的细节，良好的时间平滑性，以及长视频长度。效果同时支持面部特征和唇形同步，不止可以搞跳舞视频，也可以做数字人。本文信息图片均来源于GitHub开源地址：https://github.com/Tencent/MimicMotion二、效果展示三、概述近年来，生成式人工智能在图
DeepSeek--通向通用人工智能的深度探索者油泼辣子多加专业名词解释人工智能
一、词源与全称“DeepSeek"由"Deep”（深度）与"Seek"（探索）组合而成，中文译名为"深度求索"。其全称为"深度求索人工智能基础技术研究有限公司"，英文对应"DeepSeekArtificialIntelligenceResearchInstitute"。这一命名体现了企业对深度学习技术与未知领域持续探索的双重追求。二、发展历程初创期（2023）公司成立于中国杭州，创始团队汇聚了来自
git clone出现fatal: unable to access Failed to connect to github.com port 443: Timed out解决方案爱编程的喵喵 Python基础课程 git github timeout port 443 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了gitclone出现fatal:un
flask+layui学生信息管理系统元宇宙中的程序员 flask layui python
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、pandas是什么？二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。一、数据库建模1、创建数据模型classStudentORM(db.Model):stu_id=d
AI编程时代，程序员不得不懂的产品设计思维！！用户故事是什么?该如何写用户故事？小南AI学院人工智能敏捷开发
0.AI编程时代，你会被淘汰吗？亲爱的码农朋友们，听到AI工具写代码越来越强的消息，是不是有点慌了？ChatGPT、Copilot、AutoML，Cursor一个个名字看起来像是在“抢饭碗”的大佬。AI编程时代已经来临，单纯写代码的技能，可能会被逐渐边缘化！未来，你不仅是码农，更要成为产品经理式的码农！因为在未来，会写代码只是“入场券”，而能解决问题才是“通行证”。不会思考产品、不会理解用户、不会
ABAP git客户端
在多模态模型的架构上，ChatGPT的绘图能力主要依赖以下几个核心组件：跨模态编码器（Cross-ModalEncoder）：跨模态编码器的作用是将文本和图像的特征进行对齐。GPT可以将用户输入的文本描述转换为文本特征表示，然后利用跨模态编码器将这些特征映射到图像特征空间。这种方式确保模型能够理解描述性语言中不同细节是如何与图像特征对应的。
AI智能制造软件有什么用处雪叶雨林行业资讯 AI 人工智能制造
随着信息技术与制造业的深度融合，人工智能（AI）逐渐成为提升制造效率和灵活性的重要工具。AI智能制造软件通过集成数据分析、机器学习和自动化流程，为企业提供了优化生产、降低成本和提高质量的新途径。生产过程优化实时监控与反馈AI智能制造软件能够实时收集生产线上的各类数据，如温度、压力、速度等参数，并通过机器学习算法进行分析处理。一旦检测到异常情况，系统会立即发出警报并提供改进建议，帮助企业快速响应问题
ModuleNotFoundError: No module named ‘pywin32_bootstrap‘解决方案爱编程的喵喵 Python基础课程 python ModuleNotFound win32_bootstap 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了ModuleNotFoundErro
100个高质量ChatGPT学术论文写作提示词分享--系列（一）迪娜学姐人工智能深度学习论文阅读
我是娜姐@迪娜学姐，一个SCI医学期刊编辑，探索用AI工具提效论文写作和发表。ChatGPT学术论文写作高质量提示词分享，今天先分享50个，涵盖论文写作、文献综述、研究方法设计、数据分析、学术演讲准备等方面。1.论文写作(ThesisWriting)1.为[研究主题]制定一个引人入胜的论文标题，突出其创新性和重要性。Craftanengagingthesistitlefor[researchtop
100个高质量ChatGPT学术论文写作提示词分享--系列（二）迪娜学姐论文阅读论文笔记人工智能 chatgpt
我是娜姐@迪娜学姐，一个SCI医学期刊编辑，探索用AI工具提效论文写作和发表。ChatGPT学术论文写作高质量提示词分享，之前分享过50个，涵盖论文写作、文献综述、研究方法设计、数据分析、学术演讲准备等方面：100个高质量ChatGPT学术论文写作提示词分享--系列（一）今天继续分享50个，包括论文修改与编辑、写作技巧与提升、参考文献引用及编辑、论文投稿和课题申请：6论文修改与编辑(ThesisR
人物传记之新月篇暮雨哀尘人物传记篇哈希算法算法 c语言 python pycharm vscode windows
相关故事链接（及时更新）：Python的那些事第四篇：编程中的智慧之光控制结构-CSDN博客目录1.C语言程序：增强版加密与解密工具2.Python程序：增强版加密与解密工具功能对比表格详细功能解释人物传记简介新月，25世纪的杰出女性，以其在编程、人工智能和军事战略领域的卓越成就而闻名。她不仅是一位才华横溢的科学家，还是一位深受尊敬的军事领袖。新月的故事是关于智慧、勇气和创新精神的传奇。早年生活新
MicroAI™将人工智能培训引入RENESAS MCU sinat_41698914 人工智能 mcu big data
在端点部署的人工智能技术将加快资产密集型行业的上市时间达拉斯--(美国商业资讯)--边缘原生人工智能(AI)和机器学习(ML)产品领域的先驱MicroAITM今天宣布，公司已将其MicroAIAtomML™技术与RenesasRA微控制器(MCU)产品线进行整合。与全球微控制器领导者Renesas合作将机器学习引入MCU，并借助MicroAI直接在嵌入式环境中训练机器学习模型的能力——这在业界尚属
DeepSeek R1：中国AI黑马的崛起与挑战码事漫谈 AI 人工智能
文章目录技术突破：从零开始的推理能力进化DeepSeekR1-Zero：纯RL训练的“自我觉醒”DeepSeekR1：冷启动与多阶段训练的平衡之道实验验证：推理能力的全方位跃升基准测试：超越顶尖闭源模型蒸馏技术：小模型的逆袭行业启示：AGI之路的新范式纯RL训练的价值与挑战蒸馏技术的普惠意义开源生态的推动力未来展望：从推理到通用智能结语在人工智能领域，大型语言模型（LLMs）正以迅猛之势重塑我们的
第76期 | GPTSecurity周报云起无垠 GPTSecurity 人工智能网络安全
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.关于使用大语言模型
从简单到深刻的认知发展 AI架构设计之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
认知发展，人工智能，深度学习，神经网络，机器学习，自然语言处理，计算机视觉1.背景介绍认知发展是人类从简单到复杂的思维方式演进的过程，它涉及感知、记忆、语言、推理和决策等多个方面。随着人工智能技术的飞速发展，我们开始尝试用计算机模拟人类的认知能力，构建能够学习、理解和解决复杂问题的智能系统。从早期的符号逻辑到如今的深度学习，人工智能的发展经历了多个阶段。早期的人工智能研究主要集中在规则和逻辑推理上
2025年1月27日人工智能与科技新闻：DeepSeek震撼全球科技市场海棠AI实验室 AI 瞭望塔人工智能科技
中国AI初创公司DeepSeek震撼全球科技市场DeepSeekR1模型的突破性发展在科技迅猛发展的时代，中国人工智能初创公司DeepSeek推出的R1模型，以其卓越的技术能力，在全球AI领域掀起一场变革。这不仅是技术层面的突破，更对全球科技市场产生深远影响。技术创新与突破全新语言处理架构：提升AI理解和生成能力超越传统模型的认知能力：实现更精准的自然语言推理多模态交互：支持文本、图像、语音等多维
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite

开源方案复现ChatGPT流程！1.62GB显存即可体验，单机训练提速7.73倍

你可能感兴趣的:(chatgpt,人工智能)