公众号:肉眼品世界

人人都能懂的ChatGPT解读

作者 | 张杰，中关村科金技术副总裁

策划 | 刘燕

ChatGPT 发布了两个多月，热度不降反增，不断火爆出圈。是时候，为不懂 AI 技术的同学们白话科普一下了。

本文将用浅显且不严谨的语言解惑以下问题：ChatGPT 为什么能火起来？
ChatGPT 背后的关键技术是什么？我能弄个自己的 ChatGPT 吗？我怎么用它来赚钱？

1. ChatGPT 为什么这么火？

对话机器人不是个新技术，以往的机器人产品很多，为什么这次 OpenAI 公司推出的 ChatGPT 能这么火？因为以前的机器人只能做简单且有限的事，问天气、放音乐还行，问个复杂一些的事就有点“人工智障”了。ChatGPT 可以说是技术上的量变引起了效果上的质变，在三个方面让我感觉很惊艳：

有上下文记忆能力，多轮对话衔接地很好，很难看出是机器生成的；
有学习纠错能力，在它回答错误之后，如果你纠正了它，第二次就不会再答错。
有思维链推理能力，具备一些常识知识，能做复杂一些的算数题；

2. ChatGPT 背后的

关键技术是什么？

在 ChatGPT 背后起关键作用的是一种被称为大规模语言模型（Large Language Model，LLM）的东西，ChatGPT 用的这款语言模型命名为 GPT-3.5，GPT 是生成式预训练（Generative Pre-Training）的缩写，目前的版本号是 3.5 版。此外，在 GPT-3.5 之上，ChatGPT 还通过基于人类反馈的强化学习（Reinforcement Learning from Human Feedback，RLHF），使 GPT 能够记住之前的对话、承认错误、在连续的多轮对话中给人很顺畅的感觉。

2.1 大规模语言模型

顾名思义，大规模语言模型就是非常大的语言模型。什么是语言模型呢？

2.1.1 语言模型

简单说来，语言模型的作用就是根据已知句子的一部分，来预测下一个单词或者空缺部分的单词是什么。比如，给你前半句：“国庆前夕，天安门广场前伫立起一个 ____”，你会预测出空白部分大概率会是“大花篮”。

其实，你天天都在用语言模型，当你使用手机或电脑里的输入法回复消息时，它就在推荐你下一个单词。ChatGPT 使用的 GPT-3.5 可比输入法中的语言模型要大很多。输入法语言模型占用的存储空间可能只有 50MB，而 GPT-3.5 有 800GB。

2.1.2 神经网络

GPT 为什么会那么大？因为它内部是神经网络的结构。大规模语言模型的基础单元叫做感知机，它模拟了人脑中神经元的结构。这些感知机组织成庞大的网络结构，用来“山寨”人脑的神经网络。

一般情况下，一个正常人的大脑约有 800~1000 亿个神经元，以及约 100 万亿个突触。神经科学家 Paul Maclean 提出的三元脑（triune brain) 模型，将大脑结构分为三类：爬行脑、哺乳脑、人类脑。爬行脑最早进化出来，负责呼吸、心跳、血压等，完全自动运作。哺乳脑负责情感、记忆、习惯形成等，能够做出非常快的决策。人类脑最晚形成，负责一些复杂的分析推理，是做慢决策，即所有需要深思熟虑的事物。

GPT-3.5 的参数总量达到 1750 亿，虽然距离人脑突触的量级还有差距，但也已经显现出之前小规模模型所不具备的推理能力。要想足够智能，网络规模足够大是个必要条件。

2.1.3 Transformer

大模型的核心是一个叫 Transformer 的组件，Transformer 在这里可不是"变形金刚"的意思，也许翻译成"变压器"意思更接近些。

想想我们国家的西电东输工程，西部利用水力、风力、日光所转化的电能，经过变压器压缩成高压甚至特高压，再在电网上传输，到了东部之后再逐级降压，然后才能使用。变压器在其中先升压再降压，有效降低了能量在传输过程中的损耗。

我们人类在交流过程中也有类似的过程，同事 A 跟你说了一件事，你并没有逐字逐句的记在脑子里，而是理解了其中的语义，在脑子里形成一种意识流，这是一种压缩编码的过程。你脑子里保留的意识流具体是什么，你也说不清楚 --- 也不需要说清楚。当你向同事 B 复述这件事的时候，你重新把它组织成语言，保留了其中的各项重点内容，通过一系列的发音或文字表达给对方，这是解码的过程。这种先编码再解码的过程，就是 Transformer 的工作原理。另外，在实际当中，有些语言模型只用到堆叠多层的编码器，有些只用到堆叠多层的解码器；堆叠的层数也多有不同，少的有 6 层、12 层，多的有 48 层。

如果你有一些计算机基础，听说过词袋模型（Bag of Words，BOW）、循环神经网络（Recurrent Neural Network，RNN），那么对 Transformer 就更容易理解了。

BOW 完全丢弃了词的位置信息，没有把文本当作有顺序的序列，因此语义理解能力较差。例如，“不，我很好”和“我很不好”，两句话虽然用词一样，但词的位置不同，语义上差别巨大。
RNN 能较好的保留词的位置信息，可以考虑到词的先后顺序对预测的影响，但是，如果处理的文本长度很长，关键的词之间距离较远时，效果会显著下降。
Transformer 中引入“注意力”机制，多个组件分别关注句子中不同方面的重点，而且随着网络层次的增加，能够提取出更高级更抽象的语义信息，理解能力更强。Transformer 除了语义提取能力强，还能从无标注的数据中学习，而且场景迁移能力好。

2.1.4 思维链

此外，大规模语言模型还带给人们的一项意外的惊喜，那就是让人细思极恐的思维链（Chain-of-Thought，CoT）能力。

简单地说，思维链就是让 LLM 将一个问题拆解为多个步骤，最后给出答案，而不是让 LLM 直接给出答案。直接给答案的出错率更高。比如，你给 LLM 出了一个题目：“张三养了 10 条狗，每天照顾每条狗都要花半小时，请问他照顾这些狗要花费多长时间？”LLM 直接给答案的话可能会出错，当你提示 LLM 要“一步步地回答”时，它会告诉你：“张三养了 10 条狗，每天照顾每条狗都要花半小时，那就是 10 x 0.5 = 5 小时 / 天。5 小时 / 天 x 7 天 / 周 = 35 小时 / 周。答案是每周 35 小时。”

这项能力并不是设计者的初衷（初衷只是学习如何说人话），而是在随后的代码训练、提示学习中挖掘出来的，这些能力原本就已经存在于大模型之中，它从代码、书籍、网页中学到了一些常识知识并具备了一定的推理能力。

2.2 基于人类反馈的强化学习

人类问问题的方式对于 LLM 而言不是最自然的理解方式，为了让 ChatGPT 给出的答案更贴近人类的问题、更符合公序良俗，它在发布前采取了一种叫做“基于人类反馈的强化学习”（Reinforcement Learning by Human Feedback，RLHF）的训练策略。简单来说，就是花钱找人给模型提出各种可能的问题，并对模型反馈的错误答案进行惩罚、对正确的答案进行奖励，从而实现提升 ChatGPT 回复质量的目的。

光有海量的、无标注的数据还不够，还要有少量的、高质量的标注数据才行。前者用来训练语言模型，让它学会说人话，后者用来训练对话模型，让它别啥都瞎说，比如：回答中不能含有种族歧视和性别歧视的内容，拒绝回答不当问题和知识范围之外的问题。

3. 我能训个 ChatGPT 吗？

简单地回答：极大概率是不能的。起码在现阶段，这不是招几个人、花些钱就能做成的事，能训出 ChatGPT 的人可能比做出 4 纳米芯片的人还要少。

这其中的原因是什么？咱先来捋捋 ChatGPT 超能力的来源，再对比看看自己手中的家底。

3.1 算力

算力，也就是数据的处理能力，与数据、算法，并称为 AI 三要素。据估计，仅仅训练一次 GPT-3，Open AI 可是花费了 460 万美元。对于 ChatGPT 而言，支撑其算力基础设施至少需要上万颗英伟达 A100 的 GPU，一次模型训练成本超过 1200 万美元。

然而，在这些必要非充分条件中，算力是最容易解决的。

3.2 数据

模型要足够深、足够大，才能解决远距离的语义理解能力、才能产生抽象的推理能力，这些高级的基础的能力具有很好的通用性。因此，高级的能力可能只存在于大型模型中，而训练大模型，需要足够的数据量。

全球高质量文本数据的总存量在 4.6 万亿到 17.2 万亿个字符之间。这包括了世界上所有的书籍、科学论文、新闻文章、维基百科、公开代码以及网络上经过筛选的达标数据，例如网页、博客和社交媒体。最近的一项研究数据显示，数据总数大约为 3.2 万亿个字符。DeepMind 的 Chinchilla 模型是在 1.4 万亿个字符上训练的。也就是说，在这个数量级内，我们很有可能耗尽世界上所有有用的语言训练数据。

此外，反观中文网站的数据资源，大致占全世界总资源的 1.3%。中文内容相比英文有四五十倍的差距，人工智能脱离不了人类知识的土壤，这方面的先天条件不是短期内花钱或凭一己之力就能解决的。

3.3 人才

ChatGPT 公开出来的少量材料中，披露出了一系列训练技巧，比如：代码训练、指令微调、上下文学习等。更多的细节目前还没有公开，即便公开了也不见得是全部，即便全部公开也未必能重现。因为整个过程链条非常长，有大量的工程技巧在里边。俗话说魔鬼藏在细节里，具体的实现和工程技巧才是重头戏，好比刚学做菜的人，即便有足够的食材，照着菜谱也不可能做出一套满汉全席。

今年 2 月初，谷歌已向人工智能初创公司 Anthropic 投资约 3 亿美元，并获得该公司 10% 股份。该公司 2021 年创立，目前团队规模仅在 40 人左右，初创期的 11 位核心成员都曾经参与过 GPT-2、GPT-3 模型的研发。可见，业界对于人才的重视程度以及人才的奇缺性。

4. 如何用 ChatGPT 赚钱？

ChatGPT 似乎打破了人们关于 AI 模型的一项固有认知：“通用的不好用，好用的不通用。”

大模型革命的一个关键趋势就是，通用大模型比专用小模型表现地更好。对于定位在垂直细分领域里的初创公司来说，既不能自研出大模型，效果上又失去了竞争力，因此是不是就没有活路了？

我觉得不是，ChatGPT 的能力可以分成 chat 和 GPT 两部分来看，即上层的对话和图片的生成能力、底层的语言和推理能力。

在 ToC 类内容消费市场，未来可能会出现大量的、碎片化的 AIGC 应用，比如生成头像、诗文、甚至短视频等，重点是在有趣的细分场景里发挥创造性和想象力。在消费电子市场里，有对话能力的智能音箱、智能家电在去年的出货量有所下滑，借助更强的对话能力，也许还能挽回一些颓势。

在 ToB 类企业服务市场，AI 不再只是替代简单重复性的体力劳动，还将替代简单规律性的脑力劳动，并在逻辑复杂的脑力劳动中辅助员工提升工作效率。简单的脑力劳动，比如营销文案撰写、初级程序员和插画师等。复杂的脑力劳动，可能会围绕具体业务的推理能力，以虚拟工作助手的形式出现。

对于处于 ToB 赛道的科技公司而言，中间层可能会越来越薄，对于行业 KnowHow 的积累会成为越来越重要的竞争门槛。这其中可能会遇到很多挑战，比如：如何在使用强大的通用模型和构建自己的垂直模型之间进行迭代，如何将通用无标注的大规模数据和领域小规模知识相结合，如何将领域事实知识注入到 LLM 中使得 LLM 的输出内容可控。在目前的研究范式下，领域内高质量的标注数据 + 领域推理能力，两者如何形成“飞轮效应”是非常重要的问题。

5. 划重点

说了这么多，总结一下重点，不管你能记住多少，起码下次在电梯里遇到老板或者在饭局上遇到同学时，在聊起 ChatGPT 的时候，你能插上几句话。

关于大规模语言模型：训练时要用到万亿级的数据、花费百万美元的算力，才能使它能说人话，并具有一定的“思维链”推理能力。
大模型的超能力：模型要足够深、足够大，才能产生抽象的推理能力，这些高级的基础能力具有很好的通用性。大模型革命的一个关键趋势就是，通用大模型比专用小模型表现地更好，打破了人们一项固有认知：“通用的不好用，好用的不通用。”
应用场景：ToC 类应用要找准细分的内容生成场景，ToB 类应用要围绕推理能力去发挥，让它成为脑力工作者的辅助，替代一部分简单的脑力工作，辅助员工的做创造性工作。

最后，对于想进一步深入了解技术细节的同学，推荐一下延展阅读材料：

OpenAI 官网上关于 ChatGPT 的介绍：ChatGPT: Optimizing Language Models for Dialogue
关于大规模预训练语言模型：《预训练语言模型》
基于语言模型提示学习的推理：论文列表
关于 GPT 技术演进过程：GPT1 到 ChatGPT 的技术演进
关于大模型的涌现能力：大模型的突现能力和 ChatGPT 引爆的范式转变
关于 InstructGPT：Training language models to follow instructions with human feedback
对话式 AI 需要具备领域知识时，可以参考这本书：《知识中台》
对话式 AI 需要处理视频或语音时，可以参考：《深度学习视频理解》《语音识别服务实战》

作者简介

张杰，中关村科金技术副总裁

天津大学计算机专业博士。荣获第十届吴文俊人工智能技术发明一等奖。著有《知识中台：数字化转型中的认知技术》、《“新一代人工智能创新平台建设及其关键技术丛书”— 知识图谱》两部技术专著。研究领域：知识工程、自然语言处理等技术领域拥有丰富的理论和实践经验。主持或参与国家级课题八项，并发表学术论文十余篇、拥有专利一百余项。主导开发了推荐引擎、知识问答系统、客服机器人、大数据风控平台、行业知识图谱等多项商业化系统，累计产值数亿元。

推荐阅读：
世界的真实格局分析，地球人类社会底层运行原理
不是你需要中台，而是一名合格的架构师（附各大厂中台建设PPT）

企业IT技术架构规划方案

论数字化转型——转什么，如何转？

华为干部与人才发展手册（附PPT）

企业10大管理流程图，数字化转型从业者必备！

【中台实践】华为大数据中台架构分享.pdf

华为的数字化转型方法论

华为如何实施数字化转型（附PPT）

超详细280页Docker实战文档！开放下载

华为大数据解决方案（PPT）

2025年使用 npx + expo + react native 创建一个项目 expoyarnreact
为什么要用expo？因为reactnative官方推荐的为什么要用npx？因为expo官方推荐的怎么用呢？看expo的官方文档：https://docs.expo.dev/npxcreate-expo-app@latest这里需要注意，如果你问chatgpt，会得到npminstall-gexpo-cli来安装,但是这样方式已经过期了，不要再用了─➤expoversionWARNING:Thele
1月更新 | 国内可用的 ChatGPT 中文版镜像网站攻略合集
一、ChatGPT镜像网站①ChatGPT中文版支持4o以及o1，支持MJ绘画②ChatGPT镜像网站支持通用全模型，支持文件读取、插件、绘画、AIPPT③ChatGPT工具站收集各种可以用的ChatGPT镜像网站，免费的收费的。1.什么是ChatGPT镜像网站ChatGPT镜像网站（ChatGPTMirrorSite）是指通过复制原始网站内容和结构，创建的备用网站。其主要目的是在原始网站无法访问
Transformer入门（1）transformer及其编码器-解码器通信仿真实验室 Google BERT 构建和训练NLP模型 bert transformer 人工智能 NLP 自然语言处理
文章目录1.Transformer简介2.Transformer的编码器-解码器架构3.transformer的编码器1.Transformer简介Transformer模型是一种用于自然语言处理的机器学习模型，它在2017年由Google的研究者提出，并在论文《AttentionisAllYouNeed》中详细描述。Transformer模型的核心创新在于其采用了自注意力（self-attent
chatgpt赋能python：Python创建虚拟环境venv-环境隔离的必备工具 a058046 ChatGpt python chatgpt 人工智能计算机
Python创建虚拟环境venv-环境隔离的必备工具Python是一种非常流行的编程语言，拥有丰富的第三方库和工具。当我们在开发一个项目时，我们可能需要使用多个Python版本或多个第三方库版本来满足项目的需求。这时候，我们就需要一个工具来管理Python的环境隔离。venv就是Python自带的虚拟环境工具，它可以让我们轻松地创建一个Python环境隔离，以便于我们管理我们的Python环境。什
【人工智能 | 大数据】基于人工智能的大数据分析方法用心去追梦人工智能大数据数据分析
基于人工智能（AI）的大数据分析方法是指利用机器学习、深度学习和其他AI技术来分析和处理大规模数据集。这些方法能够自动识别模式、提取有用信息，并做出预测或决策，从而帮助企业和组织更好地理解市场趋势、客户行为以及其他关键因素。以下是几种主要的基于AI的大数据分析方法：机器学习模型：通过训练算法让计算机从历史数据中学习并做出预测或分类。常见的机器学习技术包括监督学习（如回归分析、支持向量机）、非监督学
基于MATLAB机器学习、深度学习实践技术应用梦想的初衷~ 机器学习人工智能 matlab 机器学习深度学习
近年来，MATLAB在机器学习和深度学习领域的发展取得了显著成就。其强大的计算能力和灵活的编程环境使其成为科研人员和工程师的首选工具。在无人驾驶汽车、医学影像智能诊疗、ImageNet竞赛等热门领域，MATLAB提供了丰富的算法库和工具箱，极大地推动了人工智能技术的应用和创新。原文链接https://mp.weixin.qq.com/s?__biz=Mzg2NDYxNjMyNA==&mid=224
ChatGPT搜索漏洞：AI代码生成器安全隐患及应对策略前端
近年来，随着人工智能技术的飞速发展，各种AI代码生成器层出不穷，为程序员带来了极大的便利。然而，技术进步的同时也伴随着安全风险的提升。最近，OpenAI的ChatGPT搜索工具曝出重大安全漏洞，引发了业界广泛关注。本文将深入探讨该漏洞的细节、影响以及应对措施，并展望未来AI工具安全发展趋势。ChatGPT作为一款强大的AI工具，其搜索功能本意是帮助用户快速获取信息。然而，英国卫报近期报道揭露了Ch
1月更新｜国内可用的 ChatGPT 镜像网站整理合集人工智能chatgpt
一、ChatGPT镜像网站①ChatGPT中文版支持4o以及o1，支持MJ绘画②ChatGPT镜像网站支持通用全模型，支持文件读取、插件、绘画、AIPPT③ChatGPT工具站收集各种可以的ChatGPT镜像网站，免费的收费的。支持4o以及o1，支持MJ绘画1.什么是ChatGPT镜像网站ChatGPT镜像网站（ChatGPTMirrorSite）是指通过复制原始网站内容和结构，创建的备用网站。其
1月更新 | 国内可用的 ChatGPT中文版镜像网站攻略整理人工智能chatgpt
一、ChatGPT镜像网站①ChatGPT中文版支持4o以及o1，支持MJ绘画②ChatGPT镜像网站支持通用全模型，支持文件读取、插件、绘画、AIPPT③ChatGPT工具站收集各种可以用的ChatGPT镜像网站，免费的收费的。1.什么是ChatGPT镜像网站ChatGPT镜像网站（ChatGPTMirrorSite）是指通过复制原始网站内容和结构，创建的备用网站。其主要目的是在原始网站无法访问
12月更新｜国内可用的 ChatGPT中文版镜像网站合集~
一、ChatGPT镜像网站①ChatGPT中文版支持4o以及o1，支持MJ绘画②ChatGPT镜像网站支持通用全模型，支持文件读取、插件、绘画、AIPPT③ChatGPT工具站收集各种可以的ChatGPT镜像网站，免费的收费的。支持4o以及o1，支持MJ绘画1.什么是ChatGPT镜像网站ChatGPT镜像网站（ChatGPTMirrorSite）是指通过复制原始网站内容和结构，创建的备用网站。其
降维算法：主成分分析一个人在码代码的章鱼数学建模机器学习概率论
主成分分析一种常用的数据分析技术，主要用于数据降维，在众多领域如统计学、机器学习、信号处理等都有广泛应用。主成分分析是一种通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量（即主成分）的方法。这些主成分按照方差从大到小排列，方差越大，包含的原始数据信息越多。通常会选取前几个方差较大的主成分，以达到在尽量保留原始数据信息的前提下降低数据维度的目的。它通过将多个指标转换为少数几个主成分,
【大模型】Spring AI对接ChatGpt使用详解小码农叔叔微服务治理与实战 springboot 入门到精通 spring spring ai Aspring Ai spring ai对接gpt spring ai整合gpt spring ai使用详解 spring ai使用
目录一、前言二、springai介绍2.1什么是SpringAI2.2SpringAI特点2.3SpringAI为开发带来的便利2.4SpringAI应用领域2.4.1聊天模型2.4.2文本到图像模型2.4.3音频转文本2.4.4嵌入大模型使用2.4.5矢量数据库支持2.4.6用于数据工程ETL框架三、SpringAI对接ChatGPT3.1前置准备3.2添加依赖3.3接入流程3.3.1配置文件3
1月更新｜国内可用的 ChatGPT 中文版镜像网站合集~
一、ChatGPT镜像网站①ChatGPT中文版支持4o以及o1，支持MJ绘画②ChatGPT镜像网站支持通用全模型，支持文件读取、插件、绘画、AIPPT③ChatGPT工具站收集各种可以的ChatGPT镜像网站，免费的收费的。支持4o以及o1，支持MJ绘画1.什么是ChatGPT镜像网站ChatGPT镜像网站（ChatGPTMirrorSite）是指通过复制原始网站内容和结构，创建的备用网站。其
ChatGPT 中文版：国内可用的 ChatGPT 镜像网站整理合集（1月更新）人工智能chatgpt
一、ChatGPT镜像网站①ChatGPT中文版支持4o以及o1，支持MJ绘画②ChatGPT镜像网站支持通用全模型，支持文件读取、插件、绘画、AIPPT③ChatGPT工具站收集各种可以的ChatGPT镜像网站，免费的收费的。支持4o以及o1，支持MJ绘画④ChatGPT插件好用的插件~1.什么是ChatGPT镜像网站ChatGPT镜像网站（ChatGPTMirrorSite）是指通过复制原始网
深入解析如何进行TensorFlow框架下的算子开发与适配插件开发：基于昇腾AI的完整流程快撑死的鱼华为昇腾 Ascend C的算子开发系统学习人工智能 tensorflow python
深入解析如何进行TensorFlow框架下的算子开发与适配插件开发：基于昇腾AI的完整流程在人工智能领域中，算子（Operator）作为深度学习模型的基础执行单元，决定了整个模型的计算性能和结果准确性。随着硬件平台的多样化，如何将第三方深度学习框架中的算子适配到特定的硬件平台变得至关重要。本文将深入探讨如何在TensorFlow框架下开发适配昇腾AI处理器的算子插件，通过解析算子属性映射、数据排布
【微服务】Spring AI 使用详解逆风飞翔的小叔精通springboot微服务 Spring AI Spring AI使用详解 Spring AI使用
目录一、前言二、SpringAI概述2.1什么是SpringAI2.2SpringAI特点2.3SpringAI带来的便利2.4SpringAI应用领域2.4.1聊天模型2.4.2文本到图像模型2.4.3音频转文本2.4.4嵌入大模型使用2.4.5矢量数据库支持2.4.6数据工程ETL框架三、SpringAI对接ChatGPT3.1前置准备3.2添加必要的依赖3.3接入操作流程3.3.1配置文件3
Python从0到100（八十三）：神经网络-使用残差网络RESNET识别手写数字是Dream呀 python 神经网络网络
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
解锁辅助驾驶新境界：基于昇腾 AI 异构计算架构 CANN 的应用探秘倔强的石头_ AIGC 人工智能架构
博客主页：倔强的石头的CSDN主页Gitee主页：倔强的石头的gitee主页⏩文章专栏：《AI大模型》期待您的关注目录一、引言二、CANN是什么1.异构计算与人工智能的关系2.CANN的定义和作用3.CANN的技术优势三、基于CANN的辅助驾驶AI应用原理1.目标检测算法2.智能检测流程3.算力平台支持四、基于CANN的辅助驾驶AI优势1.高效训练2.精准检测3.快速编程4.产业应用五、部署实操六
探秘IO分布式模块设计：让大数据处理更高效清水湾落车分布式
一、引言随着互联网的飞速发展，大数据、云计算、人工智能等技术逐渐成为时代的主流。在这个数据爆炸的时代，如何高效地处理海量数据成为企业面临的重大挑战。IO分布式模块设计作为一种有效的解决方案，越来越受到关注。本文将带您了解IO分布式模块设计的基本概念、原理及其在实际应用中的优势。二、什么是IO分布式模块设计？IO分布式模块设计，是指将数据存储、数据处理、数据传输等IO操作进行分布式处理的一种设计方法
【人工智能】Python实战：构建高效的多任务学习模型蒙娜丽宁 Python杂谈 AI 人工智能 python 学习
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界多任务学习（Multi-taskLearning,MTL）作为机器学习领域中的一种重要方法，通过在单一模型中同时学习多个相关任务，不仅能够提高模型的泛化能力，还能有效利用任务间的共享信息。本文深入探讨了多任务学习的基本概念、优势及其在实际应用中的重要性。
以Python构建ONE FACE管理界面：从基础至进阶的实战探索 Allen_LVyingbo python python pyqt
一、引言1.1研究背景与意义在人工智能技术蓬勃发展的当下，面部识别技术凭借其独特优势，于安防、金融、智能终端等众多领域广泛应用。在安防领域，可助力监控系统精准识别潜在威胁人员，提升公共安全保障水平；金融行业中，实现刷脸支付、远程开户等便捷服务，优化用户体验并强化交易安全。智能终端方面，为设备解锁、身份验证等功能提供支持，提升设备使用的便捷性与安全性。然而，现有面部识别系统在数据安全、检索效率及用户
明达云：赋能化工园区，智绘安全高效新蓝图明达技术物联网网络
在日新月异的科技浪潮中，数字化转型已成为各行各业转型升级的关键驱动力。尤其在化工这一关乎国家经济命脉与安全环保的重要领域，如何实现智能化管理、提升运营效率、确保生产安全，成为了摆在众多化工园区面前的重大课题。在此背景下，明达云平台以其卓越的技术实力与深厚的行业经验，正逐步成为化工园区智慧化升级的首选伙伴。智慧监管，安全先行化工生产，安全为先。明达云平台通过集成物联网、大数据、人工智能等先进技术，为
AI大模型：开启智能革命新纪元洋洋科创星球 AI项目管理赋能实战人工智能
1.AI大模型技术：智能革命的新引擎自2022年11月30日OpenAI推出ChatGPT以来，这一大型语言模型（LLM）迅速走红，标志着AI领域进入了一个新的发展阶段，即AI大模型时代。这一时代预示着AI正朝着通用人工智能（AGI）的方向发展。尽管业界对大模型的定义尚未统一，但通常指的是基于Transformer框架的大型语言模型，广义上也包括了多模态大模型，如涉及语言、声音、图像、视频等，技术
比亚迪进军具身智能：未来实验室的战略布局与挑战前端
比亚迪，这家以新能源汽车闻名全球的企业，正在悄然布局一个全新的领域——具身智能及机器人技术。近日，比亚迪成立未来实验室的消息引发广泛关注，其战略意义和未来发展前景值得我们深入探讨。在人工智能技术飞速发展的今天，选择合适的AI写代码工具对于项目的成功至关重要。比亚迪未来实验室的战略意义：汽车基因与智能融合比亚迪进军机器人领域并非偶然之举。其深厚的汽车制造经验和规模化生产能力，为其在机器人研发方面奠定
苹果携手腾讯字节跳动：AI代码生成器赋能iPhone，开启移动智能新时代？前端
近年来，人工智能技术飞速发展，其在移动设备上的应用也日益普及。近日，路透社爆料称苹果公司正在与腾讯和字节跳动商谈，计划将它们的AI模型整合到在中国销售的iPhone中，这一消息迅速引发了业界广泛关注。这不仅预示着苹果在AI领域的战略布局进一步深化，也标志着AI技术在移动设备应用领域迈入了一个新的里程碑。这篇文章将深入探讨苹果此举的意义、挑战以及对整个AI产业的影响。整合AI模型：机遇与挑战并存苹果
关于2025年人工智能agent的5个预测大模型微调实战人工智能语言模型机器学习自然语言处理
2024年是人工智能agent走向主流的一年。从年初黑客们那些笨拙、昂贵且充满激情的项目开始，agent现在已经得到了科技巨头、SaaS公司、学术研究人员等更多人的接纳。与此同时，他们的形式也在不断增多，从文本扩展到多种模式，并在现实世界中执行行动的能力也变得更强大。在这里，我预测2025年agent领域的轨迹，因为它开始在人工智能社区之外产生影响力。1.对agent的兴趣持续激增今年，对人工智能
《AGI：开启智能新纪元的钥匙》空云风语人工智能深度学习神经网络 agi 人工智能深度学习 AIGC
一、AGI：人工智能的进阶之路在科技飞速发展的当下，人工智能（AI）已逐渐渗透到我们生活的各个角落，从智能手机中的语音助手，到自动驾驶汽车，再到医疗领域的疾病诊断辅助，AI的身影无处不在。然而，在AI的宏大版图中，当前被广泛应用的大多属于狭义人工智能（NarrowAI），它专注于特定领域的任务执行，而通用人工智能（ArtificialGeneralIntelligence，简称AGI）则代表着人工
零售业的AI赋能与前端开发效率革命：ScriptEcho 的助力前端
零售业正经历着前所未有的数字化转型，但同时也面临着巨大的挑战。库存管理混乱、个性化客户体验不足等问题，严重制约着零售企业的盈利能力。而人工智能（AI）的兴起，为解决这些问题提供了新的思路。通过AI驱动的实时库存管理和客户行为分析，零售企业可以显著提升运营效率和客户满意度。然而，构建这些AI赋能的零售应用，需要强大的前端开发能力，这正是AI代码生成器ScriptEcho能够发挥关键作用的地方。AI赋
人工智能时代，企业如何搭建自己的AI知识库知识库知识库管理知识库软件
随着人工智能技术的迅猛发展，企业越来越意识到构建AI知识库的重要性。AI知识库不仅能够高效管理企业的海量知识资源，还能通过智能检索和推荐，提升员工的工作效率，促进企业的创新与发展。本文将详细探讨企业如何搭建自己的AI知识库，包括前期准备、技术选型、构建过程及后续维护等方面。一、前期准备在构建AI知识库之前，企业需要进行充分的前期准备，明确需求和目标。确定需求和目标企业首先需要明确知识库的服务对象、
科技早报｜OpenAI的人工智能模型销售收入超过微软类似业务；荣耀中国区CMO辟谣将采用麒麟芯片 | 最新快讯最新科技快讯科技人工智能 microsoft
科大讯飞新模型在测试集结果中超越GPT-4Turbo6月27日，科大讯飞发布讯飞星火大模型V4.0。与此前的版本相比，新模型在文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等七大能力上都有提升。例如，讯飞星火可以根据用户的语言描述，结合空间和常识推断描述对象所在的位置。而在图文识别上，讯飞星火大模型V4.0能力也进一步升级，在科研、金融、医疗、司法、办公等场景的应用效果已领
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息

人人都能懂的ChatGPT解读

你可能感兴趣的:(chatgpt,人工智能,机器学习)