大数据AI人工智能培训专家培训讲师叶梓

史上最大，人工智能算法模型GPT-3问世，这意味着什么？

2020年，年中。

人类历史上最大的人工智能模型，来到人间。

这个体格巨大的北鼻，哭声嘹亮，告知全世界：“我写的作文，几乎通过了图灵测试。”

那些第一次听说参数数量的人，

那些第一次翻看实验结果的人，

那些第一次口算增长速度的人，

在彼此确认了眼神之后，一致的反应是：

“哦漏，我大概是疯了吧。不，是人工智能模型疯了吧。”

同行迈出的步子，似乎要扯烂裤裆。

墙内的人，捡起惊掉的下巴。

墙外的人，他们只觉得婴儿的哭声吵闹。

“不仅会写短文，而且写出来的作文挺逼真的，几乎可以骗过人类，可以说几乎通过了图灵测试。”

如果没有后两个半句，你可能会误认为这是老师对文科生学霸的评语。

理科也超级擅长，还能辅导别人编程。

“以前都是人类去写程序，现在是人类写一个人工智能算法，算法自己从数据中推导出程序。新的人工智能技术路线已经跑通。”

学渣，看破红尘，敲敲木鱼，念出乔布斯的名言：

做个吃货，做个蠢货

（Stay hungry，Stay foolish）。

反正养老托付给人工智能了。而这样的人工智能，需要巨额的资金，需要顶级的技术。

科技巨头微软大笔一挥，千万美金的支票，拿走不谢。

据测算，即使使用市场上价格最低的GPU云计算（服务），也需要355年的时间和3500多万人民币的费用。

大明宫首席建筑师阎立本，收起画完《步辇图》的画笔，在呈给太宗李世民的臣下章奏中写道“用工十万”。

千宫之宫，留名千古。

全球顶级人工智能实验室，用金千万。

三十一位研究人员，徒手修建了一个外表看上去擅长胸口碎大石的北鼻。

挪步震掀桌椅，哭嚎万马齐喑。

这个超大人工智能模型，名叫GPT-3。

早期的深度学习模型，参数量小，好比一个乐高玩具，每天摆在办公桌上卖萌。

如今的深度学习模型，参数量挑战底层GPU并行技术，参数量挑战底层地基。

好比同样是乐高模型，GPT-3可以在北京朝阳区三里屯优衣库门口当大型摆设。

当然不是试衣服，而是欲与大楼试比高。

知乎问题：“如何看和楼一样高的乐高模型？”

网友回答：“抬头看。”

不抬头，只能看到脚丫子。一个正常的模型大小刻度表，绿巨人GPT-3模型是放不进来的，得重新画一下坐标轴的刻度。

（原来的队列）

（GPT-3来后的队列）

人工智能超大模型GPT-3和绿巨人浩克一样，都是大块头。

经常观摩，可以治疗颈椎病。

绿巨人GPT-3模型出生于美国Open AI实验室。

在看到自己的论文刷爆了朋友圈后，像他们这么低调的科研团队，一点也没有得意，只是在办公室旋转、跳跃，并巡回炫耀了24小时，而已。

早在2019年，Open AI实验室就发出前方高能预警。

他们核算了自2012年以来模型所用的计算量，从AlexNet模型到AlphaGo Zero模型。AlexNet模型，是冠军模型。AlphaGo Zero模型，是打败韩国围棋九段棋手李世石的那个，它们都是人工智能模型。

参数指标很争气，增长30万倍。

那些堪称“最大”的AI训练模型所使用的计算量，呈指数型增长。

3.4个月就会倍增。这是Open AI实验室的结论。

虽然还没有成为“定律”，但已经有很多人用“摩尔定律”和其比较。

摩尔定律说，芯片性能翻倍的周期是18个月。Open AI说，人工智能训练模型所需要的计算量的翻倍周期是3.4个月。

三个半月，一台计算机就不够了，得两台。掐指一算，618大促买新的机器，双11大促又得买新的了。

对于人工智能的科研工作来说，金钱是个好仆人。

如果你不知道Open AI，那要补补课了。

世界历史上，美国时隔9年第一次使用国产火箭从本土将宇航员送入太空，民营航天企业第一次进行载人发射，马斯克就是这家震惊世界的公司的创始人。

Open AI是全球人工智能顶级实验室，这家机构也曾有马斯克的支持。

平庸的人，都是相似的。

疯狂的人，各有各的疯狂。

一个人工智能的算法模型可以大到什么程度？

绿巨人GPT-3模型给出了新答案——1750亿个参数。

实话实说，模型创新程度很难用单个指标量化，模型复杂度和参数量有一定关系，模型参数量决定模型大小。

绿巨人GPT-3模型是啥？

是一个超级大的自然语言处理模型，将学习能力转移到同一领域的多个相关任务中，既能做组词造句，又能做阅读理解。听上去像小学语文课的内容。

把这种（预训练）模型比喻为小学生，一年级的语文作业，组词和造句，早就会做。你接手过来，给模型辅导功课，无需从头教起，接着教二年级的题目就可以了。

《语文》课本里熟悉的一幕：“阅读全文，并总结段落大意。”

绿巨人GPT-3 模型“参数”身价几何？我们来看看《福布斯·模型参数量排行榜》。

回首2011那年，AlexNet，冠军模型，有0.6亿个参数。

回顾前两年，BERT模型，流行一时，有3亿个参数。

绿巨人GPT-3 模型的亲哥哥GPT-2，有15亿个参数。

英伟达的Megatron-BERT，有80 亿参数。

2020年2月，微软Turing NLP，有170 亿参数。

2020年6月，绿巨人GPT-3，有1750亿个参数。

小学数学老师告诉我们：绿巨人GPT-3模型稳赢。

连体育老师也得这么教。

这时候，麦当劳对人工智能说，更多参数，更多欢乐。

理解模型的复杂度，要回顾一下历史。

2015年，微软发明的用于图像识别的ResNet模型训练过程大约包含10的18次方次浮点计算，模型含有千万级参数。

2016年，百度发明的用于语音识别的DeepSpeech模型训练过程大约包含10的19次方次浮点计算，模型含有亿级参数。

2017年，谷歌发明的用于机器翻译的深度学习模型训练过程大约包含10的20次方浮点计算，模型含有数十亿参数。

微软、百度、谷歌，仿佛走进了罗马角斗场，双眼充满红血丝。

拜托，哪有这么血腥，看看科技巨头的年度利润。人工智能本来就是贵族的游戏，哪个玩家没有几头健壮的现金牛。

2018年之后，人工智能模型的消费水平，进入了奢侈品俱乐部。驴牌教父起身站立，鼓掌欢迎。

要是俱乐部有个微信群，奢侈品品牌掌门人，会依次“拍了拍微软、百度、谷歌”。

以下，是一份预估的账单，更恰当地说，是奢侈品消费的账单。

此时此景，人工智能超级大模型，赋诗一首：

训练想得意，

先花一个亿。

性能要凶猛，

挥金得如土。

人工智能算法模型“疯狂”增长的背后，究竟意味着什么？

围绕这个问题，我采访了微软亚洲研究院前研究员，一流科技创始人袁进辉博士。

袁博士说了两层意思。

第一层，钱很重要。

袁进辉博士说道：“人工智能模型疯狂增长的背后，意味着人工智能的竞争已经进入到军备竞赛级别。长时间的使用GPU集群是非常花钱的。制造一个像GPT-3这样的超级模型的想法，可能有人能想到，但不是每个团队都有钱验证这一想法。除谷歌之外，很多公司没有财力训练BERT-Large模型，并且，实现这个想法对工程能力要求极高。”

土豪的生活就是这样，朴实无华又枯燥。训练超大GPT-3模型，须使用超大规模GPU机器学习集群。一个人工智能模型训练一次的花销是千万美金，一颗卫星的制造成本被马斯克降到50万美元以下。人工智能模型比卫星成本还昂贵。

土豪的生活又加了一点，土豪也得勤奋。

第二层，不是有钱就能行，技术也很重要。

在袁进辉看来，人工智能的大模型运行在大规模GPU（或者TPU）集群上，训练需要分布式深度学习框架，才能在可接受的时间内看到提升效果，大模型的训练如果没有分布式深度学习框架支持，即使能投入大笔资金搭建大规模GPU集群也无济于事。在模型和算力都如此快速增长的情况下，深度学习框架如果不跟着一起发展的话，会限制算法研究的水平和迭代速度。

对深度学习框架，人工智能模型的要求是，在努力上进的我身边，有一个同样努力上进的你。

深度学习框架呼唤技术创新，再墨守成规就会被“甩”了。

无情未必真豪杰，那究竟是什么技术如此重要？

一个能打败“内存墙”的技术。

那内存墙是什么呢？这个问题的答案，有（hen）点（ke）长（pu）。

早期深度学习模型，参数量小，一个GPU够用。当参数量变大，一个GPU不够了，麻烦就来了。当计算量相当的大，训练一个模型跑上十天半个月啥的是常事，分布式的意义就出现了。既然一张GPU卡跑得太慢就来两张，一块GPU芯片单独处理不了，得多块GPU。对某些深度学习应用来说，比较容易实现“线性加速比”，投入多少倍的GPU资源就获得多少倍加速效果。

只要砸钱，就能降低运算时间，一切看上去，都还挺美好。

但是，现实扼住咽喉，把你从“美好”中摇醒。

超大模型对计算量的需求，百倍、千倍地提升，不仅超越了任何一类芯片（GPU）单独处理的能力，而且即使砸钱堆了成百上千块的GPU，对不起，加速比很低。投了一百倍资源，只有几倍加速效果，甚至出现多个GPU比单个GPU还慢的情况。

为啥呢？

首先，深度学习是一种接近“流式”的计算模式，计算粒度变得很小，难把硬件跑满。

传统大数据处理多属于批式计算，对全体数据扫描处理后才获得结果。与此相反，深度学习训练是基于随机梯度下降算法的，这是典型的流式计算，每扫描和处理一小部分数据后，就开始调整和更新内部参数。

批式计算是，一次端过来一锅，全部吃完。流式计算是，一次来一小碗。再不给大爷盛饭，就要停嘴了，嘴停，手就停。

一般，一个GPU处理一小块数据只需要100毫秒的时间，那么问题就成了，“调度”算法能否在100毫秒的时间内为GPU处理下一小块数据做好准备。如果可以的话， GPU就会一直保持在运算状态。如果不可以，那么GPU就要间歇性地停顿，意味着设备利用率降低。

深度学习训练中的计算任务粒度非常小，通常是数十毫秒到百毫秒级别。换句话说，干活干得快，不赶紧给分派新的任务，大爷就要歇着了。

总歇着，活肯定也干不快，工期长，急死人。

另一方面，深度学习使用的装备太牛逼，不是GPU就是AI芯片，运算速度非常快。

一块GPU芯片单独处理不了，单靠GPU这一类芯片也处理不了。通常是CPU和GPU一块儿工作，CPU 负责任务的调度和管理，而GPU 负责实现计算（稠密），这就是经常说的异构计算（Heterogenous computing）。

但是又有了新问题，GPU 吞吐率非常高，可以是CPU的10倍以上，意味着同样大小的计算任务，GPU可以更快完成。GPU计算的时候，如果每次需要的数都从CPU或者从另外的GPU上拿，就把GPU也拖慢了。

CPU就好比一个吃饭比较慢的人，以前一大锅可以吃很长时间。GPU相当于吃饭特别快的人，现在一次来一小碗，一口就吃下去了。所以，把碗端上桌的速度就非常关键。

CPU和GPU，异口同声说：

“内存墙，How are you（怎么是你）？”

模型太大，就需要把模型拆开。比如说神经网络前几层拆在这个GPU上，后几层拆在另一个GPU上，或者神经网络中某一层被切割到多个GPU上去了。

[怎么切割是一道超纲题，暂（wo）且（ye）不（bu）答（hui）。]

把数据或模型拆分之后，就需要多个GPU频繁互动，互通有无。然而，漏屋偏逢连夜雨，设备互联带宽也不争气，没有实质改进，同机内部PCIe或多机互联使用的高速网的传输带宽，要低于GPU内部数据带宽一两个数量级。

可以用计算和数据传输之间的比例来衡量“内存墙“的压力有多大。计算机系统理论上恰好有一个叫运算强度（Arithmetic intensity）的概念可以刻画，说洋气一点，flops perbyte，表示一个字节的数据上发生的运算量。

只要这个运算量足够大，传输一个字节可以消耗足够多的计算量，那么即使设备间传输带宽低于设备内部带宽，也有可能使得设备处于满负荷状态。

进一步，如果采用比GPU更快的芯片，处理一小块儿数据的时间就比100毫秒更低，比如10毫秒，带宽不变，“调配”算法能用10毫秒的时间为下一次计算做好准备吗？事实上，即使是使用不那么快(相对于TPU 等专用芯片)的GPU，当前主流的深度学习框架对模型并行已经力不从心了。

CPU和GPU，仰天长啸：

“内存墙，How old are you（怎么老是你）？”

“内存墙”带来巨大压力，处理不好，就会造成设备利用率低、整体系统性能差的后果。

理论上，训练框架与硬件平台耦合程度相对较高，深度学习框架需要基于异构硬件支持训练超大规模数据或模型，分布式训练的实际性能高度依赖底层硬件的使用效率。换句话说，解决这个问题，得靠深度学习框架。

内存墙，得解决。没办法，谁让深度学习框架处在上接算法、下接芯片的位子上，在技术江湖里的卡位很关键。

袁博士在“内存墙”上，用白漆画了个大圈，写下一个大大的“拆”字。

他认为，这是深度学习框架最应该解决的问题。人生在世，钱能解决绝大多数问题；但是，不能解决的少数问题，才是根本性的问题。训练超大人工智能模型，有钱就能买硬件，但要有技术，才能把硬件用好。

道理，很简单。

现实，很残酷。

“国内深度学习框架发展水平并不落后，有多家公司开源了水准很高的，这些够用了吗？”

袁博士答道：“现有开源框架直接拿过来，真是做不了大模型这事儿，尤其参数量上到GPT-3模型这个级别的时候。

深度学习模型进入到现在这个阶段，大规模带来的问题，仅靠开源的深度学习框架已经有点吃力了。已有开源分布式深度学习框架无论使用多大规模的GPU集群，都需要漫长的时间（几个月以上）才能训练完成，时间和人力成本极高。

弱者坐失时机，强者制造时机。

“在开源版本上修改，能否满足工业级的用途？”

袁博士回答道：“现在市面上的深度学习框架，有选择的余地，但当前在某些场景（比如，模型并行）改造和定制也力不从心。就比如绿巨人GPT-3这件事儿，直接把现有开源深度学习框架拿来是搞不定的，OpenAI实验室对开源框架做了深度定制和优化，才可能在可接受的时间内把这个实验完整跑下来。”

一般人，只看到了模型开销的昂贵，没有看到技术上的难度。

“单个芯片或单个服务器无法满足训练大模型的需求，这就是所谓的Silicon Scaling的局限性。为解决这个难题，我们必须使用横向扩展的方法，通过高速互联手段把多个服务器连在一起形成计算资源池，使用深度学习框架等分布式软件来协同离散耦合的多个加速器一起高效工作，从而提高计算力的上限。”

袁博士继续解释。

袁博士还特别介绍了解决这个问题对人才的要求，他说：“改造深度学习框架，是一件困难的事。从团队方面来说，算法工程师难招聘，有计算机系统理论背景或者工程能力到位，又懂算法的工程师更难找。挖人也不解决问题。一位算法工程师挖走了，算法的巧思之处被带走了。但是，深度学习框架得把差不多整个团队挖走，才够用。”

“超大模型不是今天才有，也不是今天才被人注意到，而是一直以来就有这个趋势。有远见的人，较早就能看到趋势。最先发现个趋势和最先准备的人，最有机会。”

“很多深度学习框架刚开始研发的时候都没有瞄准这种问题，或者说没有看到这个问题。深度学习框架没有完成的作业，就要留给算法团队去做，考验算法公司技术团队对深度学习框架的改进能力。市面上的情况是，极少数企业搞得定，大多数企业搞不定。”

聊了很久，我抛出最后一个问题。

“GPT-3模型在企业业务里用不到，很多人觉得无用，实验室的玩意而已，其科学意义是什么呢？”

他笑了笑，用一贯低沉的声音说道：“GPT-3模型说明，OpenAI实验室很有科学洞见，不是人人都能想到往那个方向去探索，他们的背后有一种科学理念支持。思考大模型的时候，有一种假设（hypothesis）的方法论，当假设成立，能够解决与之相对应的科学问题。在这个方法论的指导下，勇于探索，肯定不是莫名其妙的一拍脑袋就花千万级别的美金往超大模型的方向上鲁莽的冒险。”

袁进辉把人工智能和人脑做了一个比较。

他说道：

“人类的大脑与我们现在的人工智能自然语言处理模型进行比较：人类大脑有100万亿个突触，这比最大的人工智能模型还要大三个数量级。这个人工智能模型，名叫GPT-3，几乎通过图灵测试了。一直以来，科研团队都在寻找‘能正常工作’的聊天机器人，这个模型让人看到了突破口。”

他在思考，当真正实现了具有百万亿参数的神经网络时，今天人工智能和深度学习模型面临的困难会不会就迎刃而解了呢？机器人进行真正智能对话的日子是不是就快到来了？

说到这里，他眼神中闪过一丝亮光。

在袁进辉看来，这种里程碑式的突破，通常需要杰出团队才能取得。OpenAI想到了，也做到了。它代表了这方面全球的最高水平，探索了能力的边界，拓展了人类的想象力。就像飞船飞往宇宙的最远处，触摸到了人工智能模型参数量增长的边界。

这种模型的问世，就像航天界“发射火箭”一样，成本高，工程要求也高。他们的成功，既实现了理论上的意义，也实现了工程上的意义。

人工智能的希望，在路上。

无论实验怎么苦恼，

无论效果如何不济，

GPT-3模型始终是人类迈向“智能”的无尽长阶上的一级。

没有伟大的愿景，就没有伟大的洞见。

没有伟大的奋斗，就没有伟大的工程。

（完）

受访人介绍：

袁进辉，清华大学计算机系博士，一流科技公司（OneFlow）创始人，之江实验室天枢人工智能开源开放平台架构师。曾在微软亚洲研究院从事大规模机器学习平台研发工作，2014年其研发出当时世界上最快的主题模型训练算法和系统LightLDA，被应用于微软在线广告系统。一流科技成立于2017年初，致力于打造深度学习框架的事实工业标准。

你可能感兴趣的:(人工智能,AI,人工智能,算法,gpt-3)

while,for,do...while三种循环语句不吃酸的柠檬 c语言开发语言
一、while循环while语句的语法结构和if很相似。1.1if和while的对比if（表达式）while（表达式）语句；语句；while循环语句的执行流程：练习1：在屏幕上打印1~10的数字。#includeintmain(){inti=1;//i为循环变量，i=1是对i的初始化while(iintmain(){intn=0;scanf("%d",&n);while(n){printf("%d
CS课程项目设计2：交互友好的五子棋游戏学习的学习者 CS课程项目设计 python 课程设计人工智能五子棋游戏
上次给大家分享了井字棋游戏的设计流程CS课程项目设计1：交互友好的井字棋游戏-CSDN博客https://blog.csdn.net/weixin_36431280/article/details/149309500?spm=1001.2014.3001.5501今天打算再分享进阶版井字棋游戏的版本设计——五子棋游戏。五子棋游戏操作方式与之前的井字棋类似，但策略性更强。玩家轮流在空白位置放置棋子，
AI交互的初期魅力与后期维护挑战
AI交互的初期魅力与后期维护挑战引言在当今数字化时代，人工智能（AI）技术正迅速渗透到各个领域，特别是人机交互方面。许多开发者、设计师和用户在初次与AI交互时，往往感受到一种“一时爽”的快感。这种交互方式看似高效、智能，能够快速响应需求，提供即时反馈。然而，随着时间的推移，这种初期魅力往往会转化为高昂的后期维护成本。本文将深入讨论AI交互的这一双面性，重点分析细节沟通不足以及UI设计中AI难以处理
Conda常用命令耘田 conda 人工智能
查看Conda的完整帮助文档conda-h显示当前安装的Conda版本号conda-V列出所有已创建的Conda虚拟环境（标记*表示当前激活的环境）。condaenvlist删除所有缓存文件（包括未使用的包、临时文件等），释放磁盘空间condaclean--all新建名为ai-knowledge-mgr的虚拟环境，并安装Python3.8版本condacreate-nai-knowledge-mg
2020-03-31 眸若含秋水丶
今天学习冒泡排序，通过双重for循环来实现数组有序排列。定义变量名要求：1数字字母下划线组成。2不能以关键字命名（int，printf，if，else等）。3不能以数字开头。作业1#includeintmain(){inti;intb;inta[8]={1,2,3,4,5,6,7,8};for(i=1;iintmain(){floata[10]={1,2,3,4,5,6,7,8,9,10};int
边缘智能革命：嵌入式机器学习如何让万物“思考” 万能小贤哥机器学习人工智能
当智能手表精准识别你的健身动作，工业传感器预测设备故障于毫秒之间，农业传感器自动调节灌溉水量——这些并非科幻场景，而是嵌入式机器学习（EmbeddedMachineLearning,或TinyML）正在悄然重塑的现实。这场发生在设备边缘的智能革命，正将AI从云端的数据中心拉近到我们指尖的每一台设备中。一、嵌入式机器学习：定义与核心价值嵌入式机器学习是指在资源极端受限的微控制器（MCU）、微处理器（
DAOS系统架构-JumpMap 付兄 daos DAOS 分布式存储
1.概述JumpPlacementMap是使用跳跃一致性哈希算法，以便在不同的故障域之间伪随机地分布对象。这样做是为了尽可能将他们分散到相互距离较远地故障域中，从而避免在当某个故障影响了整个故障域的情况下造成数据丢失。2.跳跃一致性哈希算法（JumpConsistentHashing）跳跃一致性哈希算法是一种一致性哈希算法，它能将keys均匀的分布在一定数量的buckets中。即使buckets的
DAOS系统架构-Placement
1.概述DAOS使用poolmap来创建一系列placementmaps，这些maps被用于计算对象布局的算法中。该算法是基于一致性哈希算法，使用对象的ID、对象的概要、以及其中一个placementmap来生成对象的布局。DAOS使用一种模块化方法，允许不同的对象使用不同的placementmap来获得应用程序所需的性能特征。2.PoolMap在DAOS中，poolmap被组织为一种树形结构，维
centos8.4使用本地yum源安装提示：Error: No available modular metadata for modular package 付兄 linux centos
安装modulemd-toolsmodulemd-tools安装和使用详细过程参考官方文档https://github.com/rpm-software-management/modulemd-tools。更换centos8.4yum源wget-O/etc/yum.repos.d/CentOS-Base.repohttps://mirrors.aliyun.com/repo/Centos-8.re
Qml动态语言切换 zhengtianzuo
此方法需要在Qt5.10或更高版本实现,在Qt5.10或更高版本实现,在Qt5.10或更高版本实现重要的事情说三遍首先在工程文件.pro中加入TRANSLATIONS=zh_CN.tsen_US.ts两个翻译文件,支持中英文两种语言切换在工程目录下cmd执行lupdatemain.qml-tszh_CN.tslupdatemain.qml-tsen_US.ts执行完后在代码目录里就可以看到生成了z
使用 CrewAI 进行股票分析：自动化投资决策的新途径 AI量化投资人工智能多智能体语言模型智能体 crewai
一、引言在当今快节奏的金融市场中，及时、准确的股票分析对于投资者做出明智决策至关重要。然而，传统的股票分析方法往往耗时且依赖人工，难以满足市场快速变化的需求。CrewAI框架的出现为股票分析带来了新的解决方案。本项目展示了如何利用CrewAI框架自动化股票分析过程，通过协调多个自主AI代理协作完成复杂任务，从而提高分析效率和准确性。二、CrewAI框架概述CrewAI旨在促进角色扮演AI代理之间的
PTA数据结构与算法-第一章——褚论 ?Suki PTA习题算法数据结构 c++
文章目录第一章——褚论第二章——线性表第三章——栈与队列第四章——字符串第五章——树与二叉树第六章——图第七章——排序第八章——检索判断题单选题程序填空题第一章——褚论第二章——线性表第三章——栈与队列第四章——字符串第五章——树与二叉树第六章——图第七章——排序第八章——检索判断题(neuDS)数据的物理结构是指数据在计算机中的实际存储形式。T(neuDS)数据的物理结构是指数据在计算机中的实际
AI实战(三)：AI写的剧本VS姜文风演技指导，有送彩蛋蓝图初音不在家人工智能大数据自然语言处理深度学习
@[TOC]一、前情回顾大家好，这是我用AI打造“爆款短剧引擎”系列的最后一篇文章。在前两篇文章中，我们已经：通过“逆向工程”的方法，创造了一个名为**“多巴胺生成器”**的AI虚拟人格。分析了它生成的第一份作品——《千亿后妈不好惹》的剧本大纲，见识了其背后冷酷而精准的商业逻辑。今天，我们将迎来最终的交付物。我们来看看，当AI把那些冰冷的逻辑，转化为热气腾腾、有具体人物和对话的剧本时，效果究竟如何
ONNX模型使用指南：从零开始掌握跨领域模型部署
ONNX模型使用指南：从零开始掌握跨领域模型部署ONNX模型作为一种开放式的神经网络交换格式，已成为AI模型部署的行业标准。当您获得一个没有使用说明的ONNX模型时，可以通过系统化的分析和部署流程，使其在不同领域发挥作用。本文将详细阐述如何分析模型结构、配置运行环境、准备特定领域输入数据、执行推理并处理结果，同时提供图像分类、自然语言处理、医疗影像分析、金融风控和自动驾驶等领域的具体应用示例，帮助
Ecounter South Lake Whatever璇
ThefirsttimetomeetSouthLakewasinautumn.Inourleisuretimeafterdinner,twoorthreefriendsinvitedeachotherandwewalkedaroundSouthLake.Thewindwaswhistlingthatday,andthewaveswerebeatingagainsttheshore,oneafter
4-Spring源码解析之this()(1)——AnnotatedBeanDefinitionReader 想当厨子的程序媛 Spring注解源码解析 spring
1.程序入口AnnotationConfigApplicationContextapplicationContext=newAnnotationConfigApplicationContext(MainConfig.class);2.AnnotationConfigApplicationContext类有参构造器其中MainConfig类是自己写的配置类，我们从这一行代码来开始分析。Spring容
排序算法之【归并排序】丶小鱼丶算法排序算法 java
目录实现归并排序【MergeSort】并提供升序和降序方法归并排序方法测试LeetCode-215题实现归并排序【MergeSort】并提供升序和降序方法/***归并排序*/publicclassMergeSort{//升序排列privatestaticfinalintUP_SORT_TYPE=1;//降序排列privatestaticfinalintDOWN_SORT_TYPE=-1;/***升
【父亲节英文绘本】He's all right, my dad. 这是我爸爸，他真的很棒！励步英语呼市分校
He'sallright,mydad.这是我爸爸，他真的很棒！Mydadisn'tafraidofanything,eventheBigBadWolf.我爸爸什么都不怕，连坏蛋大野狼都不怕。Hecanjumprightoverthemoon,他可以从月亮上跳过去，Andwalkonatightrope(withoutfallingoff).还会走高空绳索（不会掉下去）。Hecanwrestlewi
Android 异构计算与 OpenCL/CUDA/OpenVX 的协同方式实战解析观熵国产 NPU ×Android 推理优化 android 人工智能
Android异构计算与OpenCL/CUDA/OpenVX的协同方式实战解析关键词Android异构计算、OpenCL、CUDA、OpenVX、GPU加速、NPU调度、HSA架构、神经网络推理、计算图编排、SoC协同处理、AI芯片编程摘要随着国产SoC平台持续迭代，Android系统中异构计算模式已从传统CPU+GPU并行计算，扩展到集成NPU、DSP、ISP等多核单元的复杂协同体系。在AI推理
Spring AI 函数调用（Function Call）系统设计方案大树~~ AI应用开发 spring 人工智能数据库 SpringAI Function Call
一、系统概述与设计目标1.1核心目标从零构建一个灵活、安全、高效的函数调用系统，使大语言模型能够在对话中调用应用程序中的方法，同时保持良好的开发体验和企业级特性。1.2主要功能需求支持通过注解将普通Java方法标记为可被AI调用的函数自动生成符合LLM要求的函数描述和参数定义安全地解析和执行模型的函数调用请求处理并返回执行结果给模型提供扩展点以支持不同LLM提供商的特定实现1.3设计原则开发便捷性
超详细 Conda 指令详解---附有相应的示例
以下是所有conda指令的详细列表，并附有相应的示例超详细Conda指令详解环境管理命令condacreate：创建新环境condacreate--name[package_spec1package_spec2...]示例：condacreate--namemyenvnumpypandascondainstall：安装包到当前环境condainstall[--name][--file][--cha
【云原生】Helm来管理Kubernetes集群的详细使用方法与综合应用实战景天科技苑云原生K8S 零基础到进阶实战云原生 kubernetes 容器 Helm k8s k8s集群
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，前后端开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，数据分析，Django，fastapi，flask等框架，云原生k8s，linux，she
极限挑战：用知识蒸馏压缩模型，实时推荐系统在50ms内完成推荐
极限挑战：用知识蒸馏压缩模型，实时推荐系统在50ms内完成推荐标题极限挑战：用知识蒸馏压缩模型，实时推荐系统在50ms内完成推荐TagAI,知识蒸馏,实时推荐,模型压缩,技术挑战,高性能描述面对实时推荐系统必须在50ms内完成推荐这一极限条件，AI研发工程师团队在数据量从GB级飙升至PB级的巨大冲击下，展现出极高的技术实力和创新能力。团队通过引入先进的模型压缩和优化技术，成功在性能和精度之间找到了
KL散度：信息差异的量化标尺 | 从概率分布对齐到模型优化的核心度量
不对称性、计算本质与机器学习的普适应用本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心定义与数学本质KL散度（Kullback-LeiblerDivergence）用于衡量两个概率分布PPP和QQQ的差异程度，定义为：DKL(P∥Q)=∑x∈XP(x)log⁡P(x)Q(x)(离散形式)D_
Transformer：自注意力驱动的神经网络革命引擎大千AI助手人工智能 Python #OTHER transformer 神经网络深度学习 google 人工智能机器学习大模型
本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！从语言理解到多模态智能的通用架构基石⚙️一、核心定义与历史意义Transformer是由Google团队在2017年论文《AttentionIsAllYouNeed》中提出的深度学习架构，其颠覆性创新在于：完全摒弃RNN/CNN：仅依赖自注意力机制（S
[特殊字符] LLM（大型语言模型）：智能时代的语言引擎与通用推理基座大千AI助手人工智能 Python #OTHER 语言模型人工智能自然语言处理 LLM 大模型 Transformer
本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！从千亿参数到人类认知的AI革命一、核心定义与核心特征LLM（LargeLanguageModel）是基于海量文本数据训练的深度学习模型，通过神经网络架构（尤其是Transformer）模拟人类语言的复杂规律，实现文本理解、生成与推理任务。其核心特征可概
MAP最大后验估计：贝叶斯决策的优化引擎大千AI助手人工智能 Python #OTHER python 人工智能算法贝叶斯 MAP 概率论条件概率
融合先验知识与观测数据的概率推断方法本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心概念与数学本质MAP（MaximumAPosteriori）估计是贝叶斯框架下的参数估计方法，其目标为：最大化后验概率(P(\theta\midX))，即：[\hat{\theta}{MAP}=\arg\ma
MLE最大似然估计：数据驱动的概率模型参数推断基石大千AI助手人工智能 Python #OTHER 数据挖掘人工智能机器学习算法 MLE 参数估计概率论
从样本中还原未知分布的本质规律本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心思想与数学定义最大似然估计（MaximumLikelihoodEstimation,MLE）是频率学派的参数估计方法，其核心思想为：选择使观测数据出现概率最大的参数值。给定独立同分布样本X={x1,x2,…,xn}
【Docker】容器被停止/删除的方式及命令：全面解析与实践指南阿猿收手吧！ #Docker docker dubbo eureka 运维面试容器
文章目录引言一、容器的生命周期二、停止容器的命令及方式1.`dockerstop`命令2.`dockerkill`命令3.`dockerpause`和`dockerunpause`命令4.`dockerrestart`命令三、删除容器的命令及方式1.`dockerrm`命令2.`dockercontainerprune`命令3.`dockerrm`与`dockerrmi`的区别四、容器停止与删除的
服务器清理空间--主要是conda环境清理和删除
1.查看空间情况(base)zhouy24@RL-DSlab:~/zhouy24Files$df-hFilesystemSizeUsedAvailUse%Mountedonudev252G0252G0%/devtmpfs51G4.9M51G1%/run/dev/nvme0n1p31.9T1.7T42G98%/tmpfs252G800M252G1%/dev/shmtmpfs5.0M4.0K5.0M1
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class