QbitAl

清华大模型人才遭哄抢！盘点5大学术重镇10大产业玩家

衡宇发自凹非寺
量子位 | 公众号 QbitAI

做类ChatGPT产品，组中国版OpenaAI恐怕是先当下最最人尽皆知的创投野心。

有人官宣标榜放话，也有VC开始把视角投向产学研转换的大模型项目——或许能更有基础一些，其中，清华大学显然处于身负众望的头一梯队。

量子位独家获悉，背靠清华的大模型研究团队，计算机系教授唐杰所在的创业公司智谱AI，身价水涨船高，在几近哄抢的状态中接近完成一轮新融资，估值已超30亿元。

唐杰的学生同样有市无价。其麾下知名弟子杨植麟的NLP创业公司循环智能，也被寄予厚望，一切往大模型方向走，国内最头部的VC，孵化式提供支持。

唐杰师徒，清华NLP力量冰山一角

唐杰，清华计算机系教授。他刚刚入选2023 AAAI Fellow，也是ACM/IEEE Fellow。研究方向包括人工智能、数据挖掘、社交网络、机器学习和知识图谱等，曾获ACM SIGKDD Test-of-Time Award（十年最佳论文）。

△唐杰

这次传闻中被多家VC哄抢的智谱AI，在2019年由他和同为清华教授的李涓子创立，由清华大学计算机系知识工程实验室的技术成果转化而来。

经唐杰手的大模型，都是这几年里大家的“老朋友”：超大规模预训练大模型“悟道”（悟道2.0参数规模达到1.75万亿）；2021年与阿里达摩院联合发布的中文多模态预训练大模型M6；已经开源的中英文预训练语言大模型*GLM-130B。

相同参数规模下，M6训练能耗仅是GPT-3的1%；ChatgGPT需要8张A100才能跑起来，而GLM-130B仅用4张3090就能驱动。在大模型赛道上的既有产品和性能实绩，让唐杰团队被VC追逐、哄抢不足为奇。

VC手中的金橄榄枝，还抛给了唐杰的得意门生杨植麟。

杨植麟是谁？以年级第一的成绩从清华本科毕业后，他在NLP研究全球排名第一的卡内基梅隆大学语言技术研究所（LTI）就读，师从苹果AI研究负责人Ruslan Salakhutdinov和谷歌首席科学家William Cohen，4年即拿下博士学位。

△杨植麟

博士期间，杨植麟和图灵奖得主Yoshua Bengio合作发布数据集HotpotQA，又先后以一作身份发表成果Transformer-XL和XLNet——这两篇分别是ACL 2019和NeurIPS 2019最高引论文之一。现在，他的谷歌学术引用次数突破16000次。

这位90后创业者不仅学术履历优秀，在产业界的表现也可圈可点。

2016年，杨植麟创立循环智能，公司主要业务是运用NLP、语音、多模态、大模型等人工智能技术打造“销售科技”方案。与此同时，智谱AI和清华研究团队的多个AI项目由他主导，华为的“盘古”大模型也是杨植麟团队和华为云联合推出的。

ChatGPT引爆狂潮，唐杨师徒二人成了VC眼中的香饽饽，但清华大模型NLP方向上的人才富矿不止他二人。

孙茂松、刘知远团队算其中一股中坚力量，两人都来自清华自然语言处理与社会人文计算实验室（THUNLP）。THUNLP成立于上世纪70年代的实验室，牵头人是国内NLP研究领域的泰斗黄昌宁，孙茂松是黄的学生，刘知远则是孙的学生。

△孙茂松

2021年底，孙茂松团队发布了机器中文语言能力评测基准“智源指数”（CUGE），以评测和推动中文NLP的发展。其他成果不多赘述，但此处不得不提的有三个。一个是AI写诗模型“九歌”，训练过程中学习了80万首中国古诗；另一个是语言表征模型ERNIE（和百度文心大模型同名），可与当时任务最优的BERT媲美；还有以中文为核心的预训练大模型清源CPM，这是智源“悟道·文源”的前身。

另一支赫赫有名的清华系NLP队伍，是交互式人工智能（CoAI）课题组教授朱小燕和其学生黄民烈团队，他们先后提出过SentiLARE、StoryGPT等预训练模型。

黄民烈本人不仅参与了“悟道”大模型的开发，还基于大模型和对话系统的学术背景，在前年创办致力于打造“超拟人大模型”的聆心智能。去年12月，聆心智能推出首个产品AI乌托邦，用户可通过其与定制AI角色对话；在去年年底完成数千万元天使+轮融资后（投资方包括智谱AI），不到一周前，聆心智能又宣布完成Pre-A轮融资。

△黄民烈

至于不久前从京东卸任，回归学术界担任清华电子工程系教授的周伯文（旗下还有一家公司衔远科技），也在NLP、人机对话打磨了多年的研究和业界经验。

国内大模型力量百家争鸣：5大学术重镇，10大产业巨头

清华不是这轮浪潮中唯一的宠儿。随着AIGC和类ChatGPT产品相关话题日益高涨的热度，国内大模型人才市场好不热闹。

为此，量子位梳理了百家争鸣的国内产学研界大模型重镇，代表性机构和代表性人物，共计5支学术界团队和10大产业界力量，排名不分先后。当然极有可能挂一漏万，欢迎在评论区中补充。

首先是5支学术界团队：

01：复旦邱锡鹏教授团队

不鸣则已，复旦大学教授邱锡鹏带领的NLP团队没有丝毫预告，猛然在中国激起类ChatGPT产品第一朵浪花。

产品名称MOSS，致敬《流浪地球2》里拥有自我意识的AI，参数量比ChatGPT小了一个数量级，在训练方式上，直接选择和其他AI模型进行对话。MOSS即将面向公众进行内测，还要在3月马不停蹄开源代码。

据公开资料，邱锡鹏是复旦大学理学学士和博士，研究方向为中文NLP、开源NLP系统、可信NLP技术、对话系统等，共发表CCF-A/B类论文70余篇，并主持开发了开源NLP工具FudanNLP 、FastNLP。他与中国计算机学会自然语言处理专委会副主任、教授黄萱菁都来自复旦大学NLP实验室，二人均在复旦大学取得学士和博士学位。

黄萱菁的研究领域为NLP、文本检索、云计算，复旦博士毕业后留校任教。2008年前后，她以访问学者身份前往MIT，现在是复旦大学AI、NLP学科方向带头人。曾入选入选“人工智能全球女性”“AI 2000人工智能全球最具影响力提名学者”及“福布斯中国2020科技女性榜”。

02：哈尔滨工业大学智能技术与NLP研究室

哈工大智能技术与自然语言处理研究室（ITNLP Lab）自上世纪80年代初，就开始从事NLP研究，代表性成果是提出了汉字语句输入的思想，并实现了国内外第一个语句级汉字键盘输入系统。周明、王海峰、张民、荀恩东都出自哈工大NLP一脉。

教授王晓龙是实验室负责人。王晓龙硕士期间就读于天津大学，并在哈工大拿到计算机应用博士学位，名为insun的拼音输入法就是他的研究成果。实验室教师还包括博士刘秉权、博士刘远超、博士孙承杰等教授。

刘秉权，本硕博均就读于哈工大计算机专业，现为智能技术与自然语言处理研究室副主任，中国计算机学会高级会员、CCF中文信息技术专委会委员，作为主要研制人参加了“微软拼音输入法”（与微软合作）和“手机操作系统汉字智能输入”（与日本富士通合作）项目。

刘远超主要研究兴趣在智能信息处理、自然语言处理与理解、数据挖掘等领域，多次担任ACL、EMNLP、COLING、NIPS等CCF人工智能顶级会议及等学术刊物的审稿专家。

孙承杰在哈工大先后取得硕博研究生学位后，2009年起在留校任教，主要研究方向为NLP、信息抽取、信息推荐、文本挖掘和机器学习，承担和参加多项国家自然科学基金项目和国家“863”项目。

03：清华AIR

清华AIR，全称清华大学智能产业研究院，于2020年由多媒体及AI领域的世界级科学家张亚勤创建，张亚勤本人现担任清华AIR院长，同时也是清华大学智能科学讲席教授，中国工程院院士。

张亚勤本硕毕业于中国科学技术大学，在华盛顿大学取得博士学位，后当选美国艺术与科学院院士，澳州国家工程院院士，IEEE院士。他曾在微软公司工作16年，1999年和李开复博士等共同创立微软中国研究院（微软亚洲研究院前身）并担任第二任院长。又于2014年9月加盟百度公司担任总裁。

△张亚勤

清华AIR还聚集了刘洋、马维英、聂再清、刘菁菁等NLP方向的AI大牛。

刘洋是AIR执行院长，主要研究方向是NLP。武汉大学本科毕业后，刘洋在中国科学院计算技术研究所获博士学位，曾担任ACL亚太分会创始执委兼秘书长、Computational Linguistics编委。2010年，他在NLP顶会计算语言学上发表国内第一篇长文，并在ACL上成为国内第一个做tutorial学者。

马维英，IEEE Fellow，博士毕业于美国加州大学圣芭芭拉分校，AIR惠妍讲席教授、首席科学家，他的研究方向包括人工智能的几个核心领域，如大数据挖掘、ML、自然语言理解与生成、CV等。他拥有160多项技术专利，此前曾任微软亚洲研究院常务副院长、字节跳动副总裁兼AI Lab主任。

另一位AIR首席研究员聂再清本硕毕业于清华大学计算机科学与技术系，博士时期在美国亚利桑那州立大学师从美国人工智能学会前主席Subbarao Kambhampati。2004年起，在微软亚洲研究院历任副研究员/主管/高级研究员、首席研究员；2017年至2020年，在阿里担任天猫精灵首席科学家、达摩院AI Labs北京研发中心负责人。

刘菁菁同样是AIR首席研究员，拥有MIT计算机科学博士、剑桥大学MBA学位，曾任美国微软资深首席研究部门经理，带领科研团队在视觉加语言多模态机器学习，自然语言处理等人工智能领域开展科学研究。

04：西湖大学NLP实验室

西湖大学NLP实验室团队核心成员有博士张岳、蓝振忠等人。

张岳本科毕业于清华大学计算机专业，硕士、博士期间均就读于牛津大学，2010年3月-2012年6月在剑桥大学计算机科学专业从事博士后研究，现为西湖大学长聘副教授，受邀编写了剑桥大学的NLP教材。根据统计，2012年-2020年期间，张岳在NLP领域的顶会发表数量是全球第三。

△张岳NLP课程可在B站观看

蓝振忠是中山大学校友，博士毕业于卡内基梅隆大学（CMU）计算机学院，多次担任ACM Multimedia, CVPR, ECCV, ICCV 等国际顶会的论文评审专家。加入西湖大学前，他在谷歌AI工作；加盟西湖大学后，蓝振忠组建了一支30多人的团队，正在尝试整合多种AI技术，构建虚拟心理咨询师。

05：IDEA研究院

IDEA研究院，全称粤港澳大湾区数字经济研究院，创立人沈向洋。沈向洋是视频检索领域的开创者，也是ACM和IEEE院士。他博士毕业于卡内基梅隆大学，是图灵奖得主Raj Reddy的学生，与李开复、洪小文同门参与创建微软亚洲研究院（MSRA），曾担任微软公司全球执行副总裁。

IDEA研究院下大模型负责人张家兴同样出身MSRA。在获得北京大学博士学位后，张家兴先后就职于百度、微软、阿里巴巴，曾任微软亚洲研究院研究员、360数科首席科学家，2021年6月加入IDEA。去年，张家兴带领团队推出了国内第一个以中文为主的AI绘画模型“太乙”，被称为中文版Stable Diffusio。据透露，“太乙”训练数据量超过了1亿中文图文对。

△太乙根据提示次“小桥流水人家，水彩”生成的画作

接下来聊聊10家极具代表性的产业界力量：

01：百度

提起百度的NLP技术，最被人熟知的是文心大模型。百度日前已经官宣要在3月把“文心·一言”（ERNIE Bot）向公众开放，它就是基于文心大模型技术推出的生成式对话产品。

2022年，DALLE-2、Stable Diffusion引领的AI绘画狂潮中，百度顺势推出同以文心大模型为底座的AI艺术和创意辅助平台“文心 · 一格”。

百度这方面坐镇和带队的，自然是NLP领域华人第一人——王海峰。百度CTO王海峰毕业于哈尔滨工业大学，博士学历，博士毕业后王海峰加入微软亚洲研究院，进行自然语言处理方向的研究，之后历任isilk.com研究科学家，东芝（中国）研究开发中心副所长兼研究部部长等职位。2010年1月加入百度，从NLP应用开始打造了百度NLP核心团队。

核心团队成员之一有2006年浙江大学毕业后加入，现任百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜，她整体负责百度AI技术平台和智能云AI产品，百度产业级深度学习开源开放平台飞桨正是她负责。

吴华，中科院自动化研究所博士毕业，现任百度技术委员会主席，负责百度翻译项目。她曾担任自然语言处理领域国际会议ACL 2014年的程序委员会主席，是中国本土企业首位ACL程序委员会主席。

马艳军，山东大学、清华大学校友，博士毕业于爱尔兰都柏林城市大学，百度深度学习技术平台高级总监。曾任《Machine Translation》杂志编委，并多次担任顶级国际会议的 AreaChair等职务，发表论文20余篇。小度机器人正是马艳军基于深度问答技术在2013年孵化。

02：阿里达摩院

阿里达摩院机器智能技术实验室下属的语言技术实验室，是阿里巴巴负责NLP技术研发的核心团队。

现任语言技术实验室负责人黄非，从ACM杰出科学家司罗手中接过重担。加入达摩院之前，他在卡内基梅隆大学攻读博士，之后NLP研究工作在IBM Watson和Facebook开展，在NLP和AI的顶会及期刊上发表文章40多篇；另一位团队负责人邴立东和司罗、黄非同为卡内基梅隆大学校友，曾多次担任ACL、EMNLP等会议的领域主席。

前文提到的M6是阿里达摩院推出的大模型之一，同样为人所熟知的还有基于统一学习范式OFA等底层技术打造的阿里通义大模型，之所以为“通义”，是因它具备搞定多种任务的“大一统”能力。

至于达摩院被曝要推出的类ChatGPT产品，就是在阿里通义大模型体系的基础上融合升级。

△阿里内测中的达摩院版ChatGPT提前曝光

03：字节跳动

字节跳动AI Lab成立于2016年，旨在为字节跳动内容平台提供算法和技术支持，研究领域主要涉及NLP、数据挖掘、ML、语音与音频等，推出的NLP相关产品有为字节跳动所有产品提供翻译服务的Byte Translator，以及涉猎体育、金融、时事的新闻写作机器人Xiaomingbot。

字节跳动AI Lab团队总监之一李航，同时当选三大国际顶会（ACL，IEEE，ACM） Fellow。他师出日本，硕士毕业于日本京都大学电气工程系，后在东京大学取得计算机科学博士学位，主要研究方向包括信息检索、NLP等，曾在微软、华为先后任职。

本月初，字节跳动AI实验室被曝有开展类ChatGPT产品和AIGC相关研发。最新消息爆料，字节跳动正在布局大模型，在语言和图像两种模态上发力。其中，语言大模型团队由字节搜索部门领导，目前规模在十数人左右；图片大模型团队由智能创作团队牵头。

04：小冰

2020年，小冰公司从微软总部拆分，独立运营。其拥有的小冰框架以NLP为基础，是目前是全球承载交互量最大的完备AI框架之一。

本周，小冰公司的“小冰链”开放了小范围公测，不同于ChatGPT，小冰链将其思考过程完整、透明地呈现在用户面前，而且还能经过思考实施（某种）行动。

△小冰链的文字写作能力

公司CEO李笛毕业于清华大学，前微软（亚洲）互联网工程院副院长，微软时期创立了微软AI情感计算框架，现在他领导全球团队，负责人工智能小冰框架系统的技术研发、产品革新及商业落地

05：华为

2021年，华为云发布“盘古”大模型，这是业界首个千亿参数中文语言预训练模型，预训练阶段学习了40TB中文文本数据，接近人类中文理解能力。

华为这方面的核心人物，当属国际欧亚科学院院士、IEEE Fellow、华为云人工智能领域首席科学家田奇。田奇本科毕业于清华大学电子工程系，硕士毕业于美国德雷塞尔大学，后赴美国伊利诺伊大学香槟分校学习获博士学位。田奇研究方向本为CV，但近几年也转向NLP领域。

△田奇

06：腾讯

腾讯麾下有“混元”AI大模型（HunYuan）。去年年底，腾讯HunYuan进一步推出国内首个低成本、可落地的NLP万亿大模型，并再次登顶自然语言理解任务榜单CLUE。

HunYuan是业界首个可在工业界海量业务场景直接落地应用的万亿NLP大模型，最快用256张卡，1天内就能训练完成，成本直接降至原来的1/8。

△混元AI大模型支持的对话应用案例

俞栋是腾讯AI Lab副主任，同时当选ACM/IEEE/ISCA三大顶会Fellow，主要研究方向是NLP与语音识别。浙大电子工程学本科毕业后，俞栋在美国印第安纳大学计算机系和中国科学院自动化所模式识别与智能控制拿下两个硕士学位，最后在美国爱达荷大学计算机完成博士学业。加入腾讯之前，俞栋是微软研究院首席研究员。

07：京东

本月初，京东云宣布，旗下言犀人工智能应用平台将整合过往产业实践和技术积累，推出产业版ChatGPT智能人机对话平台，预计参数量达千亿级。

京东集团副总裁、IEEE Fellow何晓冬表示，京东ChatGPT领域拥有丰富的场景和高质量的数据，京东云言犀每天就能和用户进行1000万次交互。何晓冬是京东深度学习及语音和语言实验室的负责人，本科毕业于清华大学后，何晓冬在中国科学院取得硕士学位，后又至美国密苏里大学哥伦比亚分校攻读博士，研究主要集中在DL、NLP、语音识别等领域。

08：科大讯飞

科大讯飞是国内NLP行业龙头。ChatGPT爆火后，科大讯飞在投资者互动平台表示，在ChatGPT主要涉及的NLP相关技术和方向上，公司具备长期深厚的积累。

科大讯飞公开资料披露，2022年12月，科大讯飞已经进一步启动生成式预训练大模型任务攻关，类ChatGPT技术将在今年5月落地公司AI学习机产品中。

科大讯飞副总裁、研究院执行院长是刘聪，于2001 年进入中国科学技术大学攻读电子信息工程专业。加入讯飞语音实验室后，开始了在语音识别领域的研究。现在，他同时担任语音及语言信息处理国家工程研究中心副主任。

现任科大讯飞AI研究院副院长刘权，博士毕业于中国科学技术大学电子工程与信息科学系、语音及语言信息处理国家工程实验室，主要研究领域是NLP，2020年至2021年，刘权带领团队获得NLP领域5个国际权威评测冠军，曾任国际常识知识推理会议Commonsense 2017学术委员会委员。

09：澜舟科技

澜舟科技创始人周明是闻名世界的NLP专家，先后就读于重庆大学、哈尔滨工业大学和清华大学，并在清华大学担任过副教授。创业前，周明长期在微软亚洲研究院担任NLP组的负责人、微软亚研副院长。周明在NLP领域发表的文章数量居世界前列，2012年至2020年期间，周明在NLP领域顶会发表的论文数量居全球第一。

澜舟科技给予Transformer的“孟子”大模型，走轻量化路线，仅包含10亿参数量，可处理多语言、多模态数据，同时支持多种文本理解和文本生成任务。

△孟子大模型对图片内容的描述

上周，澜舟刚刚宣布与中文在线合作，要基于专用大模型开发一套预训练模型技术的文学创作辅助算法。

10：浪潮信息

去年年中，浪潮信息推出了4个技能大模型（SkillModel），分别为对话模型“源晓问”、问答模型“源晓搜”、翻译模型“源晓译”、古文模型“源晓文”，它们4个都基于“源1.0”大模型生成。“源1.0”是浪潮信息在2021年发布的巨量中文语言模型，参数量高达2457亿。

△浪潮“源”生成的新闻文本

浪潮信息在互动平台表示，公司在AIGC已从算力、算法和应用三个方面进行布局和长期研发投入。浪潮人工智能研究院首席研究员是吴韶华，他同时担任浪潮信息AI软件研发总监。他带领的团队除了推出“源1.0”，还研发了深度学习框架Caffe-MPI、人工智能开发服务平台AI Station。

ChatGPT珠玉在前，复旦MOSS一声不吭的出现，在国内掀起了更高一浪。

产学研三方都摩拳擦掌、蓄力待搏，在技术这块基石之上，能够垒起坚固高墙的人才成为了另一个必争之地，可以说，伴随着类ChatGPT产品在国内的推进，关于大模型人才的抢夺和竞争游戏，才刚刚开始。

— 联系作者 —

— 完 —

《中国AIGC产业全景报告暨AIGC 50》调研启动

谁会是中国的“ChatGPT”？最有竞争力和潜力的AIGC力量位于何方？

量子位《中国AIGC产业全景报暨AIGC 50》正式启动对外征集，期待有更多优秀的机构、产品、案例与技术能够被大众看到。

点这里关注我，记得标星哦～

算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
正义的算法迷宫—人工智能重构司法体系的技术悖论与文明试炼
一、法庭的数字化迁徙当美国威斯康星州法院采纳COMPAS算法评估被告再犯风险，当中国"智慧法院"系统年处理1.2亿件案件，司法体系正经历从石柱法典到代码裁判的范式革命。这场转型的核心驱动力是司法效率与公正的永恒张力：美国重罪案件平均审理周期达18个月，中国基层法官年人均结案357件（是德国同行的6倍），而算法能在0.3秒内完成百万份文书比对。人工智能渗透司法引发三重裂变：证据分析从经验推断转向数据
【python实战】不玩微博，一封邮件就能知道实时热榜，天秀吃瓜一条coding 从实战学python 人工智能 python linux 爬虫
❤️欢迎订阅《从实战学python》专栏，用python实现办公自动化、数据可视化、人工智能等各个方向的实战案例，有趣又有用！❤️更多精品专栏简介点这里有的人金玉其表败絮其中，有的人却若彩虹般绚烂，怦然心动前言哈喽，大家好，我是一条。在生活中我是一个不太喜欢逛娱乐平台的人，抖音、快手、微博我手机里都没装，甚至微信朋友圈都不看，但是自从开始写博客，有些热度不得不蹭。所以就有了这样一个需求，能不能让微
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
在mac m1基于llama.cpp运行deepseek
lama.cpp是一个高效的机器学习推理库，目标是在各种硬件上实现LLM推断，保持最小设置和最先进性能。llama.cpp支持1.5位、2位、3位、4位、5位、6位和8位整数量化，通过ARMNEON、Accelerate和Metal支持Apple芯片，使得在MACM1处理器上运行Deepseek大模型成为可能。1下载llama.cppgitclonehttps://github.com/ggerg
MCP协议：AI时代的“万能插座”如何重构IT生态与未来
MCP协议：AI时代的“万能插座”如何重构IT生态与未来在人工智能技术爆炸式发展的浪潮中，一个名为ModelContextProtocol（MCP）的技术协议正以惊人的速度重塑IT行业的底层逻辑。2024年11月由Anthropic首次发布，MCP在短短半年内获得OpenAI、谷歌、亚马逊、阿里、腾讯等全球科技巨头的支持，被业内誉为AI时代的HTTP协议或USB-C接口，正在成为连接大模型与现实世
《算法备案全攻略：规范与流程引领数字时代新秩序》算法及大模型备案顾问刘老师算法备案深度学习 AIGC 语言模型算法人工智能
一、算法备案：开启合规新征程（一）备案规定的起源与发展2022年国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合发布《互联网信息服务算法推荐管理规定》，自2022年3月1日起施行。此后，相关规定不断完善和演进。如国家网信办于2022年8月、10月及2023年1月先后三次公布了《境内互联网信息服务算法备案清单》。同时，2022年发布的最高人民法院《关于规范和加强人工智能司法应用
【机器学习笔记Ⅰ】9 特征缩放巴伦是只猫机器学习机器学习笔记人工智能
特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如
C语言学生成绩管理系统<；自创>；(功能7有小错误,但可运行） han_xue_feng java
腾讯云加速企业和个人开发创新公开直播预告直播预告：07/18(周四)15:00-16:00随着人工智能与大模型的蓬勃发展，我们正步入一个由技微信实习第一天周五入职，早上早早来到了公司，发现好多人都没上班，到十点才陆陆续续有人来，办理完入职后，mentor中联夏令营遗憾没有入选不过hr的回复真的很好，辛苦啦#提前批简历挂麻了怎么办##机械制造投递记录#大数据开发的工作有点过于简单了吧sq大数据开发的
Python 实战人工智能数学基础：推荐系统应用 AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术文章目录1.背景介绍2.核心概念与联系2.1用户画像2.2相似性计算2.2.1基于物品的相似度2.2.2基于用户的相似度2.3协同过滤算法2.3.1基于用户的协同过滤算法2.3.2基于物品的协同过滤算法2.3.3基于上下文的协同过滤算法3.核心算法原理和具体操作步骤以及数学模型公式详细讲解3.1基于用户的协同过滤算法3.2基于物品的协同过滤算法3.3混合协同过滤算法3.
Python桌面应用开发的未来——智能化工具与大模型赋能 IronwoodStag78
开发AI智能应用，就下载InsCodeAIIDE，一键接入DeepSeek-R1满血版大模型！标题：Python桌面应用开发的未来——智能化工具与大模型赋能随着人工智能技术的飞速发展，传统软件开发模式正在被重新定义。Python作为一门功能强大且灵活的语言，在桌面应用开发领域一直占据重要地位。然而，面对日益复杂的用户需求和快速变化的技术环境，如何提升开发效率、降低开发门槛，成为开发者亟需解决的问题
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
AI产品经理需要了解的算法知识 AI劳模人工智能产品经理 AI产品经理 AI产品经理入门零基础入门产品经理算法语言模型
1、自然语言生成（NLG）自然语言生成（NaturalLanguageGeneration，简称NLG）是一种人工智能技术，它的目标是将计算机的数据、逻辑或算法产生的信息转换成人类可读的自然语言文本。换句话说，NLG能让机器“学会”写文章、报告、故事或者其他任何形式的文字，就像人类作家那样。这项技术使得机器能够理解复杂的数据并将其转化为易于理解的语言，以适应不同的受众和情境。应用实例：金融报告自动
【Python】OpenAI API 宅男很神经 python 开发语言
【Python与OpenAIAPI深度探索：从基础到未来】第一章：OpenAIAPI概览与核心概念1.1OpenAIAPI是什么？能做什么？OpenAIAPI(ApplicationProgrammingInterface，应用程序编程接口)是一套允许开发者通过编程方式访问和使用OpenAI开发的各种先进人工智能模型的服务。这些模型经过海量数据的训练，能够在多种任务上达到甚至超越人类水平。通过AP
Python：操作 Word 对齐方式 Thomas Kant Python python word c#
亲爱的技术爱好者们，热烈欢迎来到Kant2048的博客！我是ThomasKant，很开心能在CSDN上与你们相遇～本博客的精华专栏：【自动化测试】【测试经验】【人工智能】【Python】Python：操作Word对齐方式详解（左对齐/右对齐/居中/两端对齐）在日常办公自动化中，我们经常需要对Word文档中的段落设置对齐方式，如左对齐、右对齐、居中、两端对齐等。本文将带你使用python-docx库
TestCafe ➜ Playwright fixture 架构迁移指南 Thomas Kant 自动化测试 playwright testcafe typescript 测试架构
亲爱的技术爱好者们，热烈欢迎来到Kant2048的博客！我是ThomasKant，很开心能在CSDN上与你们相遇～本博客的精华专栏：【自动化测试】【测试经验】【人工智能】【Python】
医疗金融预测与语音识别中的模型优化及可解释性技术突破智能计算研究中心其他
内容概要随着人工智能技术的纵深发展，模型优化与可解释性技术正在重塑医疗诊断、金融预测及语音识别领域的应用范式。在医疗领域，基于自适应学习的动态参数调整机制，结合迁移学习的跨场景知识复用，显著提升了疾病筛查模型的泛化能力；而金融预测场景中，联邦学习框架通过分布式数据协作，在保障隐私安全的前提下，实现了风险预测模型的多维度优化。语音识别领域则依托边缘计算架构，将模型压缩技术与实时推理引擎结合，有效解决
【大模型与机器学习解惑】什么是A/B测试，为何进行A/B测试？
以下内容将围绕机器学习中的A/B测试展开，从概念与背景到实施细节、示例代码、优化思路和未来建议，并在最后给出一个整体的“输出目录”供参考。目录什么是机器学习的A/B测试为何要进行A/B测试A/B测试的实施流程示例代码与详细解释优化方向与未来建议结语1.什么是机器学习的A/B测试A/B测试（也常被称作对照试验、SplitTest）最早多用于互联网产品的功能或界面迭代中，指的是将用户或样本随机分为两组
【kafka】在Linux系统中部署配置Kafka的详细用法教程分享景天科技苑 linux基础与进阶 shell脚本编写实战 kafka linux 分布式 kafka安装配置 kafka优化
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，PyQt5和Tkinter桌面应用开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，云原生K8S，Prometheus监控，数据分析，Django
java类加载顺序 3213213333332132 java
package com.demo; /** * @Description 类加载顺序 * @author FuJianyong * 2015-2-6上午11:21:37 */ public class ClassLoaderSequence { String s1 = "成员属性"; static String s2 = "
Hibernate与mybitas的比较 BlueSkator sql Hibernate 框架 ibatis orm
第一章 Hibernate与MyBatis Hibernate 是当前最流行的O/R mapping框架，它出身于sf.net，现在已经成为Jboss的一部分。 Mybatis 是另外一种优秀的O/R mapping框架。目前属于apache的一个子项目。 MyBatis 参考资料官网：http:
php多维数组排序以及实际工作中的应用 dcj3sjt126com PHP usort uasort
自定义排序函数返回false或负数意味着第一个参数应该排在第二个参数的前面, 正数或true反之, 0相等usort不保存键名uasort 键名会保存下来uksort 排序是对键名进行的 <!doctype html> <html lang="en"> <head> <meta charset="utf-8&q
DOM改变字体大小周华华前端
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
c3p0的配置 g21121 c3p0
c3p0是一个开源的JDBC连接池，它实现了数据源和JNDI绑定，支持JDBC3规范和JDBC2的标准扩展。c3p0的下载地址是：http://sourceforge.net/projects/c3p0/这里可以下载到c3p0最新版本。以在spring中配置dataSource为例：  <bean name="prope
Java获取工程路径的几种方法 510888780 java
第一种： File f = new File(this.getClass().getResource("/").getPath()); System.out.println(f); 结果: C:\Documents%20and%20Settings\Administrator\workspace\projectName\bin 获取当前类的所在工程路径; 如果不加“
在类Unix系统下实现SSH免密码登录服务器 Harry642 免密 ssh
1.客户机 (1)执行ssh-keygen -t rsa -C "[email protected]"生成公钥，xxx为自定义大email地址 (2)执行scp ~/.ssh/id_rsa.pub root@xxxxxxxxx:/tmp将公钥拷贝到服务器上，xxx为服务器地址 (3)执行cat
Java新手入门的30个基本概念一 aijuans java java 入门新手
在我们学习Java的过程中,掌握其中的基本概念对我们的学习无论是J2SE,J2EE,J2ME都是很重要的,J2SE是Java的基础,所以有必要对其中的基本概念做以归纳,以便大家在以后的学习过程中更好的理解java的精髓,在此我总结了30条基本的概念。　　Java概述:　　目前Java主要应用于中间件的开发(middleware)---处理客户机于服务器之间的通信技术,早期的实践证明,Java不适合
Memcached for windows 简单介绍 antlove java Web windows cache memcached
1. 安装memcached server a. 下载memcached-1.2.6-win32-bin.zip b. 解压缩，dos 窗口切换到 memcached.exe所在目录，运行memcached.exe -d install c.启动memcached Server,直接在dos窗口键入 net start "memcached Server&quo
数据库对象的视图和索引百合不是茶索引 oeacle数据库视图
视图视图是从一个表或视图导出的表，也可以是从多个表或视图导出的表。视图是一个虚表，数据库不对视图所对应的数据进行实际存储，只存储视图的定义，对视图的数据进行操作时,只能将字段定义为视图,不能将具体的数据定义为视图为什么oracle需要视图; &
Mockito(一) --入门篇 bijian1013 持续集成 mockito 单元测试
Mockito是一个针对Java的mocking框架，它与EasyMock和jMock很相似，但是通过在执行后校验什么已经被调用，它消除了对期望行为（expectations）的需要。其它的mocking库需要你在执行前记录期望行为（expectations），而这导致了丑陋的初始化代码。 &nb
精通Oracle10编程SQL(5)SQL函数 bijian1013 oracle 数据库 plsql
/* * SQL函数 */ --数字函数 --ABS(n):返回数字n的绝对值 declare v_abs number(6,2); begin v_abs:=abs(&no); dbms_output.put_line('绝对值：'||v_abs); end; --ACOS(n):返回数字n的反余弦值，输入值的范围是-1~1，输出值的单位为弧度
【Log4j一】Log4j总体介绍 bit1129 log4j
Log4j组件：Logger、Appender、Layout Log4j核心包含三个组件：logger、appender和layout。这三个组件协作提供日志功能：日志的输出目标日志的输出格式日志的输出级别(是否抑制日志的输出) logger继承特性 A logger is said to be an ancestor of anothe
Java IO笔记白糖_ java
public static void main(String[] args) throws IOException { //输入流 InputStream in = Test.class.getResourceAsStream("/test"); InputStreamReader isr = new InputStreamReader(in); Bu
Docker 监控 ronin47 docker监控
目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。 1、关于监控的内容监控宿主机本身监控宿主机本身还是比较简单的，同其他服务器监控类似，对cpu、network、io、disk等做通用的检查，这里不再细说。额外的，因为是docker的
java-顺时针打印图形 bylijinnan java
一个画图程序要求打印出： 1.int i=5; 2.1 2 3 4 5 3.16 17 18 19 6 4.15 24 25 20 7 5.14 23 22 21 8 6.13 12 11 10 9 7. 8.int i=6 9.1 2 3 4 5 6 10.20 21 22 23 24 7 11.19
关于iReport汉化版强制使用英文的配置方法 Kai_Ge iReport汉化英文版
对于那些具有强迫症的工程师来说，软件汉化固然好用，但是汉化不完整却极为头疼，本方法针对iReport汉化不完整的情况，强制使用英文版，方法如下：在 iReport 安装路径下的 etc/ireport.conf 里增加红色部分启动参数，即可变为英文版。 # ${HOME} will be replaced by user home directory accordin
[并行计算]论宇宙的可计算性 comsci 并行计算
现在我们知道,一个涡旋系统具有并行计算能力.按照自然运动理论,这个系统也同时具有存储能力,同时具备计算和存储能力的系统,在某种条件下一般都会产生意识...... 那么,这种概念让我们推论出一个结论 &nb
用OpenGL实现无限循环的coverflow dai_lm android coverflow
网上找了很久，都是用Gallery实现的，效果不是很满意，结果发现这个用OpenGL实现的，稍微修改了一下源码，实现了无限循环功能源码地址： https://github.com/jackfengji/glcoverflow public class CoverFlowOpenGL extends GLSurfaceView implements GLSurfaceV
JAVA数据计算的几个解决方案1 datamachine java Hibernate 计算
老大丢过来的软件跑了10天，摸到点门道，正好跟以前攒的私房有关联，整理存档。 -----------------------------华丽的分割线------------------------------------- 数据计算层是指介于数据存储和应用程序之间，负责计算数据存储层的数据，并将计算结果返回应用程序的层次。J &nbs
简单的用户授权系统,利用给user表添加一个字段标识管理员的方式 dcj3sjt126com yii
怎么创建一个简单的(非 RBAC)用户授权系统通过查看论坛，我发现这是一个常见的问题，所以我决定写这篇文章。本文只包括授权系统.假设你已经知道怎么创建身份验证系统(登录)。数据库首先在 user 表创建一个新的字段(integer 类型),字段名 'accessLevel',它定义了用户的访问权限扩展 CWebUser 类在配置文件(一般为 protecte
未选之路 dcj3sjt126com 诗
作者:罗伯特*费罗斯特黄色的树林里分出两条路, 可惜我不能同时去涉足, 我在那路口久久伫立, 我向着一条路极目望去, 直到它消失在丛林深处. 但我却选了另外一条路, 它荒草萋萋,十分幽寂; 显得更诱人,更美丽, 虽然在这两条小路上, 都很少留下旅人的足迹. 那天清晨落叶满地, 两条路都未见脚印痕迹. 呵,留下一条路等改日再
Java处理15位身份证变18位蕃薯耀 18位身份证变15位 15位身份证变18位身份证转换
15位身份证变18位，18位身份证变15位 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--应用上下文配置【AppConfig】 hanqunfeng springmvc4
从spring3.0开始，Spring将JavaConfig整合到核心模块，普通的POJO只需要标注@Configuration注解，就可以成为spring配置类，并通过在方法上标注@Bean注解的方式注入bean。 Xml配置和Java类配置对比如下： applicationContext-AppConfig.xml <!-- 激活自动代理功能参看：
Android中webview跟JAVASCRIPT中的交互 jackyrong JavaScript html android 脚本
在android的应用程序中,可以直接调用webview中的javascript代码,而webview中的javascript代码,也可以去调用ANDROID应用程序(也就是JAVA部分的代码).下面举例说明之: 1 JAVASCRIPT脚本调用android程序要在webview中,调用addJavascriptInterface(OBJ,int
8个最佳Web开发资源推荐 lampcy 编程 Web 程序员
Web开发对程序员来说是一项较为复杂的工作，程序员需要快速地满足用户需求。如今很多的在线资源可以给程序员提供帮助，比如指导手册、在线课程和一些参考资料，而且这些资源基本都是免费和适合初学者的。无论你是需要选择一门新的编程语言，或是了解最新的标准，还是需要从其他地方找到一些灵感，我们这里为你整理了一些很好的Web开发资源，帮助你更成功地进行Web开发。这里列出10个最佳Web开发资源，它们都是受
架构师之面试------jdk的hashMap实现 nannan408 HashMap
1.前言。如题。 2.详述。 (1)hashMap算法就是数组链表。数组存放的元素是键值对。jdk通过移位算法（其实也就是简单的加乘算法），如下代码来生成数组下标(生成后indexFor一下就成下标了）。 static int hash(int h) { h ^= (h >>> 20) ^ (h >>>
html禁止清除input文本输入缓存 Rainbow702 html 缓存 input 输入框 change
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; <input type="text" autocomplete="off" n
POJO和JavaBean的区别和联系 tjmljw POJO java beans
POJO 和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Pure Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比 POJO复杂很多， Java Bean 是可复用的组件，对 Java Bean 并没有严格的规
java中单例的五种写法 liuxiaoling java 单例
/** * 单例模式的五种写法： * 1、懒汉 * 2、恶汉 * 3、静态内部类 * 4、枚举 * 5、双重校验锁 */ /** * 五、双重校验锁，在当前的内存模型中无效 */ class LockSingleton { private volatile static LockSingleton singleton; pri