ifchange

人工智能演义第二回：遇险阻创始人早逝，敢坚持三剑客逆袭

神经网络是什么？

神经网络是人工智能领域目前最热门的一种机器学习方法，是目前最为火热的研究方向之一——深度学习的基础。

神经网络这个概念听起来无比深奥，很多非技术人士大都不明白它到底是个啥。让我们继续往下看试试是否可以“窥一斑而知全豹”。

△看图猜动物，左右滑动查看更多

猜一下，以上动物是什么？或者是由哪种动物组合成的？

也许答案你不到一秒就可以脱口而出，凭借人类大脑强大的辨识能力，尽管图中的动物经过变形处理或者视觉误差，我们还是能快速猜出这是什么动物。这就归功于我们大脑的1000多亿个神经元组成的复杂网络，即使动物们并非我们熟知的模样，我们依然可以轻松识别出。

神经网络技术正是受到人类神经元的启发，通过模拟人脑神经网络以实现类人工智能的功能。

人脑中的神经元大家初中时就很熟悉了：

而人工智能神经网络正是模拟人类大脑：

要进一步理解神经网络，我们必须要厘清以下概念：

人工智能：人工智能是一个非常大的概念，其最初定义是要让机器的行为看起来就像是人所表现出的智能行为一样。我们经常听到的语音识别、图像识别、自然语言理解等领域都是具体的人工智能方向，而机器学习、神经网络等概念都属于实现人工智能所需要的一些技术。

机器学习：机器学习是人工智能的一门分支，指通过学习过往经验来提升机器的智能性的一类方法。根据样本和训练的方式，又可以分为监督学习、无监督学习、半监督学习和强化学习等类型。

神经网络：在人工智能领域一般指人工神经网络，是一种模仿动物神经网络行为特征，进行分布式并行信息处理人工智能模型。我们通常使用的神经网络都需要通过训练数据进行参数的学习，所以神经网络也可以被归为一种机器学习方法。

深度学习：作为人工智能领域的新兴方向，深度学习目前还没有严格的定义，一般我们把一些具备较多中间隐含层的神经网络称为深度学习模型。

至暗时刻

2019年，ACM决定将2018年ACM图灵奖授予YoshuaBengio、Geoffrey Hinton和YannLeCun三位深度学习之父，以表彰他们给人工智能带来的重大突破，这些突破使深度神经网络成为计算的关键组成部分。ACM主席 Cherri M. Pancake 表示，“人工智能如今是整个科学界发展最快的领域之一，也是社会上讨论最广的主题之一。

AI的发展、人们对AI的兴趣，很大程度上是因为深度神经网络的近期进展，而Bengio、Hinton和LeCun为此奠定了重要基础”。

神经网络的发展过程遇到了哪些波折？“深度学习三巨头”有哪些有趣的故事？而这些年热门的深度学习又和神经网络有什么样的关系？

今天院长为大家一一道来。

大家知道，我们现在所说的人工神经网络确实是受生物神经网络启发而设计出来的。在1890年，实验心理学先驱William James在他的巨著《心理学原理》中第一次详细论述人脑结构及功能。其中提到神经细胞受到刺激激活后可以把刺激传播到另一个神经细胞，并且神经细胞激活是细胞所有输入叠加的结果。这一后来得到验证的假说也成为了人工神经网络设计的生物学基础。

基于这一假说，一系列模拟人脑神经计算的模型被相继提出，具有代表性的有Hebbian Learning Rule, Oja's Rule和 MCP NeuralModel等，他们与现在通用的神经网络模型已经非常相似，例如在Hebbian Learning模型中，已经可以支持神经元之间权重的自动学习。当然，现有的人工神经网络只是对人脑结构的最初级模拟，成人的大脑中估计有1000亿个神经元之多，其复杂性远超目前的所有人工神经网络模型。

1958年，就职于Cornell航空实验室的 Frank Rosenblatt 将这些最初的神经网络模型假说付诸于实施，利用电子设备构建了真正意义上的第一个神经网络模型：感知机（Perceptron）。Rosenblatt现场演示了其学习识别简单图像的过程，在当时的社会引起了轰动，并带来了神经网络的第一次大繁荣。许多学者和科研机构纷纷投入到神经网络的研究中，连美国军方大力资助了神经网络的研究，并认为神经网络比“原子弹工程”更重要。

△Frank Rosenblatt

然而好景不长，上回曾经提到的达特茅斯会议的组织者明斯基（HR图灵学院|阿兰图灵开山鼻祖，达特茅斯豪杰聚义），同时也是 Rosenblatt 的同事兼中学同学，在一次会议上和罗森布拉特大吵，认为神经网络不能解决人工智能的问题。

随后，明斯基和麻省理工学院的另一位教授佩珀特（Seymour Papert）合作，写出了《感知机：计算几何学》（Perceptrons:An Introduction to Computational Geometry)一书。该书几乎对处于萌芽中神经网络判处了死刑，书中明斯基和佩珀特证明单层神经网络不能解决XOR（异或）问题，说明神经网络的计算能力实在有限。但“感知机”的缺陷被明斯基以一种敌意的方式呈现出来，当时对Rosenblatt是个致命打击，不久后他因为一次沉船事故离开了人世。原来的政府资助机构也逐渐停止对神经网络研究的支持，神经网络为代表联结主义也随之进入了第一个至暗时刻。

整个70年代，神经网络的研究都处在寒冬之中。1974年，哈佛大学的博士生波斯（Paul Werbos）一篇博士论文证明了在神经网络多加一层，并且利用“反向传播”（back-propagation）学习方法，可以解决XOR问题。之前明斯基所刚提出的神经网络致命伤就被这增加的一层神经网络所轻松化解，这也为之后深度学习方法的提出埋下了伏笔。但这篇论文发表时正处在神经网络研究的低谷，并没有引起足够的关注。

直到八十年代中期，以John Hopfield, David Rumelhar及Hinton为代表的一批科学家进一步将反向传播传播方法引入神经网络的训练中，并提出了Hopfiled Networks和Boltzmann Machine等新的神经网络结构，主导了神经网络的又一次复兴。我们如今耳熟能详的递归神经网络（RNN）、长短期记忆网络（LSTM）和卷积神经网络（CNN）都在这一时期被相继提出。然而，当科学家们在实际训练这些模型时，却又遇到各种各样的问题，一方面当时的神经网络很容易过拟合，另一方面又缺乏足够的数据和计算能力。

深度学习三巨头

到90年代，以支持向量机（SVM）为代表的统计机器学习方法逐渐取代神经网络成为了人工智能的主流。相比于神经网络方法，支持向量机有着更扎实的统计理论基础，有着更好问题优化与求解方法。神经网络再一次陷入低谷，大量之前从事相关研究者开始转向其他方向。不过还是有很多科学家一直在默默坚守，坚信神经网络技术终有一天能够再次爆发，其中最为代表性的就是前面提到的深度学习三位创始人——Yoshua Bengio、Geoffrey Hinton 和 Yann LeCun。

△深度学习三巨头

进入新世纪以来，互联网的飞速发展对AI提出了更多需求，一方面可供训练的数据量大大增加，另一方面问题场景越来越复杂，需要有通用和模块化的方法来快速适应不同的问题，而神经网络在这方面相比于当时流行的统计学习方法都更有优势。

2006年，Hinton在Nature发表了“Reducing the Dimensionality of Data with Neural Networks”一文，提出训练更多层的神经网络来提升神经网络的泛化能力，并给出了具体的解决方案，吹响了神经网络第二次复兴的号角，并引领了深度学习这一AI的新方向。后续深度学习的发展并没有完全按照Hinton这边论文的思路，更多的是依靠算力的增加、数据的增加以及在模型训练里增加的各种技巧。

2010年Hinton和Deng Li把DNN用于声学模型建模，用于替代传统的隐马尔科夫模型，语音识别的词错误率相对降低了30%，震惊了整个AI界。2012年由Hinton和他的学生提出的AlexNet在图像领域著名的ImageNet比赛中，将图像分类错误率由25.8%下降至10%，再次让所有人惊叹于深度学习的威力。在之后的几年中，深度学习又被应用到自然语言处理、语音图像合成、自动驾驶、搜索推荐等几乎人工智能的所有领域，并刷新了几乎所有AI竞赛的最好成绩。在深度学习带动下，AI在这几年中再一次赢来爆发。

那么深度学习方法和传统的神经网络又有什么样的关系呢？

院长在这里在做个技术总结。最早期的神经网络“感知机”只有单层网络结构，被证明无法解决“异或问题”，存在先天的硬伤。后来证明增加神经网络层数并引入反向传播算法之后解决这一问题，这样神经网络的这一短板就被补齐了。然而，神经网络问题从数学上不能保证取得全局最优解（又一硬伤），当训练数据量小的时候容易过拟合，且存在其他一些模型训练的问题，导致再次沉沦。之后Hinton提出采用更多层的神经网络加预训练方法可以解决上述问题，这也就是深度学习的起源。再后来大家发现随着数据量和计算能力的提升，即使不采取预训练方法，单纯增加神经网络层数，也可以达到同样效果。随后更多的深度神经网络模型和训练方法被陆续提出，深度学习开始走向快车道。

最后在总结一下深度学习三位创始人对领域的贡献。Hinton的身世显赫，是著名逻辑学家布尔（布尔代数创始人）的后裔，从出身就带着与计算机的不解缘分。他像是深度学习领域的哲学家，不断地思考与反思，为大家指引前行的方向。在最近的一次人工智能会议上，Hinton表示自己对于反向传播“非常怀疑”，并提出“应该抛弃它并重新开始”。Bengio为深度学习的发展和推广做出了很多基础的贡献，除了大量重要论文外，他还主导研发了Theano深度学习框架，一度成为非常主流的深度学习工具，并带动了后续tensorflow与pytorch等平台的出现。Lecun是Hinton的博士后学生，也是神经网络的坚定信仰者，早在80年代他就在贝尔实验室提出了如今大名鼎鼎的卷积神经网络，当时还叫LeNet，并被广泛应用于支票的数字识别。2013年Lecun加盟Facebook组建FAIR并任职第一任主任，致力于深度学习学术界与工业界的结合。

深度学习在企业场景的应用

近年来，以Resnet和Bert为代表的深度学习算法在计算机视觉和自然语言处理领域继续披荆斩棘，不断创造各项记录。除了模型的创新，这些模型更得益于更大规模的训练样本及更强的算力的支持，很多人也在质疑深度学习这样的发展模式还能持续多久。相比于神经网络，人类在面对新问题时拥有者更好的学习效率和效果，这样说明当前神经网络的实现机制和真正人脑的神经学习机制还存在着很大的差异。如何更好探索好的网络先验结构与参数，以及引入先验知识或者通过迁移学习、多任务学习的方式进行小样本的学习已经成为了近期新的研究热点。特别是在企业服务场景，相对to C场景样本量更少，业务性更强，如何将深度学习方法与这些场景相结合也成为一个重要课题。

深度学习方法在e成科技的对话机器人、人岗匹配、音视频面试等场景起到了非常重要的作用，院长在前几期反复提到的Bert就是其中的重要代表。但作为一家to B企业，e成科技的很多算法都有自身的特殊场景，同时也面临着数据相对不足的问题。为了能使深度学习方法最大限度地发挥威力，e成科技的算法工程师们也进行了非常多的尝试与探索，在后续的专栏中，院长将会为各位小伙伴们慢慢介绍。

作为HR+AI赛道的领跑者，e成科技从创立起就将AI技术基因根植于业务场景，凭自身在AI能力和人力资本行业经验的独特优势，以及来自全球顶尖跨媒体技术实验室的AI核心团队，致力于将AI技术深度应用于人力资本全场景中，推动人力资本智能变革。6年来，e成科技积累了诸多技术、数据、场景和创新应用，并通过打造HR赛道首个AI能力开放平台，把技术赋能给整个人力资本领域。

△e成科技打造HR赛道首个AI开放平台

e成科技AI开放平台可以根据您的业务需求，灵活调用OpenAPI接口或私有云部署，提供NLP能力、实体识别、归一化知识图谱、人岗匹配、简历解析、HR机器人等成熟AI技术基础能力，AI产品组件，定制化解决方案等多种智能服务。

e成科技AI开放平台提供的AI算法能力、AI产品和AI解决方案，将帮助企业轻松、快速、零门槛拥有属于自己的AI能力及产品，实现数字化升级弯道超车。自投入使用以后，e成科技AI开放平台已助力多家企业合作伙伴应用落地，包括招聘选拔、员工服务、薪酬绩效、培训发展等人力资本全场景的应用，应用中展现出智能化、高准确率、高效率、更便捷等突出优势，高效助力用户AI技术在人力资本场景的落地。

未来，随着科技飞速发展，AI技术正在根据大数据和深度学习不断优化和升级。e成科技愿意借助于自身在AI开放平台、技术、产品、行业经验等独特优势，助您实现人力资本数字化新升级！

作者：e成科技AI算法负责人刘洋

CES Asia 2025优惠期倒计时5天，科技盛宴即将开启赛逸展张胜科技
随着时间的推移，备受瞩目的CESAsia2025优惠期已进入最后5天倒计时。作为亚洲顶级的消费电子盛会，CESAsia2025将汇聚众多国内外知名的科技企业，展示涵盖智能家居、智能出行、虚拟现实、人工智能等热门赛道的顶尖成果，是行业交流、商贸合作、趋势洞察的绝佳平台。在这最后的优惠时段内，参展商们仍有机会享受到展位费用的梯度折扣，越早锁定，优惠力度越大，还能优先挑选心仪展位，获得额外的宣传推广资源
AI Agent 原理解析及应用场景深度洞察 power-辰南大模型算法实战工程人工智能 ai agent 大模型
在当今科技飞速发展的时代，AIAgent作为人工智能领域的重要分支，正以其独特的智能特性和广泛的应用潜力，逐渐渗透到各个行业和我们生活的方方面面。它为解决复杂问题、提升系统效率和实现智能化交互提供了全新的途径。本文将深入剖析AIAgent的原理，并详细探讨其在多个领域的关键应用场景。一、AIAgent的定义与基本概念AIAgent，即人工智能代理，是一种能够感知其所处环境，并基于所感知的信息自主地
深度学习环境配置指南！（Windows、Mac、Ubuntu全讲解） Charmve #AI学习指导：从入门到进阶软件安装环境配置计算机视觉实战文档详细开放源码 cuda linux gpu anaconda ubuntu
关注“迈微AI研习社”，内容首发于公众号作者：伍天舟、马曾欧、陈信达入门深度学习，很多人经历了从入门到放弃的心酸历程，且千军万马倒在了入门第一道关卡：环境配置问题。俗话说，环境配不对，学习两行泪。如果你正在面临配置环境的痛苦，不管你是Windows用户、Ubuntu用户还是苹果死忠粉，这篇文章都是为你量身定制的。接下来就依次讲下Windows、Mac和Ubuntu的深度学习环境配置问题。一、Win
联邦学习中客户端发送的梯度是vector而不是tensor wzx_Eleven 联邦学习机器学习网络安全人工智能
在联邦学习中，当本地使用神经网络或深度学习模型时，训练的梯度通常是与模型参数（权重和偏置）相对应的梯度数据。具体来说，梯度的类型和形状取决于模型的结构（例如，卷积神经网络、全连接网络等），以及模型的层数、每层的神经元数量等因素。1.梯度类型：梯度是一个张量：在神经网络中，梯度通常是一个张量（tensor），每一层的梯度张量的形状和该层的权重形状相匹配。具体来说，梯度是损失函数对每个参数的偏导数，表
1. 基于大模型能力，如何提炼出优质prompt（入门版）姚瑞南 prompt系列课程人工智能 AIGC chatgpt
本文原创作者：姚瑞南AI-agent大模型运营专家，先后任职于美团、猎聘等中大厂AI训练专家和智能运营专家岗；多年人工智能行业智能产品运营及大模型落地经验，拥有AI外呼方向国家专利与PMP项目管理证书。（转载需经授权）本文简介：入门版：基于大模型能力，如何提炼出优质prompt提示词的重要性和价值大模型基础能力简介prompt的基本定义如何定义优质的promptprompt的万能公式与套路prom
从System Prompt来看GPT-3.5到GPT-4的进化 herosunly 大模型 system prompt gpt-3 chatgpt gpt4 gpt4o
大家好，我是herosunly。985院校硕士毕业，现担任算法t研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了从SystemPrompt来看GPT-3.5到GPT-4的进化之路，希
AI系统架构原理与代码实战案例讲解 AI天才研究院大数据AI人工智能 AI大模型企业级应用开发实战计算计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI系统架构原理与代码实战案例讲解1.背景介绍1.1人工智能的发展历程1.1.1人工智能的起源与早期发展人工智能的概念可以追溯到上世纪50年代，图灵测试的提出标志着人工智能作为一门学科的诞生。早期的研究主要集中在符号推理、专家系统等领域，取得了一些突破，例如机器定理证明、西洋跳棋程序等。1.1.2人工智能的黄金时期上世纪80年代，随着专家系统的兴起，人工智能进入了一个黄金时期。专家系统通过模拟人类
【多模态 AI】从跨模态学习到生成革命：文本、图像与音频的深度交融网罗开发人工智能 AI 大模型机器学习人工智能 AIGC
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
美国采取行动扩大人工智能出口限制数据分析能量站机器学习人工智能
大幅拓展限制：美国政府（拜登执政末期提出）出台新规，显著扩大人工智能技术出口限制，构建针对先进芯片与模型获取的国际分级体系。出口限制范围：对多数国家限制出口人工智能芯片与模型，仅少数亲密盟友除外。新规创建三级体系，对不同国家区别对待，并首次限制大型AI模型封闭权重出口。规则运作方式意见征询与生效：新规在媒体曝光后发布，设120天公众意见征询期，供新政府参考调整，预计一年后生效。国家分级及限制一级国
通用人工智能的多层次提示词架构 AI天才研究院计算机软件编程原理与应用实践大数据AI人工智能 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
通用人工智能的多层次提示词架构关键词通用人工智能（AGI），多层提示词架构，人工智能设计原则，算法原理，系统架构设计，应用案例摘要本文将深入探讨通用人工智能（AGI）的多层次提示词架构，阐述其背景、核心概念、设计原则和实现方法。我们将逐步分析这一架构在不同领域的应用，并展望其未来的发展方向。通过本文，读者将了解如何构建能够模拟人类智能的多层次提示词系统，并思考其在实际应用中的潜力与挑战。目录第一部
半导体、芯片、人工智能、智能驾驶汽车的趋势不爱原创的Yoga 人工智能汽车
1.市场增长与需求汽车半导体市场：预计到2025年，中国汽车半导体市场仍将保持稳健增长态势，AI和能源将成为未来最重要的两大变革因素。2023年中国汽车电子芯片行业市场规模约为820.8亿元，预计2024年有望增至905.4亿元左右。随着新能源汽车和智能化的快速发展，一些新的半导体技术在中国汽车领域迅速应用，如集中式架构和高性能处理器需求正日益增加。AI芯片市场：随着AI技术的不断普及和应用场景的
Minimax 开源的 4 百万超长上下文模型百态老人人工智能大数据笔记
MiniMax开源4百万超长上下文模型MiniMax开源模型概述2025年1月15日，MiniMax发布并开源了MiniMax-01全新系列模型，这一举措在人工智能领域引发了广泛关注。该系列包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。MiniMax作为大模型六小强（或六小虎）企业之一，其推出的这一系列模型有着诸多独特之处。这一系列模型的开源是Min
程序员创业公司的技术栈选择与性能优化 AI天才研究院 ChatGPT AI大模型企业级应用开发实战大数据AI人工智能大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
《程序员创业公司的技术栈选择与性能优化》概述本文旨在探讨程序员创业公司在选择技术栈和进行性能优化方面的策略与实践。随着技术的不断进步和市场的快速变化，技术栈的选择和优化成为创业公司成功的关键因素。正确的技术栈选择不仅能够提升系统的性能和可扩展性，还能降低开发成本和维护难度。关键词技术栈选择性能优化创业公司云计算数据库微服务人工智能区块链边缘计算摘要本文首先分析了技术栈选择的重要性以及创业公司在技术
AI人工智能深度学习算法：高并发场景下深度学习代理的性能调优 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1深度学习代理的兴起近年来，随着人工智能技术的飞速发展，深度学习在各个领域都取得了显著的成果。特别是在自然语言处理、图像识别、语音识别等领域，深度学习模型的性能已经超越了传统方法。为了更好地将深度学习技术应用于实际场景，深度学习代理应运而生。深度学习代理是一种将深度学习模型封装起来，并提供对外接口的服务。它可以接收来自客户端的请求，将请求数据输入到深度学习模型中进行推理，并将推理结
AI生成PPT：智能技术重塑演示文稿创作的新篇章 mhjidfoi 人工智能
在快节奏的商业与学术环境中，演示文稿（PPT）作为信息传递与观点展示的重要工具，其质量与效率直接关系到演讲者的说服力和观众的接收度。近年来，随着人工智能（AI）技术的飞速发展，AI生成PPT的应用正逐渐从科幻概念转变为现实工具，为演示文稿的创作带来了革命性的变革。本文将深入探讨AI生成PPT的工作原理、优势、挑战以及未来展望，为您揭示这一智能技术的无限潜力。一、AI生成PPT的工作原理AI生成PP
零门槛一键生成PPT，利用人工智能快速提高办公效率（无需第三方插件） beautycountry88 powerpoint 人工智能
人工智能技术的发展正以惊人的速度改变着我们的世界，今天给大家介绍下利用ChatGPT快速生成PPT的方法，它能够帮助你一键生成PPT内容和漂亮的PPT文档，无需繁琐的设计和排版，只需要与ChatGPT交流，你就能轻松拥有一份令人赞叹的演示文稿。什么是ChatGPT？它是基于人工智能技术的语言模型，能够理解和生成自然语言。与传统的PPT制作方式不同，ChatGPT通过与你进行对话，理解你的需求和要点
探索AloT（人工智能物联网）：未来智能设备的核心驱动力为也科技人工智能物联网边缘计算目标检测 iot
探索AloT（人工智能物联网）：未来智能设备的核心驱动力随着物联网（IoT）技术的飞速发展，人工智能（AI）也在各行各业中找到了应用的空间。两者的结合，诞生了一个崭新的技术领域——AloT（ArtificialIntelligenceofThings，人工智能物联网）。AloT不仅仅是AI与物联网技术的简单融合，它更是推动智能设备进化和物联网产业向更高层次发展的关键力量。今天，我们就来深入探讨Al
Python中实现多层感知机（MLP）的深度学习模型 Echo_Wish Python 笔记从零开始学Python人工智能 python 深度学习开发语言
深度学习已经成为机器学习领域的一个热门话题，而多层感知机（MLP）是最基础的深度学习模型之一。在这篇教程中，我将向你展示如何使用Python来实现一个简单的MLP模型。什么是多层感知机（MLP）？多层感知机（MLP）是一种前馈神经网络，它包含一个输入层、一个或多个隐藏层以及一个输出层。每个层都由一系列的神经元组成，神经元之间通过权重连接。MLP能够学习输入数据的非线性特征，因此在复杂问题的建模中非
深度学习-92-大语言模型LLM之基于langchain的模型IO的模型调用皮皮冰燃深度学习深度学习语言模型 langchain
文章目录1Model的输入输出2langchain支持的模型3调用Ollama模型3.1设置环境变量3.2大语言模型LLM(OllamaLLM)3.2.1生成文本补全3.2.2流式生成文本补全3.3聊天模型(ChatOllama)3.3.1内置的消息类型3.3.2HumanMessage和SystemMessage3.3.3元组方式构成消息列表3.3.4stream流式3.4文本嵌入模型(Olla
深度学习基础18（多层感知机代码实现） NDNPOMDFLR 深度学习深度学习 python 经验分享人工智能神经网络
多层感知机的从零开始实现现在自己实现一个多层感知机。为了与之前softmax回归获得的结果进行比较，将继续使用Fashion-MNIST图像分类数据集importtorchfromtorchimportnnfromd2limporttorchasd2lbatch_size=256train_iter,test_iter=d2l.load_data_fashion_mnist(batch_size)
人工智能与量子计算：未来编程的碰撞与共鸣大梦百万秋知识学爆量子计算
引言：编程的“摩尔定律”快到尽头了？曾几何时，摩尔定律曾预言着计算能力的飞速发展——每两年，晶体管的数量翻倍，处理器的速度也在跟着疯狂增长。这个定律引领了数十年的技术革命，推动了今天的智能手机、超级计算机和现代互联网的诞生。然而，摩尔定律的黄金时代正逐渐走向尾声。传统的硅基芯片工艺遇到了物理极限，无法再轻易实现持续的性能翻倍。此时，新的计算范式开始崭露头角——量子计算与人工智能（AI）的结合，正在
AI Agent：深度解析与未来展望码事漫谈 c++人工智能
一、AIAgent的前世：从概念到萌芽（一）早期探索AIAgent的概念可以追溯到20世纪50年代，早期的AI研究主要集中在简单的规则系统上，这些系统的行为是确定性的，输出由输入决定。随着时间的推移，AI逐渐能够处理不确定性，1990年代机器学习的兴起为AIAgent的发展奠定了基础，神经网络技术的突破为深度学习的发展提供了可能。（二）技术突破2017年后，大语言模型（LLM）的出现推动了AIAg
【深度学习基础】线性神经网络 | softmax回归的简洁实现 Francek Chen PyTorch深度学习深度学习神经网络回归 softmax 人工智能
【作者主页】FrancekChen【专栏介绍】⌈⌈⌈PyTorch深度学习⌋⌋⌋深度学习(DL,DeepLearning)特指基于深层神经网络模型和方法的机器学习。它是在统计机器学习、人工神经网络等算法模型基础上，结合当代大数据和大算力的发展而发展出来的。深度学习最重要的技术特征是具有自动提取特征的能力。神经网络算法、算力和数据是开展深度学习的三要素。深度学习在计算机视觉、自然语言处理、多模态数据
【人工智能】Python常用库-Keras：高阶深度学习 API IT古董深度学习人工智能 Python 人工智能 python 深度学习
Keras：高阶深度学习APIKeras是一个高效、用户友好的深度学习框架，作为TensorFlow的高级API，支持快速构建和训练深度学习模型。它以模块化、简单和灵活著称，适合研究和生产环境。Keras的发音为[ˈkerəs]，类似于“凯拉斯”或“克拉斯”。这个名字来源于希腊语κέρας(kéras)，意思是“角”或“角质物”。这个词与深度学习的灵感来源——大脑的神经网络结构有一定联系。Kera
深度求索DeepSeek V2.5-1210发布：AI代码生成器迎来全新升级 2401_89759264 人工智能前端
深度学习技术日新月异，而强大的AI代码生成器也随之不断进化。今天，我们将聚焦于深度求索团队发布的DeepSeekV2.5-1210版本，这款标志着DeepSeekV2系列收官之作，为我们带来了令人惊喜的Post-Training能力提升和备受期待的联网搜索功能。这篇文章将深入探讨DeepSeekV2.5-1210的各项改进，以及其开源带来的深远影响。DeepSeekV2系列的研发历程与V2.5-1
南京大学苏州校区学生代表团到访合合信息，开启“沉浸式”人工智能企业行人工智能图像识别程序员
为进一步深化校企合作，探索产业科技拔尖创新人才培养新模式，近期，南京大学苏州校区师生代表到访上海合合信息科技股份有限公司（以下简称“合合信息”，股票代码：SH688615）。此次活动设置了展厅讲解、技术交流、模拟面试等多个体验环节，旨在增强学生对人工智能及商业大数据技术在实际应用中的理解和认识，引导学生系统性开展职业规划，提升职业胜任力。图说：南京大学苏州校区学生代表团到访合合信息合影留念合合信息
深度学习从入门到精通：全面指南 AI天才研究院计算大数据AI人工智能 AI大模型企业级应用开发实战 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
《深度学习从入门到精通：全面指南》文章目录《深度学习从入门到精通：全面指南》文章关键词文章摘要引言第一部分：深度学习基础入门第1章：深度学习概述1.1深度学习的基本概念1.2深度学习的发展历程1.3深度学习的基本原理神经网络前向传播反向传播第2章：深度学习框架入门2.1TensorFlow入门TensorFlow环境搭建TensorFlow基本数据结构2.2PyTorch入门PyTorch环境搭建
反转字符串中的单词 II：Swift 实现与详解网罗开发 Swift vue.js
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
AIGC视频生成模型：Meta的Emu Video模型好评笔记 #Meta AIGC-视频 AIGC 机器学习人工智能 transformer 论文阅读深度学习面试
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍Meta的视频生成模型EmuVideo，作为Meta发布的第二款视频生成模型，在视频生成领域发挥关键作用。优质专栏回顾：机器学习笔记深度学习笔记多模态论文笔记AIGC—图像文章目录论文摘要引言相关工作文本到图像（T2I）扩散模型视频生成/预测文本到视频（T2V）生成分解生成方法预备知识EmuVideo生成步骤图
【Python】已解决ModuleNotFoundError: No module named ‘tensorflow‘ 屿小夏 python tensorflow neo4j
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
枚举的构造函数中抛出异常会怎样 bylijinnan java enum 单例
首先从使用enum实现单例说起。为什么要用enum来实现单例？这篇文章（ http://javarevisited.blogspot.sg/2012/07/why-enum-singleton-are-better-in-java.html）阐述了三个理由： 1.enum单例简单、容易，只需几行代码： public enum Singleton { INSTANCE;
CMake 教程 aigo C++
转自：http://xiang.lf.blog.163.com/blog/static/127733322201481114456136/ CMake是一个跨平台的程序构建工具，比如起自己编写Makefile方便很多。介绍：http://baike.baidu.com/view/1126160.htm 本文件不介绍CMake的基本语法，下面是篇不错的入门教程： http:
cvc-complex-type.2.3: Element 'beans' cannot have character Cb123456 spring Webgis
cvc-complex-type.2.3: Element 'beans' cannot have character Line 33 in XML document from ServletContext resource [/WEB-INF/backend-servlet.xml] is i
jquery实例:随页面滚动条滚动而自动加载内容 120153216 jquery
<script language="javascript"> $(function (){ var i = 4;$(window).bind("scroll", function (event){ //滚动条到网页头部的高度，兼容ie,ff,chrome var top = document.documentElement.s
将数据库中的数据转换成dbs文件何必如此 sql dbs
旗正规则引擎通过数据库配置器（DataBuilder）来管理数据库，无论是Oracle，还是其他主流的数据都支持，操作方式是一样的。旗正规则引擎的数据库配置器是用于编辑数据库结构信息以及管理数据库表数据，并且可以执行SQL 语句，主要功能如下。 1)数据库生成表结构信息：主要生成数据库配置文件(.conf文
在IBATIS中配置SQL语句的IN方式 357029540 ibatis
在使用IBATIS进行SQL语句配置查询时，我们一定会遇到通过IN查询的地方，在使用IN查询时我们可以有两种方式进行配置参数：String和List。具体使用方式如下： 1.String:定义一个String的参数userIds，把这个参数传入IBATIS的sql配置文件，sql语句就可以这样写： <select id="getForms" param
Spring3 MVC 笔记（一） 7454103 spring mvc bean REST JSF
自从 MVC 这个概念提出来之后 struts1.X struts2.X jsf 。。。。。这个view 层的技术一个接一个！都用过！不敢说哪个绝对的强悍！要看业务，和整体的设计！最近公司要求开发个新系统！
Timer与Spring Quartz 定时执行程序 darkranger spring bean 工作 quartz
有时候需要定时触发某一项任务。其实在jdk1.3，java sdk就通过java.util.Timer提供相应的功能。一个简单的例子说明如何使用，很简单： 1、第一步，我们需要建立一项任务，我们的任务需要继承java.util.TimerTask package com.test; import java.text.SimpleDateFormat; import java.util.Date;
大端小端转换，le32_to_cpu 和cpu_to_le32 aijuans C语言相关
大端小端转换，le32_to_cpu 和cpu_to_le32 字节序 http://oss.org.cn/kernel-book/ldd3/ch11s04.html 小心不要假设字节序. PC 存储多字节值是低字节为先(小端为先, 因此是小端), 一些高级的平台以另一种方式(大端)
Nginx负载均衡配置实例详解 avords
[导读] 负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡，单从字面上的意思来理解就可以解负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡
乱说的 houxinyou 框架敏捷开发软件测试
从很久以前，大家就研究框架，开发方法，软件工程，好多！反正我是搞不明白！这两天看好多人研究敏捷模型，瀑布模型！也没太搞明白. 不过感觉和程序开发语言差不多，瀑布就是顺序，敏捷就是循环. 瀑布就是需求、分析、设计、编码、测试一步一步走下来。而敏捷就是按摸块或者说迭代做个循环，第个循环中也一样是需求、分析、设计、编码、测试一步一步走下来。也可以把软件开发理
欣赏的价值——一个小故事 bijian1013 有效辅导欣赏欣赏的价值
　　第一次参加家长会，幼儿园的老师说："您的儿子有多动症，在板凳上连三分钟都坐不了，你最好带他去医院看一看。"　　回家的路上，儿子问她老师都说了些什么，她鼻子一酸，差点流下泪来。因为全班30位小朋友，惟有他表现最差；惟有对他，老师表现出不屑，然而她还在告诉她的儿子："老师表扬你了，说宝宝原来在板凳上坐不了一分钟，现在能坐三分钟。其他妈妈都非常羡慕妈妈，因为全班只有宝宝
包冲突问题的解决方法 bingyingao eclipse maven exclusions 包冲突
包冲突是开发过程中很常见的问题：其表现有： 1.明明在eclipse中能够索引到某个类，运行时却报出找不到类。 2.明明在eclipse中能够索引到某个类的方法，运行时却报出找不到方法。 3.类及方法都有，以正确编译成了.class文件，在本机跑的好好的，发到测试或者正式环境就抛如下异常： java.lang.NoClassDefFoundError: Could not in
【Spark七十五】Spark Streaming整合Flume-NG三之接入log4j bit1129 Stream
先来一段废话：实际工作中，业务系统的日志基本上是使用Log4j写入到日志文件中的，问题的关键之处在于业务日志的格式混乱，这给对日志文件中的日志进行统计分析带来了极大的困难，或者说，基本上无法进行分析，每个人写日志的习惯不同，导致日志行的格式五花八门，最后只能通过grep来查找特定的关键词缩小范围，但是在集群环境下，每个机器去grep一遍，分析一遍，这个效率如何可想之二，大好光阴都浪费在这上面了
sudoku solver in Haskell bookjovi sudoku haskell
这几天没太多的事做，想着用函数式语言来写点实用的程序，像fib和prime之类的就不想提了（就一行代码的事），写什么程序呢？在网上闲逛时发现sudoku游戏，sudoku十几年前就知道了，学生生涯时也想过用C/Java来实现个智能求解，但到最后往往没写成，主要是用C/Java写的话会很麻烦。现在写程序，本人总是有一种思维惯性，总是想把程序写的更紧凑，更精致，代码行数最少，所以现
java apache ftpClient bro_feng java
最近使用apache的ftpclient插件实现ftp下载，遇见几个问题，做如下总结。 1. 上传阻塞，一连串的上传，其中一个就阻塞了，或是用storeFile上传时返回false。查了点资料，说是FTP有主动模式和被动模式。将传出模式修改为被动模式ftp.enterLocalPassiveMode();然后就好了。看了网上相关介绍，对主动模式和被动模式区别还是比较的模糊，不太了解被动模
读《研磨设计模式》-代码笔记-工厂方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 工厂方法模式：使一个类的实例化延迟到子类 * 某次，我在工作不知不觉中就用到了工厂方法模式（称为模板方法模式更恰当。2012-10-29）： * 有很多不同的产品，它
面试记录语 chenyu19891124 招聘
或许真的在一个平台上成长成什么样，都必须靠自己去努力。有了好的平台让自己展示，就该好好努力。今天是自己单独一次去面试别人，感觉有点小紧张，说话有点打结。在面试完后写面试情况表，下笔真的好难，尤其是要对面试人的情况说明真的好难。今天面试的是自己同事的同事，现在的这个同事要离职了，介绍了我现在这位同事以前的同事来面试。今天这位求职者面试的是配置管理，期初看了简历觉得应该很适合做配置管理，但是今天面
Fire Workflow 1.0正式版终于发布了 comsci 工作 workflow Google
Fire Workflow 是国内另外一款开源工作流，作者是著名的非也同志，哈哈.... 官方网站是 http://www.fireflow.org 经过大家努力,Fire Workflow 1.0正式版终于发布了正式版主要变化: 1、增加IWorkItem.jumpToEx(...)方法，取消了当前环节和目标环节必须在同一条执行线的限制，使得自由流更加自由 2、增加IT
Python向脚本传参 daizj python 脚本传参
如果想对python脚本传参数，python中对应的argc, argv(c语言的命令行参数)是什么呢？需要模块：sys 参数个数：len(sys.argv) 脚本名： sys.argv[0] 参数1： sys.argv[1] 参数2： sys.argv[
管理用户分组的命令gpasswd dongwei_6688 passwd
NAME： gpasswd - administer the /etc/group file SYNOPSIS： gpasswd group gpasswd -a user group gpasswd -d user group gpasswd -R group gpasswd -r group gpasswd [-A user,...] [-M user,...] g
郝斌老师数据结构课程笔记 dcj3sjt126com 数据结构与算法
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
yii2 cgridview加上选择框进行操作 dcj3sjt126com GridView
页面代码 <?=Html::beginForm(['controller/bulk'],'post');?> <?=Html::dropDownList('action','',[''=>'Mark selected as: ','c'=>'Confirmed','nc'=>'No Confirmed'],['class'=>'dropdown',])
linux mysql fypop linux
enquiry mysql version in centos linux yum list installed | grep mysql yum -y remove mysql-libs.x86_64 enquiry mysql version in yum repositoryyum list | grep mysql oryum -y list mysql* install mysq
Scramble String hcx2013 String
Given a string s1, we may represent it as a binary tree by partitioning it to two non-empty substrings recursively. Below is one possible representation of s1 = "great":
跟我学Shiro目录贴 jinnianshilongnian 跟我学shiro
历经三个月左右时间，《跟我学Shiro》系列教程已经完结，暂时没有需要补充的内容，因此生成PDF版供大家下载。最近项目比较紧，没有时间解答一些疑问，暂时无法回复一些问题，很抱歉，不过可以加群（334194438/348194195）一起讨论问题。 ----广告-----------------------------------------------------
nginx日志切割并使用flume-ng收集日志 liyonghui160com
nginx的日志文件没有rotate功能。如果你不处理，日志文件将变得越来越大，还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件，不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前，nginx还是会向你重命名的文件写日志，linux是靠文件描述符而不是文件名定位文件。第二步向nginx主
Oracle死锁解决方法 pda158 oracle
　select p.spid,c.object_name,b.session_id,b.oracle_username,b.os_user_name from v$process p,v$session a, v$locked_object b,all_objects c where p.addr=a.paddr and a.process=b.process and c.object_id=b.
java之List排序 shiguanghui list排序
在Java Collection Framework中定义的List实现有Vector，ArrayList和LinkedList。这些集合提供了对对象组的索引访问。他们提供了元素的添加与删除支持。然而，它们并没有内置的元素排序支持。　　你能够使用java.util.Collections类中的sort()方法对List元素进行排序。你既可以给方法传递
servlet单例多线程 utopialxw 单例多线程 servlet
转自http://www.cnblogs.com/yjhrem/articles/3160864.html 和 http://blog.chinaunix.net/uid-7374279-id-3687149.html Servlet 单例多线程 Servlet如何处理多个请求访问？Servlet容器默认是采用单实例多线程的方式处理多个请求的：1.当web服务器启动的

人工智能演义第二回：遇险阻创始人早逝，敢坚持三剑客逆袭

你可能感兴趣的:(人工智能,深度学习,图灵奖得主,人力资本)