MemRay

李航：深度学习还局限在复杂的模式识别上

转载自：http://www.csdn.net/article/2015-07-03/2825125

华为技术有限公司诺亚方舟实验室主任李航认为，机器学习、数据挖掘和人工智能的研究，对华为未来的智能通信网络、智能企业管理、智能信息助手三个应用方向很有帮助，比如机器学习对SDN的控制能力、网络优化、人机交互、跨国交流等，都可以发挥很大的作用。

诺亚方舟实验室已经将采用深度学习（DL）提升自然语言处理（NLP）的能力（DL4NLP）作为一个研究重点，包括自然语言对话（包括知识问答）、机器翻译和图片搜索，实现以往的自然语言处理技术无法达到的效果。

李航认为，深度学习时代的到来是统计学习发展的必然趋势，今后若干年里深度学习还将是研究的热点，会有很多新技术开发出来，利用深度学习的应用也会有革命性的进步。尽管深度学习目前还停留在“复杂的模式识别（pattern recognition）”层面上，但它仍是最有效的方法，会极大推动人工智能的进步。

“如果把实现人工智能的理想比喻为登月，那么有些方法看起来好像是在爬树、在登山，基本不可行，而深度学习的方法好像是在做火箭，它至少能把我们带出地球大气圈，虽然可能还不能达到登月的目的。”他说。

李航还透露，诺亚方舟实验室在开发一个GPU、CPU与FPGA的异构深度学习平台。详情敬请期待后续报道。

李航采访实录

CSDN：诺亚实验室目前在ML/DL领域主要有哪些研究方向？具体的应用场景是什么？

李航：诺亚方舟实验室的研究领域是机器学习、数据挖掘、人工智能。我们特别聚焦在几大研究方向，包括深度学习、强化学习、流数据挖掘、图数据挖掘、时空数据挖掘、语音和语言处理、信息与知识管理。

我们的研究由三大应用牵引：智能通信网络、智能企业管理、智能信息助手，目标是为华为的未来发展做出重大贡献。华为的主要产品是通信设备、数据中心、智能手机；我们坚信大数据分析、人工智能能够使这些产品更加智能化，为用户提供全新的、更好的体验，实现跨越式的发展和进步。

智能通信网络包括SDN、网络规划与网络优化、网络维护三方面。SDN（Software Defined Networks）是未来网络的发展方向，其基本想法是将通信网络中的软件硬件剥离，将网络当作一个巨大的计算机来运行；用数据驱动、机器学习的方法帮助提升SDN的控制能力是很自然的选择，会极大提升网络的性能与效率。通信网络也看作是一个超大的图（graph），当中有大量数据在流动，怎样对网络的性能进行规划和优化是网络建设中的大问题；而数据驱动、机器学习的方法会帮助做出最优的选择。通信网络需要许多工程师维护，保证线路的畅通与高质量的通信实施，如何帮助工程师们迅速排除网络故障是通信领域的一个大问题；机器学习、人工智能技术可以帮助工程师做网络质量的预测，故障的自动诊断及自动排除。

智能企业管理也是个重要方向。对每个企业来说，客户、产品、员工都是其宝贵财富，而围绕着这些实体现在有大量的数据积累下来，如何利用这些大数据，做有效的客户关系管理、供应链管理、人力资源管理，对每个企业来说都是至关重要的，因为可以极大地提升企业的效益，企业的竞争力。从另一个角度看，企业中的知识、信息在运营中也以大数据的形式积累下来，包括结构化的数据和非结构化的数据，对每个企业来说这都是宝贵的资源，如何有效地利用这些信息与知识，挖掘更多的知识，构成了一个巨大的挑战，也提供了一个巨大的机会。还有，帮助员工之间、客户与企业之间提高交流的效率，继而提高企业的效益与竞争力，也是一个重要的问题，如像在华为这样的跨国公司，需要帮助员工克服语言障碍进行顺畅的交流。数据挖掘、机器学习等是帮助解决所有这些问题的最佳手段。

我们预见智能手机将会成为我们每个人的智能信息助手，提供信息推荐、信息抽取、信息管理、信息检索与问答、机器翻译、自然语言对话等几方面的功能。我们处在信息爆炸的时代，信息助手可以将外部的信息进行过滤把最有用的信息推荐给用户；用户与不同的人、物进行交流，信息助手可以将这其中的重要信息进行抽取；个人的信息也处于泛滥状态，如有大量的照片，信息助手可以帮助用户有效地管理个人信息；用户时常会遇到问题，信息助手可以帮助解答问题，访问信息；地球变得越来越小，用户需要与讲各种语言的人进行交流，信息助手可以给用户做翻译，克服语言障碍；作为一个贴心的“伙伴”，信息助手可以自如地用自然语言与用户交流。毫无疑问，智能信息助手需要先进的机器学习、人工智能技术构建。

CSDN：诺亚方舟实验室用DL做机器翻译获得了不错的效果，您认为其中的决定性因素是什么？您如何看到DL在NLP方面的潜力，是否会完全取代传统算法？

李航：用深度学习提高自然语言处理的能力是我们深度学习研究的一个重点，我们称之为Deep Learning for Natural Language Processing（DL4NLP），最近取得了不少的成果，可以说在业界处于领先地位。在DL4NLP中，我们主要考虑三个应用，自然语言对话（包括知识问答）、机器翻译、图片搜索。这里我想介绍一下前两个。

深度学习最近三、四年有了长足的发展，“深度强化学习”、“神经图灵机”等许多新的概念被提出。深度学习已不局限于模式识别，如图像识别、语音识别等，事实上已扩展到语言处理、知识利用、逻辑推理、自动控制等其他任务上。特别是基于深度学习的自然语言处理是当前深度学习研究的一个热点，诺亚实验室也希望自己在这方面做出重大贡献。

我们应该是用深度学习做自然语言对话最早的团队。自然语言对话包括单轮与多轮的，方法分基于检索的和基于生成的；可以认为，传统的自动问答系统属于单轮的、基于检索的特殊对话系统。我们在NTCIR组织了一个比赛，聚焦在中文、日文的单轮对话上，大家感兴趣的话可以参加。

我们用深度学习开发了几个模型做自然语言对话，包括单轮和多轮的，检索和生成的。这里介绍一下将在今年的自然语言处理顶会ACL发表的一篇论文。这个工作中我们开发了神经应答机（Neural Responding Machine），是一个单轮的对话系统，基于RNN(Recurrent Neural Network)模型，用编码器将问句转换成中间表示，再用解码器将中间表示转换成回答。用500万对话数据训练的该系统可以达到非常好的对话效果，自然回答的比率占70%以上。比如你说：“我想买一部三星手机”，系统回答：“还是支持一下国产的吧”。注意系统的回答是它看了许多对话的例子后自动生成的，而不是延用对话数据中已有的回答。系统能达到这种“智能”水平，确实让人惊叹。纯粹用数据驱动的方法建立起对话系统，以往的自然语言处理技术基本做不到，可以说深度学习给自然语言对话带来的技术进步是革命性的。

机器翻译经历了基于规则的和基于统计模型的两代技术，大家现在努力尝试用深度学习提高翻译的精度。有两种想法，一个是将深度模型集成到已有的统计翻译模型的框架中，比如BBN公司提出的方法就属于这类。另一个是彻底推翻传统的统计翻译模型，完全使用深度学习进行机器翻译，实现下一代技术。大家现在关心的是后者是否可以真正成为现实；事实上，在这方面谷歌、蒙特利尔大学各自提出了不同的模型，取得了重大的进展，受到广泛关注。

诺亚实验室在机器翻译方面的研究，采用两路齐头并进的策略，因为有许多问题需要探索，一方面研究完全基于深度学习的方法，另一方面也研究深度学习与传统模型融合的方法。我们也在与计算所、哈工大深研院合作。你提到的我们的机器翻译工作，都属于后者，有两篇今年的ACL论文。其中我们利用CNN（Convolutional Neural Network）改进了统计翻译模型中的翻译模型、语言模型，BLEU分数整体有两个点的提高，翻译模型胜过BBN模型。我们还在探索到底什么样的方法能对机器翻译带来巨大的进步。细节大家可以参照相关的CSDN报道。

我们目前为止的DL4NLP的工作，重点放在了句子的语义表示学习上，考虑用CNN或RNN模型在对话、翻译等问题中的应用。我们提出了一系列的模型，这些模型，以及业界已有的模型，到底在什么条件下工作得更好，还需要今后的研究去验证。我们DL4NLP的研究，今后会朝几个方向推动，考虑的还是以上的应用，但会把方法做得更深入，具体地关注以下问题：更复杂的深度模型（如多轮对话模型），深度模型与知识的融合，外部记忆的增强，深度学习与推理的结合等等。这些方向还有许多有意思的问题值得去探索。

CSDN：能否介绍诺亚搭建深度学习系统的过程，采用了哪些工具？为什么如此选择？

李航：诺亚实验室深度学习的研究主要是用GPU集群。我们也在开发一个深度学习的平台，是一个GPU、CPU与FPGA的异构平台。关于我们的深度学习平台，我们近期会有一些详细介绍。

CSDN：您在之前的访谈中谈到ML还需要提高学习能力，做到触类旁通、无师自通，您认为目前的挑战在哪里？技术路线上应当如何一步一步地实现这种能力？

李航：统计学习是现在机器学习的主流，大家也看到了它在许许多多应用中的成功案例。特别是现在处于大数据时代，又赶上人工智能的热潮，大家对机器学习技术的期待达到了空前的高度。但是我们应该清楚地认识到统计学习比起人的学习能力还有很多局限。比如，人的举一反三、触类旁通、无师自通的学习能力是现在的统计学习所远远不能达到的。当然，统计学习也有一些人不具备的学习能力，如大规模计算（对应着思考）、大规模存储（对应着记忆）。

深度学习其实是统计学习的一部分，或者说一个分支，其特点是复杂模型（复杂神经网络）的统计学习。深度学习时代的到来这也可以说是统计学习发展的必然趋势，因为现在数据更多了，计算机能力更强了，简单的问题用简单的方法已解决得差不多了。可以预见今后若干年里深度学习还将是研究的热点，会有很多新技术开发出来，利用深度学习的应用也会有革命性的进步。

但是，我们也应该看到，深度学习，至少是目前为止的深度学习，还是停留在“复杂的模式识别（pattern recognition）”层面上，我们有时感到它很智能，如上述的自然语言对话，但是它还只是总结并记忆住了复杂的模式，给出看似非常智能的结果。虽然我们上面说到，深度学习已扩展到推理、控制等任务，但目前为止的方法也还是局限在复杂模式识别的范围内。只是它学到的模式太复杂了，已超出了我们直观想象范围，我们感到很了不起。

Hinton、LeCun、Bengio三人最近在Science杂志上发表了题为“Deep Learning”的论文，他们预见非监督学习、语言处理、逻辑推理将是深度学习的重要发展方向。CSDN上也刊登了译文，大家可以参考。

今后的机器学习、深度学习会发展到什么水平，我们现在还看不太清楚，但有一点我们是深信不疑的，那就是它会极大地推动人工智能的进步。沿着这条路到底能走多远，是我们想知道的，也是让我们感到兴奋的。如果把实现人工智能的理想比喻为登月，那么有些方法看起来好像是在爬树、在登山，基本不可行，而深度学习的方法好像是在做火箭，它至少能把我们带出地球大气圈，虽然可能还不能达到登月的目的。

CSDN：对于机器学习的入门和进阶，您有哪些好的建议？

李航：机器学习的本质是“数学化的数据学”。所以，对机器学习技术的掌握，首先需要有好的数学基础，拥有足够的概率统计、计算理论、信息理论的知识；其次需要对数据处理有丰富的经验，经历足够多的开发、实验、观察。因为机器学习涉及的面非常广，所以需要一步一步地积累，不断地学习与钻研，这对初学者与专业人员都是一样的。我也是在这样鞭策自己。

机器学习的入门教材，我觉得最好的是Andrew Ng的机器学习讲座，他讲得确实很好，把重要的、基本的概念全部覆盖了，而且内容准确与清晰。中文的教材，据说周志华老师将出版一本入门的书，大家可以期待。

我写的《统计学习方法》并不是针对初学者的，目的是把最基本最核心的概念整理出来，让大家可以随时学习、参考，特别是对做应用的人。是工具书的定位，对有一定基础的人来说，可以成为入门书，但不适合所有人。

我自己经常参考的，统计学方面Hastie、Tibshirani 、Friedman的书，机器学习方面Bishop的书，信息理论是Cover与Thomas的书，都是领域的权威。机器学习领域太广，不太可能有一本书满足所有人的需求，大家可以根据自己的情况，有选择地学习。另外，现在网上有大量的学习资料，论文、书籍、代码、讲座、博客，大家都可以去有效地利用。

李航

华为技术有限公司诺亚方舟实验室主任，北京大学、南京大学兼职教授

日本京都大学电气电子工程系毕业，日本东京大学获得计算机科学博士学位。曾就职于日本NEC公司中央研究所，任研究员，以及微软亚洲研究院，任高级研究员与主任研究员。李航博士的研究方向包括信息检索，自然语言处理，统计机器学习，及数据挖掘。一直活跃在相关学术领域，曽出版过三部学术专著，并在顶级国际学术会议和国际学术期刊上发表过上百篇学术论文，拥有40项授权美国专利。

机器学习、基础算法、python常见面试题必知必答系列大全：（面试问题持续更新） promptllm人工智能
基础算法常见面试篇1.1过拟合和欠拟合常见面试篇一、过拟合和欠拟合是什么？二、过拟合/高方差（overfiting/highvariance）篇2.1过拟合是什么及检验方法？2.2导致过拟合的原因是什么？2.3过拟合的解决方法是什么？三、欠拟合/高偏差（underfiting/highbias）篇3.1欠拟合是什么及检验方法？3.2导致欠拟合的原因是什么？3.3过拟合的解决方法是什么？1.2Bat
从System Prompt来看GPT-3.5到GPT-4的进化 herosunly 大模型 system prompt gpt-3 chatgpt gpt4 gpt4o
大家好，我是herosunly。985院校硕士毕业，现担任算法t研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了从SystemPrompt来看GPT-3.5到GPT-4的进化之路，希
R语言机器学习算法实战系列（十九）特征选择之Monte Carlo算法（Monte Carlo Feature Selection）生信学习者1 R语言机器学习实战 r语言机器学习算法数据分析数据挖掘数据可视化人工智能
禁止商业或二改转载，仅供自学使用，侵权必究，如需截取部分内容请后台联系作者!文章目录介绍原理步骤下载数据加载R包导入数据数据预处理数据分割MCFS运行MCFS-ID过程混淆矩阵重要特征的RI最小阈值距离与共同部分收敛特征重要性排序选择重要特征构建特征依赖图提取重要特征基于重要特征构建随机森林模型混淆矩阵评估模型AUC曲线刻画模型在训练和测试数据集的表现总结系统信息介绍特征选择（FeatureSel
F#语言的图形用户界面沈霁晨包罗万象 golang 开发语言后端
F#语言的图形用户界面开发引言随着软件开发的日益复杂化，图形用户界面（GUI）在现代应用程序中的重要性不可忽视。它提供了一种直观的方式，使用户能够与应用程序进行交互。F#语言作为一种函数式编程语言，近年来在开发领域越来越受到关注，尤其是在数据分析和机器学习领域。但F#同样能够用于图形用户界面的开发，尤其是结合.NET平台及其丰富的库。本文将深入探讨F#语言在图形用户界面开发中的应用，包括常用的框架
【Springboot】——响应与分层解耦架构 Y小夜架构 spring boot 后端 java spring
博主现有专栏：C51单片机（STC89C516），c语言，c++，离散数学，算法设计与分析，数据结构，Python，Java基础，MySQL，linux，基于HTML5的网页设计及应用，Rust（官方文档重点总结），jQuery，前端vue.js，Javaweb开发，设计模式、Python机器学习、Springboot等主页链接：Y小夜-CSDN博客目录响应响应数据✨@ResponseBody✨G
如何学习爬虫技术：从入门到实践的全面指南 CodeJourney. 学习爬虫
一、引言在当今数字化时代，网络上的数据量呈爆炸式增长，能够高效地获取和处理这些数据变得愈发重要。爬虫技术作为一种从网页中自动提取信息的手段，在各个领域都有着广泛的应用，无论是数据分析、机器学习的数据集构建，还是市场调研、价格监测等商业场景，掌握爬虫技术都能为你打开一扇获取丰富信息资源的大门。然而，对于初学者来说，面对琳琅满目的工具和复杂的网络环境，可能会感到无从下手。本文将带你逐步深入了解爬虫技术
将机器学习算法移植到低端MCU上的实用指南为也科技 AI边缘计算机器学习算法单片机嵌入式硬件 python c语言物联网
将机器学习算法移植到低端MCU上的实用指南在物联网（IoT）和边缘计算迅猛发展的今天，将智能功能嵌入到资源有限的低端单片机（MicrocontrollerUnit,MCU）上，已经成为许多开发者和工程师追求的目标。然而，这一过程充满挑战，但只要掌握正确的方法，也能在低端MCU上实现高效的机器学习应用。本文将以具体的案例为例，逐步讲解每个步骤的实际操作，包括所需的工具、命令和代码示例，帮助开发者成功
Python中实现多层感知机（MLP）的深度学习模型 Echo_Wish Python 笔记从零开始学Python人工智能 python 深度学习开发语言
深度学习已经成为机器学习领域的一个热门话题，而多层感知机（MLP）是最基础的深度学习模型之一。在这篇教程中，我将向你展示如何使用Python来实现一个简单的MLP模型。什么是多层感知机（MLP）？多层感知机（MLP）是一种前馈神经网络，它包含一个输入层、一个或多个隐藏层以及一个输出层。每个层都由一系列的神经元组成，神经元之间通过权重连接。MLP能够学习输入数据的非线性特征，因此在复杂问题的建模中非
AI Agent：深度解析与未来展望码事漫谈 c++人工智能
一、AIAgent的前世：从概念到萌芽（一）早期探索AIAgent的概念可以追溯到20世纪50年代，早期的AI研究主要集中在简单的规则系统上，这些系统的行为是确定性的，输出由输入决定。随着时间的推移，AI逐渐能够处理不确定性，1990年代机器学习的兴起为AIAgent的发展奠定了基础，神经网络技术的突破为深度学习的发展提供了可能。（二）技术突破2017年后，大语言模型（LLM）的出现推动了AIAg
【深度学习基础】线性神经网络 | softmax回归的简洁实现 Francek Chen PyTorch深度学习深度学习神经网络回归 softmax 人工智能
【作者主页】FrancekChen【专栏介绍】⌈⌈⌈PyTorch深度学习⌋⌋⌋深度学习(DL,DeepLearning)特指基于深层神经网络模型和方法的机器学习。它是在统计机器学习、人工神经网络等算法模型基础上，结合当代大数据和大算力的发展而发展出来的。深度学习最重要的技术特征是具有自动提取特征的能力。神经网络算法、算力和数据是开展深度学习的三要素。深度学习在计算机视觉、自然语言处理、多模态数据
【强化学习】Unity ML-Agents框架大雨淅淅人工智能 unity 游戏引擎机器学习人工智能深度学习学习
目录一、UnityML-Agents简介二、安装与配置三、基础使用四、关键技术点五、进阶技巧与案例分析六、学习资源七、常见问题与解决方案八、实战项目与案例研究九、未来展望与发展趋势十、结语一、UnityML-Agents简介UnityML-Agents是一个由UnityTechnologies开发的开源项目，它允许开发者利用机器学习技术来训练虚拟环境中的智能代理（Agent）。无论是希望创建更逼真
AIGC视频生成模型：Meta的Emu Video模型好评笔记 #Meta AIGC-视频 AIGC 机器学习人工智能 transformer 论文阅读深度学习面试
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍Meta的视频生成模型EmuVideo，作为Meta发布的第二款视频生成模型，在视频生成领域发挥关键作用。优质专栏回顾：机器学习笔记深度学习笔记多模态论文笔记AIGC—图像文章目录论文摘要引言相关工作文本到图像（T2I）扩散模型视频生成/预测文本到视频（T2V）生成分解生成方法预备知识EmuVideo生成步骤图
【Python】已解决ModuleNotFoundError: No module named ‘tensorflow‘ 屿小夏 python tensorflow neo4j
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
通过python对excel进行数据分析和可视化新叶猫长那么可爱干什么 python的学习 python
importpandasaspdimportmatplotlib.pyplotaspltimportseabornassnsfile_path="C:\\Users\\86138\\Desktop\\book_list-计算机-机器学习-linux-android-数据库-互联网.xlsx"data=pd.read_excel(file_path)need_data=data[['书名','评分'
【Python】已解决：ModuleNotFoundError: No module named ‘tensorflow‘ 屿小夏 python tensorflow neo4j
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
智能体在环境中学习和作出决策由数入道人工智能人工智能智能体深度学习
一、概述强化学习是一类通过与环境交互获取反馈并不断优化决策策略的机器学习方法。与监督学习和无监督学习不同，强化学习直接面向序列决策问题，核心目标是找到使智能体（Agent）在环境中获得最大化累积奖励（CumulativeReward）的策略。其理论基础通常以马尔可夫决策过程（MarkovDecisionProcess,MDP）为框架。MDP的五元组通常表示为(S,A,P,R,γ)(S,A,P,R,
宇宙规律对可转移量子强化学习架构的启示 AI天才研究院计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
第1章引言：宇宙规律与量子强化学习架构1.1问题背景宇宙规律是指宇宙中普遍存在的自然规律，如物理学中的万有引力定律、量子力学中的不确定性原理等。这些规律对宇宙的运行和演化起着决定性的作用。随着科技的发展，人们开始意识到这些宇宙规律可能对人工智能领域，尤其是量子强化学习架构的设计和优化有着深远的启示。量子强化学习是一种结合了量子计算和强化学习的新型机器学习方法。它利用量子计算机的优势，在训练和优化模
C# 与 Python 代码互相调用的实践一只小灿灿 net Python c#python
一、引言在当今的软件开发领域，不同的编程语言都有其独特的优势和适用场景。C#是一种功能强大、面向对象的编程语言，主要应用于Windows平台开发、企业级应用开发以及游戏开发（借助Unity引擎等）等领域；而Python则以其简洁的语法、丰富的库以及在数据科学、机器学习、自动化脚本等众多方面的出色表现备受青睐。在实际的项目开发中，有时候我们希望能够结合这两种语言的优势，实现C#与Python代码的互
清华和哈工大把大模型量化做到了1比特，把世界顶尖多模态大模型开源大模型量化个人电脑运行！机器人领域首个开源视觉-语言操作大模型，激发开源VLMs更大潜能，视 Mamba速度提升2.8倍，内存能省87% 代码讲故事机器人智慧之心 Mamba 机器人量化大模型开源视觉 VLMs
清华和哈工大把大模型量化做到了1比特，把世界顶尖多模态大模型开源大模型量化个人电脑运行！机器人领域首个开源视觉-语言操作大模型，激发开源VLMs更大潜能，视Mamba速度提升2.8倍，内存能省87%。清华和哈工大把大模型量化做到了1比特。在追求更高效的机器学习模型部署时，模型量化技术应运而生，它通过降低权重矩阵的位宽来显著减少大型语言模型的存储和计算需求。我们一般的双精度浮点型double是64位
【机器学习】多模态AI——融合多种数据源的智能系统 2的n次方_ 人工智能
随着人工智能的快速发展，单一模态（如文本、图像或语音）已经不能满足复杂任务的需求。多模态AI（MultimodalAI）通过结合多种数据源（如文本、图像、音频等）来提升模型的智能和表现，适用于多样化的应用场景，如自动驾驶、医疗诊断、跨语言翻译等。一、多模态AI简介多模态AI是一种将不同形式的数据（如文本、图像、音频等）融合在一起的技术，旨在让模型从多个维度感知和理解信息。这种融合使得AI系统能够从
Python3.13来了！编程爱好者必看 Python之栈人工智能 python 开发语言
Python3.13于近期发布，其中包含大量重要更新。Python作为机器学习、数据科学和人工智能领域使用最广泛的编程语言，一直在不断发展，以满足这些领域日益增长的需求。最新发布的Python3.13提供了多项具有影响力的改进，旨在提高性能和生产力，对于从事ML和AI项目的开发人员来说是一个重要的里程碑。Python在ML和AI领域的主导地位主要归功于它的简单性、广泛的库支持和庞大的社区。然而，随
Transformer入门（1）transformer及其编码器-解码器通信仿真实验室 Google BERT 构建和训练NLP模型 bert transformer 人工智能 NLP 自然语言处理
文章目录1.Transformer简介2.Transformer的编码器-解码器架构3.transformer的编码器1.Transformer简介Transformer模型是一种用于自然语言处理的机器学习模型，它在2017年由Google的研究者提出，并在论文《AttentionisAllYouNeed》中详细描述。Transformer模型的核心创新在于其采用了自注意力（self-attent
【人工智能 | 大数据】基于人工智能的大数据分析方法用心去追梦人工智能大数据数据分析
基于人工智能（AI）的大数据分析方法是指利用机器学习、深度学习和其他AI技术来分析和处理大规模数据集。这些方法能够自动识别模式、提取有用信息，并做出预测或决策，从而帮助企业和组织更好地理解市场趋势、客户行为以及其他关键因素。以下是几种主要的基于AI的大数据分析方法：机器学习模型：通过训练算法让计算机从历史数据中学习并做出预测或分类。常见的机器学习技术包括监督学习（如回归分析、支持向量机）、非监督学
基于MATLAB机器学习、深度学习实践技术应用梦想的初衷~ 机器学习人工智能 matlab 机器学习深度学习
近年来，MATLAB在机器学习和深度学习领域的发展取得了显著成就。其强大的计算能力和灵活的编程环境使其成为科研人员和工程师的首选工具。在无人驾驶汽车、医学影像智能诊疗、ImageNet竞赛等热门领域，MATLAB提供了丰富的算法库和工具箱，极大地推动了人工智能技术的应用和创新。原文链接https://mp.weixin.qq.com/s?__biz=Mzg2NDYxNjMyNA==&mid=224
降维算法：主成分分析一个人在码代码的章鱼数学建模机器学习概率论
主成分分析一种常用的数据分析技术，主要用于数据降维，在众多领域如统计学、机器学习、信号处理等都有广泛应用。主成分分析是一种通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量（即主成分）的方法。这些主成分按照方差从大到小排列，方差越大，包含的原始数据信息越多。通常会选取前几个方差较大的主成分，以达到在尽量保留原始数据信息的前提下降低数据维度的目的。它通过将多个指标转换为少数几个主成分,
Python从0到100（八十三）：神经网络-使用残差网络RESNET识别手写数字是Dream呀 python 神经网络网络
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
【人工智能】Python实战：构建高效的多任务学习模型蒙娜丽宁 Python杂谈 AI 人工智能 python 学习
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界多任务学习（Multi-taskLearning,MTL）作为机器学习领域中的一种重要方法，通过在单一模型中同时学习多个相关任务，不仅能够提高模型的泛化能力，还能有效利用任务间的共享信息。本文深入探讨了多任务学习的基本概念、优势及其在实际应用中的重要性。
基于 Python 的机器学习模型部署到 Flask Web 应用：从训练到部署的完整指南 m0_74825223 python 机器学习 flask
目录引言技术栈步骤一：数据预处理步骤二：训练机器学习模型步骤三：创建FlaskWeb应用步骤四：测试Web应用步骤五：模型的保存与加载保存模型加载模型并在Flask中使用步骤六：Web应用的安全性考量示例：简单的输入验证示例：自定义错误处理示例：使用Flask-JWT-Extended进行认证结论参考资料引言在当今数据驱动的时代，机器学习模型已经广泛应用于各行各业，从金融、医疗到教育等领域。然而，
机器学习：scikit-learn 和 Jupyter Notebook（推荐初学者使用google colab） wyc9999ww 机器学习 scikit-learn jupyter 人工智能 python
对于初学者来说，scikit-learn是一个理想的机器学习入门工具。不仅提供了丰富的算法和功能，还通过一致的API设计，确保能够快速上手并进行各种机器学习任务。通过使用scikit-learn，可以专注于理解和实践机器学习的核心概念，而不必过多担心底层实现细节。所以scikit-learn能轻松实现从数据预处理到模型训练和评估的完整流程。此外在推荐一个适合初学者的深度学习平台工具googleco
有趣的python代码实例_Python之路：200个Python有趣的小例子一网打尽 weixin_39845406 有趣的python代码实例
概述博主最近在学习python，看完了一整套学习视频，然后呃呃呃，还是用不太流畅。碰巧在全球最大的同性交友论坛GayHub(呸！是开源代码托管平台Github)上面发现了一个项目，该项目列举了200多个Python小例子，Python基础、Python坑点、Python字符串和正则、Python绘图、Python日期和文件、Web开发、数据科学、机器学习、深度学习、TensorFlow、Pytor
Spring4.1新特性——综述 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Schema与数据类型优化 annan211 数据结构 mysql
目前商城的数据库设计真是一塌糊涂，表堆叠让人不忍直视，无脑的架构师，说了也不听。在数据库设计之初，就应该仔细揣摩可能会有哪些查询，有没有更复杂的查询，而不是仅仅突出很表面的业务需求，这样做会让你的数据库性能成倍提高，当然，丑陋的架构师是不会这样去考虑问题的。选择优化的数据类型 1 更小的通常更好更小的数据类型通常更快，因为他们占用更少的磁盘、内存和cpu缓存，
第一节 HTML概要学习 chenke html Web css
第一节 HTML概要学习 1. 什么是HTML HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写，它规定了自己的语法规则，用来表示比“文本”更丰富的意义，比如图片，表格，链接等。浏览器（IE,FireFox等）软件知道HTML语言的语法，可以用来查看HTML文档。目前互联网上的绝大部分网页都是使用HTML编写的。打开记事本输入一下内
MyEclipse里部分习惯的更改 Array_06 eclipse
继续补充中---------------------- 1.更改自己合适快捷键windows-->prefences-->java-->editor-->Content Assist--> Activation triggers for java的右侧“.”就可以改变常用的快捷键选中 Text
近一个月的面试总结 cugfy 面试
本文是在学习中的总结，欢迎转载但请注明出处：http://blog.csdn.net/pistolove/article/details/46753275 前言打算换个工作，近一个月面试了不少的公司，下面将一些面试经验和思考分享给大家。另外校招也快要开始了，为在校的学生提供一些经验供参考，希望都能找到满意的工作。
HTML5一个小迷宫游戏 357029540 html5
通过《HTML5游戏开发》摘抄了一个小迷宫游戏，感觉还不错，可以画画，写字，把摘抄的代码放上来分享下，喜欢的同学可以拿来玩玩！ <html> <head> <title>创建运行迷宫</title> <script type="text/javascript"
10步教你上传githib数据张亚雄 git
官方的教学还有其他博客里教的都是给懂的人说得，对已我们这样对我大菜鸟只能这么来锻炼，下面先不玩什么深奥的，先暂时用着10步干净利索。等玩顺溜了再用其他的方法。操作过程（查看本目录下有哪些文件NO.1）ls （跳转到子目录NO.2）cd+空格+目录（继续NO.3）ls （匹配到子目录NO.4）cd+ 目录首写字母+tab键+（首写字母“直到你所用文件根就不再按TAB键了”）（查看文件
MongoDB常用操作命令大全 adminjun mongodb 操作命令
成功启动MongoDB后，再打开一个命令行窗口输入mongo，就可以进行数据库的一些操作。输入help可以看到基本操作命令，只是MongoDB没有创建数据库的命令，但有类似的命令如：如果你想创建一个“myTest”的数据库，先运行use myTest命令，之后就做一些操作（如：db.createCollection('user')）,这样就可以创建一个名叫“myTest”的数据库。一
bat调用jar包并传入多个参数 aijuans
下面的主程序是通过eclipse写的： 1.在Main函数接收bat文件传递的参数（String[] args）如： String ip =args[0]; String user=args[1]; &nbs
Java中对类的主动引用和被动引用 ayaoxinchao java 主动引用对类的引用被动引用类初始化
在Java代码中，有些类看上去初始化了，但其实没有。例如定义一定长度某一类型的数组，看上去数组中所有的元素已经被初始化，实际上一个都没有。对于类的初始化，虚拟机规范严格规定了只有对该类进行主动引用时，才会触发。而除此之外的所有引用方式称之为对类的被动引用，不会触发类的初始化。虚拟机规范严格地规定了有且仅有四种情况是对类的主动引用，即必须立即对类进行初始化。四种情况如下：1.遇到ne
导出数据库提示 outfile disabled BigBird2012 mysql
在windows控制台下，登陆mysql，备份数据库： mysql>mysqldump -u root -p test test > D:\test.sql 使用命令 mysqldump 格式如下： mysqldump -u root -p *** DBNAME > E:\\test.sql。注意：执行该命令的时候不要进入mysql的控制台再使用，这样会报
Javascript 中的 && 和 || bijian1013 JavaScript &&||
准备两个对象用于下面的讨论 var alice = { name: "alice", toString: function () { return this.name; } } var smith = { name: "smith",
[Zookeeper学习笔记之四]Zookeeper Client Library会话重建 bit1129 zookeeper
为了说明问题，先来看个简单的示例代码： package com.tom.zookeeper.book; import com.tom.Host; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.ZooKeeper; import org.apache.zookeeper.Wat
【Scala十一】Scala核心五：case模式匹配 bit1129 scala
package spark.examples.scala.grammars.caseclasses object CaseClass_Test00 { def simpleMatch(arg: Any) = arg match { case v: Int => "This is an Int" case v: (Int, String)
运维的一些面试题 yuxianhua linux
1、Linux挂载Winodws共享文件夹 mount -t cifs //1.1.1.254/ok /var/tmp/share/ -o username=administrator,password=yourpass 或 mount -t cifs -o username=xxx,password=xxxx //1.1.1.1/a /win
Java lang包-Boolean BrokenDreams boolean
Boolean类是Java中基本类型boolean的包装类。这个类比较简单，直接看源代码吧。 public final class Boolean implements java.io.Serializable,
读《研磨设计模式》-代码笔记-命令模式-Command bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.List; /** * GOF 在《设计模式》一书中阐述命令模式的意图：“将一个请求封装
matlab下GPU编程笔记 cherishLC matlab
不多说，直接上代码 gpuDevice % 查看系统中的gpu,,其中的DeviceSupported会给出matlab支持的GPU个数。 g=gpuDevice(1); %会清空 GPU 1中的所有数据,,将GPU1 设为当前GPU reset(g) %也可以清空GPU中数据。 a=1; a=gpuArray(a); %将a从CPU移到GPU中 onGP
SVN安装过程 crabdave SVN
SVN安装过程 subversion-1.6.12 ./configure --prefix=/usr/local/subversion --with-apxs=/usr/local/apache2/bin/apxs --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr --with-openssl=/
sql　行列转换 daizj sql 行列转换行转列列转行
行转列的思想是通过case when 来实现列转行的思想是通过union all 来实现下面具体例子：假设有张学生成绩表(tb)如下: Name Subject Result 张三语文　　74 张三数学　　83 张三物理　　93 李四语文　　74 李四数学　　84 李四物理　　94 */ /* 想变成姓名 &
MySQL--主从配置 dcj3sjt126com mysql
linux下的mysql主从配置：说明：由于MySQL不同版本之间的(二进制日志)binlog格式可能会不一样，因此最好的搭配组合是Master的MySQL版本和Slave的版本相同或者更低， Master的版本肯定不能高于Slave版本。（版本向下兼容） mysql1 : 192.168.100.1 //master mysq
关于yii 数据库添加新字段之后model类的修改 dcj3sjt126com Model
rules: array('新字段','safe','on'=>'search') 1、array('新字段', 'safe')//这个如果是要用户输入的话，要加一下， 2、array('新字段', 'numerical'),//如果是数字的话 3、array('新字段', 'length', 'max'=>100),//如果是文本 1、2、3适当的最少要加一条，新字段才会被
sublime text3 中文乱码解决 dyy_gusi Sublime Text
sublime text3中文乱码解决原因：缺少转换为UTF-8的插件目的：安装ConvertToUTF8插件包第一步：安装能自动安装插件的插件，百度“Codecs33”，然后按照步骤可以得到以下一段代码： import urllib.request,os,hashlib; h = 'eb2297e1a458f27d836c04bb0cbaf282' + 'd0e7a30980927
概念了解：CGI，FastCGI，PHP-CGI与PHP-FPM geeksun PHP
CGI CGI全称是“公共网关接口”(Common Gateway Interface)，HTTP服务器与你的或其它机器上的程序进行“交谈”的一种工具，其程序须运行在网络服务器上。 CGI可以用任何一种语言编写，只要这种语言具有标准输入、输出和环境变量。如php,perl,tcl等。 FastCGI FastCGI像是一个常驻(long-live)型的CGI，它可以一直执行着，只要激活后，不
Git push 报错 "error: failed to push some refs to " 解决 hongtoushizi git
Git push 报错 "error: failed to push some refs to " . 此问题出现的原因是：由于远程仓库中代码版本与本地不一致冲突导致的。由于我在第一次git pull --rebase 代码后，准备push的时候，有别人往线上又提交了代码。所以出现此问题。解决方案： 1： git pull 2：
第四章 Lua模块开发 jinnianshilongnian nginx lua
在实际开发中，不可能把所有代码写到一个大而全的lua文件中，需要进行分模块开发；而且模块化是高性能Lua应用的关键。使用require第一次导入模块后，所有Nginx 进程全局共享模块的数据和代码，每个Worker进程需要时会得到此模块的一个副本（Copy-On-Write），即模块可以认为是每Worker进程共享而不是每Nginx Server共享；另外注意之前我们使用init_by_lua中初
java.lang.reflect.Proxy liyonghui160com
1.简介 Proxy 提供用于创建动态代理类和实例的静态方法（1）动态代理类的属性代理类是公共的、最终的，而不是抽象的未指定代理类的非限定名称。但是，以字符串 "$Proxy" 开头的类名空间应该为代理类保留代理类扩展 java.lang.reflect.Proxy 代理类会按同一顺序准确地实现其创建时指定的接口
Java中getResourceAsStream的用法 pda158 java
1.Java中的getResourceAsStream有以下几种： 1. Class.getResourceAsStream(String path) ： path 不以’/'开头时默认是从此类所在的包下取资源，以’/'开头则是从ClassPath根下获取。其只是通过path构造一个绝对路径，最终还是由ClassLoader获取资源。　　2. Class.getClassLoader.get
spring 包官方下载地址（非maven） sinnk spring
SPRING官方网站改版后，建议都是通过 Maven和Gradle下载，对不使用Maven和Gradle开发项目的，下载就非常麻烦，下给出Spring Framework jar官方直接下载路径: http://repo.springsource.org/libs-release-local/org/springframework/spring/ s
Oracle学习笔记(7) 开发PLSQL子程序和包 vipbooks oracle sql 编程
哈哈，清明节放假回去了一下，真是太好了，回家的感觉真好啊！现在又开始出差之旅了，又好久没有来了，今天继续Oracle的学习！这是第七章的学习笔记，学习完第六章的动态SQL之后，开始要学习子程序和包的使用了……，希望大家能多给俺一些支持啊！编程时使用的工具是PLSQL