深度学习技术前沿

NTT 高级科学家：光子是深度学习的未来！

作者 | Ryan Hamerly

编译 | 陈彩娴

转自：AI科技评论

近日，来自日本 NTT 研究所的高级科学家 Ryan Hamerly 在 IEEE Spectrum 上发表了一篇文章（“The Future of Deep Learning Is Photonic”），谈论了光学计算在未来的强大潜力。他解释了为何光学计算会降低神经网络计算的能耗，以及光子设备取代电子设备的可能。

Ryan Hamerly 的本科就读于加州理工学院物理专业，2016年从斯坦福大学获得应用物理学博士学位。博士毕业后，他先是在日本 NTT 研究所担任博士后研究员，与日本知名研究员 Yoshihisa Yamamoto、Shoko Utsunomiya 研究光学与量子计算，一年后又到 MIT 做了两年博士后，博士后导师为 Dirk Englund 教授。

图注：Ryan Hamerly

我们注意到，之前获得麻省理工科技评论“35岁以下科技创新35人”的中国青年科学家沈亦晨也在光子研究上有所成就。沈亦晨的博士毕业于 MIT，在2017年与 Nicholas Harris 发表了一篇如今谷歌学术引用接近1000的论文（“Deep learning with coherent nanophotonic circuits”），谈到将光学应用于机器学习任务，比如语音和图像识别。

图注：沈亦晨

在2017年的工作中，沈亦晨也曾提出一个开创性的想法，即用光子替代电子来进行神经网络计算。同年，他在创立了Lightelligence公司，一年半后开发出了世界上第一款光子芯片原型板卡，初步验证了光子的潜力。

研究背景

近年来，计算机技术被应用到许多原先需要依靠人类感官的任务中，会识别图像中的物体、转录语音、跨语言翻译、诊断疾病、玩复杂的游戏和驾驶汽车等等。

直接促成这些惊人发展的技术被称为“深度学习”。深度学习指的是一种被称为人工神经网络的数学模型。深度学习是机器学习的一个子领域，而机器学习是计算机科学下一个基于复杂模型与数据拟合的的分支。

虽然机器学习已经发展了很长时间，但深度学习是近年来才崛起，主要是因为计算资源增加、变得广泛可用，同时可以轻松收集用于训练神经网络的大量数据。算力的增长加快，但深度学习的计算需求增长得更快。这促使了工程师开发专门针对深度学习的电子硬件加速器，谷歌的张量处理单元 (TPU) 就是一个很好的例子。

在这里，我将描述一种解决该问题的新方法，就是使用光学处理器来执行神经网络计算，用光子替代电子。要了解光学如何解决神经网络的计算问题之前，我们首先要了解目前计算机如何进行神经网络的计算。

电子难以满足神经网络的计算需求

在绝大多数情况下，人工神经元是由在数字电子计算机上运行的特殊软件构建而成。这个软件会为特定的神经元输送多个输入和一个输出。每个神经元的状态都取决于其输入的加权和，这个过程会使用到一个非线性函数（称为“激活函数”）。这个神经元的输出，也就是“结果”，又会成为其他神经元的输入。

为了提高计算效率，这些神经元会被一组一组地分到不同的层中，神经元只会与相邻层的神经元连接。这样做的好处是可以使用线性代数的某些数学技巧来加快计算的速度。

这些线性代数计算是深度学习中对计算要求最高的部分，而且随着神经网络规模的增长，它们对计算的要求也会增长。训练（确定对每个神经元的输入应用哪个权重的过程）和推理（当神经网络给出想要的结果时）步骤也是同样的原理。

这些神秘的线性代数计算是怎样的？它们其实没有那么复杂。它们涉及对矩阵的运算，而矩阵只是数字的矩形数组。

这是个好消息，因为现代计算机硬件已经针对矩阵运算进行了很好的优化。在深度学习兴起很久之前，矩阵运算就已经是高性能计算的重要基础。用于深度学习的相关矩阵计算可以归结为大量的乘法和累加运算，就是将成对的数字相乘并将它们的乘积相加。

这些年来，深度学习需要越来越多的乘法累加运算。比如 LeNet，这是一个开创性的深度神经网络，主要用于图像分类。1998 年，它被证明在识别手写字母和数字方面优于其他机器技术。到了 2012 年，神经网络 AlexNet 出现，能够识别图像中数千种不同类型的物体，但它的乘法累加运算却是 LeNet 的 1600 倍。

从 LeNet 的雏形成果到 AlexNet，神经网络对计算性能的需求提高了近 11 倍。在这 14 年里，摩尔定律促进了大部分算力的增长，但目前的挑战是难以再保持过去的增长趋势，因为摩尔定律已经失去发展的动力。这时候，要提高算力，通常的解决方案是在一个问题上投入更多的计算资源，以及时间、金钱和精力。

图注：两束光线撞上一个光束分束器（蓝色方块），光束的强度与它们要相乘的数字 x 与 y 相当。离开分束器的光束照在光电探测器（椭圆形）上，提供与光强度平方成正比的电信号。将一个光电探测器信号调反，并将其与另一个信号相加，就会产生一个与两个输入的乘积成正比的信号。

所以，训练当今的大型神经网络通常会带来显著的环境问题。例如，2019 年的一项研究（“Energy and Policy Considerations for Deep Learning in NLP”）发现，训练一个特定的深度神经网络来进行自然语言处理所产生的二氧化碳排放量是汽车在整个生命周期内的驾驶所产生的二氧化碳排放量的五倍。

论文地址：https://arxiv.org/pdf/1906.02243.pdf

光学应运而生

可以肯定的是，数字电子计算机的进步促进了深度学习的蓬勃发展，但这并不意味电子计算机是执行神经网络计算的唯一机器。数十年前，当数字计算机还相对原始时，一些工程师是使用模拟计算机来解决困难的计算。随着数字电子技术的进步，那些模拟计算机被淘汰了。

但现在也许是再次使用模拟计算机的好时机，尤其是当模拟计算可以通过光学的方式来完成时。

我们知道，光纤可以支持比电线高得多的数据速率。这也是为什么从 1970 年代后期开始，所有长途通信线路都采用光纤的原因。从那时起，光数据线路取代了铜线，已实现越来越短的跨度，一路延伸到数据中心的机架到机架通信。光数据通信速度更快，能耗也更低。光学计算也有同样的优势。

但数据传播与用数据进行计算有很大的区别。这也是模拟光学所遇到的障碍。传统的计算机是基于晶体管，而晶体管是高度非线性的电路元件——这意味着它们的输出不仅与输入成正比，至少在用于计算时是这样。非线性决定了晶体管的开关，使得它们可以被塑造成逻辑门电路。这种切换很容易用电子设备来完成，所以电子设备的非线性十分重要。但光子遵循的是麦克斯韦方程，是线性的，这就意味着光学设备的输出通常与其输入成正比。

在这里，一个诀窍是利用光学设备的线性来做深度学习最依赖的部分——线性代数。

为了解释如何做到这一点，我将在这里描述这样一个光子设备：当它与一些简单的模拟电子设备耦合时，它可以将两个矩阵相乘。这种乘法将一个矩阵的行与另一个矩阵的列组合在一起。更准确地说，它将这些行和列中的数对相乘，并将它们的乘积加在一起——也就是我之前描述的乘法和累加运算。我和我在 MIT 的同事在 2019 年发表了一篇文章（“Large-Scale Optical Neural Networks Based on Photoelectric Multiplication”），解释了为什么可以光子设备做到这一点。我们正在努力构建这样一个光学矩阵乘法器。

论文地址：https://journals.aps.org/prx/abstract/10.1103/PhysRevX.9.021032

在这个光子设备中，最基础的计算单元是一个被称为“分束器”的光学元件。分束器的实际组装很复杂，但你可以把它想象成一个 45 度角的半镀银镜子。如果您从侧面向其发送一束光，分束器将允许一半光直接穿过它，而另一半则从有角度的镜子中反射，使其与入射光束成 90 度反弹。

图注：分束器

现在将第二束光垂直于第一束光照射到该分束器中，使其照射到成角度的镜子的另一侧。第二光束的一半将类似地以 90 度角透射和反射。两个输出光束将与第一个光束的两个输出成组合。所以这个分束器会有两个输入和两个输出。

要使用此设备进行矩阵乘法，你需要生成两个光束，且光束的电场强度与要相乘的两个数字成正比。我们将这些电场强度称为 x 和 y。将这两束光照射到分束器中，分束器会将这两束光合并在一起。这种特殊的分束器会产生两个输出，其电场值为 (x + y)/√2 和 (x − y)/√2。

除了分束器之外，这个模拟乘法器还需要两个简单的电子元件（两个光电探测器）来测量两个输出光束。不过，它们不测量这些光束的电场强度，而是测量光束的功率，该功率与其电场强度的平方成正比。

为什么这种联系很重要？要理解这一点，需要一些代数知识，但都是高中阶段的内容：当你对 (x + y)/√2 平方时，你会得到 (x2 + 2xy + y2)/2。当你平方 (x − y)/√2 时，你会得到 (x2 − 2xy + y2)/2。从前者中减去后者得到 2xy。

现在停下来思考这个简单数学的重要性。这意味着：如果你将一个数字编码为具有一定强度的光束，将另一个数字编码为另一种强度的光束，然后将它们通过这样的分束器发送，用光学探测器来测量两个输出，并在将它们相加之前抵消所产生的电信号之一，你就会得到一个与两个数字的乘积成正比的信号。

图注：Lightmatter 的神经网络加速器中集成的 Mach-Zehnder 干涉仪模拟显示了三种不同的状态，其中在干涉仪的两个分支中传播的光经历了不同的相对相移。

我的描述听起来像是这些光束中的每一个光束都必须保持稳定。但事实上，你可以在两个输入光束中短暂地震动光并测量输出脉冲。更好的做法是，你可以将输出信号馈送到电容器中，只要震动持续，电容器就会积累电荷。然后，你可以在相同的时间段内再次脉冲输入，编码两个要相乘的新数字。它们的产品为电容器增加了一些电荷。你可以根据需要多次重复此过程，每一次都进行一次新的乘法累加运算。

以这种方式使用脉冲光可以让你飞速执行许多此类运算。其中，最耗能的部分是读取该电容器上的电压，这时需要一个模数转换器。但是你不必在每个脉冲后都这样做。你可以等到 N 个脉冲后结束后再统一读取。这意味着：该设备可以使用相同的能量来执行 N 次乘法累加运算，不管 N 是大是小。在这里，N 对应神经网络中每层的神经元数量，很容易达到数千个，所以用光子执行神经网络计算的能耗会很少。

有时候，你也可以在输入端节省能源，因为相同的值经常被用作多个神经元的输入。它不用多次将数字转换为光（每转换一次就会消耗一次能量），而是可以一次性转换所有，产生的光束可以被分成多个电流波段。通过这种方式，输入转换的能源成本可以在多次运算中分摊。

将一束光束分成多个波段需要透镜，但透镜很难安装在芯片上。因此，我们正在开发的以光学方式执行神经网络计算的设备很可能会是一种结合高集成光子芯片与单个光学元件的混合体。

其他实践案例

我在这里概述了我和我的同事一直在追求的策略，但从光学角度解决这个问题的方法不止一种。比如，另一个很有前景的方案是基于 Mach-Zehnder 干涉仪，它结合了两个分束器和两个全反射镜，也可以用光学方式运算矩阵乘法。两家有 MIT 学术背景的初创公司 Lightmatter 和 Lightelligence（沈亦晨创办）正在开发基于 Mach-Zehnder 干涉仪的光学神经网络加速器。Lightmatter 已经制造出一个光学芯片原型，并有望在今年年底开始销售使用该芯片的光加速器板。

另一家使用光学进行计算的初创公司是 Optalysis。早在 1960 年代，光学计算的首批用途之一就是处理合成孔径雷达数据。但这有一个重大挑战，就是如何将傅立叶变换（一种数学运算）应用于要测量的数据上。当时的数字计算机一直在努力解决这些问题。即使是现在，将傅立叶变换应用于大规模数据也需要密集的计算。但是，傅立叶变换可以以光学的方式执行，只需要一个透镜（lens）——这也是多年来工程师处理合成孔径数据的方式。Optalysis 希望根据当前的需求改进这种方法，并广泛应用。

还有一家叫做 Luminous 的公司，源于普林斯顿大学，他们正致力于创建基于激光神经元的脉冲神经网络（spiking neural networks）。脉冲神经网络更像是模仿生物神经网络的运作方式，比如我们的大脑，能够使用低能量进行计算。Luminous 的硬件仍处于早期开发阶段，但结合脉冲和光学两种节能方法的潜力还是非常令人期待的！

光学的机遇与挑战

当然，目前仍有许多技术挑战需要克服。

一是要提高模拟光学计算的精度和动态范围，这方面还远不及数字电子设备所能达到的效果。这是因为这些光学处理器受到各种噪声源的影响，而且用于输入和输出数据的数模转换器和模数转换器精度有限。事实上，很难想象一个光学神经网络的运行精度超过 8 到 10 位。虽然存在 8 位电子深度学习硬件（比如 Google 的 TPU），但这个行业还需要更高的精度，尤其是用于神经网络训练时。

将光学元件集成到一块芯片上也很难。由于这些元件的尺寸为数十微米，它们无法像晶体管一样进行紧密封装，所以目标芯片的面积也会加大。2017年，来自 MIT 的团队（沈亦晨为一作）就针对这个问题发表了一篇工作（“Deep learning with coherent nanophotonic circuits”），谈到一种尺寸为 1.5 毫米的芯片。即使是最大的芯片也不会超过几平方厘米，这限制了可以用这种方式并行处理的矩阵的大小。

论文地址：https://www.nature.com/articles/nphoton.2017.93.epdf

在计算机的架构方面，光学研究人员还有许多其他问题要解决。但可以肯定的是，至少在理论上，光学有希望将深度学习的发展加速几个数量级。

基于当前可用于各种组件（光调制器、检测器、放大器、模数转换器）的技术，我们有理由相信，神经网络计算的能源效率可以比当今的电子处理器提高 1,000 倍。如果用新兴的光学技术作出更激进的假设，神经网络计算的能源效率甚至可能提高一百万倍。而且，由于电子处理器的功率有限，这些能源效率的进步很可能会转化为相应的速度改进。

模拟光学计算中的许多概念已有数十年历史。有些概念的诞生甚至早于硅计算机。光学矩阵乘法、甚至光学神经网络的首次出现甚至可以追溯到1970年代。但当时这种方法并没有流行起来。但如今时代不同，光学计算的命运可能会有所改变，原因主要有三点：

首先，如今深度学习有真正的用途，而不仅仅是学术上的好奇；
其次，我们不能仅仅依靠摩尔定律来改进电子产品；
最后，我们有了前几代人没有的新技术：集成光子学。

这些因素表明，光神经网络将真正到来，而且，神经网络计算的未来可能是光子的。

原文链接：

https://spectrum.ieee.org/computing/hardware/the-future-of-deep-learning-is-photonic?utm_source=dlvr.it&utm_medium=twitter

推荐阅读

【重磅】斯坦福李飞飞《注意力与Transformer》总结，84页ppt开放下载！
台大李宏毅《机器学习》2021课程撒花完结！附视频、PPT，以及一本答疑书
分层级联Transformer！苏黎世联邦提出TransCNN: 显著降低了计算/空间复杂度！
清华姚班教师劝退文：读博，你真的想好了吗？
2021李宏毅老师最新40节机器学习课程！附课件+视频资料
最强通道注意力来啦！金字塔分割注意力模块，即插即用，效果显著，已开源！
登上更高峰！颜水成、程明明团队开源ViP，引入三维信息编码机制，无需卷积与注意力
常用 Normalization 方法的总结与思考：BN、LN、IN、GN
注意力可以使MLP完全替代CNN吗？未来有哪些研究方向？
清华鲁继文团队提出DynamicViT：一种高效的动态稀疏化Token的ViT
并非所有图像都值16x16个词--- 清华&华为提出一种自适应序列长度的动态ViT

重磅！DLer-计算机视觉&Transformer群已成立！

大家好，这是计算机视觉&Transformer论文分享群里，群里会第一时间发布最新的Transformer前沿论文解读及交流分享会，主要设计方向有：图像分类、Transformer、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、视频超分、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。

进群请备注：研究方向+学校/公司+昵称（如Transformer+上交+小明）

???? 长按识别，邀请您进群！

PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
提升企业级数据处理效率！TDengine 四个集群优化点详解 TDengine （老段） TDengine 运维大数据数据库物联网时序数据库服务器运维 tdengine
为了帮助企业更好地进行大数据处理，我们在此前TDengine3.x系列版本中进行了几项与集群相关的优化和新功能开发，以提升集群的稳定性和在异常情况下的恢复能力。这些优化包括clusterID隔离、leaderrebalance、raftlearner和restorednode。本文将对这几项重要优化进行详细阐述，以解答企业在此领域的疑问，并帮助大家更好地应对相关挑战。clusterID隔离问题fi
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
stm32与ESP32-C3通过串口连接林内克思 stm32 嵌入式硬件单片机
ESP32-C3是一款安全稳定、低功耗、低成本的物联网芯片，搭载RISC-V32位单核处理器，支持2.4GHzWi-Fi和Bluetooth5（LE）。ESP32-C3本身就可以作为一个单片机使用，但是我们这里只是把ESP32-C3作为一个Wi-Fi/蓝牙模块使用。STM32与ESP32-C3使用串口进行通讯。STM32可以给ESP32-C3发送命令，这种命令叫ESP-AT指令。首先通过pc串口E
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
使用NVIDIA NeRF将2D图像转换为逼真的3D模型（Python） ByteWhiz 3d python 计算机视觉 Python
使用NVIDIANeRF将2D图像转换为逼真的3D模型（Python）NeuralRadianceFields（NeRF）是一种强大的方法，可以将2D图像转换为逼真的3D模型。它使用神经网络来建模场景的辐射场，并通过渲染多个视角的图像来重建3D模型。在本文中，我们将使用Python和NVIDIANeRF库来实现这一过程。首先，我们需要安装所需的库。我们可以通过以下命令使用pip安装NVIDIANe
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
全面探索Kafka：架构、应用与流处理
Kafka：企业级消息系统与流处理平台的深度解析ApacheKafka作为分布式流处理平台，广泛应用于大数据处理和实时分析领域。本文将基于其官方文档，详细探讨Kafka的核心功能、应用场景以及如何进行有效管理。背景简介Kafka作为高吞吐量的消息系统，支持企业级的发布-订阅模式。它能够处理大量实时数据，并支持高并发读写操作。本文将依据Kafka官方文档的内容，逐层深入，从入门到高级应用，帮助读者全
Flink时间窗口详解 bxlj_jcj Flink flink 大数据
一、引言在大数据流处理的领域中，Flink的时间窗口是一项极为关键的技术，想象一下，你要统计一个电商网站每小时的订单数量。由于订单数据是持续不断产生的，这就形成了一个无界数据流。如果没有时间窗口的概念，你就需要处理无穷无尽的数据，难以进行有效的统计分析。而时间窗口的作用，就是将这无界的数据流按照时间维度切割成一个个有限的“数据块”，方便我们对这些数据进行处理和分析。比如，我们可以定义一个1小时的时
正义的算法迷宫—人工智能重构司法体系的技术悖论与文明试炼
一、法庭的数字化迁徙当美国威斯康星州法院采纳COMPAS算法评估被告再犯风险，当中国"智慧法院"系统年处理1.2亿件案件，司法体系正经历从石柱法典到代码裁判的范式革命。这场转型的核心驱动力是司法效率与公正的永恒张力：美国重罪案件平均审理周期达18个月，中国基层法官年人均结案357件（是德国同行的6倍），而算法能在0.3秒内完成百万份文书比对。人工智能渗透司法引发三重裂变：证据分析从经验推断转向数据
探索实时流处理的未来：Kafka Streams 深度指南秋或依
探索实时流处理的未来：KafkaStreams深度指南项目介绍欢迎进入KafkaStreams：实时流处理的世界！这不仅仅是一本书，更是一个通往流处理领域深层奥秘的门户。由PrashantPandey编著，这本书以ApacheKafka2.1中的KafkaStreams库为核心，为读者铺就了一条从理解基础概念到熟练掌握KafkaStreams编程的路径。无论是软件工程师、数据架构师，还是对大数据处
Elasticsearch搜索引擎存储：从原理到实践的全景解析 Python×CATIA工业智造搜索引擎 elasticsearch 大数据
引言在大数据时代，数据规模呈指数级增长，传统数据库的模糊查询、实时分析能力逐渐成为瓶颈。Elasticsearch（简称ES）凭借其分布式架构、实时搜索和灵活的数据分析能力，成为企业级搜索与存储的核心引擎。截至2025年，ES在全球日志分析、电商搜索、实时监控等场景的市场占有率超过60%。本文将从存储架构、核心技术、应用场景及优化策略四个维度，深入解析Elasticsearch的设计哲学与实践价值
主板基础知识 bcbobo21cn 硬件主板
主板，又叫主机板（mainboard）、系统板（systemboard）、或母板（motherboard），是计算机最基本的同时也是最重要的部件之一。主板一般为矩形电路板，上面安装了组成计算机的主要电路系统，一般有BIOS芯片、I/O控制芯片、键盘和面板控制开关接口、指示灯插接件、扩充插槽、主板及插卡的直流电源供电接插件等元件。主板制造质量的高低，决定了硬件系统的稳定性。主板与CPU关系密切，每一
【电脑】主板的基础知识 Mike_Wuzy 电脑
主板（Motherboard）是计算机的核心组件之一，它将所有其他硬件部件连接在一起并协调它们的工作。以下是关于主板的详细知识：1.架构组成一个典型的主板通常由以下几个主要部分构成：芯片组（Chipset）：分为南桥和北桥两个部分。北桥（Northbridge）：负责处理高速数据传输，如连接内存控制器、显示接口等。现代CPU集成了北桥的功能，因此许多主板上已经不再有独立的北桥芯片。南桥（South
NumPy-@运算符详解 GG不是gg numpy numpy
NumPy-@运算符详解一、@运算符的起源与设计目标1.从数学到代码：符号的统一2.设计目标二、@运算符的核心语法与运算规则1.基础用法：二维矩阵乘法2.一维向量的矩阵语义3.高维数组：批次矩阵运算4.广播机制：灵活的形状匹配三、@运算符与其他乘法方式的核心区别1.对比`np.dot()`2.对比元素级乘法`*`3.对比`np.matrix`的`*`运算符四、典型应用场景：从基础到高阶1.深度学习
【python实战】不玩微博，一封邮件就能知道实时热榜，天秀吃瓜一条coding 从实战学python 人工智能 python linux 爬虫
❤️欢迎订阅《从实战学python》专栏，用python实现办公自动化、数据可视化、人工智能等各个方向的实战案例，有趣又有用！❤️更多精品专栏简介点这里有的人金玉其表败絮其中，有的人却若彩虹般绚烂，怦然心动前言哈喽，大家好，我是一条。在生活中我是一个不太喜欢逛娱乐平台的人，抖音、快手、微博我手机里都没装，甚至微信朋友圈都不看，但是自从开始写博客，有些热度不得不蹭。所以就有了这样一个需求，能不能让微
【Kafka专栏 13】Kafka的消息确认机制：不是所有的“收到”都叫“确认”！
作者名称：夏之以寒作者简介：专注于Java和大数据领域，致力于探索技术的边界，分享前沿的实践和洞见文章专栏：夏之以寒-kafka专栏专栏介绍：本专栏旨在以浅显易懂的方式介绍Kafka的基本概念、核心组件和使用场景，一步步构建起消息队列和流处理的知识体系，无论是对分布式系统感兴趣，还是准备在大数据领域迈出第一步，本专栏都提供所需的一切资源、指导，以及相关面试题，立刻免费订阅，开启Kafka学习之旅！
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo

NTT 高级科学家：光子是深度学习的未来！

推荐阅读

你可能感兴趣的:(神经网络,芯片,人工智能,深度学习,大数据)