shiner_chen

自动驾驶的算力（TOPS）谎言

原文链接
当前，自动驾驶运算系统正在进入一场算力的竞赛中，特斯拉刚以自研的达到72TOPS算力、业内最强的FSD/HW3.0升级HW2.5不久，英伟达最新推出的芯片系统达到了2000TOPS的惊人算力。然而，自动驾驶首要确保的安全性和算力并没有直接关系，即便1000E（T的百万倍）OPS也达不到L4级别，这只是硬件厂家的数字游戏而已，内行人从不当真。

这些所谓高算力实际针对乘积累加运算的高算力。乘积累加运算（英语：MultiplyAccumulate, MAC）。这种运算的操作，是将乘法的乘积结果和累加器 A 的值相加，再存入累加器：

若没有使用 MAC 指令，上述的程序需要二个指令，但 MAC 指令可以使用一个指令完成。而许多运算（例如卷积运算、点积运算、矩阵运算、数字滤波器运算、乃至多项式的求值运算，基本上全部的深度学习类型都可以对应）都可以分解为数个 MAC 指令，因此可以提高上述运算的效率。

之所以说自动驾驶的安全性和TOPS算力并没有直接关系基于三点。

一、这些所谓的高算力实际都只是乘积累加矩阵运算算力，只是对应深度学习算法的，只对应向量。深度学习是一种非确定性算法，而车辆安全需要确定性算法来保障。人工智能只是锦上添花，最终还是需要确定性算法把守安全底线。而确定性算法不靠乘积累加运算算力，它通常是标量运算，也就是更多依赖CPU的运算，那些所谓的高TOPS算力毫无意义。

二、深度学习视觉感知中目标分类与探测（detection)是一体的，无法分割。也就是说，如果无法将目标分类（classifer，也可以通俗地说是识别）就无法探测。换句话说，如果无法识别目标就认为目标不存在。车辆会认为前方无障碍物，会不减速直接撞上去。训练数据集无法完全覆盖真实世界的全部目标，能覆盖50%都已经是很神奇的了，更何况真实世界每时每刻都在产生着新的不规则目标。特斯拉多次事故都是如此，比如在中国两次在高速公路上追尾扫地车（第一次致人死亡），在美国多次追尾消防车。还有无法识别车辆侧面（大部分数据集都只采集车辆尾部图像没有车辆侧面图像）以及无法识别比较小的目标。TOPS算力高只是缩短能识别目标的识别时间，如果无法识别，还是毫无价值。

三，高TOPS都是运算单元（PE）的理论值，而非整个硬件系统的真实值。真实值更多取决于内部的SRAM、外部DRAM、指令集和模型优化程度。最糟糕的情况下，真实值是理论值的1/10算力甚至更低。

深度学习的不确定性

深度学习分为训练和推理两部分，训练就好比我们在学校的学习，但神经网络的训练和我们人类接受教育的过程之间存在相当大的不同。神经网络对我们人脑的生物学——神经元之间的所有互连——只有一点点拙劣的模仿。我们的大脑中的神经元可以连接到特定物理距离内任何其它神经元，而深度学习却不是这样——它分为很多不同的层（layer）、连接（connection）和数据传播（data propagation）的方向，因为多层，又有众多连接，所以称其为神经网络。

训练神经网络的时候，训练数据被输入到网络的第一层。然后所有的神经元，都会根据任务执行的情况，根据其正确或者错误的程度如何，分配一个权重参数（权重值）。在一个用于图像识别的网络中，第一层可能是用来寻找图像的边。第二层可能是寻找这些边所构成的形状——矩形或圆形。第三层可能是寻找特定的特征——比如闪亮的眼睛或按钮式的鼻子。每一层都会将图像传递给下一层，直到最后一层；最后的输出由该网络所产生的所有这些权重总体决定。

经过初步（是初步，这个是隐藏的）训练后得到全部权重模型后，我们就开始考试它，比如注入神经网络几万张含有猫的图片（每张图片都需要在猫的地方标注猫，这个过程一般是手工标注，也有自动标注，但准确度肯定不如手工），然后拿一张图片让神经网络识别图片里的是不是猫。如果答对了，这个正确会反向传播到该权重层，给予奖励就是保留，如果答错了，这个错误会回传到网络各层，让网络再猜一下，给出一个不同的论断这个错误会反向地传播通过该网络的层，该网络也必须做出其它猜测，网络并不知道自己错在哪里，也无需知道。在每一次尝试中，它都必须考虑其它属性——在我们的例子中是「猫」的属性——并为每一层所检查的属性赋予更高或更低的权重。然后它再次做出猜测，一次又一次，无数次尝试……直到其得到正确的权重配置，从而在几乎所有的考试中都能得到正确的答案。

得到正确的权重配置，这是一个巨大的数据库，显然无法实际应用，特别是嵌入式应用，于是我们要对其修剪，让其瘦身。首先去掉神经网络中训练之后就不再激活的部件。这些部分已不再被需要，可以被「修剪」掉。其次是压缩，这和我们常用的图像和视频压缩类似，保留最重要的部分，如今模拟视频几乎不存在，都是压缩视频的天下，但我们并未感觉到压缩视频与原始视频有区别。

深度学习的关键理论是线性代数和概率论，因为深度学习的根本思想就是把任何事物转化成高维空间的向量，强大无比的神经网络，说来就是无数的矩阵运算和简单的非线性变换的结合。在19世纪中期，矩阵理论就已经成熟。概率论在18世纪中期就有贝叶斯，在1900年俄罗斯的马尔科夫发表概率演算，概率论完全成熟。优化理论主要来自微积分，包括拉格朗日乘子法及其延伸的KKT，而拉格朗日是18世纪中叶的法国数学家。RNN则和非线性动力学关联甚密，其基础在20世纪初已经完备。至于GAN网络，则离不开19世纪末伟大的奥地利物理学家波尔兹曼。强化学习的理论基础是1906年俄罗斯数学家马尔科夫发表的弱大数定律（weak law of large numbers）和中心极限定理（central limit theorem），也就是马尔科夫链。

可以说深度学习所需要的理论基础在100年前已经基本齐全（概率和信息论略微不足，在20世纪60年代补齐），现在的深度学习只是从理论走向实用，这当中最关键的推手就是GPU的高TOPS算力，是英伟达的GPU造就了深度学习时代的到来，深度学习没有理论上的突破，只是应用上的扩展。经过压缩后，多个神经网络层被合为一个单一的计算。最后得到的这个就是推理Inference用模型或者说算法模型。

实际深度学习就是靠蛮力计算（当然也有1X1卷积、池化等操作降低参数量和维度）代替了精妙的科学。深度学习没有数学算法那般有智慧，它知其然，不知其所以然，它只是概率预测，它无法具备确定性。所以在目前的深度学习方法中，参数的调节方法依然是一门“艺术”，而非“科学”。深度学习方法深刻地转变了人类几乎所有学科的研究方法。以前学者们所采用的观察现象，提炼规律，数学建模，模拟解析，实验检验，修正模型的研究套路被彻底颠覆，被数据科学的方法所取代：收集数据，训练网络，实验检验，加强训练。这也使得算力需求越来越高。机械定理证明验证了命题的真伪，但是无法明确地提出新的概念和方法，实质上背离了数学的真正目的。这是一种“相关性”而非“因果性”的科学。历史上，人类积累科学知识，在初期总是得到“经验公式”，但是最终还是寻求更为深刻本质的理解。例如从炼丹术到化学、量子力学的发展历程。

深度学习的理论基础已经不可能出现大的突破，因为目前人类的数学特别是非确定性数学已经走火入魔了，有一本书叫《数学：确定性的丧失》说得非常好。

书中的一个比喻：在莱茵河畔，一座美丽的城堡（暗指德国哥廷根大学，曾经在200年里是全球数学研究中心，数学的圣地，非线性动力学圣地。希特勒执政后全球数学圣地转移至美国的普林斯顿大学）已经矗立了许多个世纪。在城堡的地下室中生活着一群蜘蛛，突然一阵大风吹散了它们辛辛苦苦编织的一张繁复的蛛网，于是它们慌乱地加以修补，因为它们认为，正是蛛网支撑着整个城堡。小至四元数、负数、复数、矩阵，大至微积分、非欧几何，经验算术及其延展代数背后隐藏着深深困扰数学家的逻辑问题。然而，数学家们是在贡献概念而不是从现实世界中抽象出思想，这些概念却被证明越来越实用，数学家们变得越来越肆无忌惮。通过应用经验来修正理论逻辑，数学逐步失去了其先验性，变得越来越像哲学甚至玄学。

宝马L3/L4智能驾驶软件架构

宝马L3/L4主系统计算路径，Fallback系统监督主系统，当得知主系统计算的路径会发生事故或碰撞时，Fallback系统会切换为主系统，主系统使用人工智能的非确定性算法，Fallback系统使用经典的确定性算法来保证安全。

真假TOPS

推理领域，算力理论值取决于运算精度、MAC的数量和运行频率。大概可以简化为这样子，INT8精度下的MAC数量在FP16精度下等于减少了一半。FP32再减少一半，依次类推。其计算相当简单，假设有512个MAC运算单元，运行频率为1GHz，INT8的数据结构和精度（自动驾驶推理领域常见精度），算力为512 x 2 x 1 Gigahertz = 1000 Billion Operations/Second = 1 TOPS(Tera-Operations/second)。如果是FP16精度那么就是0.5TOPS。例如英伟达的Tesla V100有640个Tensor核，每核有64个MAC运算单元，运行频率大约1.480GHz，那么INT8下算力为640*64*2*1.480Gigahertz=121TOPS。但是Tesla V100的训练就使用CUDA核，有5120个CUDA核，双精度（FP64）下算力是另一种算法了。这个月刚发布的A100，有432个三代Tensor核，每个核包含512个MAC运算单元（等同于64个双精度MAC），运行频率为1.41Gigahertz，INT8下算力为432*512*2*1.41Gigahertz=624TOPS。特斯拉的FSD是9216个MAC运算单元，运行频率是2GHz，INT8算力为9216*2*2GHz=36.86TOPS。

真实值和理论值差异极大。决定算力真实值最主要因素是内存（ SRAM和DRAM)带宽，还有实际运行频率（即供电电压或温度），还有算法的batch尺寸。例如谷歌第一代TPU，理论值为90TOPS算力，最差真实值只有1/9，也就是10TOPS算力，因为第一代内存带宽仅34GB/s。而第二代TPU下血本使用了HBM内存，带宽提升到600GB/s（单一芯片，TPU V2板内存总带宽2400GB/s）。最新的英伟达的A100使用40GB的2代HBM，带宽提升到1600GB/s，比V100提升大约73%。特斯拉是128 bitLPDDR4-4266 ，那么内存的带宽就是：2133MHz*2DDR*128bit/8/1000=68.256GB/s。比第一代TPU略好（这些都是理论上的最大峰值带宽）其性能最差真实值估计是2/9。也就是大约8TOPS。16GB版本的Xavier内存峰值带宽是137GB/s。

为什么会这样？这就牵涉到MAC计算效率问题。如果你的算法或者说CNN卷积需要的算力是1TOPS，而运算平台的算力是4TOPS，那么利用效率只有25%，运算单元大部分时候都在等待数据传送，特别是batch尺寸较小时候，这时候存储带宽不足会严重限制性能。但如果超出平台的运算能力，延迟会大幅度增加，存储瓶颈一样很要命。效率在90-95%情况下，存储瓶颈影响最小，但这并不意味着不影响了，影响依然存在。然而平台不会只运算一种算法，运算利用效率很难稳定在90-95%。这就是为何大部分人工智能算法公司都想定制或自制计算平台的主要原因，计算平台厂家也需要推出与之配套的算法，软硬一体，实难分开。

比如业内大名鼎鼎的ResNet-50，其需要MAC大约为每秒70亿次运算，英伟达TeslaT4运行ResNet-50每秒可处理3920张224*224的图像，3920 images/second x 7 BillionOperations/image = 27,440 Billion Operations/second = 27.4 TrillionOperations/Second = 27.4 TOPS。而英伟达Tesla T4的理论算力是130TOPS。实际只有27.4TOPS。

也有些软件改善内存瓶颈的方法，比如修改指令集，让权重值快速加载，提高数据复用率，减少频繁读取，例如华为曾经用过的寒武纪的IP。但最简单有效的解决方法还是提高内存带宽。

提高内存带宽有三种方法，一是缩短运算单元与存储器之间的物理距离，二是使用高带宽内存即HBM，三加大内存容量。注意上文所说的内存带宽都是理论上的带宽，实际带宽跟物理距离关系极为密切，物理距离远会让内存实际带宽下降不少，但具体数值还未有详细资料。

第一种方法最有效。物理距离最近的自然把存储器与运算单元制作在一个die里（一一级缓存和二级缓存），线宽可能只有1-2微米，但是存储器所占晶圆面积很大，工艺与运算单元也有比较大的差异，这样做会大幅度提高成本，因此大部分厂家的in-die内存容量都很小。退一步，把存储器与运算单元制作在一个package里，目前台积电的CoWos工艺大约可以做到55微米（ Micro-bump)。这是目前所有主流厂家的选择，毕竟计算是针对数据中心的芯片也要优先考虑价格。最差的就是特斯拉和谷歌第一代TPU使用PCB板上的内存（ BGA），这样线宽大约1100-1500微米。缩短距离不仅能提高存储带宽，同时还能降低内存功耗。

HBM最早由AMD和SK Hynix提出，但是三星几乎垄断HBM市场，目前已经发展到HBM2代，HBM2可以做到最高12颗TSV堆叠3.6TB/s的带宽，传统DRAM最顶级的GDDR6是768GB/s。HBM的缺点是太贵，针对消费类市场的产品没人敢用，也缺乏应用场景，只有数据中心才用。除此之外还有一个缺点，用HBM就意味着必须用台积电的CoWos工艺，这样才能尽量缩短与运算单元的物理距离，最大限度发挥HBM的性能。英特尔的EMIB工艺可以抗衡台积电的CoWos工艺，但英特尔不做代工。因此全球高性能AI芯片无一例外都在台积电生产，市场占有率100%。

再来说运行频率。在设计集成电路时，仿真或EDA会给出常见的三种状态分析。

WCS (Worst Case Slow) : slow process, high temperature, lowestvoltage

TYP (typical) : typical process, nominal temperature, nominalvoltage

BCF (Best Case Fast ) : fast process, lowest temperature, highvoltage

假设一个AI芯片，运行频率2GHz，一般温度25°，电压0.8V，算力为2TOPS。在WCS下，温度为125度，电压0.72V，此时频率会降低到1GHz，算力就会降为1TOPS。

那么每瓦TOPS有没意义呢？抱歉，也没多大意义的。首先是因为算力值本身就有很多种可能，厂家肯定只选数值最大的那个给你看。其次这只是运算单元芯片本身的功耗与算力比，没有考虑DRAM。在深度学习计算中，数据频繁存取，极端情况下，功耗可能不低于运算单元。

结论

不必纠结于数字游戏，深度学习只是锦上添花，确定性算法把守安全底线才是最重要的。当然业界风气使然，数字游戏还会继续，还会更加热闹，但业内人士都心知肚明，完全无人驾驶落地还是遥遥无期。

软件工程的熵减：AI代码生成器如何降低系统复杂度前端
软件开发的世界，如同一个不断膨胀的宇宙。随着项目规模的增长，代码库日益庞大，系统复杂度也随之水涨船高。维护、扩展和协作的难度成倍增加，这如同物理学中的熵增原理一样，系统朝着混乱无序的方向发展。为了对抗这种“熵增”，我们需要寻找有效的手段，而AI代码生成器的出现，为我们提供了一种强大的武器。在传统的软件开发模式下，开发者花费大量时间处理重复性工作，例如编写大量的样板代码，这不仅效率低下，而且容易引入
告别繁琐！使用AI代码生成器ScriptEcho快速构建WebSocket实时应用前端
WebSocket实时应用，以其低延迟、高效率的特点，在实时聊天、在线游戏、股票交易等领域发挥着越来越重要的作用。然而，对于新手开发者来说，构建一个功能完善的WebSocket应用却并非易事。复杂的代码编写、繁琐的后端接口对接以及漫长的调试测试过程，往往成为入门学习的巨大挑战。幸运的是，现在有了AI代码生成器ScriptEcho，它能够显著简化开发流程，帮助你快速构建高质量的WebSocket应用
Flink CDC MySQL同步MySQL错误记录 lingllllove flink mysql 大数据
FlinkCDC简介FlinkCDC（ChangeDataCapture）是一种高效的数据同步工具，利用Flink强大的实时流处理能力，从MySQL等数据库捕获数据变更，并将这些变更实时同步到目标数据库。本文将详细介绍FlinkCDCMySQL同步到MySQL时常见的错误记录及其解决方法。常见错误及解决方法1.连接错误错误信息：FailedtoconnecttoMySQLserver.可能原因：
论文阅读笔记：AI+RPA 几道之旅人工智能
文章目录论文题目下载地址论文摘要论文题目Challengesandopportunities:ImplementingRPAandAIinfrauddetectioninthebankingsector下载地址点击这里下载论文摘要在银行业中，将机器人流程自动化（RPA）和人工智能（AI）集成用于欺诈检测是一项重大变革，既带来了挑战，也带来了机遇。随着金融机构面临日益复杂的欺诈企图，RPA和AI成为
PyTorch 基础数据集：从理论到实践的深度学习基石那年一路北 Pytorch理论+实践深度学习 pytorch 人工智能
一、引言深度学习作为当今人工智能领域的核心技术，在图像识别、自然语言处理、语音识别等众多领域取得了令人瞩目的成果。而在深度学习的体系中，数据扮演着举足轻重的角色，它是模型训练的基础，如同建筑的基石，决定了模型的性能和泛化能力。PyTorch作为当下最流行的深度学习框架之一，为开发者提供了丰富且强大的工具来处理数据集。本文将深入探讨PyTorch中的基础数据集，从深度学习中数据的重要性出发，详细介绍
【2025】拥抱未来砥砺前行摔跤猫子其他年终总结拥抱未来砥砺前行深度思考
2024是怎样的一年2024在历史画卷上是波澜壮阔的一年，人工智能的浪潮来临，涌现出无数国产大模型。22年11月ChatGPT发布，它的出现如同在平静湖面上投下一颗巨石，激起了层层波澜，短短五天用户数就达到了100万，让整个世界为之侧目的同时也掀起了一场AI技术竞赛的浪潮。面对大模型这一蓝海，各方力量都试图搭上这趟时代的列车，争先恐后的相继开启布局。公司大模型名称发布时间澜舟科技孟子GPTV120
通过Amazon Bedrock API调用Anthropic Claude模型的实战指南 qwd41564qwd python
在AI技术的飞速发展中，AmazonBedrockAPI为开发者提供了一种稳定可靠的方式来访问Anthropic的Claude模型。无论是启动新的项目还是集成AI解决方案，通过Bedrock调用Claude模型都提供了更广泛的应用场景和便利性。本文将指导您如何在Python中通过AmazonBedrock向Claude模型发起API调用。技术背景介绍Bedrock是Amazon推出的一个集成平台，
使用 RunnableParallel 并行执行步骤的实践指南 GEAWfaacc 服务器 linux 运维 python
在现代软件开发中，优化计算效率是非常关键的任务。尤其在涉及大规模数据处理或复杂计算时，并行执行成为提高性能的重要手段。LangChain提供了RunnableParallel工具，能够方便地将多个计算过程并行化执行。本文将通过实例代码，深入解析如何利用RunnableParallel实现计算过程的并行化。技术背景介绍RunnableParallel是一个强大的工具，可以将多个可运行的任务（即Run
android material 组件 - ShapeableImageView 2401_89210258 android gitee
android:padding=“1dp”android:scaleType=“centerCrop”android:src=“@mipmap/ic_img”app:layout_constraintBottom_toBottomOf=“parent”app:layout_constraintEnd_toEndOf=“parent”app:layout_constraintStart_toStar
Spring AI - 对话模型还是转转 spring 人工智能 java
目录：SpringAI框架介绍SpringAI对话模型核心API简介SpringAI提供了很多便利的功能，主要如下：AIModelAPI“ModelAPI”提供了聊天、文本转图像、音频转录、文本转语音、嵌入等功能，且不局限于某个固定的大模型提供商，如OpenAI，Microsoft，Amazon,Google,AmazonBedrock,HuggungFace等等。下面是支持的AI模型的示意图：C
用 aiofiles 模块的 asyncio.to_thread() 方法将同步文件操作转换为异步操作 PyAIGCMaster python
importaiofilesimportreasyncdefdownload_text_to_file(url,name):asyncwithaiohttp.ClientSession()assession:asyncwithsession.get(url)asresponse:text=awaitresponse.text()obj_content=re.compile(r"content:'(
力扣 739. 每日温度 pursuit_csdn 力扣热题 100 leetcode 算法
https://leetcode.cn/problems/daily-temperatures题目给定一个数组，表示每天的天气返回一个数组，indexi表示几天后比当前的温度要高，没有则为0思路维护一个单调递减栈，若当前的温度比栈顶大，则更新栈顶index的值代码classSolution{public:vectordailyTemperatures(vector&temperatures){in
aws s3仅允许cloudfront访问_配置跨账户S3存储桶的访问 weixin_39839478 aws aws s3查看accesskey secretkey 我们无法刷新此账户的凭据
【Domain1的组织复杂性设计（DesignforOrganizationalComplexity）】——-配置跨账户S3存储桶的访问（CrossAccountS3BucketConfiguration）Hello大家好，欢迎回来，我们今天的课程内容是跨账户S3存储桶的访问。当前，在很多组织中，应用跨账户S3存储桶访问的架构组成是非常普遍的，同样，对于AWSSAP认证考试，掌握跨账户存储桶的访问
pytest 通过实例讲清单元测试、集成测试、测试覆盖率 Coding Is Fun pytest 单元测试集成测试
1.单元测试概念定义:单元测试是对代码中最小功能单元的测试，通常是函数或类的方法。目标:验证单个功能是否按照预期工作，而不依赖其他模块或外部资源。特点:快速、独立，通常是开发者最先编写的测试。示例：pytest实现单元测试#功能模块：一个简单的数学函数defadd(x,y):"""加法函数"""returnx+ydefdivide(x,y):"""除法函数，包含除零检查"""ify==0:rais
调用asyncio.to_thread后上下文依然一致吗 socratescli python asyncio
使用Python的asyncio时，可以把一个同步的函数放到线程池中执行从而避免这个函数阻塞asyncio自身的事件循环。比如可以把requests库的请求放进去asyncdefto_thread_do_request(url):returnawaitasyncio.to_thread(requests.get,url)这个to_thread_do_request方法就不会造成asyncio的阻塞
使用 LangChain 构建多PDF文档聊天应用 jkgSFS langchain pdf easyui python
随着大型语言模型（LLMs）的普及，如何将它们应用于文档处理成为了热门话题之一。本文将通过一个教程，展示如何使用LangChain构建一个能够处理多个PDF文档并与之对话的应用。技术背景介绍LangChain是一个广受欢迎的库，能够帮助开发者轻松地与LLMs和不同的嵌入技术进行整合。它提供了方便的接口和工具，使得复杂的自然语言处理任务变得简单高效。核心原理解析我们将利用LangChain来读取多个
【前端异常】JavaScript错误处理：分析 Uncaught (in promise) error vip1024p vip1024p 前端 javascript 开发语言
在前端开发中，JavaScript异常是不可避免的。随着现代前端应用越来越多地使用异步操作(如Promise、async/await等)，开发者常常会遇到Uncaught(inpromise)error错误。这个错误是由于未正确处理Promise的拒绝(rejection)而导致的，常常出现在异步操作失败的情况下。如果不妥善处理，可能会导致应用的不稳定和用户体验的下降。本文将深入分析Uncaugh
探索未来，AI-WEBUI：让AI创作触手可及农爱宜
探索未来，AI-WEBUI：让AI创作触手可及ai_webuiAI-WEBUI:AuniversalwebinterfaceforAIcreation,一款好用的图像、音频、视频AI处理工具项目地址:https://gitcode.com/gh_mirrors/ai/ai_webui1、项目介绍AI-WEBUI是一个创新的开源项目，它提供了一个全面的Web界面，让你无需编程背景就能轻松进行AI创作
LLM - 大模型 ScallingLaws 的 CLM 和 MLM 中不同系数(PLM) 教程(2) ManonLegrand 大模型 (LLM)LLM ScalingLaws CLM MLM IsoFLOPs SymboLab
欢迎关注我的CSDN：https://spike.blog.csdn.net/本文地址：https://spike.blog.csdn.net/article/details/145188660免责声明：本文来源于个人知识与公开资料，仅用于学术交流，欢迎讨论，不支持转载。ScalingLaws(缩放法则)是大模型领域中，用于描述模型性能(Loss)与模型规模N、数据量D、计算资源C之间关系的经验规
构建一个查询分析系统 AWsggdrg 数据库 python
技术背景介绍在构建一个查询分析系统时，需要能够加载文档、使用聊天模型、生成嵌入、创建向量存储并执行检索。这些过程的目标是将用户输入的查询优化，以实现更为精准的检索结果。本文将通过一个端到端的示例展示如何使用查询分析提升检索结果的相关性。我们将着眼于如何对LangChain的YouTube视频进行检索，并通过查询分析解决原始用户问题直接传递给搜索引擎时可能出现的失败模式。核心原理解析查询分析的核心在
李开复与零一万物：AI创业的务实之道，以及AI写代码工具的崛起前端
2025年伊始，AI领域便掀起一阵波澜。零一万物，这家备受瞩目的AI公司，其人员变动和业务拆分引发了广泛关注。李开复，这位在AI领域深耕多年的资深人士，对此做出了回应，其核心观点值得我们深思：在AI领域，盲目追求规模并非最佳策略。这不仅关乎零一万物，也为众多AI初创公司提供了宝贵的经验。李开复观点解读：理性决策，而非盲目扩张李开复认为，初创公司“负担不起”超大模型的预训练。这“负担不起”并非仅仅指
AI时代：前端工程师和数学家真的要失业了吗？前端
ExaCEO威廉·布里克近日发布的惊人预测在科技界引发轩然大波：他认为前端工程师将在三年内消失，而数学家则只有700天的时间。这一预测并非危言耸听，它反映了AI代码生成器等AI技术高速发展带来的巨大行业冲击。本文将深入探讨AI技术对前端开发和数学领域的影响，以及由此带来的机遇与挑战。前端开发行业的AI革命布里克的预测并非空穴来风。近年来，众多AI写代码工具如雨后春笋般涌现，例如ScriptEcho
ChatGPT Canvas：开启AI编程新纪元——你的AI代码生成器来了！前端
OpenAI近日宣布ChatGPTCanvas全面开放，并带来了两项重磅更新：直接运行Python代码和整合GPTs生态系统。这意味着，即使你不是专业的程序员，也能轻松体验编程的乐趣，并利用AI的力量创造出更多可能性。这对于想要学习编程或提高工作效率的用户来说，无疑是一个巨大的福音。这篇文章将深入探讨这两项更新，并展望ChatGPTCanvas的未来发展。直接运行Python代码：降低编程门槛，释
AI 2025：技术飞跃与应用鸿沟——AI代码生成器引领未来？前端
2024年，人工智能技术经历了前所未有的飞跃。大型语言模型（LLM）的能力显著提升，成本大幅下降，多模态应用成为主流。然而，令人担忧的是，技术进步与实际应用普及之间存在着巨大的鸿沟。“智能体”等概念被热炒，但实际应用却远未达到预期。本文将探讨这种技术进步与应用普及之间的矛盾，并分析弥合鸿沟的关键所在。技术的突飞猛进2024年，AI技术在多个方面取得了突破性进展。首先，模型能力得到了显著提升。GPT
StarRocks Awards 2024 年度贡献人物开源
在过去一年，StarRocks在Lakehouse与AI等关键领域取得了显著进步，其卓越的产品功能极大地简化和提升了数据分析的效率，使得"OneData，AllAnalytics"的愿景变得更加触手可及。虽然实现这一目标的道路充满挑战且漫长，但我们并不孤单，因为有一群社区伙伴与我们并肩作战。每一位贡献者的代码提交和每一次的布道，都在推动着StarRocks社区向前发展。为了表达对这些贡献者的深深感
软件架构的康威定律：AI如何重构团队协作模式前端
1.引言康威定律，一个简洁却深刻的观察：任何组织设计出的系统，其结构都与组织自身的沟通结构保持一致。这意味着，一个团队的沟通方式、组织结构直接影响着最终产品的架构。这在软件开发领域尤为明显。一个沟通效率低下的团队，往往会设计出复杂、难以维护的软件系统。而近年来，人工智能技术的飞速发展为解决这一问题提供了一种新的途径。本文将探讨AI工具，特别是AI辅助代码生成工具，如何帮助团队克服康威定律的限制，重
2025年，AI时代下的前端职业思考前端
近年来，随着AI技术的迅猛发展，尤其是像ChatGPT、Copilot这样的工具，前端开发领域正在经历前所未有的变革。许多新人不禁会问：“在AI普及的时代，2025年还该不该学前端？前端就业还有没有前途？”今天，我们就从多个角度深入探讨这个问题，并为你提供一些实用的建议。一、AI对前端开发的影响1.AI正在改变前端开发的工作方式AI工具已经能够自动生成代码、优化UI设计、甚至调试Bug。例如，Gi
第9章：Python TDD解决货币对象相等性比较难题 Tester_孙大壮测试驱动开发 python 驱动开发开发语言
写在前面这本书是我们老板推荐过的，我在《价值心法》的推荐书单里也看到了它。用了一段时间Cursor软件后，我突然思考，对于测试开发工程师来说，什么才更有价值呢？如何让AI工具更好地辅助自己写代码，或许优质的单元测试是一个切入点。就我个人而言，这本书确实很有帮助。第一次读的时候，很多细节我都不太懂，但将书中内容应用到工作中后，我受益匪浅。比如面对一些让人抓狂的代码设计时，书里的方法能让我逐步深入理解
实操数据预处理：从理论到实践的基础步骤炼丹侠 python 机器学习人工智能
在快速发展的人工智能领域，数据不仅是基础，更是推动技术创新的关键力量。高质量的数据集是构建高效、准确模型的前提。本文将全面深入探讨数据预处理的各个环节，从基础的数据清洗到复杂的数据增强，再到高效的Python应用实践，为你提供一站式的数据处理解决方案。无论你的经验如何，这篇文章都将成为你宝贵的资源。数据清洗：打好数据质量的基础数据清洗是提升数据质量的首要步骤，涵盖了如下几个关键操作：缺失值的智能处
费希尔（FISHER）阀门定位器DVC6000调试步骤冶金仪表圈自动化调节阀调节阀改造
DVC6000调试步骤：打开275/375手操器从主菜单（MainMenu）选择Hart应用（HARTApplication）从Online找到该定位器。依次进入Setup&Diag——DetailedSetup——Mode——InstumentMode(或者按手操器上快捷键直接进入)——警告！inservice模式被送到仪表当中时阀门也许会动（WARNING!Valvemaymovewhenin
关于旗正规则引擎规则中的上传和下载问题何必如此文件下载压缩 jsp 文件上传
文件的上传下载都是数据流的输入输出，大致流程都是一样的。一、文件打包下载 1.文件写入压缩包 string mainPath="D:\upload\"; 下载路径 string tmpfileName=jar.zip; &n
【Spark九十九】Spark Streaming的batch interval时间内的数据流转源码分析 bit1129 Stream
以如下代码为例（SocketInputDStream）： Spark Streaming从Socket读取数据的代码是在SocketReceiver的receive方法中，撇开异常情况不谈(Receiver有重连机制，restart方法，默认情况下在Receiver挂了之后，间隔两秒钟重新建立Socket连接)，读取到的数据通过调用store(textRead)方法进行存储。数据
spark master web ui 端口8080被占用解决方法 daizj 8080 端口占用 spark master web ui
spark master web ui 默认端口为8080，当系统有其它程序也在使用该接口时，启动master时也不会报错，spark自己会改用其它端口，自动端口号加1，但为了可以控制到指定的端口，我们可以自行设置，修改方法： 1、cd SPARK_HOME/sbin 2、vi start-master.sh 3、定位到下面部分
oracle_执行计划_谓词信息和数据获取周凡杨 oracle 执行计划
oracle_执行计划_谓词信息和数据获取(上) 一：简要说明在查看执行计划的信息中，经常会看到两个谓词filter和access，它们的区别是什么，理解了这两个词对我们解读Oracle的执行计划信息会有所帮助。简单说，执行计划如果显示是access，就表示这个谓词条件的值将会影响数据的访问路径（表还是索引），而filter表示谓词条件的值并不会影响数据访问路径，只起到
spring中datasource配置 g21121 dataSource
datasource配置有很多种，我介绍的一种是采用c3p0的，它的百科地址是： http://baike.baidu.com/view/920062.htm  <bean name="propertiesConfig" class="org.springframework.b
web报表工具FineReport使用中遇到的常见报错及解决办法（三）老A不折腾 finereport FAQ 报表软件
这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、repeated column width is largerthan paper width：这个看这段话应该是很好理解的。比如做的模板页面宽度只能放
mysql 用户管理墙头上一根草 linux mysql user
1.新建用户 //登录MYSQL@>mysql -u root -p@>密码//创建用户mysql> insert into mysql.user(Host,User,Password) values(‘localhost’,'jeecn’,password(‘jeecn’));//刷新系统权限表mysql>flush privileges;这样就创建了一个名为：
关于使用Spring导致c3p0数据库死锁问题 aijuans spring Spring 入门 Spring 实例 Spring3 Spring 教程
这个问题我实在是为整个 springsource 的员工蒙羞如果大家使用 spring 控制事务，使用 Open Session In View 模式， com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.
百度词库联想 annan211 百度
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>RunJS</title&g
int数据与byte之间的相互转换实现代码百合不是茶位移 int转byte byte转int 基本数据类型的实现
在BMP文件和文件压缩时需要用到的int与byte转换,现将理解的贴出来; 主要是要理解;位移等概念 http://baihe747.iteye.com/blog/2078029 int转byte; byte转int; /** * 字节转成int,int转成字节 * @author Administrator *
简单模拟实现数据库连接池 bijian1013 java thread java多线程简单模拟实现数据库连接池
简单模拟实现数据库连接池实例1： package com.bijian.thread; public class DB { //private static final int MAX_COUNT = 10; private static final DB instance = new DB(); private int count = 0; private i
一种基于Weblogic容器的鉴权设计 bijian1013 java weblogic
服务器对请求的鉴权可以在请求头中加Authorization之类的key，将用户名、密码保存到此key对应的value中，当然对于用户名、密码这种高机密的信息，应该对其进行加砂加密等，最简单的方法如下： String vuser_id = "weblogic"; String vuse
【RPC框架Hessian二】Hessian 对象序列化和反序列化 bit1129 hessian
任何一个对象从一个JVM传输到另一个JVM，都要经过序列化为二进制数据(或者字符串等其他格式，比如JSON)，然后在反序列化为Java对象，这最后都是通过二进制的数据在不同的JVM之间传输(一般是通过Socket和二进制的数据传输)，本文定义一个比较符合工作中。 1. 定义三个POJO Person类 package com.tom.hes
【Hadoop十四】Hadoop提供的脚本的功能 bit1129 hadoop
1. hadoop-daemon.sh 1.1 启动HDFS ./hadoop-daemon.sh start namenode ./hadoop-daemon.sh start datanode 通过这种逐步启动的方式，比start-all.sh方式少了一个SecondaryNameNode进程，这不影响Hadoop的使用，其实在 Hadoop2.0中，SecondaryNa
中国互联网走在“灰度”上 ronin47 管理灰度
中国互联网走在“灰度”上（转）文/孕峰第一次听说灰度这个词，是任正非说新型管理者所需要的素质。第二次听说是来自马化腾。似乎其他人包括马云也用不同的语言说过类似的意思。灰度这个词所包含的意义和视野是广远的。要理解这个词，可能同样要用“灰度”的心态。灰度的反面，是规规矩矩，清清楚楚，泾渭分明，严谨条理，是决不妥协，不转弯，认死理。黑白分明不是灰度，像彩虹那样
java-51-输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。 bylijinnan java
public class PrintMatrixClockwisely { /** * Q51.输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。例如：如果输入如下矩阵： 1 2 3 4 5 6 7 8 9
mongoDB 用户管理开窍的石头 mongoDB用户管理
1:添加用户第一次设置用户需要进入admin数据库下设置超级用户（use admin） db.addUsr({user:'useName',pwd:'111111',roles:[readWrite,dbAdmin]}); 第一个参数用户的名字第二个参数
[游戏与生活]玩暗黑破坏神3的一些问题 comsci 生活
暗黑破坏神3是有史以来最让人激动的游戏。。。。但是有几个问题需要我们注意玩这个游戏的时间，每天不要超过一个小时，且每次玩游戏最好在白天结束游戏之后，最好在太阳下面来晒一下身上的暗黑气息，让自己恢复人的生气 &nb
java 二维数组如何存入数据库 cuiyadll java
using System; using System.Linq; using System.Text; using System.Windows.Forms; using System.Xml; using System.Xml.Serialization; using System.IO; namespace WindowsFormsApplication1 {
本地事务和全局事务Local Transaction and Global Transaction(JTA) darrenzhu java spring local global transaction
Configuring Spring and JTA without full Java EE http://spring.io/blog/2011/08/15/configuring-spring-and-jta-without-full-java-ee/ Spring doc -Transaction Management http://docs.spring.io/spri
Linux命令之alias - 设置命令的别名，让 Linux 命令更简练 dcj3sjt126com linux alias
用途说明设置命令的别名。在linux系统中如果命令太长又不符合用户的习惯，那么我们可以为它指定一个别名。虽然可以为命令建立“链接”解决长文件名的问题，但对于带命令行参数的命令，链接就无能为力了。而指定别名则可以解决此类所有问题【1】。常用别名来简化ssh登录【见示例三】，使长命令变短，使常用的长命令行变短，强制执行命令时询问等。常用参数格式：alias 格式：ali
yii2 restful web服务[格式响应] dcj3sjt126com PHP yii2
响应格式当处理一个 RESTful API 请求时，一个应用程序通常需要如下步骤来处理响应格式：确定可能影响响应格式的各种因素，例如媒介类型，语言，版本，等等。这个过程也被称为 content negotiation。资源对象转换为数组，如在 Resources 部分中所描述的。通过 [[yii\rest\Serializer]]
MongoDB索引调优（2）——[十] eksliang mongodb MongoDB索引优化
转载请出自出处：http://eksliang.iteye.com/blog/2178555 一、概述上一篇文档中也说明了，MongoDB的索引几乎与关系型数据库的索引一模一样，优化关系型数据库的技巧通用适合MongoDB，所有这里只讲MongoDB需要注意的地方二、索引内嵌文档可以在嵌套文档的键上建立索引，方式与正常
当滑动到顶部和底部时，实现Item的分离效果的ListView gundumw100 android
拉动ListView，Item之间的间距会变大，释放后恢复原样； package cn.tangdada.tangbang.widget; import android.annotation.TargetApi; import android.content.Context; import android.content.res.TypedArray; import andr
程序员用HTML5制作的爱心树表白动画 ini JavaScript jquery Web html5 css
体验效果：http://keleyi.com/keleyi/phtml/html5/31.htmHTML代码如下： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"><head><meta charset="UTF-8" > <ti
预装windows 8 系统GPT模式的ThinkPad T440改装64位 windows 7旗舰版 kakajw ThinkPad 预装改装 windows 7 windows 8
该教程具有普遍参考性，特别适用于联想的机器，其他品牌机器的处理过程也大同小异。该教程是个人多次尝试和总结的结果，实用性强，推荐给需要的人！缘由小弟最近入手笔记本ThinkPad T440，但是特别不能习惯笔记本出厂预装的Windows 8系统，而且厂商自作聪明地预装了一堆没用的应用软件，消耗不少的系统资源（本本的内存为4G，系统启动完成时，物理内存占用比
Nginx学习笔记 mcj8089 nginx
一、安装nginx 1、在nginx官方网站下载一个包，下载地址是： http://nginx.org/download/nginx-1.4.2.tar.gz 2、WinSCP(ftp上传工
mongodb 聚合查询每天论坛链接点击次数 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 18 */ { "_id" : ObjectId("5596414cbe4d73a327e50274"), "msgType" : "text", "sendTime" : ISODate("2015-07-03T08:01:16.000Z"
java术语（PO/POJO/VO/BO/DAO/DTO） Luob. DAO POJO DTO po VO BO
PO(persistant object) 持久对象在o/r 映射的时候出现的概念,如果没有o/r映射,就没有这个概念存在了.通常对应数据模型(数据库),本身还有部分业务逻辑的处理.可以看成是与数据库中的表相映射的java对象.最简单的PO就是对应数据库中某个表中的一条记录,多个记录可以用PO的集合.PO中应该不包含任何对数据库的操作. VO(value object) 值对象通
算法复杂度 Wuaner Algorithm
Time Complexity & Big-O： http://stackoverflow.com/questions/487258/plain-english-explanation-of-big-o http://bigocheatsheet.com/ http://www.sitepoint.com/time-complexity-algorithms/

自动驾驶的算力（TOPS）谎言

你可能感兴趣的:(AI,人工智能)