喜欢打酱油的老鸟

更大的模型并不总是更好的模型，微型机器学习将是未来的方向

在NASA的推动下,电子产品的小型化成为一个完整的消费品行业。现在我们可以把贝多芬的全部作品放在翻领针上用耳机听。

--天体物理学家兼科学评论员尼尔·德格拉斯·泰森(Neil deGrasse Tyson)

超低功耗嵌入式设备的普遍存在，再加上诸如针对微控制器的TensorFlow Lite的嵌入式机器学习框架的引入，将使AI驱动的IoT设备大规模普及。

--哈佛大学副教授Vijay Janapa Reddi

嵌入式设备的微型机器学习(TinyML)

本文的目的是向读者介绍小型机器学习的概念及其未来潜力。在本系列的后续文章中，将对特定的应用程序，实现和教程进行深入讨论。

介绍

在过去的十年中，我们见证了由于处理器速度的提高和大数据的出现，机器学习算法的规模呈指数增长。最初，模型足够小，可以使用中央处理器(CPU)中的一个或多个内核在本地计算机上运行。

此后不久，由于引入了基于云的服务(例如SaaS平台(例如Google Colaboratory)和IaaS(例如Amazon EC2实例))，使用图形处理单元(GPU)的计算对于处理更大的数据集变得十分必要，并且变得更加容易获得。此时，算法仍可以在单台计算机上运行。

最近，我们已经看到了专用的专用集成电路(ASIC)张量处理单元(TPU)的开发，该模块可以封装约8个GPU的功能。这些设备已经增强了在多个系统之间分布学习的能力，以尝试发展越来越大的模型。

最近，随着GPT-3算法的发布(2020年5月发布)而达到了顶峰，该算法的网络体系结构包含了惊人的1750亿个神经元，是人脑中神经元数量的两倍(约850亿)。这是有史以来创建的第二大神经网络Turing-NLG(于2020年2月发布，包含约175亿个参数)的神经元数量的10倍以上。一些估计称，该模型的培训成本约为1000万美元，并使用了约3 GWh的电力(大约三个小时的一小时核电站的输出)。

尽管GPT-3和Turing-NLG的成就值得称赞，但自然而然地，这引起了业内一些人士对AI行业日益增长的碳足迹的批评。但是，它也有助于激发AI界对更节能计算的兴趣。这样的想法，例如更高效的算法，数据表示和计算，一直是看似无关的领域的关注重点：微型机器学习。

微型机器学习(tinyML)是机器学习与嵌入式物联网(IoT)设备的交叉点。该领域是一门新兴的工程学科，具有革新许多行业的潜力。

tinyML的主要行业受益者是边缘计算和节能计算。TinyML源自物联网(IoT)的概念。物联网的传统思想是将数据从本地设备发送到云进行处理。一些人对此概念提出了某些担忧：隐私、延迟、存储和能源效率等等。

能源效率。(通过有线或无线方式)传输数据非常耗能，比机载计算(具体而言，乘累加单位)要高大约一个数量级。开发可以执行自己的数据处理的物联网系统是最节能的方法。人工智能的先驱们已经讨论了"以数据为中心"的计算思想(与云模型的"以计算为中心"相对)，现在我们开始看到它正在发挥作用。

隐私。传输数据可能会侵犯隐私。此类数据可能被恶意行为者拦截，并且当存储在单个位置(例如云)中时，其固有的安全性降低。通过将数据主要保留在设备上并最大程度地减少通信，这可以提高安全性和隐私性。

存储。对于许多物联网设备而言，它们获取的数据毫无用处。想象一下一个安全摄像机每天24小时记录着建筑物的入口。在一天的大部分时间里，相机镜头没有任何用处，因为什么也没发生。通过拥有仅在必要时才激活的更智能的系统，就需要较低的存储容量，并减少了传输到云所需的数据量。

潜伏。对于标准IoT设备(例如Amazon Alexa)，这些设备将数据传输到云中进行处理，然后根据算法的输出返回响应。从这个意义上讲，该设备只是通向云模型的便捷网关，就像您自己和亚马逊服务器之间的信鸽。该设备非常笨拙，完全取决于互联网的速度才能产生结果。如果您的网速较慢，Amazon Alexa也会变慢。对于具有机载自动语音识别功能的智能IoT设备，由于减少了对外部通信的依赖(如果不是这样)，因此可以减少延迟。

这些问题导致了边缘计算的发展，即在边缘设备(位于云"边缘"的设备)上执行处理活动的想法。这些设备在内存，计算和功能方面都受到资源的高度限制，从而导致了更高效的算法，数据结构和计算方法的发展。

此类改进也适用于较大的模型，这可能导致机器学习模型的效率提高几个数量级，而不会影响模型的准确性。

例如，Microsoft开发的算法可以小到2 KB，但比典型的40 MB kNN算法或4 MB神经网络具有更好的性能。这个结果听起来可能并不重要，但是在尺寸的1/10万分之一的模型上，相同的精度令人印象深刻。如此小的模型可以在具有2 KB RAM的Arduino Uno上运行，总之，你现在可以在5美元的微控制器上构建这样的机器学习模型。

我们正处于一个有趣的十字路口，机器学习在两个计算范式之间分叉：以计算为中心的计算和以数据为中心的计算。在以计算为中心的范例中，数据是通过数据中心中的实例进行存储和分析的，而在以数据为中心的范例中，处理是在数据的原始位置进行的。尽管我们似乎正在迅速迈向以计算为中心的范例的上限，但是以数据为中心的范例的工作才刚刚开始。

物联网设备和嵌入式机器学习模型在现代世界中变得越来越普遍(到2020年底，预计将有200亿以上的活动设备)。其中许多你甚至可能都没有注意到。智能门铃、智能恒温器、智能手机，只要你说几句话，甚至只是拿起电话，都可以"唤醒"。本文的其余部分将更深入地关注tinyML的工作方式以及当前和将来的应用程序。

云的层次结构

TinyML的例子

以前，复杂的电路是设备执行各种动作所必需的。现在，机器学习使将这种硬件"智能"抽象为软件变得越来越可能，从而使嵌入式设备变得更加简单，轻巧和灵活。

嵌入式设备的机器学习所面临的挑战是巨大的，但是在这一领域已经取得了巨大的进步。在微控制器上部署神经网络的关键挑战是低内存占用，有限的功率和有限的计算。

TinyML最明显的例子也许是在智能手机中。这些设备会永久地积极聆听"唤醒词"

例如Android智能手机的" Hey Google"或iPhone的" Hey Siri"。通过智能手机的主中央处理器(CPU)运行这些活动，现代iPhone的主中央处理器(CPU)为1.85 GHz，将在短短几个小时内耗尽电池。对于大多数人每天最多使用几次的这种程度的降级是不可接受的。

为了解决这个问题，开发人员创建了专用的低功耗硬件，该硬件可以用小电池(例如，环形CR2032"硬币"电池)供电。这些功能使电路即使在CPU未运行时(基本上在屏幕不亮时)也保持活动状态。

这些电路消耗的功率仅为1 mW，使用标准CR2032电池可供电长达一年。

看起来好像不对，但这很重要。能量是许多电子设备的限制因素。任何需要主电源的设备都限于带有布线的位置，当同一位置有十几个设备时，这些位置很快就会变得不堪重负。市电也效率低下且价格昂贵。将电源电压(在美国大约为120 V)转换为典型的电路电压范围(通常约为5 V)会浪费大量能量。拥有笔记本电脑充电器的任何人在拔出充电器时都可能知道这一点。充电器内部变压器产生的热量在电压转换过程中被浪费掉了能量。

即使是带电池的设备，电池寿命也有限，因此需要频繁对接。许多消费类设备的设计使电池可持续使用一个工作日。TinyML设备可以使用硬币大小的电池继续运行一年，这意味着它们可以放置在偏远的环境中，仅在必要时进行通信以节省能源。

唤醒词并不是我们看到的无缝嵌入在智能手机中的唯一TinyML。加速度计数据用于确定是否有人刚拿起电话，这会唤醒CPU并打开屏幕。

显然，这些并不是TinyML的唯一可能应用。实际上，TinyML为企业和业余爱好者提供了许多令人兴奋的机会，以生产更智能的IoT设备。在当今世界，数据变得越来越重要的情况下，将机器学习资源分配到偏远地区受内存限制的设备的能力可能会给农业，天气预报或地震等数据密集型行业带来巨大好处。

毫无疑问，赋予边缘设备执行数据驱动的处理能力的能力将为工业过程带来范式转变。举例来说，能够监测农作物并在检测到诸如土壤湿度，特定气体(例如苹果成熟时会散发出乙烷)等特征或特定大气条件(例如大风，低温或高湿度)，将大大促进作物生长并因此提高作物产量。

作为另一个示例，智能门铃可能装有摄像头，该摄像头可以使用面部识别来确定谁在场。这可以用于安全目的，甚至可以用于当有人在场时将门铃的摄像头馈送到房屋中的电视，以便居民知道谁在门口。

目前，tinyML的两个主要重点领域是：

关键字发现。大多数人已经熟悉此应用程序。" Hey Siri"和" Hey Google"是关键字的示例(通常与" hotword"或" wake word"同义使用)。这样的设备连续收听来自麦克风的音频输入，并且被训练为仅响应特定的声音序列，这些特定的声音序列与学习的关键字相对应。这些设备比自动语音识别(ASR)应用程序更简单，并且相应地使用了更少的资源。某些设备(例如Google智能手机)利用来提供扬声器验证以确保安全性。
视觉唤醒词。唤醒词有一个基于图像的类似物，称为视觉唤醒词。将它们视为图像的二进制分类，以表示存在或不存在。例如，可以设计智能照明系统，使得其在检测到人的存在时启动，并在他们离开时关闭。同样，当存在特定的动物时，野生动物摄影师可以使用它来拍照，而当他们发现有人时，可以使用安全摄像机拍摄照片。

下面显示了TinyML当前机器学习用例的更广泛概述。

TinyML的机器学习用例

TinyML如何工作

TinyML算法的工作方式与传统机器学习模型几乎相同。通常，通常在用户计算机或云中对模型进行训练。后期训练是真正的tinyML工作开始的地方，在此过程中通常称为深度压缩。

深度学习模型压缩流程图

模型蒸馏

训练后，然后以创建具有更紧凑表示形式的模型的方式更改模型。修剪和知识蒸馏是用于此目的的两种此类技术。

知识提炼的基础思想是，较大的网络内部具有稀疏性或冗余性。虽然大型网络具有较高的表示能力，但如果网络容量未达到饱和，则可以在具有较低表示能力的较小网络(即较少的神经元)中进行表示。Hinton等，2015将教师模型中嵌入的信息称为"黑暗知识"，转移给学生模型。

下图说明了知识提炼的过程。

深度压缩过程图。在此图中，"老师"是经过训练的卷积神经网络模型。教师的任务是将其"知识"转移到参数较少的较小卷积网络模型中，即"学生"。此过程称为知识提取，用于将相同的知识包含在较小的网络中，从而提供了一种压缩网络的方式，以便可以将其用于更多受内存限制的设备上。

在此图中，"老师"是训练有素的神经网络模型。教师的任务是将其"知识"转移到参数较少的较小的网络模型中，即"学生"。此过程用于将相同的知识包含在较小的网络中，从而提供一种压缩知识表示的方式，从而压缩神经网络的大小，以便可以将其用于更多受内存限制的设备。

同样，修剪可以帮助使模型的表示更加紧凑。广义上讲，修剪尝试删除对输出预测几乎没有用的神经元。这通常与较小的神经权重相关联，而由于在推理过程中它们的重要性较高，因此会保留较大的权重。然后在修剪后的体系结构上对网络进行再培训，以微调输出。

用于提取模型的知识表示形式的修剪

量化

蒸馏后，然后将模型量化后训练成与嵌入式设备的体系结构兼容的格式。

为什么需要量化?想象一下使用ATmega328P微控制器的Arduino Uno，该微控制器使用8位算术。要在Uno上运行模型，理想情况下，模型权重必须存储为8位整数值(而许多台式机和笔记本电脑使用32位或64位浮点表示法)。通过对模型进行量化，权重的存储大小将减少4倍(对于从32位到8位值的量化)，准确性通常受到的影响可以忽略不计(通常约为1-3%)。

8位编码期间的量化误差插图(然后用于重建32位浮点数)

由于某些信息可能会在量化过程中丢失(例如，在基于整数的平台上，浮点表示形式的值为3.42可能会被截断为3)。为了解决这个问题，还提出了量化感知(QA)培训作为替代方案。QA训练从本质上将训练期间的网络限制为仅使用量化设备上可用的值。

霍夫曼编码

编码是一个可选步骤，有时会通过最大有效地存储数据(通常通过著名的来进一步减小模型大小。

汇编

对模型进行量化和编码后，将其转换为可由某种形式的轻型神经网络解释器解释的格式，其中最受欢迎的可能是(〜500 KB大小)和(〜大小为20 KB)。然后将模型编译为C或C ++代码(大多数微控制器使用的语言以有效利用内存)，并由解释器在设备上运行。

TInyML应用程序的工作流程

tinyML的大多数技能来自处理微控制器的复杂世界。TF Lite和TF Lite Micro非常小，因为已删除了所有不必要的功能。不幸的是，这包括有用的功能，例如调试和可视化。这意味着，如果在部署过程中出现错误，可能很难分辨正在发生什么。

另外，尽管模型必须存储在设备上，但模型还必须能够执行推理。这意味着微控制器必须具有足够大的内存以使其能够运行(1)其操作系统和库，(2)神经网络解释器(例如TF Lite)，(3)存储的神经权重和神经体系结构，以及(4)推理过程中的中间结果。因此，tinyML研究论文中经常引用量化算法的峰值内存使用量，以及内存使用量，乘法累加单位(MAC)的数量，准确性等。

为什么不在设备上训练?

在设备上进行训练会带来更多的并发症。由于数值精度降低，要保证足够的网络训练所需的精度水平变得极为困难。标准台式计算机上的自动区分方法对于机器精度大约是准确的。以10 ^ -16的精度计算导数是令人难以置信的，但是对8位值使用自动微分将导致较差的结果。在反向传播过程中，这些导数会复合并最终用于更新神经参数。在如此低的数值精度下，这种模型的精度可能很差。

话虽如此，神经网络已经使用16位和8位浮点数进行了训练。

Suyog Gupta及其同事在2015年发表的第一篇有关降低深度学习中的数值精度的论文是""。本文的结果很有趣，表明32位浮点表示形式可以减少为16位定点表示形式，而精度几乎没有降低。但是，这是使用的唯一情况，因为平均而言，它会产生无偏结果。

在2018年，Naigang Wang及其同事在其论文"使用8位浮点数"中使用8位浮点数训练了神经网络。由于需要在反向传播期间保持梯度计算的保真度(在使用自动微分时能够实现机器精度)，因此使用8位数字而不是推理来训练神经网络要实现的挑战明显更大。

计算效率如何?

还可以对模型进行定制，以使它们的计算效率更高。在移动设备(例如MobileNetV1和MobileNetV2)上广泛部署的模型体系结构就是很好的例子。这些本质上是卷积神经网络，已经重塑了卷积运算以使其具有更高的计算效率。这种更有效的卷积形式称为深度可分离卷积。还可以使用和来针对延迟优化。

下一次AI革命

在资源受限的设备上运行机器学习模型的能力为许多新的可能性打开了大门。发展可能有助于使标准机器学习更加节能，这将有助于消除对数据科学对环境影响的担忧。此外，tinyML允许嵌入式设备具有基于数据驱动算法的新智能，该智能可用于从预防性维护到检测森林中的鸟声的任何事物。

尽管某些机器学习从业者无疑将继续扩大模型的规模，但一种新的趋势正在朝着内存，计算和能源效率更高的机器学习算法发展。TinyML仍处于起步阶段，有关该主题的专家很少。这个空间正在快速增长，并将在未来几年内成为人工智能在工业中的新的重要应用。

【编辑推荐】

SpringBoot的设计理念和目标、整体架构你有深入了解吗
在外国人眼中，阿里云跻身全球第三的秘诀居然是这些......
关于大数据时代的社会治理之道，听听专家怎么说
微软将为Windows 10设备带来Windows 10X的设置体验
李开复对话彭特兰：AI不是单打独斗，应避免AI冷战

新浪财经App喜娜AI助手通过大模型登记，已上线AI摘要和个股公告AI解读量子位
3月14日，官方发布的信息显示，新浪财经App喜娜AI助手近日已通过北京市生成式人工智能服务登记。目前，喜娜AI助手已上线两项创新功能：喜娜AI摘要和个股公告AI解读。这两项功能旨在通过先进的人工智能技术，提升用户对财经资讯和上市公司公告的理解与分析效率，这标志着AI技术在信息服务领域的又一重大突破。喜娜AI摘要：快速提炼财经资讯核心要点AI时代，资讯信息迎来爆炸性增长，用户每天都要面对海量资讯，
模型微调：让AI更懂你的魔法棒带上一无所知的我 pytorch 人工智能 python
模型微调：让AI更懂你的魔法棒✨在人工智能的世界里，模型微调（Fine-tuning）就像是一位魔法师用魔法棒对预训练模型进行“个性化改造”，让它更适应特定的任务。今天，我们就来深入探讨模型微调的技术细节，让你也能像魔法师一样，轻松驾驭AI模型！什么是模型微调？模型微调是指在预训练模型的基础上，通过少量的特定任务数据进行训练，使模型更好地适应新任务的技术。预训练模型通常是基于大规模数据集（如Ima
从 DeepSeek 到 AI 工具箱：Websoft9 应用托管平台赋能高校教学与科研人工智能deepseek
从DeepSeek到AI工具箱：Websoft9应用托管平台赋能高校教学与科研人工智能技术的快速发展正在重塑高校的教学与科研生态。从智能教学辅助到跨学科研究，AI工具的应用场景不断扩展，而技术落地的复杂性也带来新的挑战。在这一背景下，如何将大模型能力与多样化AI工具无缝整合，构建安全、易用的科研教学环境，成为高校数字化转型的关键命题。一、高校智能化转型的三大痛点技术门槛高•AI工具部署依赖专业运维
聊聊关于Python与人工智能那些事小G-biu- python 人工智能 tensorflow
Python与人工智能：介绍Python在人工智能方面的应用Python是一种广泛使用的编程语言，也是人工智能领域中最受欢迎的语言之一。Python提供了许多用于构建和训练人工智能模型的库和框架。本文将介绍一些常见的人工智能技术以及Python在这些技术中的应用。OpenAIOpenAI是一个非营利组织，旨在推动人工智能的发展并促进其对人类的利益。OpenAI通过开发人工智能技术、研究人工智能的影
当现代教育技术遇上仓颉---探秘华为仓颉编程语言与未来教育技术的接轨想成为高手499 华为服务器 php
引言随着人工智能、物联网、区块链等新兴技术的发展，编程语言的需求也在不断演化。据市场研究机构发布的数据显示，全球编程语言市场规模预计在未来五年内将以每年10%的速度增长。此外，越来越多的企业和高校正在积极推动基于分布式系统和硬件优化的新型语言开发，这进一步表明对高性能编程语言的需求日益旺盛。近年来，华为推出了自研编程语言“仓颉”，以其高效的语法设计、灵活的语义表达能力和强大的跨平台适配性能引发了编
Python在人工智能与机器人开发中的应用与实践一键难忘 python 人工智能机器人
Python在人工智能与机器人开发中的应用与实践Python已经成为人工智能和机器人开发的主要编程语言之一，凭借其简洁的语法、强大的库支持和广泛的社区资源，Python为开发者提供了一个高效且易于学习的平台。在这篇文章中，我们将深入探讨如何使用Python进行人工智能（AI）和机器人开发，并通过实际代码示例展示核心技术和应用。1.Python在人工智能中的应用人工智能（AI）领域的核心任务包括机器
智慧交通是什么，可以帮助我们解决什么问题? Guheyunyi 运维大数据人工智能信息可视化前端
智慧交通是什么？智慧交通（SmartTransportation）是指利用物联网（IoT）、大数据、人工智能（AI）、云计算、5G通信等先进技术，对交通系统进行智能化管理和优化，以提高交通效率、减少拥堵、降低事故率、提升出行体验，并实现交通资源的合理配置和可持续发展。智慧交通的核心是通过数据采集、分析和应用，实现交通系统的智能化、自动化和协同化，从而构建一个高效、安全、绿色、便捷的交通生态系统。智
在线视频创作平台（Vidnami） deepdata_cn 视频生成视频剪辑视频创作
Vidnami是一款功能强大的在线视频创作平台，前身为ContentSamurai，于2015年推出，2020年更名为Vidnami。它运用人工智能技术，能够分析输入的文本，自动从大量素材中选取合适的图像和视频片段，将文字快速转化为具有专业外观的视频，无需用户具备视频编辑经验。该平台提供多种视频模板、全主题定制功能以及内置的免版权媒体库，包括3000万张图片和3万首音乐，还支持自动配音，用户可以录
OpenCV第1课OpenCV 介绍及其树莓派下环境的搭建嵌入式老牛树莓派之OpenCV opencv 人工智能计算机视觉
1.机器是如何“看”的我们人类可以通过眼睛看到五颜六色的世界，是因为人眼的视觉细胞中存在分别对红、绿、蓝敏感的3种细胞。其中的光感色素根据光线的不同进行不同比例的分解，从而让我们识别到各种颜色。对人工智能而言，学会“看”也是非常关键的一步。那么机器人是如何看到这个世界的呢？这就涉及到人工智能方向重要的分支--机器视觉。机器视觉即用机器人代替人眼来做测量和判断，通过机器视觉产品（即图像摄取装置，分C
Linux安装Anaconda和Jupyter 硬水果糖人工智能 Linux linux jupyter 运维
一、了解Anaconda和Jupyter引言：Anaconda是一个流行的开源数据科学平台，广泛用于数据分析、机器学习、人工智能等领域。它是一个集成了大量科学计算和数据科学工具的Python和R编程语言环境。Anaconda的主要目标是简化数据科学和机器学习的开发流程，提供一个易于安装和管理的环境。而预装了大量常用的Python和R库，这些库涵盖了数据科学的各个方面，包括：数据分析：Pandas、
DeepSeek 大模型落地成都高新区：科技赋能警务的创新变革 AGI大模型学习科技人工智能 DeepSeek 大模型 chatgpt 大模型应用 AI大模型
在科技飞速发展的当下，人工智能正以前所未有的速度融入各个领域，深刻改变着人们的生活与工作方式。公安领域也不例外，积极拥抱科技创新，成为提升警务效能、维护社会稳定的关键路径。全国第一例警用DeepSeek大模型落地成都高新区，这一突破性举措在警务智能化发展进程中具有里程碑意义，为公安工作带来了全方位的革新。一、警用DeepSeek大模型落地的时代背景近年来，国产AI蓬勃发展，不断涌现出令人瞩目的成果
大数据和人工智能概念全面解析就犯得上方法
一、大数据和人工智能大数据是伴随着信息数据爆炸式增长和网络计算技术迅速发展而兴起的一个新型概念。根据麦肯锡全球研究所的定义，大数据是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合，具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。大数据能够帮助各行各业的企业从原本毫无价值的海量数据中挖掘出用户的需求，使数据能够从量变到质变，真正产生价值
DeepSeek爆火，背后模型竟藏着这些秘密！ qq_23519469 ai
DeepSeek是什么来头最近，AI圈可是被一个名字刷爆了屏，那就是DeepSeek！它就像一颗横空出世的超级新星，在全球范围掀起了一阵狂热的追捧潮，这热度，简直了！大家都在疯狂讨论它，各种测评、对比层出不穷。它到底有啥过人之处，能让这么多人都为之疯狂？今天咱就来好好唠唠。DeepSeek，全称杭州深度求索人工智能基础技术研究有限公司，是一家专注于开发先进大语言模型（LLM）和相关技术的企业。它成
AI人工智能代理工作流AI Agent WorkFlow：设计智能任务处理流程 AI天才研究院计算 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能代理工作流AIAgentWorkFlow：设计智能任务处理流程作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来在当今的数字化时代，随着数据量的爆炸式增长和复杂性的提升，传统的手动任务处理方式已经无法满足高效、准确的需求。人工智能技术的发展为自动化任务处理提供了新的可能性。AI人工智能代理（AIAgent）作为一
【大模型科普】AIGC技术发展与应用实践（一文读懂AIGC）人工智能
【专栏介绍】⌈⌈⌈人工智能与大模型应用⌋⌋⌋人工智能（AI）通过算法模拟人类智能，利用机器学习、深度学习等技术驱动医疗、金融等领域的智能化。大模型是千亿参数的深度神经网络（如ChatGPT），经海量数据训练后能完成文本生成、图像创作等复杂任务，显著提升效率，但面临算力消耗、数据偏见等挑战。当前正加速与教育、科研融合，未来需平衡技术创新与伦理风险，推动可持续发展。文章目录一、AIGC概述（一）什么是
EmbodiedSAM：在线实时3D实例分割,利用视觉基础模型实现高效场景理解数据猎手小k 3D 实例分割在线实时感知视觉基础模型（VFM）应用
2025-02-12，由清华大学和南洋理工大学的研究团队开发一种名为EmbodiedSAM（ESAM）的在线3D实例分割框架。该框架利用2D视觉基础模型辅助实时3D场景理解，解决了高质量3D数据稀缺的难题，为机器人导航、操作等任务提供了高效、准确的视觉感知能力。一、研究背景随着机器人技术和人工智能的发展，机器人在复杂环境中执行任务（如导航、操作和交互）的能力越来越依赖于对三维（3D）场景的实时、准
国产信创AI IDE：开启智能编程新时代 InsCode AI IDE
国产信创AIIDE：开启智能编程新时代随着信息技术的迅猛发展，软件开发工具也在不断演进。近年来，人工智能（AI）技术的应用为编程工具带来了革命性的变化。其中，国产信创AIIDE——InsCodeAIIDE，作为一款由CSDN、GitCode和华为云CodeArtsIDE联合开发的新一代集成开发环境（IDE），以其智能化、高效化的特点，正在引领智能编程的新时代。最新接入DeepSeek-V3模型，点
【产品小白】什么是AI产品经理百事不可口y 产品经理的一步一步人工智能产品经理学习产品运营内容运营用户运营
一、AI产品经理的定义与角色定位AI产品经理是人工智能技术与商业应用之间的核心桥梁，负责将复杂的AI技术转化为满足市场需求的产品。需同时具备技术理解力、商业洞察力和用户思维，既要参与算法选型与数据建模，又要定义产品功能与市场策略，是贯穿产品全生命周期的关键角色。与传统互联网产品经理相比，AI产品经理的独特之处在于：技术深度参与：需理解机器学习、自然语言处理（NLP）、计算机视觉等技术原理，并参与数
人工智能（AI）系统化学习路线 xiaoyu❅ python 人工智能学习
一、为什么需要系统化学习AI？人工智能技术正在重塑各行各业，但许多初学者容易陷入误区：❌盲目跟风：直接学习TensorFlow/PyTorch，忽视数学与算法基础。❌纸上谈兵：只看理论不写代码，无法解决实际问题。❌方向模糊：对CV/NLP/RL等细分领域缺乏认知，难以针对性提升。正确的学习姿势：“金字塔式”分层学习（理论→算法→框架→应用→工程化），逐步构建完整的AI知识体系。二、人工智能学习路线
MMScan数据集：首个最大的多模态3D场景数据集，包含层次化的语言标注数据集
2024-10-24，由上海人工智能实验室联合多所高校创建了MMScan，这是迄今为止最大的多模态3D场景数据集，包含了层次化的语言标注。数据集的建立，不仅推动了3D场景理解的研究进展，还为训练和评估多模态3D感知模型提供了宝贵的资源。一、研究背景：随着大型语言模型（LLMs）的兴起和与其他数据模态的融合，多模态3D感知因其与物理世界的连接而受到越来越多的关注，并取得了快速进展。然而，现有的数据集
【AI大模型】RAG如何让生成AI更智能？最新方法与优劣深度解析健忘的派大星人工智能语言模型 ai AI大模型 agi RAG 程序员
前言近年来，人工智能技术突飞猛进，尤其是生成式AI，简直像是开了挂一样，各种惊艳的表现让人直呼“未来已来”。根据IDC的研究，生成式AI的市场规模在2022年已经达到了107亿美元，而到2026年，这个数字预计会飙升至326亿美元！不过，尽管生成式AI很强大，但它也并非完美无缺——比如生成内容的质量、准确性和可靠性，依然有提升的空间。这时候，检索增强生成（RAG）技术登场了！RAG的核心思路很简单
A Survey of Large Language Models大模型综述论文章节总结 WhyteHighmore 论文语言模型人工智能自然语言处理论文笔记
ASurveyofLLM人大译ASurveyofLargeLanguageModels这篇论文全面回顾了大型语言模型(LLM)的最新进展，重点关注其发展背景、关键发现和主流技术。文章主要围绕LLM的四个主要方面展开：1引言自从1950年图灵测试被提出以来，人类一直在探索机器掌握语言智能的方法。语言本质上是一种受语法规则支配的复杂、精细的人类表达系统，这使得开发能够理解和掌握语言的强大人工智能(AI
AI：对比ChatGPT这类聊天机器人，人形机器人对人类有哪些不一样的影响？ InnoLink_1024 AGI 人工智能机器学习 chatgpt 人工智能机器人
人形机器人与像ChatGPT这样的聊天机器人相比，虽然都属于人工智能技术的应用，但由于其具备的物理形态和与环境的互动能力，它们对人类的影响会有很大的不同。下面从多个角度进行对比，阐述它们各自对人类的不同影响：1.物理交互与虚拟交互人形机器人：具有物理形态，能够在物理世界中与人类进行直接交互。例如，搬运物品、进行日常家务、提供身体上的帮助（如扶持老人、帮助走路等），以及进行非语言的沟通（如手势、面部
DeepSeek从入门到精通「清华团队」 YuKeeHgg DeepSeek 人工智能 ai
由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余梦珑博士后及其团队撰写文档的核心内容围绕DeepSeek的技术特点、应用场景、使用方法以及如何通过提示语设计提升AI使用效率等方面展开，帮助用户从入门到精通DeepSeek的使用。「文末附下载方式」第一部分：DeepSeek基础概念1.1DeepSeek简介定义：专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。核心产品：开源
人工智能的未来：从基础到前沿的探索与展望小二爱编程· 人工智能 ai AI编程 AI写作 AI作画
1.人工智能简介内容概述：人工智能（AI）是指模拟和执行人类智能任务的技术。随着计算能力和数据量的增加，AI在各个领域取得了显著进展，从自动化的基本任务到解决复杂的实际问题，人工智能正渗透到我们生活的各个方面。2.人工智能的种类与发展内容概述：AI的种类可以按智能的复杂度分为三大类：弱人工智能（NarrowAI）：目前大多数应用都属于弱AI，如语音助手、自动驾驶等。它们专注于特定任务，并且无法扩展
SciER：首个大规模科学文档中的实体和关系抽取数据集数据集
2024-10-28，为科学文档中的实体和关系抽取领域带来了突破，提供了一个包含106篇完整科学出版物、超过24,000个实体和12,000个关系的大规模数据集，这对于构建科学知识图谱和促进科学信息抽取技术的发展具有重要意义。数据集地址：SciER|科学信息提取数据集|人工智能数据集一、研究背景：在科学文档中，实体（如数据集、方法、任务）和它们之间的关系对于理解科学发现和推动研究进展至关重要。然而
元戎启行最新战略RoadAGI：所有移动智能体都将被AI驱动量子位
2025年3月18日（北京时间），元戎启行作为国内人工智能企业代表，出席由NVIDIA主办的GTC大会。会上，公司CEO周光发表了技术主题演讲，展示了公司的最新战略布局RoadAGI，并发布道路通用人工智能平台——AISpark（以下简称”Spark平台”）。RoadAGI是元戎启行实现物理世界通用人工智能的关键一步，旨在让包括智能驾驶汽车在内的移动智能体，都具有在道路上自主行驶、与物理世界深度交
【财经信息差】2024年12月27日最新财经资讯一览每日财经热点一网打尽代码简单说 AI观财经:财经信息差 AI观财经财经信息差今日财经资讯财经热点今日资讯
大家好，欢迎来到财经信息差！每天，我们将带你直击全球财经动态，精选最新的市场变化、政策动向与产业趋势，让你在最短的时间内，轻松掌握最关键的财经资讯。随着人工智能技术的迅猛发展，我们将用AI的视角为你解析财经热点、企业动向及全球经济变化，让复杂的信息变得简单易懂，帮助你做出更明智的投资决策。财经领域股票市场美股三大指数集体低开，大型科技股多数下跌，纳斯达克金龙指数跌1.07%。小鹏汽车跌3.32%，
探索AI知识库的无限潜力：定义、应用与未来展望知识库知识库管理知识库软件
一、AI知识库的定义AI知识库，作为人工智能技术与传统知识库概念的融合，是指利用人工智能算法和技术构建、管理和维护的信息存储系统。它不仅包含了大量的结构化、半结构化和非结构化数据，还具备智能检索、推理分析、自我学习和优化等高级功能。AI知识库通过模拟人类的认知过程，实现了对知识的有效组织和高效利用，为各种应用场景提供了强大的支持。二、AI知识库的应用1.客户服务与支持在电子商务领域，AI知识库的应
低代码平台未来发展趋势有哪些？低代码
低代码平台的未来发展趋势呈现出多维度的创新与深化，以下结合JNPF快速开发平台的特性，为您分析其未来的发展方向：1.智能化与AI深度融合低代码平台将与人工智能技术深度融合，实现开发流程的智能化升级。例如，JNPF平台有望通过自然语言处理技术，让开发者仅需用自然语言描述需求，平台即可自动生成初步的应用架构和代码逻辑。此外，AI技术还将用于智能推荐、代码自动生成、流程自动化等功能，进一步提升开发效率。
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><

更大的模型并不总是更好的模型，微型机器学习将是未来的方向

你可能感兴趣的:(人工智能)