开拓者5号

IBM推出的张量计算库Ocean Tensor Library

矩阵和张量运算构成了广泛领域和应用的基础，并且在许多情况下构成了整体计算复杂性的重要部分。通用gpu能够加速其中许多操作并使其他操作成为可能，这导致了这些设备的广泛适应性。为了充分利用张量运算的计算能力，需要专门的软件，目前有几个包（主要是在深度学习领域）包含了CPU和GPU上的张量运算。然而，支持一般张量运算的独立框架仍然缺失。在本文中，我们填补了这一空白，并提出了海洋张量库：一个模块化的张量支持包，它被设计为在各种设备类型上需要密集张量操作的应用程序的基础层。API经过精心设计，功能强大，可扩展，同时易于使用。这个包是开源的。

1简介

在过去十年左右的时间里，通用GPU已成功应用于医学成像[14，17]、分子动力学模拟[9]、射电天文学[3]、数据挖掘[4]、图形处理[15]和许多其他领域[10]。最近，gpu已经广泛应用于深度学习，并在很大程度上实现了深度学习。与其他领域相比，深层次学习的软件包可能更多，如Caffe[8]、Torch[7]和Tensorflow[1]。其中一个原因是在深入学习中需要灵活性，以便尝试不同的网络架构和数据转换，以获得最佳可能的模型。考虑到数据、节点参数和中间结果可以方便地以多维数组或张量的形式表示，这些包已经逐渐向通用计算环境转变。尽管取得了这些进展，但仍有很大的改进空间：现有的软件包往往是单一的，需要大量的外部依赖，并且往往缺乏张量布局灵活性、支持的数据类型或对新设备类型的扩展。最重要的是，一个独立的张量支持包被设计为广泛的其他应用程序的基础仍然缺失。为了填补这一空白，解决现有封装的一些缺点，我们提出了海洋张量包（Ocean Tensor Library），一个模块化的开源基础库用于密集张量操作。

我们在第二节描述了海洋张量包（

简称海洋Ocean）的设计和实现，并在第三节强调了它的一些独特特性。在第四节中，我们将查看现有的包，并将它们与海洋进行对比。我们在第5节中提供了一个使用海洋的示例，并在第6节中进行了总结。

2设计和实现

海洋张量（Ocean Tensor Library）包被设计成一个基础层，用于需要在一个或多个设备类型和实例上进行密集张量操作的应用程序。考虑到广泛的潜在应用和领域，重要的是将张量运算分组到相干模块中，而不是通过一个巨大的单片封装来提供。这样，用户可以在需要时安装功能，这有助于减少依赖项的有效数量。另一个优点是，与外部库的接口和兼容性被本地化为独立的模块，从而使包更易于管理。海洋中使用的另一个设计原则（本节稍后将讨论）是使用定义良好的层。

2.1 模块化

Ocean中的模块化模块包括一个接口以及每个受支持设备类型的独立实现。模块接口负责与设备无关的参数检查，包括张量的有效性和张量维度的兼容性。然后，它确定要使用的数据类型和设备，并为与设备类型关联的模块查询函数查找表。如果可用，则在执行所有必需的类型转换、广播以及结果张量和中间张量的分配（例如，当张量在内存中重叠时）之后调用该函数。如果函数不可用，或者尚未加载设备类型的模块实现，则会引发错误。设备级的函数通常只需要检查对给定数据类型的张量的支持，或者实现张量操作，或者更典型地，调用提供所需操作的低级库函数。

如果需要，函数可以访问与每个设备实例关联的特定于模块的上下文信息。

模块接口和设备实现可以单独加载，但核心模块接口除外，核心模块接口包括CPU实现。接口和实现之间的分离使得可以用替代方案来替换模块实现，例如高度优化或专用的专有版本。使用函数表还可以替换单个函数进行性能比较或调试，或者插入记录运行时或累积调用统计信息的函数。模块接口和设备实现之间的分离也使得使用新的设备类型扩展海洋变得容易。

特别是，每个模块中的模块和功能可以一次添加和测试一个，从而避免了开始时的巨大开发工作。

核心模块构成了海洋张量包的基础。它提供所有基本的张量操作，并实例化和公开可用的设备实例。许多标准功能，例如不同设备类型之间的打印和张量复制，都需要CPU上的张量支持，因此核心模块接口与CPU实现（pyOcean_CPU）相结合。GPU实现可以通过导入pyOcean_GPU单独加载。

为了方便起见，这两个包裹都是通过海运进口的。允许模块之间的依赖关系，并且一个模块的实例化可以导致加载其他模块。仔细注册模块的实例化顺序，以确保只有当没有其他模块依赖于模块时，才能最终确定模块。

2.2分层实施

在Ocean Tensor包的实现中，注意保持不同抽象级别之间的干净分离，如图1所示。底层的库提供独立于张量表示的低级张量操作。这包括现有的库，如BLAS和CUBLAS，以及定制开发的坚实基础库，它为CPU和GPU提供基本张量函数。这个级别的库不是特定于海洋的，可以由需要低级别张量运算的其他应用程序独立使用。海洋张量API定义了一个统一的张量类型以及各种张量操作，它们被组织为模块。如上所述，模块本身可以分为两层，即接口和设备实现。海洋API是用C语言实现的，以最大限度地提高其他语言的可访问性。图1中的顶层显示了可能绑定到Ocean的语言（当前版本只实现对Python的支持）。
但是，API的使用不限于语言绑定。例如，使用张量运算的应用程序，或者支持符号张量计算图的库，也可以构建在海洋张量API之上。

3功能

Ocean Tensor软件包[2]为CPU和GPU提供了一套全面的张量操作。这些函数可以直接作为C库使用，也可以通过易于使用的Python界面使用。在本节中，我们将探索该软件包的某些功能，并以基于Python接口的代码摘录进行说明。

3.1对象类型

Ocean Tensor Package的用户界面公开了几种对象类型，如图2所示。在对象层次结构的顶部是Tensors和Scalars，它们每个都有给定的数据类型。张量是存储为存储对象的连续内存块的视图。与每个存储对象相关联的是一个流，该流用于调度异步操作以及维护流间依存关系。流对象本身与特定设备类型（例如CPU或GPU）的设备实例（例如CPU或GPU＃0）关联。

3.1.1设备

设备对象使实例化张量或存储对象时可以使用的设备规范。此外，它们还提供给定设备的一般信息，例如支持字节交换数据或所有当前已加载模块的列表。根据设备类型，可能会提供其他信息。例如，在GPU设备上，可以查询许多属性，包括多处理器计数或当前可用的空闲内存。高级功能包括实例化新流，指定设备的中间张量缓冲区的数量及其最大大小。 Ocean维护可用设备的列表，包括ocean.cpu设备以及GPU设备的ocean.gpu列表，可以对它们进行索引以获得所需的设备实例。

3.1.2存储

存储对象封装了一块连续的内存，该内存可以动态分配，也可以由外部源提供。与存储关联的数据类型有两个主要目的：首先，当在不提供类型的情况下从存储实例化张量时，将其用作默认数据类型；第二，格式化存储元件以供显示。存储对象的数据类型可以自由更改，而不会影响使用它的张量。可以在同一存储上叠加不同数据类型的张量。发生这种情况的一个典型示例是查询复杂的双精度张量的虚部时，这会导致在double类型的存储中产生一个额外的张量视图。可以共享同一存储的不同张量类型的数量没有限制。张量操作使用存储流进行同步，以避免竞争情况和数据不一致。

可以将存储数据标记为只读，这可以防止直接或通过张量操作对数据进行任何更新（将存储标记为只读反映在所有派生的张量中）。

3.1.3张量

海洋张量易于在任何可用设备上实例化。例如，在设备gpu [0]上创建具有单精度浮点格式的3×4张量只需编写：tensor = ocean.tensor（[3,4]，ocean.float，ocean.gpu [ 0]）。省略数据类型或设备时，将使用用户指定的默认值。与稍后在第4节中介绍的某些其他程序包相比，没有当前活动设备的概念，也不需要进行显式设备更改即可实例化新张量或对其执行操作。默认情况下，张量遵循列为主的内存布局，但支持常规跨度（以字节为单位），从而允许与大多数Numpy张量兼容。 Numpy [12]的两个区别是（1）支持Ocean中复杂的半精度数据类型，以及支持Numpy中的其他数据类型（例如字符串和日期时间），以及（2）张量维数的最大值。目前，Ocean中最大张量维数设置为8，但是此限制很容易放松或消除。 Numpy的硬编码最大张量为32。与Numpy相似，Ocean允许CPU上的张量具有小端字节顺序和大端字节顺序，并且张量操作可以按任一字节顺序进行。如果需要，可以通过字节交换元素或在标志和实际字节顺序不匹配的情况下，通过简单地指定适当的字节顺序来轻松更改字节顺序。

3.2 Tensor操作

如第2节中所述，Ocean中的Tensor操作是通过模块提供的。Core模块构成了Ocean的基础，并且包括基本对象类以及设备实例的定义。作为最基本的操作，Core模块支持张量创建。带有或不带有初始化的数据，来自存储以及嵌套列表，序列和其他张量类型形式的数据的数据。除了创建张量，Core模块还提供了广泛的基本功能集，包括用于形状和轴操作，索引，复制功能，类型和设备转换，基本算术运算，三角运算的功能（在所有实数和复数浮点上均受支持）类型），以及沿一个或多个轴的张量缩减。（可以在Ocean Tensor Package存储库[2]中找到功能的完整列表。）下面，我们重点介绍一些功能。

3.2.1类型转换

张量的类型可以看作是数据类型和与张量关联的设备的组合。海洋中的张量具有关联的类型，因此有时可能需要类型转换。显式类型转换可以使用ocean.cast函数（仅返回所请求类型的张量的副本）和ocean.ensure函数（仅当所请求的类型与输入的类型不同时才返回类型转换的张量）使用。使用数据类型（ocean.float（T））或设备实例（ocean.gpu [1]（T））进行类型转换等效于仅使用数据类型或设备更新来调用ensure函数。

Ocean中的隐式类型转换用于确保张量操作的输入参数具有适当的类型和字节顺序。例如考虑张量加法：C = A + B。为了避免对所有可能的类型组合实施加法运算，我们需要根据A和B的类型确定C的类型，并相应地对数据类型和设备进行标准化。解决设备类型的一种方法是强加设备订购并选择优先级最高的设备。这要求对命令进行规范，并且肯定会导致意外结果，当然，当可以从代码的其他部分更改设备命令时也是如此。另一种方法是始终从操作员的左侧或参数列表中的第一个参数使用设备。

在A + = B中，很明显B应该被强制到A的设备，因此我们对A + B进行相同的操作。如果希望使用B的设备（即B.device），则在这种情况下可以写B + A或使用显式强制转换：ocean.ensure（A，B.device）+ B或只需B.device（A）+ B

对于隐式转换数据类型，我们遵循Numpy并使用可以保留两种数据类型的最小可用数据类型。例如，将有符号和无符号8位整数相加会得到16位有符号整数。由于没有标准数据类型可用于四精度浮点数，因此对于64位整数和浮点数会产生异常，这会导致双精度浮点数。默认情况下，Ocean上的自动类型转换默认是打开的，但是如果需要严格的类型检查，则可以由用户禁用。关闭时，只要遇到类型不匹配，就会引发异常。

例如，当取负实数的平方根或大小大于1的标量的反余弦时，基于张量的内容进行类型转换是理想的。

这样的运算是否应该导致非数字（NaN）值，返回复数值结果或产生错误？ Ocean中采用的方法是向此类运算符添加指示计算模式的参数。在标准模式下，无需对张量元素进行检查，并且在需要时会生成NaN值。在警告和错误模式下进行检查，当遇到值超出操作员域的元素时，分别给出警告或错误。最后，在复杂模式下，进行检查以确定是否结果数据类型应为实数或复数。如果需要，可以始终使用显式类型转换。

3.2.2索引

Ocean支持沿一个或多个维度的多种索引模式，这些模式可以组合以对张量进行索引。基本的一维分度模式是：（1）标量，沿轴分度单个元素；（2）范围，以索引规则排列的元素集；（3）冒号“：”运算符表示整个尺寸。除了基本模式外，还可以使用一维或二维索引数组来选择特定元素，方法是沿一维指定索引，或者沿多个维指定索引元组。按照Python的惯例，可以使用负索引来指示相对于维度末端的索引。最后，布尔张量可以用作索引的掩码，其中非零元素表示要选择的元素。索引中省略的维将使用冒号运算符进行隐式索引，并且省略号对象“ ...”可能会出现一次，以指示在该位置应用零个或多个冒号运算符来完成索引。仅使用基本索引模式（显式或隐式）对张量进行索引时，该张量的视图以共享原始存储的新张量的形式返回。在所有其他情况下，通过复制索引元素来创建新的张量

索引数组和布尔掩码需要特殊的预处理：对于索引数组，需要检查索引的有效性；对于布尔型蒙版，必须计算所选元素的数量，以确定输出张量的大小；并将所选择的索引转换为相对偏移量到被索引张量的数据缓冲区中。当这样的索引被重复使用时，为每次使用应用相同的预处理步骤就浪费了计算工作。为了避免这种情况，Ocean引入了索引对象，该索引对象是通过对ocean.index对象建立索引来构造的（在常规函数调用中，不允许将range和冒号参数作为参数使用）。一旦创建了索引对象，就可以将其绑定到张量大小以转换负索引，检查索引的有效性，确定索引范围与给定维的重叠，以及将布尔掩码转换为显式索引。索引对象可以随后（或直接）绑定到张量跨度，后者将所有索引数组和布尔掩码转换为张量数据内的相对偏移量。绑定索引对象和未绑定索引对象都可以以与用于构造它的索引模式完全相同的方式使用。这样，如果需要，可以使用索引对象来创建其他索引对象。当索引对象绑定到大小时，相关的张量尺寸必须匹配，并且跨度也必须匹配。

3.2.3互操作性

Ocean的Python接口提供了插件模块，用于定义张量和标量的外部对象类型，以及在这些对象和相应的Ocean类型之间进行转换。解析张量操作参数时，会将插件提供的所有扩展对象类型进行比较。这使它们的使用方式与洋张量和标量基本相同。例如，我们可以通过导入pyOceanNumpy来声明Numpy张量和标量类型。一旦完成，就可以编写诸如A + np.asarray（[4,5,6]）的表达式，其中A是一个海洋张量。可以使用A.convertTo（'numpy'）转换为Numpy，其中'numpy'字符串由插件注册。当受外部张量类型支持时，将生成张量的浅表副本，除非用户另有要求。

3.2.4解除内存分配

Python中的自动垃圾收集可以延迟张量对象的删除，并导致设备耗尽可用内存，尽管用户进行了认真的管理。为了强制删除张量，可以调用dealloc张量函数，该函数维护Python张量对象，但将内容替换为空张量。这样可以释放任何动态分配的张量数据，同时避免在重新分配后意外使用张量的问题。

4 现有的软件包

我们现在将海洋中的一些功能与其他软件包中的功能进行比较。由于大多数软件包都处于活动开发阶段，因此我们只讨论编写时可用的功能。

Numpy[12]是用于密集张量操作的事实上的Python包。Numpy是为cpu上的张量编写的，不支持任何其他设备类型上的张量。最近的CuPy[11]包为GPU设备实现了tensors，它的接口与Numpy的接口非常相似，但在其他方面基本上是独立的。这两个包都是作为Python-C API编写的，并直接扩展Python类，这限制了它们作为独立包的使用。此外，这两个包中的每一个只支持一种设备类型。

ArrayFire[18]是一个支持多种设备类型并作为具有单独语言绑定的通用库编写的包。这同样适用于大多数深度学习包。正如在引言中提到的，张量操作是深度学习包的基础，因此我们考虑一些最流行的软件：CAFE（8）、PyTrof（6, 13）、TunSoFrase[1 ]和MxNET[5 ]。所有这些包都支持多种设备类型上的张量操作，并将至少一部分可用的张量操作公开给用户。尽管如此，考虑到对深度学习的关注，这些包不是编写的，也不是打算用作独立的张量支持包。特别是，许多包定义了具有高度特定于域的成员函数和变量的张量类。例如，类可以为每个张量提供梯度信息，或者包括对包含张量的符号计算图节点的引用。
转存失败重新上传取消转存失败重新上传取消

在表1中，我们列出了一些我们认为在通用张量包中很重要的性质，因此在海洋中实现。如第3.2.1节中详细讨论的，这些特性之一是支持自动类型铸造。Numpy、CuPy和ArrayFire都支持此功能，但正在考虑的所有深度学习包中都缺少此功能。

从开发人员的角度来看，有一个统一的张量类型或类是很方便的。除Caffe外的所有包都支持此功能，Caffe提供了一个模板类（其他几个包在后台使用模板类，但在API中提供统一类型）。对于tensor包2，支持一组全面的数据类型显然很重要。包之间的覆盖范围有很大的不同，因此我们将重点放在对复杂数据类型的支持上，这需要额外的功能，例如共轭和对张量的实部和虚部的访问。在所考虑的四个深度学习包中，只有TensorFlow支持复杂的张量类型（基于单精度和双精度浮点）。Numpy、CuPy和ArrayFire也支持这些类型。Ocean是唯一一个额外提供基于半精度浮点的复杂数据类型的包。

张量在内存中的布局由步长或沿每个维度的连续元素之间的距离给出。张量跨度的灵活性可实现以下功能：沿尺寸进行广播，轻松操纵轴以及在定期索引的次张量上创建视图。此外，它确保与张量和矩阵的各种现有数据类型兼容。大多数深度学习包以及ArrayFire都遵循连续的行为主数据顺序，并具有隐式跨度，可以根据张量维和给定数据类型的元素大小来推断隐式跨度。 PyTorch默认情况下也使用此数据顺序，但是允许用户通过将张量步幅指定为元素大小的非负倍数来覆盖标准布局。 Numpy和CuPy支持任意步伐。这些软件包中的每一个都与Ocean一起，在可能的情况下实现轴的排序和合并连续的轴，以增加内存局部性并减少遍历维度的开销，这两者都有助于提高跨步数据的张量运算的计算效率。对于许多操作，例如一元和二进制元素级操作，使用连续张量布局的包可以将张量展平为一个维。其他操作可能需要与上述类似的优化。 ArrayFire将张量维数限制为四个，并且经常使用显式嵌套的for循环，并在最内层的循环中使用索引计算来遍历数据。

提供任意步幅带来的一些困难是张量可能在内存中自动重叠，并且成对的张量之间的重叠检测变得不平凡。

为了获得一致的计算结果，例如A [[1，2]] = A [[2，1]]，对重叠检测的良好支持至关重要。 Ocean检查自重叠张量，并在大多数操作中将它们视为只读（未正确定义将不同值写入相同内存地址的语义）。还包括张量对之间的重叠检测以及中间张量的分配以解决重叠。在PyTorch和Numpy中也存在类似的检查。 TensorFlow中的重叠检测仅限于张量视图。

除了Ocean之外，本节中考虑的所有程序包都没有定义张量类型与张量操作的底层实现之间的明确区分。结果，除了现有库（例如BLAS和cuBLAS）已经提供的那些张量操作之外，其他任何张量操作都无法轻松转移以用于其他程序包。

5说明性示例

我们现在基于示例QR因式分解来说明Ocean Tensor Package的某些功能（例如，参见[16]）。当然，这仅仅是一个例子。 QR分解应该是软件包不可或缺的一部分，并计划在未来的线性代数模块中提供直接支持。可以在Ocean Tensor Package存储库的文档中找到核心模块提供的功能的完整列表以及大量示例[2]。

6 结论

在本文中，我们介绍了Ocean Tensor软件包，这是一个通用的张量支持软件包，用于在不同设备类型上的密集张量。该软件包以模块化的方式组织，将张量操作的连贯集合组合在模块中。每个模块都包含一个与设备无关的接口，该接口公开了可用的功能，以及单独的设备专用模块，这些模块提供了这些设备上这些功能的实现。在Ocean中，一个有意识的设计决定是提供清晰分离的抽象层。底层提供了独立于张量表示的低级张量操作，因此也可以被其他软件包用作独立的基础库。 Ocean Tensor软件包的基础牢固地建立在核心模块中，因此未来的工作将主要集中在通过添加新模块和扩展现有模块来提高功能性上。

Available at https://github.com/ibm/ocean-tensor-package

轻松掌握：Milvus向量数据库部署与RAG使用技巧威研威语人工智能数据库 milvus 数据库人工智能 RAG
Milvus简介Milvus是一款开源的向量数据库，由Zilliz开发并维护，适合用于机器学习和人工智能领域。是一款专为处理向量查询而设计的数据库，Milvus能够对万亿级向量进行索引。Milvus官网：https://milvus.io/Milvus中文文档：https://www.milvus-io.com/Milvus部署环境准备Linux操作系统Docker19.03或更高版本Docker
《深度剖析：鸿蒙系统下智能NPC与游戏剧情的深度融合》人工智能深度学习
在游戏开发领域，鸿蒙系统的崛起为开发者们带来了前所未有的机遇与挑战。尤其是在开发基于鸿蒙系统的人工智能游戏时，实现智能NPC的行为逻辑与游戏剧情紧密结合，成为了打造沉浸式游戏体验的关键。鸿蒙系统作为一款面向全场景的分布式操作系统，具有强大的多设备协同能力和出色的性能表现。这为人工智能游戏的开发提供了坚实的基础，使得游戏能够在不同设备上流畅运行，并且实现数据的无缝同步。而人工智能技术的融入，则为游戏
《解锁华为黑科技：MindSpore+鸿蒙深度集成奥秘》人工智能深度学习
在数字化浪潮汹涌澎湃的当下，人工智能与操作系统的融合已成为推动科技发展的核心驱动力。华为作为科技领域的先锋，其AI开发框架MindSpore与鸿蒙系统的深度集成备受瞩目，开启了智能生态的新篇章。华为MindSpore：AI框架的创新先锋MindSpore自2019年诞生以来，迅速在AI领域崭露头角。它以其独特的设计理念和先进的技术架构，为开发者提供了全场景的AI开发支持。从设计理念上看，MindS
Python API接口君王的羔羊 Python AI python
人工智能机器人EverydayWechat老李API图灵机器人：http://www.turingapi.com/（需求实名制认证，并每天免费数量只有100条）青云客智能聊天机器人：http://api.qingyunke.com/（无须申请，无数量限制，但有点智障，分手神器。分手神器，慎用）智能闲聊（腾讯）：https://ai.qq.com/product/nlpchat.shtml(申请使用
深度学习在医疗影像诊断中的应用与实现 Evaporator Core #DeepSeek快速入门人工智能 #深度学习深度学习人工智能
引言随着人工智能技术的快速发展，深度学习在医疗领域的应用日益广泛，尤其是在医疗影像诊断方面。医疗影像数据量大、复杂度高，传统的诊断方法往往依赖于医生的经验，容易受到主观因素的影响。而深度学习通过自动学习特征，能够从海量数据中提取出有用的信息，辅助医生进行更精准的诊断。本文将探讨深度学习在医疗影像诊断中的应用，并通过代码示例展示如何实现一个简单的医疗影像分类模型。深度学习在医疗影像诊断中的应用1.图
1985-2024年地级市人工智能专利数据经管数据库人工智能
《地级市人工智能专利数据（1985-2024）》于2025年1月完成最新更新。数据聚焦于中国各地级市，时间跨度设定为1985年至2024年。在数据整理过程中，参照《关键数字技术专利分类体系（2023）》，依据其中“人工智能”类技术的专利分类号，结合国家知识产权局所提供的信息，对各地每年的专利申请展开搜索与匹配。在此基础上，从众多专利申请中精准筛选出属于“人工智能”类别的专利，并进行数量统计，数据涵
python实现KNN算法的手写数字识别：深入解析与完整项目流程快撑死的鱼 Python算法精解算法
随着人工智能和机器学习的快速发展，图像识别技术在多个领域得到广泛应用。而手写数字识别作为图像识别的典型场景之一，已经成为研究者和开发者学习、应用机器学习算法的经典项目。本文将深入解析如何使用Python编程语言，结合KNN（K-最近邻）算法实现手写数字识别系统。文章不仅介绍了算法的核心原理，还从用户交互、图像处理、数据预处理等多个角度对整个项目进行了全方位的讲解。读者通过本文，可以全面掌握手写数字
《今日AI-人工智能-编程日报》小亦工作室人工智能
1.AI行业动态1.1Manus通用智能体初成型，开启AIAgent新时代中泰证券发布研报称，首款通用型AI智能体Manus已问世，能够将复杂任务拆解为可执行的步骤链，并在虚拟环境中灵活调用工具，标志着AI从“Reasoner”走向“Agent”阶段。Manus的成功引发了开源复现潮，DeepSeek模型已被整合到OWL项目中，并在GAIA基准测试中表现接近Manus。1.2DeepSeek-R2
1章5节：大模型术语解读与从生成到推理的演进 DAT｜R科学与人工智能人工智能
在人工智能的浩瀚宇宙中，大模型正以前所未有的速度演进，推动着科技变革的新浪潮。从多模态到通用模型，再到行业模型，人工智能的边界不断拓展，为各行各业带来了全新的机遇与挑战。本篇文章将深入剖析大模型相关的核心术语，探讨其内涵、应用及发展趋势，并回顾大模型从生成到推理的演进历程，解析全球科技巨头与国内前沿企业在这一领域的竞争与创新。让我们一同探索大模型的演进脉络，把握智能时代的发展脉搏。一、剖析大模型相
Microsoft Fabric 功能更新！更多智能优化，数据平台更强大
近期，微软MicrosoftFabric又更新了，大大增强了AI方面的功能。迅易科技作为微软13年来紧密的生态合作伙伴，为300+行业头部客户实施1000+项目。今天，我们带大家来看下，MicrosoftFabric有什么新玩法？一年前，微软正式推出了一款端到端数据平台，MicrosoftFabric（国际版）是一个集成一体化的平台，提供支持各种数据项目的人工智能驱动服务，帮助所有数据团队能够更快
数据分析及人工智能框架汇总 xihuanyuye 机器学习
一、数据分析二、人工智能1、Tensorflow1、简介TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统，其命名来源于本身的运行原理。Tensor（张量）意味着N维数组，Flow（流）意味着基于数据流图的计算，TensorFlow为张量从流图的一端流动到另一端计算过程。TensorFlow是将复杂的数据结构传输至人工智能神经网中进行分析和处理过程的系统。Tenso
嵌入式人工智能应用- 第七章人脸识别数贾电子科技嵌入式人工智能应用人工智能
嵌入式人工智能应用`文章目录嵌入式人工智能应用1人脸识别1.1dlib介绍1.2dlib特点1.3dlib的安装与编译2人脸识别原理2.1ResNet3代码部署3.1安装[CUDAToolkit12.8](https://developer.nvidia.com/cuda-downloads?target_os=Linux&target_arch=x86_64&Distribution=Ubunt
2025 年最值得收听的 AI 播客推荐！助你轻松掌握人工智能前沿动态！真智AI 人工智能开发语言机器学习
如今，几乎每个人都被告知需要提升技能，而当前许多组织最看重的技能之一就是人工智能（AI）。学习AI相关技能通常涉及数学、统计学和机器学习，但除此之外，你还需要了解行业趋势、业内人士的观点以及各大公司的动态。然而，学习并不意味着时刻都要埋头苦读！有时候，你需要给大脑一个喘息的机会，同时依然能获取有价值的信息。而收听AI相关的播客，就是一个轻松高效的方式。以下是2025年你必须关注的AI播客！1.Th
人工智能概念 zhangpeng455547940 计算机人工智能
机器学习、深度学习、大模型机器学习提供框架，使得系统可以从数据中学习算法：线性回归、逻辑回归、支持向量机、决策树、随机森林、K近邻算法深度学习是实现这一目标的工具，模仿人脑，使用多层神经网络进行学习算法：多层感知器、卷积神经网络、循环神经网络、长短期记忆网络大模型指参数量巨大的深度学习模型人工智能应用：自然语言处理、图像识别与生成、语音识别、政务与企业服务...
（十一）人工智能 - Python 教程 - Python元组星星学霸人工智能 -Python系列教程 python 搜索引擎开发语言
更多系列教程，每天更新更多教程关注：xxxueba.com星星学霸1元组（Tuple）元组是有序且不可更改的集合。在Python中，元组是用圆括号编写的。实例创建元组：thistuple=("apple","banana","cherry")print(thistuple)("apple","banana","cherry")2访问元组元素可以通过引用方括号内的索引号来访问元组元素：实例打印元组中
CES Asia2025新机制引关注，科技创新奖申报火热赛逸展张胜科技
随着2025第七届亚洲消费电子技术贸易展（赛逸展）“展位即门票”机制的推出，科技创新奖的申报工作也正式拉开帷幕。截至目前，已有数十家企业提交了申报材料，涵盖人工智能、物联网、智能硬件等多个热门领域。据了解，CESAsia2025科技创新奖旨在表彰在科技研发和产品创新方面取得卓越成就的企业。此次申报面向所有预订展位的参展企业，评审过程将由行业专家、院士，协会，学者和媒体代表共同参与，确保评选结果的公
再添殊荣！移远通信工业智能品牌宝维塔™斩获AI创新应用奖移远通信算力人工智能工业智能
12月24日，2024中国物联网产业大会暨第21届慧聪品牌盛会在深圳圆满落幕。会上，移远通信凭借其工业智能品牌宝维塔™在推动AI技术落地与应用创新方面的卓越贡献，获颁“AI创新应用奖”。作为科技发展的前沿力量，AI技术正深刻改变着各行各业的生产模式和效率，尤其在工业领域，展现出了巨大潜力。宝维塔™是移远通信精心打造的工业智能品牌，专注于将人工智能、边缘计算、机器视觉、深度学习、软件算法平台等前沿技
2025扩展可能性采购和供应链管理使用AI报告100+份汇总解读|附PDF下载拓端研究室百度人工智能
原文链接：https://tecdat.cn/?p=40348在当今快速发展的商业环境中，采购和供应链管理领域正经历着深刻变革，人工智能（AI）技术的融入成为推动这一变革的关键力量。本报告汇总解读聚焦于AI在采购和供应链管理中的应用，深入剖析其发展现状、面临挑战与潜在机遇。通过对大量数据的分析，揭示AI技术在实际应用中的具体表现，如不同行业的采用比例、应用场景等。本报告汇总洞察基于文末135份供应
【Agent实战】发票信息识别提取专家（AI +OCR技术结合ChatGPT4o能力+结构化prompt（CoT、One-shot等）+Knowledge - RAG+API工具Agent项目实践）姚瑞南大模型落地探索及agent搭建 RAG技术应用探索 prompt实战应用案例人工智能 ocr prompt AIGC chatgpt gpt agi
本文原创作者：姚瑞南AI-agent大模型运营专家，先后任职于美团、猎聘等中大厂AI训练专家和智能运营专家岗；多年人工智能行业智能产品运营及大模型落地经验，拥有AI外呼方向国家专利与PMP项目管理证书。（转载需经授权）目录1.项目背景2.项目目标定性：定量：3.发票核心字段概述4.关键举措5.Workflow设计思路及编排5.1整体设计思路5.2流程搭建及解读流程解读：代码节点：解析agent数据
你所不知道的关于AI的27个冷知识——AI的军事应用贫苦游商 transformer 人工智能自动化算法 gpt
AI的军事应用亲爱的朋友们，今天我们要踏入一个既神秘又令人激动的领域——人工智能（AI）在军事中的应用。想象一下，一个由智能机器人和无人机组成的军队，能够进行精准打击和复杂的战略部署，这一切听起来像是科幻电影中的场景，但在现实中已经逐渐成为可能。让我们一起探索AI在军事中的奇妙应用以及它所带来的挑战。智能无人机：空中的无形战士首先，让我们飞向天空，看看那些令人惊叹的智能无人机。这些无人机不仅能进行
普通人如何利用GPT赚钱之开发虚拟助手贫苦游商普通人利用AI搞钱系列 gpt 人工智能深度学习机器人 AIGC
普通人如何利用GPT赚钱之开发虚拟助手随着人工智能技术的迅猛发展，GPT（GenerativePre-trainedTransformer）作为一种强大的语言模型，正在改变我们的生活和工作方式。普通人如何利用GPT赚钱？开发虚拟助手是一个极具潜力的方向。本文将探讨如何开发虚拟助手，以及如何通过这一技术实现经济收益。什么是虚拟助手虚拟助手是一种基于人工智能的技术，能够理解自然语言并执行特定任务。它们
spring boot 基础学习 - 请求参数映射与参数j校验破小孩儿乖 spring boot 学习笔记 spring 请求参数 spring boot spring mvc
springboot支持多种类型的请求参数映射1.简单数据的映射简单数据我们只需要给handler添加相应的形参，保证形参名称和页面请求参数的名称一致，spring就会回自动的帮我们将请求参数进行格式装换并封装到形参中：handler代码：@RequestMapping("paramstest")publicStringsimpleparam(Integerid,Stringusername,Bo
南京大学×百度“星河杯”AI大模型创意校园赛正式起航
3月9日，教育部长怀进鹏在十四届全国人大二次会议民生主题记者会上，谈到了人工智能+教育的重要性。他强调，要把人工智能技术深入到教育教学和管理的全过程和全环节，研究其有效性和适应性，让青年一代更加主动地学习，让教师更加创造性地教学。南京大学早在年初就已经敏锐地洞察到了人工智能的重要性，在新学期工作布置会上，发布了一个前瞻性决策：24年9月面向全体本科新生开设“人工智能通识核心课程体系”，南京大学党委
大模型（DeepSeek等）是否会动摇AI工程师的工作？点我头像干啥 Ai 深度学习人工智能 AI编程计算机视觉
引言近年来，人工智能（AI）领域取得了突飞猛进的发展，尤其是大模型（如GPT-3、BERT、DeepSeek等）的出现，极大地推动了自然语言处理（NLP）、计算机视觉（CV）等领域的进步。大模型凭借其强大的泛化能力和广泛的应用场景，逐渐成为AI领域的核心技术之一。然而，随着大模型的普及，一个备受关注的问题浮出水面：大模型是否会动摇AI工程师的工作？本文将从多个角度探讨这一问题，分析大模型对AI工程
DeepSeek大模型部署指南点我头像干啥 Ai 人工智能 python 分类数据挖掘深度学习
在当今人工智能快速发展的时代，大模型的应用越来越广泛。DeepSeek作为一款高性能的大模型，支持长文本、多模态、代码生成等复杂任务，已经在多个领域展现出强大的能力。本文将详细介绍DeepSeek大模型的部署流程，帮助读者在自己的环境中高效地使用这一先进工具。一、DeepSeek大模型简介DeepSeek是一款专注于大模型与AGI（人工智能通用智能）研究的高性能基座模型。它支持长文本处理、多模态理
医学人工智能影像诊断数据收集与整理 V搜xhliang0246 人工智能健康医疗算法
在医学领域中，人工智能（AI）尤其是深度学习技术，已经被广泛应用于医学影像的分析和诊断。为了训练这些模型，需要大量的高质量标注数据。下面我会给出一个简单的示例流程，介绍如何收集、整理和准备医学影像数据集，并提供一些基础的Python代码示例。数据收集首先，你需要收集包含医学影像的数据集。这些数据通常来自医院或研究机构，并且需要经过伦理审查和患者同意。示例数据集假设我们有一个包含肺部X光片的数据集，
深度学习模块缝合教程：从理论到实践 RockLiu@805 深度学习模块机器视觉深度学习人工智能
深度学习模块缝合教程：从理论到实践引言随着深度学习的不断发展，模型的设计与优化成为研究者关注的核心问题之一。如何有效地“缝合”不同模块，以实现更高效的计算和更强大的功能，是当前深度学习研究中的一个重要课题。在本文中，我们将从基础概念出发，详细探讨深度学习模块缝合的方法、技巧及其应用场景。无论是理论深厚的研究者还是实验导向的实践者，都可以从中获得启发。一、深度学习基础知识详解深度学习是人工智能领域的
全球首款通用 AI 智能体 Manus 发布的分析报告 PM简读馆技术杂谈人工智能
一、引言在人工智能领域持续蓬勃发展的进程中，新的技术成果与产品不断涌现，推动着行业的快速变革。全球首款通用AI智能体Manus的发布成为近期备受瞩目的事件，尤其其宣称性能超越OpenAI，更是引发了行业内外的广泛关注与讨论。本报告将围绕Manus展开深入探讨，分析其特点、性能优势、可能带来的影响以及面临的挑战等方面内容。链接：https://manus.im/二、Manus的基本概述（一）发布背景
AI人工智能2025年发展趋势及普通人利用AI赚钱的方法 A达峰绮人工智能经验分享赚钱
一、2025年AI人工智能发展趋势（一）增强型工作与人机协作2025年，几乎所有主要的软件工具都将整合生成式人工智能功能。人们将更多地考虑如何与人工智能携手合作，扩展技术能力，把创造性和人际交往技能应用到机器仍然无法管理的工作中。（二）实时自动决策拥有更加成熟的人工智能战略的企业将走向整个业务流程的端对端自动化。这很可能发生在物流、客户支持和营销领域，算法将在这些领域进行决策，带来更高的效率和对变
毕业论文AIGC高？5个方法有效降低AI率，消除AI痕迹！我是宝库 AIGC 人工智能经验分享论文抽检毕业论文 AIGC检测学习方法
现在很多学校要求毕业论文基本都要检测AIGC了。AIGC是指人工智能生成的内容，现在无论是毕业论文还是期刊投稿，都会检测论文是否由AI生成的，比如知网、维普、万方、Turnitin、MasterAI率检测等。如果你的论文使用了AI工具辅助写作，自己提前进行AIGC检测，必要时降低AIGC率是很有必要的，那么，如何降低AIGC率呢？分享5种方法：1、改写句子结构。AI生成的句子通常比较长，句子结构僵
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。