计算机视觉研究院

8次迭代5大升级，3大核心优势，旷视深度学习框架天元1.0详细分析讲解

计算机视觉研究院专栏

作者：Edison_G

AI 技术需要开源、开放。就在刚刚结束的中关村论坛旷视平行论坛中，旷视正式发布了天元 1.0 预览版。

9 月 18 日，中关村论坛旷视平行论坛中，旷视研究院院长、首席科学家孙剑正式发布了开源深度学习框架天元 1.0 预览版，并对天元的技术特性与发展方向进行了深入解读。

旷视 2014 年开始研发深度学习框架天元。目前，旷视 1400 多名研发人员全员使用天元 MegEngine，旷视所有算法均通过天元 MegEngine 进行训练和推理。

MegEngine 简介

MegEngine 是旷视完全自主研发的深度学习框架，中文名为“天元”，是旷视 AI 战略的重要组成部分，负责 AI 三要素（算法，算力，数据）中的“算法”。MegEngine 的研发始于 2014 年，旷视内部全员使用。如今，旷视的所有算法均基于 MegEngine 进行训练和推理。

MegEngine 是工业级的深度学习框架，架构先进，性能优异，移植性强。MegEngine 强调产品化能力，在此基础上保证研发过程的快捷便利。

MegEngine 具有几个特点。一是“训练推理一体”。MegEngine 支持多种硬件平台（ CPU，GPU，ARM ）。不同硬件上的推理框架和 MegEngine 的训练框架无缝衔接。部署时无需做额外的模型转换，速度/精度和训练保持一致，有效解决了 AI 落地中“部署环境和训练环境不同，部署难”的问题。

二是“动静合一”。动态图易调试，静态图好部署。鱼和熊掌如何兼得，是现代深度学习框架的核心诉求。MegEngine 在静态图的基础上，逐渐加入支持完整动态图的功能。在动态模式下加速研发过程，无需改变模型代码一键切换至静态模式下的部署，为科研和算法工程师同时提供便利。

三是“兼容并包”。MegEngine 的顶层 API 基于 Python，采取了类似于 PyTorch 的风格。简单直接，易于上手，便于现有项目进行移植或整合。为更好地帮助学习实践，MegEngine 同时提供了“开箱即用”的在线深度学习工具 MegStudio ，和汇聚了顶尖算法和模型的预训练模型集合 Model Hub 。

四是“灵活高效”。MegEngine 底层的高性能算子库对于不同的硬件架构进行了深度适配和优化，并提供高效的亚线性内存优化策略，对于生产环境繁多的计算设备提供了极致的性能保证。高效易用的分布式训练实现能有效支持富有弹性的大规模训练。

MegEngine 的上述特点使其成为了最适合工业级研发的框架之一。更多特性还在持续开发中，也欢迎更多的开发者加入。

动静合一

瞄准痛点：静态图好部署，动态图易调试，但两者难以兼得

同时适配科研实验和生产部署环境
内置动静转换
动静态混合编程

import megengine.functional as F
from megengine.jit import trace


# import trace之后设置 enabled 属性切换动静态图
trace.enabled = True


# 使用 trace 类装饰网络 forward 的函数
@trace
def train_func(data, label, *, opt, net):
    pred = net(data)
    loss = F.cross_entropy_with_softmax(pred, label)
    opt.backward(loss)
    return pred, loss


# 调用函数训练网络，动静态图一套代码
train_func(data, label, opt=optimizer, net=le_net)

兼容并包

瞄准痛点：框架学习接口各异，模型复现困难，学习成本高

Pythonic风格API，简单直接，易于上手
支持导入PyTorch Module
特别为计算机视觉（Computer Vision）任务优化

import megengine as mge
import megengine.functional as F
import megengine.module as M
import numpy as np


# 经典的基于 Module 的网络搭建接口
class LeNet(M.Module):
    def __init__(self):
        super(LeNet, self).__init__()
        self.conv1 = M.Conv2d(1, 6, 5)
        self.relu1 = M.ReLU()
        self.pool1 = M.MaxPool2d(2, 2)
        # 省略部分代码...
        self.classifer = M.Linear(84, 10)


    # 符合 Pythonic 风格的计算流程代码
    def forward(self, x):
        x = self.pool1(self.relu1(self.conv1(x)))
        # 省略部分代码...
        x = self.classifer(x)
        return x

灵活高效

瞄准痛点：生产环境计算设备繁多，缺乏优秀性能

高性能算子，充分利用算力
高效内存优化策略，支持自动 Sublinear 内存优化
JIT代码生成机制，加速计算
内置算法选择，智能适配设备

训练推理一体

瞄准痛点：从研究到生产，流程复杂，精度难以对齐

从训练到推理，无需模型转化，精度损失最小化
跨设备模型精度对齐
自动模型优化简化流程

from megengine.jit import trace


# 使用 trace 类装饰网络 forward 的函数
@trace
def val_func(x, *, net):
    return net(x)


# 调用trace接口无需运行直接编译网络
val_func.trace(inp, net=net)


# 将编译后的网络进行导出，直接生成可用于部署的序列化文件
val_func.dump('./mnist.mge', arg_names=["data"])

目前官网也支持“视觉类”的模型有八类了：

接下来我们可以详细说说天元1.0的改进！

旷视天元 1.0 预览版，历经 8 次迭代 5 大升级

2020 年 3 月，旷视正式将天元开源，提供给全球开发者使用。开源以来，天元从 3 月的 Alpha 版本升级到 6 月的 Beta 版本、到 9 月的 1.0 版本，期间实现了 8 次迭代。

此次天元 1.0 预览版，相比之前的版本，实现了 5 项重要的技术升级。

首先，天元 1.0 预览版提供了全新的 Imperative Runtime。天元通过重写动态执行引擎，打破过去几个版本中动态图的限制，解决了一系列资源释放的问题，并大幅提升了动态自由度，让使用 GPU 计算像 NumPy 一样方便自如。

其次，天元 1.0 预览版新增自动代码裁剪功能。在实际的 AI 应用开发中，用户经常面临模型大小的问题。自动代码裁剪功能让用户可以全自动的针对自己网络使用的算子进行代码裁剪，不用手工配置就能最小化推理时的代码体积，极大提升端侧推理的竞争力。

此外，天元 1.0 预览版进行了 10 余项推理侧性能优化，进一步提升了端侧推理性能。同时，天元支持了更多的国产硬件。天元对于主流的一些国产硬件进行了接入，方便在国产 NPU 芯片上进行推理工作。

最后，天元实验性的开发了一套基于 MLIR 的 JIT 引擎，尝试利用 MLIR 这一项非常有前景的方案进行计算图的进一步融合、优化来整体提升深度学习训练和推理的速度。

经过了半年的开源工作，现在天元拥有了完整的功能体系。天元希望能依靠训推一体这一特性，让产业应用可以更快、更高效的落地。让深度学习也可以简单开发。

天元三大核心优势，实现简单开发

从开源到现在经过半年的技术迭代，天元拥有了三大核心优势：训练推理一体、全平台高效支持、动静结合的训练能力。

核心优势 1：训练推理一体

所谓训练推理一体，就是让训练与推理不再是完全孤立的两个步骤。为什么训推一体如此重要？在传统深度学习模型开发流程中，从训练到推理，开发者需要经过一系列格式转换。但随之而来的也会有种种复杂难题，比如推理框架对算子不支持、作为中间转换格式的 ONNX 版本不一致，转换成 Caffe 过程中存在一些层的中间形状变化导致无法转换，涉及到量化模型时量化参数的定义不一致等，都会增大转换的难度。

除了转换难外，由于各个平台的差异性和预处理逻辑的复杂性，训练侧提供的预处理逻辑很有可能与推理侧实现的结果不一致，推理和训练的精度对齐变得非常困难。

传统深度学习模型开发环境下，在不断地对分配、适配和微调的过程中，一个模型的落地工作往往需要数天到数周时间。如果还涉及到多平台的部署，则以上问题复杂度和难度会成倍增加，让模型交付变得非常困难。

为了解决传统模型开发的一系列痛点，天元在训练和推理侧均是一套底层框架提供支持，对算子的支持、量化参数的理解均高度一致。同时，天元支持各类常用的 CV 算子操作，便于开发者将预处理的代码逻辑直接写入模型结构当中，从而让训练和推理间的差距大幅度缩小，开发者不再需要为了模型转换而头疼。

经过各方用户一段时间的实际验证，使用天元整个模型，可以将从训练到推理的交付时长缩短至传统方案的十分之一以下，真正做到天级交付。

另外，由于训推一体化，模型在训练阶段与推理阶段可以高度对齐，这使得量化感知训练产生的模型可以无风险的在端侧应用。同时天元拥有精心设计的量化训练模块，大大降低了量化感知训练模型的使用门槛。

以上表格中，在各类模型上，通过应用量化感知训练，可以在极小的精度下降前提下，使用 int8 推理。量化感知训练产生的高精度模型，配合上天元经过高度优化的 int8 算子，可以将各个常见网络的推理耗时降至浮点模型的 30%~50% 以内，有效带来性能加速。

核心优势 2：全平台高效支持

广泛而高效的平台支持，是实现训推一体的前提。只有在各个平台上都提供足够高效便捷的推理能力，才能真正的免除模型转换工作。

对于开发者常用的各类 CPU、GPU 和 NPU，天元均提供了全面而高效的支持，让用户无需为每个平台重新学习重新开发，可以让用户一套模型、一套代码走天下。

天元支持的设备包括 NVIDIA GPU、ARM、X86 和 AMD GPU 平台以及各类国产 NPU 芯片。同时，测试表明，相比其他一些框架，天元在 CUDA、ARM、X86 平台上都具备性能优势。

深度学习应用中，运行时的内存占用是一个重要的指标。由于天元的自动内存优化策略在训练侧得到了充分的打磨，天元可以在内存占用和推理性能之间取得良好的平衡。

仅依靠通用的优化策略，天元对于任意的模型结构都有足够良好的优化表现，框架无需针对网络结构特殊优化。这保证了天元可以在开发者自己的模型结构也保持较低的内存占用，让天元可以帮助各个领域的开发者降低内存占用量，提高竞争力。

端侧推理时，推理程序的二进制体积同样是一项非常重要的指标，对于端侧的 SDK 竞争力非常重要。

对此，天元提供了自动代码裁剪机制，根据模型的结构，将不需要的 kernel 实现和代码片段裁减掉的过程全自动，从而将代码体积大幅度缩小，大幅度提升端侧 SDK 的竞争力。

核心优势 3：动静结合的训练能力

动态图训练对程序员友好，可以随时停下来 Debug；而静态图的训练好处是可以让训练的精度、内存消耗和训练速度达到最优。如何兼得动态图训练和静态图训练的好处？天元通过动静结合支持快速模型设计。动态模式下，天元可以方便的排查模型问题，在遇到错误后及时停下，便于分析模型结构上的异常问题。通过添加一行 trace，模型可以被直接转换为静态图模式，获得静态图所独有的图优化，一方面可以更好的对显存进行复用，提高显存利用率，另一方面可以优化计算顺序，提升模型的训练性能。

在 Beta 版天元推出了亚线性内存优化技术。目前天元是唯一一个支持全自动亚线性内存优化技术的框架。静态模式下，在静态图的基础上，额外添加一个配置项，则可以便捷的启用亚线性内存优化。天元内置的 Sublinear 亚线性内存优化功能，可以对任意的模型结构进行内存优化，在相同的显卡下，可以训练出更大更准确的模型。

亚线性内存优化的特点是参数量越大，从而节省下的显存量越多。因此越庞大的模型，从中获得的收益就越大。由于算法的普适性，无论是任何的模型结构，都可以全自动的被亚线性内存优化机制处理。

共同推进开源生态建设

在使用上，天元模型中心 Model Hub 提供了丰富的预训练模型，包括图像分类、目标检测、图像分割等模型，并且每个模型都提供了 SOTA 级别准确率，让使用者可以便捷的上手天元，站在巨人的肩膀上开始自己的科研工作。

此外，天元已经与小米 MACE、OpenAI Lab Tengine 进行了深度的集成，用户可以将 MegEngine 的模型直接转换到 MACE 或 Tengine 中执行，从而获取在各类异构设备上执行深度学习模型的能力。

深度学习框架的未来路线

天元 1.0 预览版的发布意味着天元已经迭代成为一个完备的深度学习框架。未来天元将如何迭代发展？旷视天元技术团队认为深度学习未来会继续蓬勃发展，在不断涌现新技术新方案的同时，现有的方案和技术会进一步的范式化，简化整个流程，像传统软件开发一样精确分工、快速迭代。因此天元会持续在易用性和整个深度学习落地的流程化上努力，让深度学习应用的流程更加清晰易懂，从而大幅提高 AI 的生产力。

此外，在过去的一段时间中，深度学习框架从编译器中借鉴了相当一部分的内容，旷视天元技术团队认为随着 MLIR 等新兴技术的产生，框架将会进一步向编译器化发展，从而获得更大幅度的性能提升。

最后，随着大量云、端上的 AI 芯片的衍生以及各类神经网络加速器应用的愈加广泛，每家芯片自身的推理框架越来越强大。训推一体的核心是在训练阶段对芯片的充分了解和兼容，因此如何让用户能从一开始就训练出一个适用于最终要用到的芯片的模型，才是让整个落地流程最高效的重点。天元希望能够与芯片协同演进，协同发展，让整个生态能够更加健康蓬勃的发展。

AI 产业落地浪潮中，开发者只有在友好、开放、创新的开发环境中，才能更好地进行 AI 的价值设计与开发，为全球输送 AI 动能。欢迎全球开发者，加入天元社区，一起让深度学习也可以简单开发。

部分摘自于机器之心！

／End.

我们开创“计算机视觉协会”知识星球一年有余，也得到很多同学的认可，我们定时会推送实践型内容与大家分享，在星球里的同学可以随时提问，随时提需求，我们都会及时给予回复及给出对应的答复。

如果想加入我们“计算机视觉研究院”，请扫二维码加入我们。我们会按照你的需求将你拉入对应的学习群！

计算机视觉研究院主要涉及深度学习领域，主要致力于人脸检测、人脸识别，多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架，我们这次改革不同点就是，我们要着重”研究“。之后我们会针对相应领域分享实践过程，让大家真正体会摆脱理论的真实场景，培养爱动手编程爱动脑思考的习惯！

计算机视觉研究院

长按扫描二维码
关注我们获取更多资讯

【剪裁Patch】已标注的WSI剪裁Patch的处理流程（以QuPath软件得到的标注信息为例） X CODE WSI 病理图像 QuPath Python
1.整体处理思路整体处理流程如图所示，概括来说就是：根据标注信息将WSI区分为肿瘤区域和正常区域，对这个区域进行采样裁剪得到具有Patch级别标签的Patch。当然，这里的Patch标签是根据标注信息决定的，如果标注的是癌症亚型信息，那么也可以将不同亚型的Patch区分出来。那么下面就对每个步骤进行介绍以及提供具体的Python代码。2.详细步骤（提供代码）2.0标注文件示例以下是用QuPath软
23.5.15---在python中读取excel表格数据并可视化多一点灵性 python matplotlib 开发语言机器学习
目录1.在python中通过以下代码可以防止运行结果出现中文乱码的情况（如画图时）2.在将excel表格文件中的数据读取出来，并将其中的两列数据作为行列坐标用图画出来2.1设置坐标轴显示的刻度及范围3.在PythonConsole清除运行的控制台数据使用：1.在python中通过以下代码可以防止运行结果出现中文乱码的情况（如画图时）##设置字符集，防止中文乱码importmatplotlibasm
【华为od刷题（C++）】HJ30 字符串合并处理 m0_64866459 华为od c++链表
我的代码：#include//用于输入输出流#include//用于字符串处理#include//用于动态数组的处理#include//包含排序等常见算法#include//用于字符串流的处理，可以将数据从字符串流中提取#include//提供字符处理函数，如isdigit、isalpha等#include//提供位集处理，能够将数字转换为二进制表示usingnamespacestd;charbi
从零到精通：Linux上的Conda环境详细教程
第一章：Conda简介Conda的定义Conda是一个开源的包管理系统和环境管理系统，可以在多个平台上安装、运行和更新软件包和依赖项。Conda最初是为Python和R语言的数据科学包创建的，但现在支持多种编程语言和工具。Conda的主要功能和优势包管理：Conda能够自动处理包的依赖关系，确保每个包所需的库和工具都被正确安装。它支持从各种渠道安装包，如CondaForge和Anaconda官方仓
Briefcase 项目常见问题解决方案刘梓苹
Briefcase项目常见问题解决方案briefcaseToolstosupportconvertingaPythonprojectintoastandalonenativeapplication.项目地址:https://gitcode.com/gh_mirrors/br/briefcase1.项目基础介绍和主要编程语言Briefcase是一个由BeeWare项目开发的工具，旨在帮助开发者将Py
Ubuntu20.04切换源 dongdundun ubuntu linux 运维
一、ubuntu20.04系统重装二、工具安装1.更换Ubuntu源更换conda源更换pip源2.安装QQqq闪退卸载安装wine版QQ3.安装搜狗输入法及中文设置安装搜狗输入法中文设置4.安装vim5.安装google6.安装VsCode7.安装python3的opencv8.安装向日葵向日葵闪退9.ubuntu下识别不到U盘10.安装Typora11.安装百度网盘12.安装ceres库（优化
yolov5/v7/v8/v9/v10环境详细配置教程（Windows+conda+pycharm）视觉算法er 深度学习环境配置 YOLO 目标检测人工智能深度学习 conda pycharm
一、所需环境配置1.1.虚拟环境创建首先，打开AnacondaPrompt命令窗口，创建一个新的虚拟环境，后面的包都在这个环境中安装。创建命令是：我的习惯是使用3.8版本的python，你也可以换成更高版本；condacreate-nyolopython=3.8输入命令后，运行结果如下：输入y即可；1.2.激活虚拟环境安装完成后，即可激活虚拟环境，输入以下命令即可；condaactivateyol
大数据 ETL 工具 Sqoop 深度解析与实战指南
一、Sqoop核心理论与应用场景1.1设计思想与技术定位Sqoop是Apache旗下的开源数据传输工具，核心设计基于MapReduce分布式计算框架，通过并行化的Map任务实现高效的数据批量迁移。其特点包括：批处理特性：基于MapReduce作业实现导入/导出，适合大规模离线数据迁移，不支持实时数据同步。异构数据源连接：支持关系型数据库（如MySQL、Oracle）与Hadoop生态（HDFS、H
Python 领域 Conda 的集群环境部署经验
Python领域Conda的集群环境部署经验关键词：Conda、Python环境管理、集群部署、环境复制、依赖管理、虚拟环境、Anaconda摘要：本文深入探讨了在集群环境中使用Conda进行Python环境部署的最佳实践。我们将从Conda的核心概念出发，详细讲解环境创建、依赖管理、环境复制和集群部署的全流程。文章包含实际案例、性能优化技巧和常见问题解决方案，旨在帮助读者掌握高效、可靠的Pyth
Python pip与Conda环境的兼容性问题
Pythonpip与Conda环境的兼容性问题关键词：Python环境管理、pip与conda冲突、依赖解析、虚拟环境、包管理、兼容性解决方案、依赖冲突摘要：本文深入探讨Python生态中pip和conda两种主流包管理工具的兼容性问题。我们将从底层机制分析冲突根源，通过具体案例展示常见问题场景，并提供多种解决方案和最佳实践。文章包含详细的依赖解析算法分析、环境隔离技术比较，以及通过实际代码演示如
python中操作数据库 seiseilalei python 数据库 python sql
python中cursor操作数据库（转）原文出处：http://doudouclever.blog.163.com/blog/static/175112310201284115340663/python操作数据库，要安装一个Python和数据库交互的包MySQL-python-1.2.2.win32-py2.5.exe，然后我们就可以使用MySQLdb这个包进行数据库操作了。操作步骤如下：1、建
Python:爬虫基础《爬取红楼梦》
小说爬虫项目说明文档用于爬取诗词名句网上小说内容的Python爬虫项目。本项目以《红楼梦》为例，演示如何爬取完整的小说内容。项目功能爬取小说的所有章节名称获取每个章节的URL链接下载并保存每个章节的内容到独立的文本文件自动创建存储目录包含基本的错误处理和请求延迟环境要求Python3.x依赖包：requestsbeautifulsoup4logging安装依赖pipinstallrequestsb
挑战华为社招：7年老Java一次坑爹的面试经历 m0_57286571 程序员 java 后端面试
前言今天刚好有空，跟大家聊聊如何学好算法进大厂。前两天一个读者和我说，他坚持刷算法题2个月，薪资翻番去了他梦寐以求的大厂，期间面字节跳动还遇到了原题…其实据我所知目前国内的大厂和一些独角兽，已经越来越效仿硅谷公司的做法，通过编程定题面试，来考察数据结构和算法的扎实程度。以我的经验来说，**对于新手来说，扎实的掌握一门语言是其一，其二就是要有基本的算法能力，这个非常重要。对于进阶的用户，更多技术栈的
python之数据库操作婵婵子~ python 数据库 python
python操作sqlserver数据库python标准数据库接口为pythonDB-API，具体可参考：https://wiki.python.org/moin/DatabaseInterfacesPython的DB-API，为大多数的数据库实现了接口，使用它连接各数据库后，就可以用相同的方式操作各数据库。PythonDB-API使用流程：引入API模块。获取与数据库的连接。执行SQL语句和存储
结合创新idea：机器学习+运筹优化=CCF高端局 Ai多利机器学习人工智能
2024深度学习发论文&模型涨点之——机器学习+运筹优化机器学习是人工智能的一个分支，它使计算机系统能够从数据中学习并改进其性能，而无需进行明确的编程。运筹优化，也称为运筹学或运营管理，是应用数学的一个分支，它使用数学模型和算法来支持复杂决策过程的制定。机器学习与运筹优化的结合是一个前沿且活跃的研究领域，它们相互补充，为解决复杂问题提供了新的思路和方法。小编整理了一些机器学习+运筹优化【论文+代码
冒泡和快速排序的区别郭尘帅666 算法数据结构
冒泡算法快速排序时间复杂度O（n^2）最坏/平均O（nlogn）平均，O（n^2）最坏空间复杂度O（1）O（logn）最好/O(n)最坏稳定性很稳定(元素顺序不变)不稳定(元素顺序可能改变)适用场景小规模数据或接近有序的数据大规模数据核心思想重复遍历，每轮都会把最大的元素移至末尾选择基准值，比基准值小的元素放左边，大的放右边代码实现对比1.冒泡排序publicstaticvoidbubbleSor
《剑指迷宫：破解矩阵路径之谜》一只咸鱼大王故事版本数据结构与算法 C++数据结构算法递归回溯
故事标题：《剑与路之书——矩阵迷宫的路径密钥》引子：迷宫之城的秘密在遥远的算法大陆，有一座神秘的城市——“迷宫之城”。在这座城市的中心，矗立着一座名为“命运之塔”的古老建筑。传说中，这里藏着一本神秘的典籍——《剑指天书》，书中记载着无数关于矩阵、路径和逻辑推理的奥秘。在这片土地上，有一种被称为“矩阵迷宫”的古老魔法阵。它由一个个字符格子组成，每一步只能向上下左右移动一格。而最神奇的是，如果一条路径
常见手撕项目C++ 氏族归来 c++开发语言
常见手撕项目C++设计模式单例模式饿汉模式懒汉模式策略模式策略接口实现具体的策略（虚函数重写）定义上下文用户调用代码最短路径算法使用函数模板写冒泡排序写一个类模板stringreplace详解方法概览参数介绍代码示例多线程信号量解释设计模式单例模式单例模式是一种常用的软件设计模式，其目的是确保一个类只有一个实例，并提供一个全局访问点来获取该实例。优点：资源控制：单例模式能够确保一个类只有一个实例存
JuPyter(IPython) Notebooks中使用pip安装Python的模块 weixin_34218890 开发工具 python 人工智能
问题描述：没有带GPU的电脑，搞深度学习不是耍流氓嘛，我网上看到有个云平台，免费使用了一下，小姐姐很热情。使用过程如下：他们给的接口是Jupyter编辑平台，我就在上面跑了一个小例子。tensorflow和python环境是他们配置好的，不过我的例子中需要导入matplotlib.pylot模块。可是他们没有提供，怎么办呢？网上查了一下啊解决方法：采用如下方法：importpipdefMyPipi
【LangChain编程：从入门到实践】LangChain与其他框架的比较 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【LangChain编程：从入门到实践】LangChain与其他框架的比较1.背景介绍1.1人工智能发展现状在当今时代，人工智能(AI)已经成为科技领域中最热门和最具革命性的话题之一。随着计算能力的不断提升和算法的持续优化,AI系统正在不断扩展其应用范围,包括自然语言处理、计算机视觉、决策系统等各个领域。1.2LangChain概述在这种背景下,LangChain作为一个新兴的AI框架应运而生。L
重塑知识的圣殿：人工智能时代的教育革命与人文守护田园Coder 人工智能科普人工智能科普
教育，承载着文明火种传递的千年使命，其核心始终围绕两个永恒命题：如何让知识更有效地被获取？如何让个体潜能更充分地绽放？在信息爆炸、技能迭代加速的当代，传统教育模式——标准化课程、统一进度、有限师资、资源不均——正面临前所未有的压力。人工智能（AI）的崛起，如同一股强大的变革洪流，正以前所未有的深度和广度渗透教育生态的各个环节。从量身定制的学习路径到永不疲倦的智能导师，从虚拟现实的沉浸课堂到洞察学情
踏入真实：具身智能与物理世界的认知交响
当大型语言模型在文本的海洋中纵横捭阖，生成式AI在数字画布上挥洒创意时，人工智能仍有一个根本性的疆域尚未完全征服——真实的三维物理世界。理解一个苹果，不能仅靠词向量坐标；学会行走，无法通过阅读说明书达成；在拥挤的街道导航，远非处理符号逻辑那般简单。智能的进化，自生命诞生之初，便与具身性（Embodiment）和环境交互（Interaction）密不可分。我们的认知、学习、乃至意识的雏形，都源于身体
Jupyter安装指南及Python配置 CodeWG python jupyter ide Python
Jupyter是一个非常流行的交互式计算环境，广泛用于数据分析、机器学习和科学计算等领域。本文将详细介绍如何安装Jupyter并配置Python环境。步骤1：安装Python首先，我们需要安装Python。请按照以下步骤进行操作：打开Python官方网站（https://www.python.org）并下载适用于您操作系统的最新版本的Python。运行下载的安装程序，并按照向导的指示进行安装。在安
Python 变量、数据类型、数据类型的转换介绍 cs_mengxi Python python 开发语言
介绍【Python变量、数据类型、数据类型的转换】变量什么是变量python中，变量是存储数据的标识符。通过变量我们可以将数据赋值给名称，再程序中通过引用这个名称去访问对应的数据常见的使用场景变量赋值：使用等号（=）将值赋给变量。x=5name=“John”同时为多个变量赋值a=b=c=1动态类型：Python是一种动态类型语言，变量的类型是根据赋给它的值自动推断的。同一个变量可以在不同的时间赋予
Python运算符简介满目828 python 开发语言初学者运算符
目录一.算术运算符二.赋值运算符三.比较运算符四.逻辑运算符五.其他运算符六.运算符优先级一.算术运算符算术运算符包含:+,-,*,/,**,//,%(注:在运算过程中如含有小数,则结果为float类型(小数))+(加法运算符)a=10b=20#+result=a+bprint(result)print(3+4)-(减法运算符)a=10b=20#-result=a-bprint(result)pr
Python scikit-learn 【机器学习库】全面讲解
让AI成为我们的得力助手：《用Cursor玩转AI辅助编程——不写代码也能做软件开发》scikit-learn（简称sklearn）是Python最流行的机器学习库之一，提供简单高效的数据挖掘和数据分析工具。它基于NumPy、SciPy和Matplotlib构建，广泛应用于工业界和学术界。核心优势统一API设计：所有模型使用一致的接口（fit()、predict()、score()）丰富的算法：覆
Jenkins集成GitHub实现自动化打标签实战指南 ivwdcwso 运维与云原生 jenkins github 自动化 CI/CD devops
本文将详细介绍如何使用Jenkins与GitHubAPI集成，实现自动化打标签的完整流程。以下是完整的Python脚本和详细解析。完整Python脚本#!/root/miniconda3/bin/pythonimportjsonimportboto3importosimportpytzimportargparsefromdatetimeimportdatetimefromgithubimportG
超详细yolov8/11-segment实例分割全流程概述：配置环境、数据标注、训练、验证/预测、onnx部署(c++/python)详解
因为yolo的检测/分割/姿态/旋转/分类模型的环境配置、训练、推理预测等命令非常类似，这里不再详细叙述，主要参考**【YOLOv8/11-detect目标检测全流程教程】**，下面有相关链接，这里主要针对数据标注、格式转换、模型部署等不同细节部分；【YOLOv8/11-detect目标检测全流程教程】超详细yolo8/11-detect目标检测全流程概述：配置环境、数据标注、训练、验证/预测、o
Nystromformer：一种基于 Nyström 方法的自注意力近似算法 AI专题精讲 Paper阅读人工智能自然语言处理 AI
1.摘要Transformer已经成为广泛自然语言处理任务中的强大工具。推动Transformer展现出卓越性能的一个关键组件是self-attention机制，它对每个token编码了其他token的影响或依赖关系。虽然self-attention机制具有诸多优势，但其在输入序列长度上的二次复杂度限制了其在较长序列上的应用——这是当前社区积极研究的一个主题。为了解决这一限制，我们提出了Nystr
使用 C++/OpenCV 和 MFCC 构建双重认证智能门禁系统
使用C++/OpenCV和MFCC构建双重认证智能门禁系统引言随着物联网和人工智能技术的发展，智能门禁系统在安防领域的应用越来越广泛。相比于传统的钥匙、门禁卡或密码，生物识别技术（如人脸识别、指纹识别、虹膜识别等）提供了更高的安全性与便利性。然而，单一的生物识别方式在某些场景下可能存在安全隐患。例如，人脸识别可能被高清照片或视频欺骗（称为“欺骗攻击”），在光照、姿态变化剧烈时识别率也可能下降。为了
Spring中@Value注解，需要注意的地方无量 spring bean @Value xml
Spring 3以后,支持@Value注解的方式获取properties文件中的配置值，简化了读取配置文件的复杂操作 1、在applicationContext.xml文件(或引用文件中)中配置properties文件 <bean id="appProperty" class="org.springframework.beans.fac
mongoDB 分片开窍的石头 mongodb
mongoDB的分片。要mongos查询数据时候先查询configsvr看数据在那台shard上，configsvr上边放的是metar信息，指的是那条数据在那个片上。由此可以看出mongo在做分片的时候咱们至少要有一个configsvr,和两个以上的shard（片）信息。第一步启动两台以上的mongo服务 &nb
OVER(PARTITION BY)函数用法 0624chenhong oracle
这篇写得很好，引自 http://www.cnblogs.com/lanzi/archive/2010/10/26/1861338.html OVER(PARTITION BY)函数用法 2010年10月26日 OVER(PARTITION BY)函数介绍开窗函数 &nb
Android开发中，ADB server didn't ACK 解决方法一炮送你回车库 Android开发
首先通知：凡是安装360、豌豆荚、腾讯管家的全部卸载，然后再尝试。一直没搞明白这个问题咋出现的，但今天看到一个方法，搞定了！原来是豌豆荚占用了 5037 端口导致。参见原文章：一个豌豆荚引发的血案——关于ADB server didn't ACK的问题简单来讲，首先将Windows任务进程中的豌豆荚干掉，如果还是不行，再继续按下列步骤排查。 &nb
canvas中的像素绘制问题换个号韩国红果果 JavaScript canvas
pixl的绘制，1.如果绘制点正处于相邻像素交叉线，绘制x像素的线宽，则从交叉线分别向前向后绘制x/2个像素，如果x/2是整数，则刚好填满x个像素，如果是小数，则先把整数格填满，再去绘制剩下的小数部分，绘制时，是将小数部分的颜色用来除以一个像素的宽度，颜色会变淡。所以要用整数坐标来画的话（即绘制点正处于相邻像素交叉线时），线宽必须是2的整数倍。否则会出现不饱满的像素。 2.如果绘制点为一个像素的
编码乱码问题灵静志远 java jvm jsp 编码
1、JVM中单个字符占用的字节长度跟编码方式有关，而默认编码方式又跟平台是一一对应的或说平台决定了默认字符编码方式；2、对于单个字符：ISO-8859-1单字节编码，GBK双字节编码，UTF-8三字节编码；因此中文平台(中文平台默认字符集编码GBK)下一个中文字符占2个字节，而英文平台(英文平台默认字符集编码Cp1252(类似于ISO-8859-1))。 3、getBytes()、getByte
java 求几个月后的日期 darkranger calendar getinstance
Date plandate = planDate.toDate(); SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd"); Calendar cal = Calendar.getInstance(); cal.setTime(plandate); // 取得三个月后时间 cal.add(Calendar.M
数据库设计的三大范式（通俗易懂） aijuans 数据库复习
关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。数据库的设计范式是数据库设计所需要满足的规范。只有理解数据库的设计范式，才能设计出高效率、优雅的数据库，否则可能会设计出错误的数据库. 目前，主要有六种范式：第一范式、第二范式、第三范式、BC范式、第四范式和第五范式。满足最低要求的叫第一范式，简称1NF。在第一范式基础上进一步满足一些要求的为第二范式，简称2NF。其余依此类推。
想学工作流怎么入手 atongyeye jbpm
工作流在工作中变得越来越重要，很多朋友想学工作流却不知如何入手。很多朋友习惯性的这看一点，那了解一点，既不系统，也容易半途而废。好比学武功，最好的办法是有一本武功秘籍。研究明白，则犹如打通任督二脉。系统学习工作流，很重要的一本书《JBPM工作流开发指南》。本人苦苦学习两个月，基本上可以解决大部分流程问题。整理一下学习思路，有兴趣的朋友可以参考下。 1 首先要
Context和SQLiteOpenHelper创建数据库百合不是茶 android Context创建数据库
一直以为安卓数据库的创建就是使用SQLiteOpenHelper创建,但是最近在android的一本书上看到了Context也可以创建数据库,下面我们一起分析这两种方式创建数据库的方式和区别,重点在SQLiteOpenHelper 一:SQLiteOpenHelper创建数据库: 1,SQLi
浅谈group by和distinct bijian1013 oracle 数据库 group by distinct
group by和distinct只了去重意义一样，但是group by应用范围更广泛些，如分组汇总或者从聚合函数里筛选数据等。譬如：统计每id数并且只显示数大于3 select id ,count(id) from ta
vi opertion 征客丶 mac opration vi
进入 command mode （命令行模式）按 esc 键再按 shift + 冒号注：以下命令中带 $ 【在命令行模式下进行】，不带 $ 【在非命令行模式下进行】一、文件操作 1.1、强制退出不保存 $ q! 1.2、保存 $ w 1.3、保存并退出 $ wq 1.4、刷新或重新加载已打开的文件 $ e 二、光标移动 2.1、跳到指定行数字
【Spark十四】深入Spark RDD第三部分RDD基本API bit1129 spark
对于K/V类型的RDD,如下操作是什么含义？ val rdd = sc.parallelize(List(("A",3),("C",6),("A",1),("B",5)) rdd.reduceByKey(_+_).collect reduceByKey在这里的操作，是把
java类加载机制 BlueSkator java 虚拟机
java类加载机制 1.java类加载器的树状结构引导类加载器 ^ | 扩展类加载器 ^ | 系统类加载器 java使用代理模式来完成类加载，java的类加载器也有类似于继承的关系，引导类是最顶层的加载器，它是所有类的根加载器，它负责加载java核心库。当一个类加载器接到装载类到虚拟机的请求时，通常会代理给父类加载器，若已经是根加载器了，就自己完成加载。虚拟机区分一个Cla
动态添加文本框 BreakingBad 文本框
<script> var num=1; function AddInput() { var str=""; str+="<input
读《研磨设计模式》-代码笔记-单例模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ public class Singleton { } /* * 懒汉模式。注意，getInstance如果在多线程环境中调用，需要加上synchronized，否则存在线程不安全问题 */ class LazySingleton
iOS应用打包发布常见问题 chenhbc ios iOS发布 iOS上传 iOS打包
这个月公司安排我一个人做iOS客户端开发，由于急着用，我先发布一个版本，由于第一次发布iOS应用，期间出了不少问题，记录于此。 1、使用Application Loader 发布时报错：Communication error.please use diagnostic mode to check connectivity.you need to have outbound acc
工作流复杂拓扑结构处理新思路 comsci 设计模式工作算法企业应用 OO
我们走的设计路线和国外的产品不太一样，不一样在哪里呢？国外的流程的设计思路是通过事先定义一整套规则(类似XPDL)来约束和控制流程图的复杂度(我对国外的产品了解不够多，仅仅是在有限的了解程度上面提出这样的看法)，从而避免在流程引擎中处理这些复杂的图的问题，而我们却没有通过事先定义这样的复杂的规则来约束和降低用户自定义流程图的灵活性，这样一来，在引擎和流程流转控制这一个层面就会遇到很
oracle 11g新特性Flashback data archive daizj oracle
1. 什么是flashback data archive Flashback data archive是oracle 11g中引入的一个新特性。Flashback archive是一个新的数据库对象，用于存储一个或多表的历史数据。Flashback archive是一个逻辑对象，概念上类似于表空间。实际上flashback archive可以看作是存储一个或多个表的所有事务变化的逻辑空间。
多叉树:2-3-4树 dieslrae 树
平衡树多叉树,每个节点最多有4个子节点和3个数据项,2,3,4的含义是指一个节点可能含有的子节点的个数,效率比红黑树稍差.一般不允许出现重复关键字值.2-3-4树有以下特征: 1、有一个数据项的节点总是有2个子节点(称为2-节点) 2、有两个数据项的节点总是有3个子节点(称为3-节
C语言学习七动态分配 malloc的使用 dcj3sjt126com c language malloc
/* 2013年3月15日15:16:24 malloc 就memory(内存) allocate(分配)的缩写本程序没有实际含义，只是理解使用 */ # include <stdio.h> # include <malloc.h> int main(void) { int i = 5; //分配了4个字节静态分配 int * p
Objective-C编码规范[译] dcj3sjt126com 代码规范
原文链接 : The official raywenderlich.com Objective-C style guide 原文作者 : raywenderlich.com Team 译文出自 : raywenderlich.com Objective-C编码规范译者 : Sam Lau
0.性能优化-目录 frank1234 性能优化
从今天开始笔者陆续发表一些性能测试相关的文章，主要是对自己前段时间学习的总结，由于水平有限，性能测试领域很深，本人理解的也比较浅，欢迎各位大咖批评指正。主要内容包括：一、性能测试指标吞吐量、TPS、响应时间、负载、可扩展性、PV、思考时间 http://frank1234.iteye.com/blog/2180305 二、性能测试策略生产环境相同基准测试预热等 htt
Java父类取得子类传递的泛型参数Class类型 happyqing java 泛型父类子类 Class
import java.lang.reflect.ParameterizedType; import java.lang.reflect.Type; import org.junit.Test; abstract class BaseDao<T> { public void getType() { //Class<E> clazz =
跟我学SpringMVC目录汇总贴、PDF下载、源码下载 jinnianshilongnian springMVC
----广告-------------------------------------------------------------- 网站核心商详页开发掌握Java技术，掌握并发/异步工具使用，熟悉spring、ibatis框架；掌握数据库技术，表设计和索引优化，分库分表/读写分离；了解缓存技术，熟练使用如Redis/Memcached等主流技术；了解Ngin
the HTTP rewrite module requires the PCRE library 流浪鱼 rewrite
./configure: error: the HTTP rewrite module requires the PCRE library. 模块依赖性Nginx需要依赖下面3个包 1. gzip 模块需要 zlib 库 ( 下载: http://www.zlib.net/ ) 2. rewrite 模块需要 pcre 库 ( 下载: http://www.pcre.org/ ) 3. s
第12章 Ajax（中） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Optimize query with Query Stripping in Web Intelligence blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Optimize+query+with+Query+Stripping+in+Web+Intelligence and a very straightfoward video http://www.sdn.sap.com/irj/scn/events?rid=/library/uuid/40ec3a0c-936
Java开发者写SQL时常犯的10个错误 tomcat_oracle java sql
1、不用PreparedStatements 　　有意思的是，在JDBC出现了许多年后的今天，这个错误依然出现在博客、论坛和邮件列表中，即便要记住和理解它是一件很简单的事。开发者不使用PreparedStatements的原因可能有如下几个：　　他们对PreparedStatements不了解　　他们认为使用PreparedStatements太慢了　　他们认为写Prepar
世纪互联与结盟有感阿尔萨斯
10月10日，世纪互联与（Foxcon）签约成立合资公司，有感。全球电子制造业巨头（全球500强企业）与世纪互联共同看好IDC、云计算等业务在中国的增长空间，双方迅速果断出手，在资本层面上达成合作，此举体现了全球电子制造业巨头对世纪互联IDC业务的欣赏与信任，另一方面反映出世纪互联目前良好的运营状况与广阔的发展前景。众所周知，精于电子产品制造（世界第一），对于世纪互联而言，能够与结盟

8次迭代5大升级，3大核心优势，旷视深度学习框架天元1.0详细分析讲解

MegEngine 简介

你可能感兴趣的:(算法,大数据,编程语言,python,人工智能)