深度之眼

8类CNN-Transformer混合架构魔改方案盘点，附23个配套模型＆代码

为进一步提高模型的性能，我们将CNN在局部特征提取方面的优势与Transformer在全局信息建模方面的优势两相结合，提出了CNN-Transformer混合架构。目前，它已经成为我们研究视觉任务、发文章离不开的模型。针对CNN+transformer组合方向的研究也成为了当下计算机视觉领域研究中的大热主题。

CNN-Transformer架构凭借众所周知的优势，在视觉任务上取得了令人瞩目的效果，它不仅可以提高模型在多种计算机视觉任务中的性能，还能实现较好的延迟和精度之间的权衡。为挖掘CNN-Transformer混合架构更多的潜力，有关于它的各种变体的研究也逐步增多。

为了方便同学们了解CNN-Transformer的最新进展与研究思路，我这次就和大家分享该架构常用的8种魔改方法，包含早期层融合、模块融合、基于注意力的融合等。每种方法的代表性模型以及配套的论文代码也都整理了，希望同学们阅读后可以获得缝合模块的启发，快速涨点。

23个模型原文及开源代码需要的同学看文末

1.早期层融合

Hybrid ViT

论文：AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE

用于大规模图像识别的Transformer

「简述：」Transformer架构在自然语言处理中很成功，但在计算机视觉中的应用有限。目前，注意力机制主要与卷积神经网络结合使用。我们发现，可以直接在图像补丁序列上应用纯Transformer，它在图像分类任务上表现很好。与最先进的卷积神经网络相比，Vision Transformer（ViT）在多个基准测试中取得了出色的结果，而且训练所需的计算资源大大减少。

DETR

论文：End-to-End Object Detection with Transformers

使用Transformers进行端到端目标检测

「简述：」论文提出了一种新的目标检测方法，将目标检测看作是一个直接集合预测问题。这种方法简化了检测流程，不需要像非最大抑制或锚点生成这样的手动设计组件。新方法的主要成分包括一个全局损失和一个变压器编码器-解码器架构。它通过推理对象之间的关系和全局图像上下文，直接并行输出最终预测集。这个模型概念简单，不需要专门的库，在COCO数据集上的准确性和运行时性能与Faster R-CNN相当。

LeViT

论文：LeViT: a Vision Transformer in ConvNet’s Clothing for Faster Inference

用于更快推理的 ConvNet 服装中的视觉transformer

「简述：」论文设计了一种名为LeViT的混合神经网络架构，用于快速推理图像分类。该架构结合了卷积网络和视觉Transformer的优点，并引入了一些新的方法来提高准确性和效率。作者在不同硬件平台上进行了广泛的实验，结果表明LeViT在速度/准确性权衡方面优于现有的卷积网络和视觉Transformer。

CPVT

论文：CONDITIONAL POSITIONAL ENCODINGS FOR VISION TRANSFORMERS

视觉transformer的条件位置编码

「简述：」论文提出了一种条件位置编码方案，用于视觉transformer。与先前的位置编码不同，作者的方案是动态生成的，并根据输入令牌的局部邻域进行条件化。这使得该方案可以推广到比模型在训练过程中见过的任何序列更长的输入序列，并提高了性能。作者还使用一个简单的位置编码生成器实现了该方案，并将其命名为条件位置编码视觉transformer（CPVT）。

2.横向层融合

DPT

论文：Vision Transformers for Dense Prediction

用于密集预测的视觉transformer

「简述：」论文介绍了一种名为密集视觉transformer的网络架构，它使用视觉transformer代替卷积神经网络作为密集预测任务的主干。作者将来自视觉transformer不同阶段的令牌组合成不同分辨率的图像状表示，并逐步使用卷积解码器将它们合并为全分辨率预测。该架构在密集预测任务上表现出色，并在单目深度估计和语义分割等任务上创造了新的最高记录。

LocalViT

论文：LocalViT: Bringing Locality to Vision Transformers

将局部性引入视觉Transformer

「简述：」作者研究了如何将局部性机制引入视觉Transformer。通过在feed-forward网络中引入深度可分离卷积，增加了视觉Transformer的局部性。作者验证了局部性机制的重要性，并成功地将其应用于4种视觉Transformer。在ImageNet2012分类任务中，增强局部性的Transformer比基线表现更好，同时参数数量和计算量几乎没有增加。

3.顺序融合

CoAtNet

论文：CoAtNet: Marrying Convolution and Attention for All Data Sizes

结合卷积和注意力处理各种数据规模

「简述：」论文介绍了一种混合模型CoAtNets，它结合了卷积网络和Transformer的优势。通过简单的相对注意力和垂直堆叠卷积层和注意力层的方式，CoAtNets在ImageNet上实现了最先进的性能，同时具有更高的效率和泛化能力。

CMT

论文：CMT in TREC-COVID Round 2: Mitigating the Generalization Gaps from Web to Special Domain Search

缓解从网络到特定领域搜索的泛化差距

「简述：」本文介绍了一种针对特定领域（如COVID）的搜索系统，利用领域自适应预训练和少次学习技术来帮助神经排序器缓解领域差异和标签稀缺问题。该系统在TREC-COVID任务第二轮中表现最佳，旨在从与COVID-19相关的科学文献中检索有用信息。

BoTNet

论文：Bottleneck Transformers for Visual Recognition

用于视觉识别的瓶颈Transformer

「简述：」论文介绍了一种名为BoTNet的骨干架构，它使用自注意力机制来处理计算机视觉任务，如图像分类、目标检测和实例分割。通过在ResNet的最后三个瓶颈块中使用全局自注意力替换空间卷积，该方法在实例分割和目标检测方面表现优异，同时减少了参数数量和延迟时间。作者还指出了如何将具有自注意力的ResNet瓶颈块视为Transformer块。

4.并行融合

Conformer

论文：Conformer: Local Features Coupling Global Representations for Visual Recognition

局部特征与全局表示相结合的视觉识别方法

「简述：」本文提出了一种名为Conformer的混合网络结构，结合了卷积操作和自注意力机制，以增强表示学习能力。Conformer采用并发结构，最大程度地保留局部特征和全局表示。实验表明，Conformer在ImageNet上比视觉变压器高出2.3％，在MSCOCO上比ResNet-101高出3.7％和3.6％的mAPs，分别用于目标检测和实例分割，展示了其作为通用骨干网络的巨大潜力。

Mobile-Former

论文：Mobile-Former: Bridging MobileNet and Transformer

连接MobileNet和Transformer

「简述：」论文提出了Mobile-Former网络结构，它结合了MobileNet和Transformer的优点，中间有双向桥接。该结构利用了MobileNet在局部处理和Transformer在全局交互方面的优势，并且桥接可以实现局部和全局特征的双向融合。Mobile-Former中的Transformer包含很少的令牌（例如6个或更少），这些令牌是随机初始化的，以学习全局先验知识，从而降低了计算成本。结合提出的轻量级交叉注意力来模拟桥接，Mobile-Former不仅计算效率高，而且具有更强的表示能力。

BossNAS

论文：BossNAS: Exploring Hybrid CNN-transformers with Block-wisely Self-supervised Neural Architecture Search

使用分块自监督神经网络结构搜索探索混合CNN-Transformers

「简述：」论文提出了BossNAS无监督神经网络结构搜索方法，用于解决以前方法中由于大权重共享空间和有偏见的监督而导致的不准确架构评级问题。该方法将搜索空间分解为多个块，并利用自监督训练方案分别对每个块进行训练，然后将它们作为一个整体搜索向种群中心。在具有挑战性的HyTra搜索空间上，该方法搜索到的模型BossNet-T在ImageNet上实现了高达82.5%的准确性，比EfficientNet高出2.4%。

5.模块融合

Early convolutions help transformers see better

早期的卷积有助于Transformer更好地观察

「简述：」本文研究了Vision transformer (ViT) 模型的优化问题，发现其对优化器的选择、超参数和训练计划长度非常敏感。作者认为这个问题可能与ViT模型的patchify stem有关，该stem是通过将输入图像应用一个步幅为p（默认为16）的p×p卷积实现的。为了测试这种非典型设计选择是否会导致问题，作者分析了原始patchify stem和用少量堆叠的步幅为2的3×3卷积替换ViT stem的简单对应物的ViT模型的优化行为。使用卷积stem替代ViT极大地提高了优化稳定性，并提高了峰值性能（在ImageNet-1k上提高了约1-2%的top-1准确性），同时保持了flops和运行时间不变。

Escaping the big data paradigm with compact transformers

用紧凑型Transformer摆脱大数据范式

「简述：」本文介绍了一种名为Compact Transformers的小型学习方法，通过合适的大小、卷积化的分词技术，使transformers能够避免过拟合，并在小数据集上超越最先进的CNN。该方法具有灵活性，模型大小可以很小，只有0.28M参数即可获得有竞争力的结果。在CIFAR-10上从零开始训练时，最佳模型可以达到98%的准确率，这是以前基于transformer的模型的数据效率的显著提高，比其他transformer小10倍以上，是ResNet50的15%大小，同时达到类似的性能。

6.分层融合

MaxViT

论文；MAXIM: Multi-Axis MLP for Image Processing

用于图像处理的多轴MLP

「简述：」本文介绍了MAXIM多轴多层感知器（MLP）架构，用于图像处理任务。该架构使用UNet形状的分层结构，并支持长范围交互。MAXIM包含两个基于MLP的构建模块：一个多轴门控MLP和一个交叉门控块。作者的实验结果表明，所提出的MAXIM模型在多个图像处理任务上实现了最先进的性能，同时需要比竞争模型更少或相当数量的参数和FLOPs。

CvT

论文：CvT: Introducing Convolutions to Vision Transformers

将卷积引入视觉Transformers

「简述：」论文介绍了Convolutional vision Transformer（CvT）新架构，通过将卷积引入视觉Transformer来提高性能和效率。作者通过两个主要修改来实现这一目标：包含新卷积嵌入的Transformer层次结构和利用卷积投影的卷积Transformer块。这些更改将CNN的有利属性引入ViT架构，同时保持了Transformer的优点。作者通过实验验证了CvT，表明该方法在ImageNet-1k上实现了比其他视觉Transformer和ResNets更好的性能，同时具有更少的参数和更低的FLOPs。

Visformer

论文：Visformer: The Vision-friendly Transformer

视觉友好的Transformer

「简述：」论文介绍了一种名为Visformer的新架构，该架构通过逐步将基于Transformer的模型转换为基于卷积的模型来提高视觉识别性能。作者进行了实证研究，并在转换过程中获得了有用的信息。基于这些观察结果，作者提出了Visformer，它在ImageNet分类准确性方面优于其他模型，并且当模型复杂度较低或训练集较小时，优势更加显著。

ViTAE

论文：ViTAE: Vision Transformer Advanced by Exploring Intrinsic Inductive Bias

通过探索内在归纳偏差提高视觉Transformer性能

「简述：」本文介绍了ViTAE架构，该架构通过从卷积中探索内在归纳偏差来提高视觉Transformer的性能。ViTAE具有多个空间金字塔缩减模块，能够降低输入图像的尺寸并将其嵌入到具有丰富多尺度上下文的令牌中，从而获得内在尺度不变性IB。此外，在每个Transformer层中，ViTAE还具有并行的卷积块，其特征被融合并输入到前馈网络中，以获得内在局部性IB。实验证明，ViTAE在ImageNet和下游任务上优于基线Transformer和并发工作。

ConTNet

论文：ConTNet: Why not use convolution and transformer at the same time?

为什么不同时使用卷积和Transformer？

「简述：」本文介绍了ConTNet架构，将Transformer与ConvNet结合起来，以提供更大的感受野。ConTNet可以像普通的ConvNets一样进行优化，并保持出色的鲁棒性。作者展示了ConTNet在图像分类和下游任务上的优越性和有效性。ConTNet还作为Faster-RCNN和Mask-RCNN的骨干网络，在COCO2017数据集上分别比ResNet50高出2.6％和3.2％。

7.基于注意力的融合

EA-AA-ResNet

论文：Evolving Attention with Residual Convolutions

使用残差卷积来发展注意力

「简述：」作者提出了一种基于进化注意力的新颖通用机制，以提高transformer的性能。一方面，不同层的注意力图共享共同知识，因此前面的层的注意力可以通过残差连接指导后续层的注意力。另一方面，低级和高级注意力在抽象水平上有所不同，因此作者采用卷积层来模拟注意力图的演化过程。所提出的进化注意力机制在多种任务上取得了显著的性能提升，包括图像分类、自然语言理解和机器翻译。

ResT

论文：ResT: An Efficient Transformer for Visual Recognition

用于视觉识别的高效Transformer

「简述：」论文介绍了一种名为ResT的高效多尺度视觉Transformer，可作为通用的图像识别主干。与现有的Transformer方法相比，ResT具有一些优势，如内存高效的多头自注意力机制、灵活的位置编码和重叠卷积操作的补丁嵌入等。实验结果表明，所提出的ResT可以大幅超越最近最先进的主干网络。

CeiT

论文： Incorporating Convolution Designs into Visual Transformers

将卷积设计融入视觉Transformers

「简述：」论文提出了CeiT架构，将CNN和Transformer结合起来，以提取低层次特征、加强局部性和建立长范围依赖关系。实验结果表明，CeiT具有更好的效果和泛化能力，无需大量训练数据和额外的CNN教师。此外，CeiT模型还表现出更好的收敛性，可以显著降低训练成本。

8.通道增强融合

CB-HVTNet

论文：CB-HVTNet: A channel-boosted hybrid vision transformer network for lymphocyte assessment in histopathological images

用于组织病理图像中淋巴细胞评估的信道增强混合视觉变换网络

「简述：」论文提出了一种名为CB-HVT的混合视觉变换器网络，用于组织病理学图像中淋巴细胞的评估。该网络使用迁移学习生成增强通道，并同时使用变换器和CNN来分析淋巴细胞。CB-HVT由五个模块组成，可以有效地识别淋巴细胞。在两个公开可用的数据集上进行的实验结果表明，CB-HVT具有良好的泛化能力，可以成为病理学家的有价值的工具。

关注下方《学姐带你玩AI》

回复“缝合模型”获取模型+论文+代码

码字不易，欢迎大家点赞评论收藏

MySQL中的读锁与写锁：概念与作用深度剖析恩爸编程 mysql mysql 数据库 mysql读锁 mysql写锁 mysql中的读锁啥意思 mysql中的写锁啥意思 mysql锁机制
MySQL中的读锁与写锁：概念与作用深度剖析在MySQL数据库的并发控制机制中，读锁和写锁起着至关重要的作用。它们是确保数据在多用户环境下能够正确、安全地被访问和修改的关键工具。一、读锁（共享锁）概念读锁，也称为共享锁（SharedLock），在MySQL中使用LOCKINSHAREMODE语句来实现。当一个事务对某一数据对象施加读锁时，允许其他事务同时对该数据对象进行读取操作，但不允许其他事务对
咱们一起学C++第二十七篇：之C++程序结构与“Hello, World!”深度剖析一杯年华@编程空间咱们一起学习C++visual studio vim emacs docker vscode
咱们一起学C++第二十七篇：之C++程序结构与“Hello,World!”深度剖析在C++学习的征程中，我们共同探索，不断深入理解这门语言的奥秘。此前，我们学习了编写第一个C++程序所需的基础知识，包括iostream类的使用和命名空间的初步概念。今天，我们将进一步剖析C++程序的基本结构，详细解读经典的“Hello,World!”程序，深入理解其背后的原理和C++语言的特性，这对于我们掌握C++
AI绘画能取代设计师吗？网络安全我来了 IT技术 AI作画
AI绘画能取代设计师吗？在日益数字化的时代，人工智能（AI）正在快速渗透我们的生活和工作中。特别是在设计领域，AI绘画这一新兴技术引发了热烈讨论。你是否也曾好奇，AI绘画是否有可能取代设计师的工作？让我们一同探讨这个引人深思的话题。1.AI绘画的现状1.1AI绘画技术的形成与发展AI绘画的背后，离不开图像风格迁移、图文预训练模型和扩散模型这三大技术的共同推动。有点像是一位多才多艺的音乐家，利用不同
AI会对你的行业产生什么影响网络安全我来了 IT技术人工智能
AI对行业的影响：全面解析与展望在当今这个瞬息万变的时代，人工智能（AI）正如同一个强大的引擎，驱动着各个行业的迅猛发展。这不仅仅是一种技术的崛起，更是全球经济和社会结构的深刻变革。今天，让我们深入解析AI，尤其是生成式AI，如何影响我们的工作与生活，以及我们可以期待的未来。生成式AI的迅猛崛起生成式AI的定义与特点生成式AI，简单来说，就是机器学习的一个分支，通过学习大量数据，生成新的内容。这就
9. 马科维茨资产组合模型+FF5+GARCH风险模型优化方案（理论+Python实战） AI量金术师金融资产组合模型进化论 python 开发语言金融人工智能机器学习算法
目录0.承前1.核心风险函数代码讲解1.1数据准备和初始化1.2单资产GARCH建模1.3模型拟合和波动率预测1.4异常处理机制1.5相关系数矩阵计算1.6构建波动率矩阵1.7计算协方差矩阵1.8确保矩阵对称性1.9确保矩阵半正定性1.10格式转换和返回1.11calculate_covariance_matrix函数汇总2.代码汇总3.反思3.1不足之处3.2提升思路4.启后0.承前本篇博文是对
Open WebUI应用实践孙将帼
open-webui/open-webui:User-friendlyWebUIforLLMs(FormerlyOllamaWebUI)(github.com)Tutorial|OpenWebUIOpenWebUITip:OpenWebUI、Ollama、Helm、ChromaDB、RAG、Pipelines、sentence-transformers库、1、OpenWebUI是一个可扩展的、自托
python保存和调用模型 sphinxrascal168 大幅度
2.创建文件目录，保存模型importosfromsklearn.externalsimportjoblib#创建文件目录dirs='testModel'ifnotos.path.exists(dirs):os.makedirs(dirs)#保存模型joblib.dump(LR,dirs+'/LR.pkl')3.读取模型#读取模型LR=joblib.load(dirs+'/LR.pkl')test
语言模型与向量模型：深入解析与实例剖析 ♢.＊语言模型人工智能自然语言处理
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、Java与Python的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！在自然语言处理领域，语言模型和向量模型
Model Import Settings UniMark unity editor manual unity
前言在可视化3D世界中，模型是3D世界的核心，你可以没有贴图，可以没有特效，甚至可以没有用户交互界面，但必须得有模型来描述世界的基本样貌。在3D世界中，由点线面构成了模型的轮廓；由UV和纹理，共同描述模型的样貌；由骨骼和蒙皮信息描述模型的运动姿态；再由骨骼的运动轨迹描述模型在某个时间段内的肢体动作。MODELPAGEMODEL功能描述ScaleFactor调整导入模型的全局缩放比例。如果模型的比例
Cursor AI Anjgst 人工智能
CursorAI完整指南：AI驱动的新一代编程工具目录简介主要特性安装与设置核心功能详解使用技巧价格方案常见问题简介CursorAI是一个基于VSCode的革命性AI驱动代码编辑器，它将人工智能与传统编程环境完美结合，为开发者提供更智能、更高效的编程体验。主要特性1.AI智能补全Tab智能补全：通过AI预测并补全多行代码上下文感知：理解整个项目结构和编码风格多语言支持：支持所有主流编程语言2.代码
kotlin扩展函数！啃下这些Framework技术笔记，醍醐灌顶！_kotlin framework features 2401_89694162 笔记
前言选了开发这一行，就意味着想混得好就要持续学习，你的技术和薪资、位置直接挂钩，进步对于程序员的重要性就不赘述了，接下来作为过来人，为广大同行分享一些学习干货，希望可以帮到大家什么是HTTPS?HTTPS(基于安全套接字层的超文本传输协议或者是HTTPoverSSL)是一个Netscape开发的Web协议。你也可以说：HTTPS=HTTP+SSLHTTPS在HTTP应用层的基础上使用安全套接字层作
Python 调用常见大模型 API 全解析 ♢.＊ python 开发语言语言模型 nlp
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、JAVA、PYTHON与SAP的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！调用通义千问接口获取APIKe
使用Ollama 在Ubuntu运行deepseek大模型：以DeepSeek-coder为例 skywalk8163 人工智能 ubuntu linux 人工智能 deepseek
DeepSeek大模型这几天冲上热搜啦！咱们来亲身感受下DeepSeek模型的魅力吧！整个操作流程非常简单方便，只需要2步，先安装Ollama，然后执行大模型即可。安装Ollama在Ubuntu下安装Ollama非常简单，直接snap安装即可：sudosnapinstallollama运行DeepSeek大模型直接用ollamarun后面跟模型名字即可，比如执行deepseek-coderolla
cursor软件的chat和composer分别是什么 hunter206206 人工智能 python
Cursor是一款基于人工智能的代码编辑器，集成了类似ChatGPT的功能，旨在帮助开发者更高效地编写代码。以下是Cursor中Chat和Composer的具体功能：1.ChatCursor中的Chat是一个基于AI的聊天功能，类似于ChatGPT，但专门为编程场景优化。它的主要用途包括：代码解释：帮助你理解代码的功能或逻辑。代码生成：根据自然语言描述生成代码片段。代码优化：提供代码优化建议或重构
AI编译器之——为什么大模型需要Relax？ FF-Studio 人工智能深度学习自然语言处理机器学习语言模型
放在最前：Relax的关键创新深度学习模型（比如ChatGPT这种大模型）在运行时经常遇到“输入尺寸不固定”的情况。比如你问它一个问题，这次输入是10个字，下次可能是100个字。传统编译器处理这种“变来变去”的尺寸很笨——要么只能按固定尺寸优化（导致变尺寸时性能暴跌），要么每次都要重新编译（慢到没法用）。Relax的创新：符号形状：让编译器学会“代数”Relax允许编译器用“符号变量”（比如n）表
实战LLM强化学习——使用GRPO（DeepSeek R1出圈算法） FF-Studio DeepSeek R1 算法语言模型人工智能自然语言处理机器学习
——关于使用Unsloth库、LoRa微调及GRPOTrainer自定义奖励函数实现“只输出10个英语单词”的探索为什么要进行“只输出10个英文单词”的极端尝试？在大模型的训练或微调当中，大多数场景我们都希望它能“自由发挥”，给出越丰富越好的答案。但，为了更好的理解强化学习在LLM训练过程中发挥的意义，也为了学习GPRO这个强化学习算法，笔者出此题目，方便大家学习理解。GRPO（GroupRela
Ubuntu交叉编译 arm板子上的TVM 陈有爱 TVM ubuntu 人工智能
目录X86Ubuntu的TVM安装LLVM下载tvm配置config.cmake编译源码python安装测试是否安装成功可以在安装一些库，用于RPCTracker和auto-tuning交叉编译801arm的TVM交叉编译链下载配置config.cmake编译源码编译的时候可能会遇到错误ONNX模型转换为TVM模型创建pre.py，将onnx模型编译成tvm.so文件测试TVM模型修改demo程序
【AI中数学-数理统计-综合实例-包括python实现】揭开数据的面纱：真实样本数据的探索与可视化云博士的AI课堂 AI中的数学人工智能 python 数理统计数据预处理数据探索数据可视化机器学习
第五章：数理统计-综合实例1.揭开数据的面纱：真实样本数据的探索与可视化在人工智能（AI）应用中，数据是构建算法和模型的基石，而数理统计则为我们提供了理解和处理这些数据的工具。数据探索和可视化是数理统计中至关重要的步骤，它们不仅能帮助我们理解数据的分布、关系和趋势，还能够为后续的建模工作提供依据。本节将通过五个实际案例，展示如何使用数理统计和可视化技术对真实样本数据进行探索。每个案例都包括具体的描
Apache TVM：开源深度学习编译器栈的领跑者计攀建Eliza
ApacheTVM：开源深度学习编译器栈的领跑者tvmOpendeeplearningcompilerstackforcpu,gpuandspecializedaccelerators项目地址:https://gitcode.com/gh_mirrors/tv/tvm项目介绍ApacheTVM是一个专为深度学习系统设计的编译器栈。它旨在弥合生产力导向的深度学习框架与性能和效率导向的硬件后端之间的差
Apache Airflow 全面解析由数入道人工智能 apache Airflow
1.Airflow的定义与核心定位ApacheAirflow是一个开源的工作流自动化与调度平台，由Airbnb于2014年创建，2016年进入Apache孵化器，2019年成为顶级项目。其核心设计理念是“WorkflowsasCode”，通过编程方式定义、调度和监控复杂的数据流水线（Pipeline），适用于ETL、机器学习模型训练、数据湖管理、报表生成等场景。2.核心概念与架构解析2.1核心组件
AI人工智能代理工作流AI Agent WorkFlow：面向服务计算中的代理工作流管理 AI大模型应用之禅 AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能代理工作流AIAgentWorkFlow：面向服务计算中的代理工作流管理关键词：人工智能，代理工作流，服务计算，自动执行，智能调度，协同处理，流程管理1.背景介绍1.1问题的由来随着互联网和云计算的快速发展，服务计算作为一种分布式计算模式，已经成为企业信息化建设的重要方向。在服务计算中，工作流技术被广泛应用于业务流程的建模、执行和管理。然而，传统的基于BPM（业务流程管理）的工作流管理
Spring AI 在微服务中的应用：支持分布式 AI 推理 drebander AI 编程 springAI
1.引言在现代企业中，微服务架构已成为开发复杂系统的主流方式，而AI模型推理也越来越多地被集成到业务流程中。如何在分布式微服务架构下高效地集成SpringAI，使多个服务可以协同完成AI任务，并支持分布式AI推理，是企业面临的关键挑战。本篇文章将探讨：在微服务架构中如何部署SpringAI服务；如何通过分布式AI推理提高推理性能与扩展性；典型应用场景，如电商推荐、智能客服、实时分析等。2.Spri
架构师考试系列（２）论文专题：论统一过程开发方法RUP的应用 CoderIsArt 架构设计研究软件架构
摘要：2020年6月，我参加了本公司的“虚拟现实（VR）”（下面称为该项目）平台的开发工作。我在此项目中，作为主要管理人员，担任系统架构师，负责整个项目的架构设计工作。该项目包括素材管理、热点管理、场景管理、VR产品制作、VR产品管理、VR产品展示等相关功能模块。该项目主要采用了RUP开发模型，对项目的开发过程进行规范和改进。本文以该项目为例，结合了作者的实践，讨论RUP(统一过程)在开发中的应用
6. 深入Linux安全世界：构建坚不可摧的系统屏障涛ing Linux概览 linux 安全运维服务器 ubuntu unix c++
本章目录前言6.1理解Linux安全模型深入了解文件权限权限位详解：修改文件权限：绘制示例图：文件权限的结构6.2用户账户的安全设置查看系统中的用户示例解释：管理用户的安全策略6.3防火墙与网络安全性常用iptables规则1.**只允许特定IP访问SSH服务**2.限制连接速率简单网络流量防火墙结构示意图：6.4数据加密技术使用GPG进行文件加密1.生成密钥对2.加密文件3.解密文件数据加密的流
2025年美赛数学建模 MCM Problem B: Managing Sustainable Tourism 问题 B：可持续旅游管理思路+代码解析【第一问】一键难忘付费专栏数学建模 2025美赛 2025年美赛数学建模可持续旅游管理
本文为个人解题笔记，仅供参考学习。本文B题的第一问。其他问题均在本专栏内，订阅一次，全部可见。本文为个人解题笔记，仅供参考学习。第一小问【为阿拉斯加州朱诺建⽴⼀个可持续旅游业模型。】BuildamodelforasustainabletourismindustryinJuneau,Alaska.Youmaywanttoconsiderfactorssuchasthenumberofvisitors
github最强Chatbox AI 模型桌面，支持 ChatGPT、Claude等主流模型，适用于 Win、Linux等，总结文档图片并互动，智能编程，AI实时联网搜索与查询，图片生成，科研写作等 struggle2025 人工智能深度学习语音识别计算机视觉语言模型图像处理数据分析
一、软件介绍（文末提供下载）Chatbox是一个AI模型桌面客户端，支持ChatGPT、Claude、GoogleGemini、Ollama等主流模型，适用于Windows、Mac、Linux、Web、Android和iOS全平台。github地址：GitHub-Bin-Huang/chatbox:User-friendlyDesktopClientAppforAIModels/LLMs(GPT,
2025年美赛数学建模 MCM Problem B: Managing Sustainable Tourism 问题 B：可持续旅游管理代码解析 2025年数学建模美赛 2025年美赛MCM/ICM 数学建模旅游 2025美赛 2025年数学建模美赛 python代码 matlab 可持续旅游管理
目录代码框架：遗传算法优化可持续旅游模型python代码代码解析：matlab代码代码解析：代码框架：遗传算法优化可持续旅游模型python代码importnumpyasnpimportrandomimportmatplotlib.pyplotasplt#定义遗传算法的参数POP_SIZE=100#种群大小GENS=500#迭代代数MUTATION_RATE=0.01#变异率CROSSOVER_R
vLLM源码之分离式架构 Bj陈默架构
一、vLLM分离式架构概述1.基本概念vLLM是一个用于高效地服务大语言模型（LLM）推理的库。其分离式架构是一种创新的设计理念，旨在优化LLM的运行效率。这种架构将模型执行的不同阶段进行分离处理，主要包括请求处理、模型执行和结果输出等关键环节。2.设计目的提升吞吐量。通过分离式架构，可以并行处理多个请求，避免不同请求在处理过程中的相互干扰，充分利用硬件资源，特别是在处理高并发请求时能显著提高系统
Python 实现文本摘要功能热爱技术的小胡 python
互联网时代信息爆炸式增长，人们面对越来越多的信息无法一一阅读，而文本自动摘要技术可以一定程度上缓解这个问题。摘要就是一篇文章的核心部分信息，文本自动摘要技术分抽取式摘要和生成式摘要，前者是在原文中挑选一定比例的句子拼凑成一个摘要，后者更接近人为的总结式简写一篇文章。目前越来越多的研究者使用深度神经网络来研究生成式摘要技术，但是难度也挺大，效果有限。本文的方法是使用基于启发式规则的算法实现了一个抽取
关于时间序列预测的一份介绍张焚雪人工智能算法大数据
时间序列预测是一种基于过去数据点的分析方法，用于预测未来值。它广泛应用于经济学、金融、气象学、销售预测、库存管理等领域。在这篇文章中，我就将介绍有关时间序列预测有关的东西，具体将包含其有关的概念、预测过程以及相关模型简介。一、概念1.1预测模型所谓预测模型就是用基于历史数据预测未来值的各种数学和统计模型，它是时间序列预测的核心，选择合适的预测模型直接影响到预测结果的准确性。一般我们考虑根据频率与趋
Java实现的基于模板的网页结构化信息精准抽取组件：HtmlExtractor yangshangchuan 信息抽取 HtmlExtractor 精准抽取信息采集
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件，本身并不包含爬虫功能，但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。 HtmlExtractor是为大规模分布式环境设计的，采用主从架构，主节点负责维护抽取规则，从节点向主节点请求抽取规则，当抽取规则发生变化，主节点主动通知从节点，从而能实现抽取规则变化之后的实时动态生效。如
java编程思想 -- 多态百合不是茶 java 多态详解
一: 向上转型和向下转型面向对象中的转型只会发生在有继承关系的子类和父类中（接口的实现也包括在这里）。父类：人子类：男人向上转型： Person p = new Man() ; //向上转型不需要强制类型转化向下转型： Man man =
[自动数据处理]稳扎稳打,逐步形成自有ADP系统体系 comsci dp
对于国内的IT行业来讲,虽然我们已经有了"两弹一星",在局部领域形成了自己独有的技术特征,并初步摆脱了国外的控制...但是前面的路还很长.... 首先是我们的自动数据处理系统还无法处理很多高级工程...中等规模的拓扑分析系统也没有完成,更加复杂的
storm 自定义日志文件商人shang storm cluster logback
Storm中的日志级级别默认为INFO，并且，日志文件是根据worker号来进行区分的，这样，同一个log文件中的信息不一定是一个业务的，这样就会有以下两个需求出现： 1. 想要进行一些调试信息的输出 2. 调试信息或者业务日志信息想要输出到一些固定的文件中不要怕，不要烦恼，其实Storm已经提供了这样的支持，可以通过自定义logback 下的 cluster.xml 来输
Extjs3 SpringMVC使用 @RequestBody 标签问题记录 21jhf
springMVC使用 @RequestBody(required = false) UserVO userInfo 传递json对象数据，往往会出现http 415，400,500等错误，总结一下需要使用ajax提交json数据才行，ajax提交使用proxy，参数为jsonData，不能为params；另外，需要设置Content-type属性为json，代码如下：（由于使用了父类aaa
一些排错方法文强chu 方法
1、java.lang.IllegalStateException: Class invariant violation at org.apache.log4j.LogManager.getLoggerRepository(LogManager.java:199)at org.apache.log4j.LogManager.getLogger(LogManager.java:228) at o
Swing中文件恢复我觉得很难小桔子 swing
我那个草了！老大怎么回事，怎么做项目评估的？只会说相信你可以做的，试一下，有的是时间！用java开发一个图文处理工具，类似word，任意位置插入、拖动、删除图片以及文本等。文本框、流程图等，数据保存数据库，其余可保存pdf格式。ok,姐姐千辛万苦，
php 文件操作 aichenglong PHP 读取文件写入文件
1 写入文件 @$fp=fopen("$DOCUMENT_ROOT/order.txt", "ab"); if(!$fp){ echo "open file error" ; exit; } $outputstring="date:"." \t tire:".$tire."
MySQL的btree索引和hash索引的区别 AILIKES 数据结构 mysql 算法
Hash 索引结构的特殊性，其检索效率非常高，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的查询效率要远高于 B-Tree 索引。可能很多人又有疑问了，既然 Hash 索引的效率要比 B-Tree 高很多，为什么大家不都用 Hash 索引而还要使用 B-Tree 索引呢
JAVA的抽象--- 接口 --实现百合不是茶
抽象接口实现接口 //抽象类 ,方法 //定义一个公共抽象的类 ,并在类中定义一个抽象的方法体抽象的定义使用abstract abstract class A 定义一个抽象类例如： //定义一个基类 public abstract class A{ //抽象类不能用来实例化，只能用来继承 //
JS变量作用域实例 bijian1013 作用域
<script> var scope='hello'; function a(){ console.log(scope); //undefined var scope='world'; console.log(scope); //world console.log(b);
TDD实践（二） bijian1013 java TDD
实践题目：分解质因数 Step1：单元测试： package com.bijian.study.factor.test; import java.util.Arrays; import junit.framework.Assert; import org.junit.Before; import org.junit.Test; import com.bijian.
[MongoDB学习笔记一]MongoDB主从复制 bit1129 mongodb
MongoDB称为分布式数据库，主要原因是1.基于副本集的数据备份， 2.基于切片的数据扩容。副本集解决数据的读写性能问题，切片解决了MongoDB的数据扩容问题。事实上，MongoDB提供了主从复制和副本复制两种备份方式，在MongoDB的主从复制和副本复制集群环境中，只有一台作为主服务器，另外一台或者多台服务器作为从服务器。本文介绍MongoDB的主从复制模式，需要指明
【HBase五】Java API操作HBase bit1129 hbase
import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.HColumnDescriptor; import org.apache.ha
python调用zabbix api接口实时展示数据 ronin47
zabbix api接口来进行展示。经过思考之后，计划获取如下内容： 1、获得认证密钥 2、获取zabbix所有的主机组 3、获取单个组下的所有主机 4、获取某个主机下的所有监控项
jsp取得绝对路径 byalias 绝对路径
在JavaWeb开发中，常使用绝对路径的方式来引入JavaScript和CSS文件，这样可以避免因为目录变动导致引入文件找不到的情况，常用的做法如下：一、使用${pageContext.request.contextPath} 　　代码” ${pageContext.request.contextPath}”的作用是取出部署的应用程序名，这样不管如何部署，所用路径都是正确的。
Java定时任务调度：用ExecutorService取代Timer bylijinnan java
《Java并发编程实战》一书提到的用ExecutorService取代Java Timer有几个理由，我认为其中最重要的理由是：如果TimerTask抛出未检查的异常，Timer将会产生无法预料的行为。Timer线程并不捕获异常，所以 TimerTask抛出的未检查的异常会终止timer线程。这种情况下，Timer也不会再重新恢复线程的执行了;它错误的认为整个Timer都被取消了。此时，已经被
SQL 优化原则 chicony sql
一、问题的提出　在应用系统开发初期，由于开发数据库数据比较少，对于查询SQL语句，复杂视图的的编写等体会不出SQL语句各种写法的性能优劣，但是如果将应用系统提交实际应用后，随着数据库中数据的增加，系统的响应速度就成为目前系统需要解决的最主要的问题之一。系统优化中一个很重要的方面就是SQL语句的优化。对于海量数据，劣质SQL语句和优质SQL语句之间的速度差别可以达到上百倍，可见对于一个系统
java 线程弹球小游戏 CrazyMizzz java 游戏
最近java学到线程，于是做了一个线程弹球的小游戏，不过还没完善这里是提纲 1.线程弹球游戏实现 1.实现界面需要使用哪些API类 JFrame JPanel JButton FlowLayout Graphics2D Thread Color ActionListener ActionEvent MouseListener Mouse
hadoop jps出现process information unavailable提示解决办法 daizj hadoop jps
hadoop jps出现process information unavailable提示解决办法 jps时出现如下信息： 3019 -- process information unavailable3053 -- process information unavailable2985 -- process information unavailable2917 --
PHP图片水印缩放类实现 dcj3sjt126com PHP
<?php class Image{ private $path; function __construct($path='./'){ $this->path=rtrim($path,'/').'/'; } //水印函数，参数：背景图，水印图，位置，前缀,TMD透明度 public function water($b,$l,$pos
IOS控件学习：UILabel常用属性与用法 dcj3sjt126com ios UILabel
参考网站： http://shijue.me/show_text/521c396a8ddf876566000007 http://www.tuicool.com/articles/zquENb http://blog.csdn.net/a451493485/article/details/9454695 http://wiki.eoe.cn/page/iOS_pptl_artile_281
完全手动建立maven骨架 eksliang java eclipse Web
建一个 JAVA 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=App [-Dversion=0.0.1-SNAPSHOT] [-Dpackaging=jar] 建一个 web 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=web-a
配置清单 gengzg 配置
1、修改grub启动的内核版本 vi /boot/grub/grub.conf 将default 0改为1 拷贝mt7601Usta.ko到/lib文件夹拷贝RT2870STA.dat到 /etc/Wireless/RT2870STA/文件夹拷贝wifiscan到bin文件夹，chmod 775 /bin/wifiscan 拷贝wifiget.sh到bin文件夹，chm
Windows端口被占用处理方法 huqiji windows
以下文章主要以80端口号为例，如果想知道其他的端口号也可以使用该方法..........................1、在windows下如何查看80端口占用情况?是被哪个进程占用?如何终止等. 这里主要是用到windows下的DOS工具,点击"开始"--"运行",输入&
开源ckplayer 网页播放器，跨平台(html5, mobile)，flv, f4v, mp4, rtmp协议. webm, ogg, m3u8 ！天梯梦 mobile
CKplayer，其全称为超酷flv播放器，它是一款用于网页上播放视频的软件，支持的格式有：http协议上的flv,f4v,mp4格式，同时支持rtmp视频流格式播放，此播放器的特点在于用户可以自己定义播放器的风格，诸如播放/暂停按钮，静音按钮，全屏按钮都是以外部图片接口形式调用，用户根据自己的需要制作出播放器风格所需要使用的各个按钮图片然后替换掉原始风格里相应的图片就可以制作出自己的风格了，
简单工厂设计模式 hm4123660 java 工厂设计模式简单工厂模式
简单工厂模式（Simple Factory Pattern）属于类的创新型模式，又叫静态工厂方法模式。是通过专门定义一个类来负责创建其他类的实例，被创建的实例通常都具有共同的父类。简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。简单工厂模式是工厂模式家族中最简单实用的模式，可以理解为是不同工厂模式的一个特殊实现。
maven笔记 zhb8015 maven
跳过测试阶段： mvn package -DskipTests 临时性跳过测试代码的编译： mvn package -Dmaven.test.skip=true maven.test.skip同时控制maven-compiler-plugin和maven-surefire-plugin两个插件的行为，即跳过编译，又跳过测试。指定测试类 mvn test
非mapreduce生成Hfile，然后导入hbase当中 Stark_Summer map hbase reduce Hfile path实例
最近一个群友的boss让研究hbase，让hbase的入库速度达到5w+/s，这可愁死了，4台个人电脑组成的集群，多线程入库调了好久，速度也才1w左右，都没有达到理想的那种速度，然后就想到了这种方式，但是网上多是用mapreduce来实现入库，而现在的需求是实时入库，不生成文件了，所以就只能自己用代码实现了，但是网上查了很多资料都没有查到，最后在一个网友的指引下，看了源码，最后找到了生成Hfile
jsp web tomcat 编码问题王新春 tomcat jsp pageEncode
今天配置jsp项目在tomcat上，windows上正常，而linux上显示乱码，最后定位原因为tomcat 的server.xml 文件的配置，添加 URIEncoding 属性： <Connector port="8080" protocol="HTTP/1.1" connectionTi