To_1_oT

人物交互（human object interaction）论文汇总-2018年

1. Detecting and Recognizing Human-Object Interactions

1.1 总述

中心思想是以人为中心。假设是一个人的外表信息（姿态、衣服、动作等）是确定与他们交互的物体的有力线索（人的外表信息对于定位参与交互的物体可能处于何处是很有帮助的，根据此可以进一步缩小参与交互的目标物体的搜索空间）。为了利用这个线索，本文的模型学习了根据检测到的人和人的外表信息来预测特定动作的物体位置的密度。

1.2 网络结构

主要分为三个分支：目标检测分支、人为中心分支、交互分支。其中：
(1)目标检测分支的输入是卷积特征，输出是物体的框坐标以及分类分数 $S_h$ ， $S_o$ ，这部分和普通的目标检测类似。

(2)人为中心分支输入人的框的特征（通过RoiAlign），输出动作分数 $S_h^a$ 以及基于人外观信息计算的给定人-动作对的交互目标物体的预测位置 $μ_h^a$ ，后面用于计算 $g_(h,o)^a$ —物体框 $b_o$ 是真实的交互目标的可能性。由于可同时有多种交互，所以 $S_h^a$ 输出采用二值Sigmod分类器用于多标签分类，使用二元交叉熵损失，而 $μ_h^a$ 部分的损失计算类似于边框回归。

(3)交互分支输入人框的特征和物体框的特征，然后这两个分支的两个A维向量求和再通过Sigmod得到A维得分S_(h,o)^a，同样使用二元交叉熵损失。

最终的得分为 $S_h*S_o*S_h^a*g_(h,o)^a$ 。训练时，所有分支都使用RPN训练。

1.3 密度预测

根据人的外观特征 $b_h）$ 直接预测精确的目标物体的坐标是很难的，所以本文预测可能位置上的密度，后面将此与检测到的物体位置一起使用以定位参与交互的物体。
作者将目标物体位置上的密度建模为高斯函数，该函数的平均值 $μ_h^a）$ 是根据人的外观和所执行的动作来预测的。 $g_(h,o)^a=exp⁡（‖b_(o|h)-μ_h^a ‖^2/(2σ^2 )）$ 。使用g来表示物体框 $b_o$ 和预测目标位置 $μ_h^a$ 的相关性，也就是物体框 $b_o$ 是真实的交互目标的可能性。
此外， $b_(o|h)$ 是 $b_o$ 相对于 $b_h$ 的位置编码，。方式类似于边框回归，损失函数使用的是smooth L1，在 $b_(o|h)$ 和 $μ_h^a$ 之间计算。

1.4 实验

推理时，通过下面这个公式来进行配对三元组：

它会选择一个高置信度且临近于一个得分较高的动作的预测目标位置的物体框。

在VCOCO数据集上达到了40.0，在HICO-DET数据集上达到了9.94.

下面是预测的密度的可视化例子：

2. Learning to Detect Human-Object Interactions

2.1 总述

本文是在提出HICO-DET数据集时提出的。核心思想是交互模式（即空间配置图），用以描述两个边界框（人和物）的空间关系，认为人与物体的空间关系对于学习交互知识是很重要的线索。

2.2 网络结构

常规的提取人物交互proposal的方式是根据RPN的目标检测proposal两两配对（人框和物框），这样的话人物交互的proposal就太多了。本文保留检测分数最高的若干个检测框（前10个），然后对于每个交互类别，将人框和物框组合配对以生成proposal（每个交互类别有10*10=100个proposal）。
主要分为三个分支，不同的分支从不同的来源提取特征，直观上围绕人类和物体的局部信息对于区分交互类别很重要，所以主要关注人和物体的特征。人分支、物体分支和人物对分支分别从人框上、物体框上、人物空间关系上提取特征。
人和物分支：从边界框裁剪图像，然后调整为固定大小，再通过卷积网络提取特征，最后输出得分。
每个分支最后是一个二进制分类器，输出交互分数。每个交互类别都有一个二进制分类器。最终的HOI得分是三个分支融合得来的。

2.3 空间关系编码（人物对分支）

空间配置图是一个2通道的二进制图像，第一个通道和第二个通道分别是人和物，框内部分值为1，框外为0.
对于同一种空间关系，无论人-物对位于图中什么位置，它的空间配置图应该是相同的，所以需要删去人-物对之外的像素。
不同的人-物框对的宽高比（以及大小）可能是不同的，而网络的输入需要固定的宽高比和大小，所以有两种方式处理：

空间配置图两边调整为固定大小，不考虑宽高比。
将空间配置图的较长的一边固定长度，保持宽高比，在短的一边填充0
接收空间配置图输入的网络有两种方式：

使用第二种（b）时效果更好。
因为HOI是多标签分类，所以应用Sigmod+交叉熵损失来训练该部分。总的loss为所有分支的loss之和。

2.4 实验

HICO-DET获得了10.4的结果。

3. Compositional Learning for Human Object Interaction

3.1 总述

本文探讨的是人物交互的zero-shot学习问题。现有方法未考虑使用外部先验知识，而且数据集中的交互类别是有限的，训练的模型无法推广使用。因此本文提出一种使用外部知识图和图卷积网络的方法。核心思想来自于VQA任务中的Compositional learning，不过本文侧重于人和物的交互。
日常交互动作可通过动词-名词对来描述，本文利用这些动词-名词对来学习交互。但是存在一个问题：模型如何学习在上下文中构成的新的交互类别。为此，本文探索使用外部先验知识来弥补这部分的缺陷，帮助进行交互的组合建模。具体来说就是，从知识库中提取三元组（主体、动词、客体，即主谓宾）来构建外部知识图，每个动词名词都是图形中的一个节点，单词嵌入是该节点的特征。每个三元组定义了一个相应的名词动词之间的路径，信息传递（训练）是是使用多层图神经网络实现的。最终将交互的zero-shot学习简化为图空间中的最近邻搜索问题。

3.2 网络结构

主要分为三个部分：

编码构建人物交互的知识图，通过使用WordNet构建。
对该图神经网络进行训练，来学习构建新的交互动作。
卷积神经网络提取视觉特征。

最终的结果来自于图神经网络特征和视觉特征的融合。网络的目标是学习一个得分函数：

其中，x是基础卷积网络提取的视觉特征， $y^v$ 和 $y^n$ 分别是动词和名词，K为交互动作的外部先验知识。本文核心就是通过一个图结构构建出K，并使用这个图学习组合新的交互动作。
交互的图表示如下图，其中圆圈代表交互动作：

3.3 实验

在HICO-DET上获得了21的mAP。

4. Learning Human-Object Interactions by Graph Parsing Neural Networks

4.1 总述

本文提出一种新的HOI识别框架—图解析神经网络（GPNN）。对于给定的一个场景，GPNN推断一个解析图，该图包括两部分，一个是由邻接矩阵表示的HOI图结构，一个是节点标签。
利用HOI图的结构化表示，可以显式地利用丰富的关系，并且可以有效地集成来自各个元素的信息并在结构上进行传播。整个模型和消息传递操作是定义明确且完全可微分的。因此，可以以端到端的方式从数据中高效地学习HOI知识。

4.2 网络结构

首先将所有的结点特征（所有物体，包括人）连成一个HOI图，经过网络学习得到的权重对该图的进行加权，然后得到的解析图中有的边较粗，有的较细，较粗的边对应于节点之间具有较强的信息，进而得到交互结果。

4.3 GPNN

人/物是结点，他们的关系是边。一个给定的HOI图，其中包含了所有的人物关系，通过保留有意义的边并标记结点来推断一个HOI解析图。
GPNN根据结点特征和边特征来推断出一个最佳的解析图，解析图是HOI图的一个子图。GPNN主要由四个函数组成，分别是link函数、message函数、update函数以及readout函数。
具体来说，链接函数（link）将边缘特征（F）作为输入，并推断节点之间的连通性。因此，构造了软邻接矩阵（A），并将其用作通过节点之间边缘的消息的权重。通过message函数汇总该节点的由其他节点传入的消息，然后通过update函数根据消息更新节点的隐藏嵌入状态。最后，readout函数计算每个节点的目标输出。

这四种函数的定义如下：
(1) link函数
输入节点特征和边特征，输出一个表示结点间连通性的邻接矩阵。然后开始在解析图上传播消息，其中软邻接矩阵通过边缘控制信息传递。
该部分的网络定义为具有一个或多个卷积层和Sigmod激活层的小型神经网络。使用1*1卷积，因为具有1×1内核的多个卷积层的本质效果类似于应用于每个边缘特征的全连接层，不同之处在于所有边缘均共享卷积权重。

(2) message函数和update函数
message函数汇总来自其他节点的消息；update函数根据汇总的消息来更新隐藏的结点状态。
Message函数的网络定义为拼接操作，拼接了结点隐藏状态或边特征的线性转换输出（通过全连接层线性转换）。Update函数使用循环神经网络中的Gated Recurrent Unit (GRU)实现。

(3) readout函数
对于每个结点，该函数读入隐藏状态，输出结点的HOI标签。
网络定义为几个全连接层组合在一起，再加上一个激活层（softmax或者sigmod）。
基于以上4个函数，消息沿着HOI图传递并由学习到的邻接矩阵A加权，最终得到解析图。

4.4 实验

在HICO-DET上达到了mAP13.11；在VCOCO上达到了mAP44.5。

5. Pairwise Body-Part Attention for Recognizing Human-Object Interactions

5.1 总述

常规的人物交互检测方法是将人视为一个整体，忽略了通常情况下是人的某个部位在与物体交互而不是整个人，仅关注身体部位并不能捕获重要的HOI语义，因为忽略了不同身体部位之间的相关性。所以作者认为在HOI识别中应该注意身体部位，而且对于某个交互来说不同的身体部位的重要性也不同，此外还应进一步考虑不同的身体部位之间的相关性。以此出发，本文提出一种身体部位对注意力网络，学习专注于关键身体部位以及其与HOI识别的相关性。身体部位对的引入减少了大量的误报，因为与HOI不相关的身体部位都被过滤掉了。

5.2 网络结构

网络首先从一组proposal中提取人、物体和场景的视觉特征。使用ROI-pairwise Pooling（a）对不同身体部位的特征及其成对相关性进行编码。然后，成对的身体部位注意模块（b）将选择那些重要的身体部位对的特征图。来自人、物体和场景的全局外观特征（c）也用于预测。最终的预测来自于身体注意力模块的结果和全局外观特征的结果的融合。

采用MIL（Multiple Instance Learning）解决图像中多人同时出现的问题。MIL层的输入是图像中每个人的预测，其输出是分数数组，该分数数组采用所有输入预测中每个HOI的最大分数。

5.3 全局外观特征

该部分从全局来考虑，利用整个人、物体和场景的特征进行HOI识别。在基础网络得到的特征图上，ROI Pooling为每个人和物体以及场景在给定其边界框的情况下提取ROI特征。对于每个检测到的人，将他的特征与物体特征以及场景特征连接起来作为该部分的最终特征。

给定一个物体边界框，一个简单的解决方案是提取相应的特征图，然后将其与人和场景的现有特征连接起来。然而，这种方法对于HOI识别的任务没有太大的改进，因为物体和人之间的相对位置没有被编码。因此，本文将ROI作用于检测到的人与物体的联合框而不是每个单独的人/物框。

HICO数据集中，图像中可以有多个人和多个物体。对于每个人，可以在他周围共同出现多个物体。为解决此问题，作者对不同物体和人的多个联合框进行采样，并将ROI池分别应用于每个联合框。围绕一个人采样的物体总数是固定的。

5.4 局部身体部位对特征

(1) ROI-pairwise Pooling

$R_1$ 和 $R_1$ 分别代表不同身体部位的边界框， $R_u$ 代表身体部位对的联合框。常规做法是取一个人的所有的身体部位对，但是若该对中的两个身体部位相距较远则联合框包含了大量的与HOI不相关的信息，为此ROI-pairwise pooling层提取 $R_1$ 和 $R_2$ 的框内区域特征，框外区域将被丢弃（设为0）。对于ROI-pairwise pooling中每个采样的网格位置，对网格区域内的最大值进行采样。

(2) Attention Module
身体部位对的数量很大（若有n个身体部位，则数量为 $C_n^2$ ），而其中相互关联的对很少，所以作者用注意力模块自动发现那些有重要的相关联的对。

根据由ROI-pairwise pooling层池化的逐对身体部位特征图（pair 1—pair m），应用FC层来估计注意力得分，这些得分代表了该身体部位对的重要性。然后，将注意力分数与身体部位特征图相乘。最后，引入特征选择层，该层选择前k个最重要的身体部位对（根据得分），并将它们的reweight特征图传播到下一步。

(3) 身体部位框的构建
首先利用姿态估计器估计人体关键点，然后根据这些关键点定义十个人体部位，然后这些部位定义为规则的边界框，边长与人体框大小成正比。

6. iCAN: Instance-Centric Attention Network for Human-Object Interaction Detection

6.1 总述

本文提出了端到端可训练的以实例为中心的注意力模块用于学习使用人或外观突出信息区域的物体实例。假设是一个实例的外观（无论是人还是物）提供关于图像中我们应该注意的位置的提示。例如，更好地确定一个人是否携带物体，应该将其注意力集中在拿着物体的人的手周围的区域。以实例为中心的注意力网络（iCAN）为每个检测到的人或物体动态生成注意力图以突出显示与任务相关的区域。

6.2 网络结构

所提出的模型主要包括以下三个分支：
1）基于人类外观检测交互的人的分支;
2）基于物体外观预测交互的物体的分支;
3）用于编码人类和物体边界框之间的空间布局的成对分支。
首先给定由Faster R-CNN检测到的目标实例，使用所有人-物体对生成HOI假设。然后融合来自各个分支的动作分数以产生最终预测。

6.3 iCAN模块

给定图像的卷积特征（以灰色显示）和人/物体边界框（以红色显示），iCAN模块提取实例 $x_{inst}^h$ （人类）或 $x_{inst}^o$ （物体）的外观特征，作为以实例为中心的注意力图的特征。

为了计算注意力图，首先使用ROI Pooling提取实例级外观特征，即通过残差块、全局平均池化以及全连接层得到512维的特征。

接下来是将实例级外观特征和卷积特征图嵌入到512维空间中，并使用向量点积测量该嵌入空间中的相似性。然后通过应用Softmax获得以实例为中心的注意力图。注意图突出显示图像中的相关区域，其可以有助于识别与给定人/物体实例相关联的HOI。

最后通过计算注意力特征和卷积特征融合后特征的加权平均值来提取上下文特征。iCAN模块的最终输出是实例级外观特征和基于注意力的上下文特征的融合（拼接），即使用1×1卷积和人类实例外观特征 $x_{inst}^h$ 将图像特征嵌入到全连接层中。

其中，res5表示第五残差块，GAP表示全局平均池化层，FC表示全连接层。

6.4 实验

在HICO-DET上达到了14.84的mAP；在VCOCO上达到了45.3的mAP。其中通过添加iCAN模块，AP提高了1.5.

中国信通院“护证计划”正式启动，合合信息入选首批技术支撑单位大模型人工智能算法
随着人工智能技术的飞速发展，AI照“骗”在各个行业泛滥成灾，数字图像的真实性面临前所未有的挑战。近日，由中国互联网协会中小企业发展工委会主办的“卓信大数据计划”2025年度会议在京召开。本次会议上，中国信通院、中国互联网协会、中国图象图形学学会以及合合信息、蚂蚁安全实验室等多家企业代表共同启动了以AI守护AI，面向可信证照的专项行动“护证计划”，合合信息成功入选“护证计划”首批技术支撑单位。图说：
【Stable Diffusion】AnimatedDiff--AI动画插件使用技巧分享；文生视频、图生视频、AI生成视频工具；乘凉~ 人工智能应用 stable diffusion 人工智能音视频
本专栏主要记录人工智能的应用方面的内容，包括chatGPT、DeepSeek、AI绘画等等；在当今AI的热潮下，不学习AI，就要被AI淘汰；所以欢迎小伙伴加入本专栏和我一起探索AI的应用，通过AI来帮助自己提升生产力；本文的目标就是让每一个读者，都能学会并掌握AnimateDiff的使用；成功用它来生成你想要的视频。AnimateDiff是StableDiffusion的一个插件，借助它，你可以实
清华大学《DeepSeek与AI幻觉》（无套路免费分享） xiecoding.cn 人工智能 deepseek deepseek教程 deepseek与AI幻觉 deepseek清华教程
随着人工智能技术的飞速发展，以DeepSeek为代表的国产大模型正逐渐成为各行各业的重要工具。然而，AI在生成内容时常常会出现“幻觉”——即生成与事实不符、逻辑断裂或脱离上下文的内容。清华大学新闻与传播学院与人工智能学院联合推出的这篇教程《DeepSeek与AI幻觉》，系统性地讲解了AI幻觉的成因、评测方法及应对策略，旨在帮助用户更好地理解和使用AI工具。《DeepSeek与AI幻觉》：https
上海第二批49家创新型企业总部名单出炉，合合信息入选人工智能算法大数据大模型
创新型企业是上海现代化产业体系的重要组成部分，是上海高质量发展的活力所在。近期，上海为新认定的第二批49家创新型企业总部进行授牌，着力为创新型企业在沪发展壮大营造良好环境。此次获授牌的企业总部涵盖集成电路、生物医药、人工智能、数字经济、战新综合等重点产业领域，上海合合信息科技股份有限公司（股票代码：688615.SH）成功入选第二批49家创新型企业总部名单，系人工智能领域获奖企业之一。图说：上海市
深入详解人工智能机器学习：强化学习猿享天开人工智能基础知识学习人工智能机器学习强化学习
目录强化学习概述强化学习的基本概念定义关键组件强化学习过程常用算法应用示例示例代码代码解释应用场景强化学习核心概念和底层原理核心概念底层原理总结强化学习概述强化学习（ReinforcementLearning,RL）是机器学习中的一个重要领域，其核心目标是通过与环境的交互学习如何采取行动以最大化累积奖励。与监督学习不同的是，强化学习不依赖于给定的输入输出对，而是通过试探和反馈不断改进决策策略。强化
2025年，值得关注的LLM大趋势 AI小白熊人工智能产品经理 python 开发语言学习 ai 大模型
随着人工智能技术不断进步，大语言模型正在改变各行各业的运作方式。从代码生成到语言学习应用，GenAI已经渗透到我们日常生活的方方面面。随着像上个月OpenAI的“12天”计划或谷歌的Veo2和Imagen3等新技术的发布，我们看到了快速的创新迭代。面对这些变化，2025年LLM的大趋势值得我们关注。LLM的新兴应用：不仅仅是聊天机器人回想起最初我们用ChatGPT来生成代码或修改文本时，可能没有意
构建智慧校园：推动教育现代化的重要路径智慧校园-合肥自友科技智慧校园数字化校园智慧校园平台智慧校园智慧校园系统智慧校园平台智慧校园建设智慧校园软件智慧校园方案智慧校园厂商
随着信息技术的飞速发展，智慧校园作为教育领域的新趋势，正逐渐成为推动教育现代化的重要力量。智慧校园不仅是一种物理空间的升级，更是一种教育理念和实践方式的革新。它强调利用大数据、人工智能、物联网等前沿技术，实现教学过程的智能化、个性化与高效化。智慧校园的核心在于智能硬件设施的广泛部署，如智能教室、电子白板、智能图书馆等，这些设备不仅能够提供更为便捷、高效的教与学环境，还能够收集并分析大量数据，为优化
自然语言处理入门：从基础概念到实战项目范范0825 自然语言处理人工智能
自然语言处理入门：从基础概念到实战项目一、引言自然语言处理（NaturalLanguageProcessing，简称NLP）是人工智能的重要分支，旨在让计算机能够理解、生成和处理人类语言。随着大数据和深度学习的发展，NLP技术在文本分类、机器翻译、问答系统、情感分析等领域得到了广泛应用。本文将从NLP的基础概念入手，逐步介绍关键技术，最终通过一个完整的实战项目帮助读者掌握如何在实际应用中使用NLP
Python深度学习实践：使用TensorFlow构建图像分类器 Evaporator Core Python开发经验 python 深度学习 tensorflow
摘要随着深度学习技术的飞速发展，图像识别已成为AI领域的热点应用之一。本篇文章将引导读者使用Python和Google的TensorFlow框架，从零开始构建一个简单的图像分类器。我们将深入探讨卷积神经网络（CNN）的基本原理，实现一个能够识别MNIST手写数字的数据集模型，并通过实战代码演示整个过程，最终展示模型的训练与评估。一、环境配置与库导入确保已安装Python3.7+版本，以及Tenso
深度学习进阶：构建多层神经网络孤寂大仙v 深度学习神经网络人工智能
在上一篇文章中，我们从零开始构建了一个简单的两层神经网络，并通过异或问题（XOR）展示了神经网络的强大能力。今天，我们将进一步深入，构建一个更复杂的多层神经网络，并引入更多高级概念，如多隐藏层、激活函数选择、正则化等。我们还会使用更复杂的分类任务来训练模型，并评估其性能。1.多层神经网络的结构在实际应用中，深度学习模型通常包含多个隐藏层，这种结构被称为深度神经网络（DNN）。多层神经网络能够学习更
无法启动此程序，因为计算机丢失api-ms-win-core-path-l1-1-0.dll的解决方案爱编程的喵喵 Python基础课程 python windows 7 api-ms-win-core 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了无法启动此程序，因为计算机丢失api
Elasticsearch：使用阿里云 AI 服务进行向量化和重新排名
作者：来自ElasticTomásMurúa在本文中，我们将介绍如何将阿里云AI功能与Elasticsearch集成，以提高语义搜索的相关性。阿里云人工智能搜索是一种将高级人工智能功能与Elasticsearch工具相结合的解决方案，利用QwenLLM/DeepSeek-R1系列提供高级推理和分类模型。在本文中，我们将使用同一作者撰写的小说和戏剧的描述来测试阿里巴巴重新排名和稀疏嵌入端点。步骤创建
智能任务管理工具：提升团队协作与项目执行力的利器团队协作工具
智能任务管理工具是一类能够自动化处理任务分配、进度跟踪、团队协作等任务管理活动的软件。这类工具通常利用先进的算法和人工智能技术，帮助用户更高效地完成项目管理、日常任务规划等工作。以下是一些知名的智能任务管理工具及其特点：一、板栗看板●简介：一款智能驱动的高效任务管理工具，通过AI系统分析用户任务数据，自动设定任务优先级，并提供实时进度监控和智能任务分配功能。特点：○AI智能判断任务优先级，提高任务
Python实现观察者模式麦田里走一夜 PYTHON python 观察者模式开发语言
请关注【来玩AI】公众号体验人工智能来玩AI>>>Python实现观察者模式观察者模式python代码实现说明应用场景观察者模式模式是一种常用的设计模式，可以在对象之间建立一对多的依赖关系。Python中实现观察者模式有多种方式，下面给出一种基于类和装饰器的实现方式：python代码实现classObserver:defupdate(self,observable,*args,**kwargs):
深入探讨Ceph：分布式存储架构的未来深度Linux ceph 分布式架构 C/C++
在数字化浪潮汹涌澎湃的当下，数据量呈爆发式增长，传统存储系统在应对海量数据存储、高并发访问以及灵活扩展等方面，逐渐显得力不从心。分布式存储技术应运而生，成为解决现代数据存储难题的关键方案，而Ceph作为分布式存储领域的佼佼者，正日益受到广泛关注和应用。Ceph以其卓越的性能、高可靠性、强大的扩展性以及开源的特性，在众多分布式存储系统中脱颖而出，被广泛应用于云计算、大数据、人工智能等前沿领域。无论是
pytorch基础-layernormal 与 batchnormal yuweififi pytorch 人工智能 python
nn.LayerNorm（层归一化）和nn.BatchNorm（批量归一化）是深度学习中常用的两种归一化方法，都有助于提高模型的训练效率和稳定性，但它们在归一化维度、应用场景、计算方式等方面存在明显区别，以下为你详细介绍：1、归一化维度nn.LayerNorm：对单个样本的特征维度进行归一化。无论输入数据的形状如何，它会计算每个样本在特征维度上的均值和方差，然后进行归一化。例如，对于一个形状为(b
通过TensorFlow实现简单深度学习模型（2） yyc_audio 人工智能深度学习 python 机器学习
前文我们已经实现了对每批数据的训练，下面继续实现一轮完整的训练。完整的训练循环一轮训练就是对训练数据的每个批量都重复上述训练步骤，而完整的训练循环就是重复多轮训练。deffit(model,images,labels,epochs,batch_size=128):forepoch_counterinrange(epochs):print(f"Epoch{epoch_counter}")batch_
从入门到精通，解锁AI新高度——DeepSeek学习手册周师姐学习
资料链接：https://pan.quark.cn/s/c927326f70c5你是否渴望掌握前沿AI技术，却在复杂的理论和实践中迷茫？现在，一本由清华大学出品的《DeepSeek：从入门到精通》学习手册横空出世，为你开启AI新世界的大门。作为人工智能领域的新兴力量，DeepSeek以其卓越的性能和创新的技术，正在重塑我们对AI的认知。这本手册，由清华大学顶尖科研团队精心编写，是DeepSeek技
【有啥问啥】深入了解 FlashMLA：Hopper GPU 的高效 MLA 解码内核有啥问啥大模型行业调研科普算法语言模型
深入了解FlashMLA：HopperGPU的高效MLA解码内核简介在人工智能(AI)领域，特别是大型语言模型(LLM)领域，对计算效率和速度的需求持续增长。为了应对这些挑战，DeepSeek推出了FlashMLA，这是一种专为NVIDIAHopperGPU架构优化的高效MLA(Multi-LayerAttention)解码内核。FlashMLA旨在加速LLM的解码过程，从而显著提高模型的响应速度
阿里巴巴DIN模型原理与Python实现 eso1983 python 开发语言算法推荐算法
阿里巴巴的DeepInterestNetwork(DIN)是一种用于点击率预测（CTR）的深度学习模型，特别针对电商场景中用户兴趣多样化和动态变化的特性设计。其核心思想是通过注意力机制动态捕捉用户历史行为中与当前候选商品相关的兴趣。1.DIN模型原理1.核心问题传统推荐模型（如Embedding+MLP）将用户历史行为视为固定长度的向量，忽略了用户兴趣的多样性。例如，用户历史行为中可能包含多个互不
Exception:data did not match any variant of untagged enum PyPreTokenizerTypeWrapper at line 69 解决方案爱编程的喵喵 Python基础课程 python tokenizer PyPreTokenizer 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了Exception:datadidn
一学就会：A*算法详细介绍（Python）不去幼儿园人工智能（AI）#启发式算法算法 python 人工智能机器学习开发语言
本篇文章是博主人工智能学习以及算法研究时，用于个人学习、研究或者欣赏使用，并基于博主对相关等领域的一些理解而记录的学习摘录和笔记，若有不当和侵权之处，指出后将会立即改正，还望谅解。文章分类在启发式算法专栏：【人工智能】-【启发式算法】（6）---《一学就会：A*算法详细介绍（Python）》一学就会：A*算法详细介绍（Python）目录A*算法介绍A*算法的核心概念A*算法的特点A*算法示例：迷宫
【LangChain编程：从入门到实践】实现多模态代理 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【LangChain编程：从入门到实践】实现多模态代理作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：LangChain编程，多模态代理，自然语言处理，多媒体数据融合，复杂任务解决能力1.背景介绍1.1大背景与问题的提出随着人工智能技术的飞速发展，尤其是大模型在自然语言处理领域的突破，如通义千问、通义万相、阿里云通义大模型等，我们正迎来一个全
222222222222222 智能与优化开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、pandas是什么？二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例可供参考一、pandas是什么？示例：pandas是基于Nu
Farm3D- Learning Articulated 3D Animals by Distilling 2D Diffusion论文笔记 Im Bug 3d 论文阅读
Farm3D:LearningArticulated3DAnimalsbyDistilling2DDiffusion1.Introduction最近的研究DreamFusion表明，可以通过text-imagegenerator提取高质量的三维模型，尽管该生成模型并未经过三维训练，但它仍然包含足够的信息以恢复三维形状。在本文中，展示了通过文本-图像生成模型可以获取更多信息，并获得关节模型化的三维对
月之暗面改进并开源了 Muon 优化算法，对行业有哪些影响？互联网之路. 知识点开源算法
互联网各领域资料分享专区(不定期更新)：Sheet正文月之暗面团队改进并开源的Muon优化算法在深度学习和大模型训练领域引发了广泛关注，其核心创新在于显著降低算力需求（相比AdamW减少48%的FLOPs）并提升训练效率，同时通过开源推动技术生态的共建。1.显著降低大模型训练成本，推动技术普惠算力需求锐减：Muon通过引入权重衰减和一致的RMS更新，解决了原始Muon在大规模训练中的稳定性问题，使
Spring Boot 动态配置数据源全解析 ♢.＊ spring boot 后端 java
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、Java与Python的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！引言在企业级应用开发中，单一数据源往往
深入解析：如何编写 Mapper 文件 ♢.＊ oracle 数据库 mybatis
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、Java与Python的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！在软件开发尤其是涉及数据库交互的项目中
OpenCV开源机器视觉软件视觉人机器视觉杂说 opencv 开源人工智能
OpenCV（OpenSourceComputerVisionLibrary）是一个开源的计算机视觉和机器学习软件库，广泛应用于实时图像处理、视频分析、物体检测、人脸识别等领域。它由英特尔实验室于1999年发起，现已成为计算机视觉领域最流行的工具之一，支持多种编程语言（如C++、Python、Java）和操作系统（Windows、Linux、macOS、Android、iOS）。核心功能图像处理基
Spring Boot 中 @Transactional 注解全面解析 ♢.＊ spring boot 数据库 sql
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、Java与Python的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！引言在企业级应用开发中，数据的一致性和
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n