人工智能与算法学习

ICCV 2021 | 腾讯优图17篇论文入选，含跨模态检索与分割、车辆识别、视频理解等领域...

计算机视觉世界三大顶会之一的ICCV 2021论文接收结果出炉！本次大会收到来自全球共6236篇有效投稿，最终有1617篇突出重围被录取，录用率约为25.9%。此次ICCV 2021接收的论文分为检测、分割、跟踪、视觉定位、底层图像处理、图像视频检索、三维视觉等多个方向。本次腾讯优图实验室共有17篇论文被收录，其中Oral论文2篇，涵盖跨模态检索、分割、行人识别、神经网络、人群计数、车辆识别、物体识别、视频偏好推理、多标签识别等前沿领域。

▶️ 以下为入选论文：

基于Wasserstein耦合图学习的跨模态检索

Wasserstein Coupled Graph Learning for Cross-Modal Retrieval

图在跨模态图像文本的理解中发挥着重要作用，因为图可以表征图像文本的内在结构，而这种结构对于跨模态相似性的度量具有很好的鲁棒性。在本文中，我们提出了一种基于Wasserstein耦合图学习的方法来处理跨模态检索任务。首先，我们分别根据两个输入的跨模态样本构建图，并通过相应的图编码器提取鲁棒特征。然后，构建一个Wasserstein耦合字典用于进一步的特征学习，其中该字典包含多组对应的图键值，并且每个键值对应一种模态。基于该耦合字典，可以通过Wasserstein图嵌入的方式将输入图转换到字典空间中实现相似性度量。所提出的Wasserstein图嵌入方法通过最优传输捕获输入图与每个对应键值之间的图相关性，从而可以很好地表征图之间的结构关系。为了进一步促进图的判别性学习，我们对耦合字典的图键值专门定义了一个基于Wasserstein度量的判别损失函数，该损失函数可以使对应的键值更加紧凑，非对应的键值更加分散。实验结果证明了我们所提出的方法的有效性。

简笔画监督语义分割推理

Scribble-Supervised Semantic Segmentation Inference

本文提出了渐进分割推理框架(PSI)来解决简笔画监督的语义分割任务。借助于潜在的上下文依赖性，我们设计封装了上下文模式传播和语义标签传播这两条主要线索来增强并改善弱监督像素级分割结果。在上下文模式传播中，不同细粒度的上下文模式互相关联并通过图模型传递模式信息，以此来增强像素标签预测的置信推理。进一步地，依赖于已估计像素的高置信度，初始标注点的标签信息通过自适应学习策略扩散传播至图上的其他区域。上下文模式传播和语义标签传播这两条线索最终在像素级标签推理中被建模成一个闭环的更新过程。大量的实验验证了我们提出的PSI框架的有效性，同时该方法也在两个公开的简笔画分割数据集上取得了优越的性能。

深度神经网络结构解耦

Architecture Disentanglement for Deep Neural Networks

???? 此篇论文被收录为Oral

理解深度神经网络的内部机理对神经网络提供可信的应用十分重要。现有的研究主要聚焦于如何将具体的语义与单神经元或单层相关联，忽略了网络的整体推理过程的解释。本文提出了神经网络解耦这个概念，旨在将具体语义与解耦的子结构相关联，从而理解网络从输入到输出的整体推理过程。本文实验揭示了神经网络可以按照任务被拆解成子结构，并且最高层语义并不一定出现在神经网络最深层。最后，本文探讨了相似子结构是导致神经网络分类错误的原因之一。

基于并列检测分割学习的弱监督实例分割

Parallel Detection-and-Segmentation Learning for Weakly Supervised Instance Segmentation

本文从自顶而下和自底向上的实例分割方法启发，为弱监督实例分割任务提出一种统一平行检测分割的学习框架。特别地，检测模块和常见的弱监督目标检测一样，而分割模块采用自监督学习来学习类别无关的前景分割，然后再通过自训练来逐步获得特定类别的分割结果。最后，本文在多个数据集上验证了该算法的有效性。

全部遮挡：行人重识别的遮挡感知掩码网络

Occlude Them All: Occlusion-Aware Mask Network for Person Re-identification

随着深度学习时代的到来，行人重识别（ReID）取得了显着的成就。然而，大多数方法仅解决了基于完整图片的行人重识别问题。但在真实世界的场景常常涉及被遮挡的行人，这类行人图片提供部分视觉外观，所以降低了 ReID 的准确性。一种常见的策略是通过辅助模型定位可见的身体部位，但是辅助模型的训练数据和待解决的数据存在领域偏差等，效果不佳。为了避免在遮挡ReID问题中使用额外的有问题的模型，我们提出了 OcclusionAware Mask Network (OAMN)。该方法提出了一个基于注意力机制的的掩码模型，它需要有遮挡标签的数据来指导训练，为此，我们提出了一种新的适用于遮挡问题的数据增强方案，该方案可为任何全身数据集生成多样化且精确标记的遮挡。我们所提出的方案比现有的策略更适合包含有限种遮挡类型的现实世界情景。我们还提供了一种新颖的遮挡统一方案。上述三个模型组件使现有的注意力机制能够准确地捕捉各种遮挡情形下的身体部位。我们在多个行人重识别的benchmarks上进行了各种综合实验，证明了OAMN方法优于现有的SOTA方法。

修正黑夜的怪异：

夜间场景高效自监督的单目深度估计方法

Regularizing the Night-time Weirdness: Efficient Self-supervised Monocular Depth Estimation in the Dark

单目深度估计旨在从单张图像或单目视频中预测深度信息。近来一些自监督方法在KITTI和Cityscapes上获得了出色的效果。然而，在更具挑战性的黑夜场景中，由于低能见度和极端光照导致的弱纹理和帧间不一致性，这些方法往往不能得到可用的结果。为了处理这个问题，本文提出了一个新的框架：首先提出基于先验的正则化方法以学习深度信息的先验分布，避免出现异常结果；其次，提出了映射一致的图像增强模块以提升图像可见度和对比度，同时保持帧间一致性；最后，提出了基于统计的掩膜策略以去除弱纹理区域在训练中带来的干扰。实验结果证明了本文方法的有效性，同时在两个常用的黑夜数据集上获得了当前最优的效果。

基于耦合语义注意力的弱监督目标定位

TS-CAM: Token Semantic Coupled ttention

Map for Weakly Supervised Object Localization

弱监督目标定位是指仅根据图像层面的类别标签学习目标位置的任务。基于卷积神经网络 (CNN)的分类模型往往仅会激活目标的局部判别区域，而忽略完整的目标范围，称为局部激活问题。在这篇文章中，我们认为局部激活问题是由于CNN的内在特性导致。CNN由一系列卷积操作组成，导致模型仅具有局部的感受野，无法获取长距离的特征依赖性。基于此，我们提出我们提出基于Transformer的耦合语义类别激活图（TS-CAM）方法，借助自注意力机制提取长距离特征相似性。TS-CAM 首先将图像分割为一系列子块，通过位置编码学习不同子块间全局的注意力。之后，对每个子块进行重新排列得到得到类别语义图。最后，融合模型学习的全局注意力图与类别语义图得到类别激活图。在 ILSVRC/CUB-200-2011 数据集上的实验表明，TS-CAM 的性能超过其他基于CNN-CAM结构的方法约 7.1%/27.1%，达到SOTA。

基于异质关系互补的车辆重识别方法

Heterogeneous Relational Complement for Vehicle Re-identification

在车辆重识别任务中，难点是从不同角度的摄像头所拍摄的图片中，准确地寻找出相同的车辆，而要有效地解决该问题，需要网络能够学习到车辆在不同角度的不变特征。为了能够获得这个鲁棒的表征，本文提出一种新型的异质关系互补网络（HRCN），该网络将特定区域特征和跨层特征作为增补特征，来增强高层表达。考虑到这些特征存在异质性，各个特征之间的分布特征以及语义信息都不尽相同，为此本文在HRCN中设计一个图关系模块，将这些异质特征嵌入到统一的特征空间。此外，本文提出一种新的评价指标Cross-camera Generalization Measure (CGM)，相较CMC和mAP，CGM具备更强的位置敏感性以及更好的跨摄像头泛化惩罚。实验结果表明HRCN在VehicleID和VeRi-776数据集上均达到state-of-the-art。

重新思考人群中的计数和定位问题：

一种完全基于点的全新框架

Rethinking Counting and Localization in Crowds: A Purely Point-Based Framework

???? 此篇论文被收录为Oral

相比仅仅估计人群中的总人数，在人群中定位每个个体更为切合后续高阶人群分析任务的实际需求。但是，已有的基于定位的解决方法依赖于某些中间表示（如密度图或者伪目标框）作为学习目标，这不光容易引入误差，而且是一种反直觉的做法。本文提出了一种完全基于点的全新框架，可同时用于人群计数和个体定位。针对基于该全新框架的方法，我们不满足于仅仅量化图像级别的绝对计数误差，因此我们提出了一种全新的度量指标即密度归一化平均精度，来提供一个更全面且更精准的性能评价方案。此外，作为该框架一个直观解法，我们给出了一个示例模型，叫做点对点网络（P2PNet）。P2PNet忽略了所有冗余步骤，直接预测一系列人头点的集合来定位图像中的人群个体，这完全与真实人工标注保持一致。通过深入分析，我们发现实现该方法的一个核心策略是为预测候选点分配最优的学习目标，并通过基于匈牙利算法的一对一匹配策略来完成了这一关键步骤。实验证明，P2PNet不光在人群计数基准上显著超越了已有SOTA方法，还实现了非常高的定位精度。

从异质到一致：

深入研究人群计数中的计数区间划分问题

Uniformity in Heterogeneity: Diving Deep into Count Interval Partition for Crowd Counting

近期，人群计数任务中学习目标不准确的问题得到了日益的关注。受以往少数工作的启发，我们摒弃了直接预测计数值本身的思路，而是通过预测计数值所在的预设区间来解决这个问题。然而，不合适的区间划分会使得来自不同计数区间的图像块所贡献的计数误差非常不均衡，并进一步导致较差的计数精度。因此，我们提出了一个新颖的计数区间划分标准叫做均匀误差准则（UEP），该准则可以使得来自不同计数区间的计数误差贡献尽可能相等从而来最小化预测风险。进一步地，为了缓解计数值量化过程中不可避免引入的数值量化误差，我们提出了平均计数代理准则（MCP）。MCP准则为每个计数区间选取最优的计数代理值来表示所有该区间的样本在推理过程中的预测计数值，这使得图像级别的整体期望离散化误差可被忽略不计。据我们所知，本工作是第一个深入探究此类区间分类任务，并且针对其区间划分问题给出有效解决方案的。根据以上所提的可被理论证明的准则，我们设计了一个简单高效的模型，称为UEPNet，该模型在多个权威数据集上达到了SOTA的精度。

用于决策黑盒模型的自适应历史驱动攻击

Adaptive History-driven Attack for Decision-based Black-box Models

基于决策的黑盒攻击是指在只有目标模型的 top-1 标签可用时构造对抗样本。一种常见的做法是从一个大的扰动开始，然后用一个确定的方向和一个随机的方向迭代地减少它，同时保持它的对抗性。由于每次查询获取的信息有限和方向采样效率低下，很难在有限的查询次数内获得足够小的扰动。为了解决这个问题，我们提出了一种新的攻击方法，称为自适应历史驱动攻击（AHA），它从所有历史查询中收集信息作为当前采样的先验，以提高性能。此外，为了平衡确定性方向和随机方向，我们根据实际幅度减少与预期幅度减少的比率动态调整系数。这种策略提高了优化过程中查询的成功率，让对抗样本沿着决策边界快速移动。我们的方法还可以与子空间优化（如降维）相结合，以进一步提高效率。在 ImageNet 和 CelebA 数据集上进行的实验表明，在相同数量的查询下，我们的方法平均降低了至少 24.3% 的扰动幅度。最后，我们通过对流行的防御方法和 MEGVII Face++ 提供的APIs进行评估来证明我们方法的实际效果。

高质量解耦显著对象检测

Disentangled High Quality Salient Object Detection

近年来，随着数字设备的发展，越来越多的计算机视觉任务需要处理高清图像，比如视觉显著性检测任务。现有的显著性检测方法处理高清图片时，主要会面临两个问题。第一个问题是现有的方法往往无法同时精确捕捉高清图片的语义信息和边界细节。为了解决这个问题，我们将高清显著性检测任务解耦为低分-分类和高分-回归任务。在低分辨率阶段，我们提出LRSCN网络充分捕捉图片的语义信息；在高分辨率阶段，我们提出HRRN回归得到精确的边界细节。第二个问题是现有的高清显著性检测算法需要额外的高清标注数据训练网络，因而需要较大的标注代价。为了解决这个问题，我们在训练阶段使用uncertainty loss，因而不需要额外的高清训练数据训练HRRN。我们提出的方法在HRSOD-TE，DAVIS-S两个高清数据测试集，以及DUTS-TE，SOC等6个低分辨率测试数据集上都达到了SOTA的效果。

基于双路关系互补的多标签识别方法

Transformer-based Dual Relation Graph for Multi-label Image Recognition

多标签识别的主要目标是同时识别一幅图像中的多个对象。现有的大多数工作主要通过学习标签共现依赖关系从而增强特征的语义表达，而忽略了图像中多个物体间的空间依赖关系。对此，本文提出一种基于Transformer的双路互补关系学习框架来联合学习空间依赖与共现依赖。针对空间依赖，该方法提出跨尺度Transformer建模长距离空间上下文关联；针对共现依赖，该方法提出类别感知约束和空间关联引导，基于图神经网络联合建模动态语义关联，最后联合这两种互补关系进行协同学习得到鲁棒的多标签预测结果。实验结果表明，该方法在经典多标签识别数据集MS-COCO 和VOC 2007上均超过SOTA。

基于偏好推理的个性化精彩视频检测

PR-Net: Preference Reasoning for Personalized Video Highlight Detection

个性化精彩视频检测旨在根据用户的喜好将长视频缩短为有趣的时刻，这最近也引起了社区的关注。目前的方法将用户的历史作为整体信息来预测用户的偏好，但忽略了用户兴趣的内在多样性，导致偏好表示模糊和无法解释的预测。在本文中，我们提出了一个简单而有效的偏好推理框架（PR-Net），显式地将不同的兴趣考虑在内，以进行具有可行解释的帧级精彩预测。具体来说，对于每个输入帧，我们通过基于注意力机制的历史精彩片段融合来生成输入相关的用户偏好。此外，为了防止用户历史信息不全等问题，我们将由用户特定的偏好和学习得到的通用偏好融合成了综合的偏好特征，从而实现了自适应地支持通用精彩视频检测。最后，我们通过计算查询帧与该用户的综合偏好及非精彩偏好特征之间的语义相似度来预测其是否属于精彩帧的程度。此外，为了缓解由于标注不完整造成的歧义，我们提出了一种新的双向对比损失，以确保嵌入空间的紧凑性和可微性。通过这种方式，我们的方法显着优于最先进的方法，平均准确度精度相对提高了 12%。

从学习中知道哪里可见：

针对遮挡行人重识别的一种可见度感知方法

Learning to Know Where to See: A Visibility-Aware Approach for Occluded Person Re-identification

行人重识别在近年来已经取得了明显的进步。然而，遮挡现象对最近的行人重识别方法依然是个常见且具有挑战性的任务。目前一些主流方法利用额外信息（比如，人体姿态信息）来判断人体可见部位，从而缓解遮挡问题。虽然这些方法取得明显的进步，但是他们严重依赖于细粒度的额外信息，对额外信息中存在的估计错误敏感。在本文中，我们证实了如果额外信息变得稀疏或者有噪声时，现存的方法性能是会出现下降的。因此，我们提出了一种简单但有效的方法，该方法对稀疏和有噪声的姿态信息是鲁棒的。我们将姿态信息离散化为人体部分的可见度标签，这可以降低遮挡区域的影响。我们在实验中证明了我们的方法能够更有效和鲁棒地利用姿态信息。此外，我们的方法能够很容易地嵌入到大多数行人重识别方法中。相关的实验证明了我们的算法达到了目前的领先水平。

Ask&Confirm：

不完整描述下跨模态检索的主动细节丰富

Ask&Confirm: Active Detail Enriching for Cross-Modal Retrieval with Partial Query

近年来，基于文本的图像检索取得了长足的进步。然而，现有方法的性能在现实生活中会受到影响，因为用户可能会提供对图像的不完整描述，这通常会导致结果充满了符合不完整描述的误报。在这项工作中，我们引入了部分查询问题并广泛分析了它对基于文本的图像检索的影响。以前的交互式方法通过被动地接收用户的反馈来迭代地补充不完整的查询来解决这个问题，这既耗时又需要大量的用户努力。相反，我们提出了一种新颖的检索框架，该框架以询问和确认的方式进行交互过程，其中 AI 主动搜索当前查询中缺少的判别细节，而用户只需要确认 AI 的提议。具体来说，我们提出了一种基于对象的交互，使交互检索更加用户友好，并提出了一种基于强化学习的策略来搜索有区别的对象。此外，由于难以获得人机对话数据，全监督训练通常是不可行的，因此我们提出了一种弱监督训练策略，除了文本图像数据集之外，不需要人工标注的对话。实验表明，我们的框架显着提高了基于文本的图像检索的性能。

为任意视角下的3D物体识别学习具有空间感知能力的典范视角表征

Learning Spatially-Aware Canonical View Representation for 3D Shape Recognition with Arbitrary Views

为使多视角3D物体识别更切合实际场景，这篇工作专注于任意视角下的物体识别，即视角位置与个数任意给定的情况；为解决任意视角带来的新挑战，我们提出一种具有空间感知能力的典范视角表征；我们首先将来自任意视角的图像特征使用最优传输与一组可学的参考视角特征对齐，由此得到一组固定数量的典范视角特征；随后我们将这些对齐的典范视角特征进行聚合，得到一个鲁棒的3D物体表征用于识别；我们在此提出一种空间感知损失，约束典范视角特征能被离散地嵌入于欧式空间的各个象限；在ModelNet40、ScanObjectNN与RGBD数据集中的实验结果表明，我们的方法不仅在传统的固定视角情况下性能优秀，而且在更有挑战的任意视角情况下相比其他方法有显著的性能提升。

推荐阅读

GCN图卷积网络入门详解

一位阿里资深大佬对深度学习框架的见解

南大周志华教授入围院士候选！计算机领域共计7人

样本量极少如何机器学习？看看这篇Few-Shot Learning综述

‍

AIGC空间智能在服装设计领域的颠覆性变革 AI天才研究院 ChatGPT 实战 ChatGPT AI大模型应用入门实战与进阶 AIGC ai
AIGC空间智能在服装设计领域的颠覆性变革关键词：AIGC、空间智能、服装设计、数字孪生、生成式AI、3D人体建模、智能设计系统摘要：本文深入探讨AIGC（人工智能生成内容）与空间智能技术在服装设计领域的融合创新，揭示其如何通过三维人体建模、场景模拟、智能生成算法重构传统设计流程。从技术原理层解析空间智能的核心模块，结合生成对抗网络（GAN）、Transformer模型等前沿算法，展示从创意生成到
Python编程菜鸟教程：从入门到精通的完全指南_python菜鸟教程 2401_89285717 python 开发语言
我们将介绍Python在数据科学、机器学习、Web开发等方面的应用，并带你了解Python社区和生态系统。基础入门Python安装：在官方网站下载安装包，根据不同操作系统进行安装。Mac用户可直接使用Homebrew进行安装Windows用户需下载安装包后进行手动安装Linux用户可使用apt-get或yum进行安装基础语法：Python是一种解释型语言，支持面向对象、函数式和面向过程等多种编程范
编程效率的飞跃、创新驱动的测试与行业应用的新篇章
###引言在人工智能技术飞速发展的今天，AI工具、大模型及行业应用正在深刻改变着开发者的工作模式与各领域的发展格局。从智能编码助手到自动化测试平台，从大模型落地实践到垂直行业解决方案，AI正成为提升效率、驱动创新的核心引擎。本文将围绕“AI技术如何重塑你的工作与行业”这一主题，探讨AI工具、AI编程、AI测试以及AI行业应用和大模型落地等方面的影响。 ###一、AI工具重塑开发工作 #
中电金信：十问高质量数据集：金融大模型价值重塑有“据”可循
2025年，随着大模型在金融领域的深度应用，高质量数据集已逐渐成为决定模型性能的“基石”。面对数据要素价值释放的关键机遇期，国家政策不断深入推进：2月，国务院国资委启动“AI+”专项行动，着力攻克数据难题；5月，数字中国峰会发布了首批30项央企AI高质量数据集成果；6月，在央国企金融领域人工智能高质量数据集工作推进会上，14家企业共同签署了“央国企金融数据产业共同体倡议书”，旨在推动人工智能与数据
毕业论文 | 人工智能侵权责任法律问题研究——以无人驾驶汽车为例北斗猿毕业论文设计人工智能无人驾驶法律侵权责任法民法典
===========================================github：https://github.com/MichaelBeechanCSDN：https://blog.csdn.net/u011344545===========================================人工智能侵权责任法律问题研究——以无人驾驶汽车为例目录摘要一、绪论(一)课
人工智能发展简史——未来是属于AI人工智能的。 AI天才研究院 ChatGPT AI人工智能与大数据人工智能
目录人工智能发展简史第一章：起步期-20世纪50年代及以前1.1计算机象棋博弈（Programmingacomputerforplayingchess）1.2图灵测试（TuringTest）1.3达特茅斯学院人工智能夏季研讨会（DartmouthSummerResearchConferenceonArtificialIntelligence）1.4感知机（Perceptrons）第二章：第一次浪潮
算法化资本——智能投顾技术重构金融生态的深度解析田园Coder 人工智能科普人工智能科普
金融市场的数字化进程正经历着本质性跃迁。当传统交易大厅的开放式喊价被服务器集群的低频嗡鸣取代，当投资决策从人类直觉转向概率矩阵计算，一场由人工智能驱动的资本范式革命已悄然降临。智能投顾作为这场变革的核心载体，其技术架构不仅重塑财富管理的运作逻辑，更在认知层面挑战着金融市场的存在根基。理解这场变革的深度与广度，需要穿透技术表象，审视算法与资本结合引发的复杂生态嬗变。智能投顾系统的技术支柱建立于三重认
03 数据可视化的世界非常广阔，除了已提到的类型，还有许多更细分或前沿的可视化形式。晨曦543210 信息可视化人工智能
十五、机器学习与数据科学专用图表特征重要性图（FeatureImportancePlot）用途：展示机器学习模型中各特征对预测结果的贡献度。示例：随机森林模型中影响房价预测的关键因素。混淆矩阵热力图（ConfusionMatrixHeatmap）用途：分类模型性能评估，显示预测结果与真实标签的对比。示例：疾病诊断模型的真阳性/假阳性分布。学习曲线（LearningCurve）用途：分析模型训练过程
AI“大航海”时代：企业人力资源的AI-HR实践与效能提升策略
在数字化浪潮的推动下，人工智能（AI）正以前所未有的速度渗透各行各业，人力资源管理（HR）领域也不例外。AI技术的引入与应用落地，不仅提升HR管理效率，更在深层次上带来人力资源运作模式的变革。什么是AI-HR所谓AI-HR，是指将人工智能技术应用于人力资源管理，并通过机器学习、自然语言处理、数据挖掘等技术，优化招聘、培训、绩效评估、员工关系等人力资源各个业务模块。近年来，随着AI技术的成熟和普及，
生成式人工智能认证（GAI认证）含金量怎么样？技能咖 GAI认证生成式人工智能认证人工智能
当生成式人工智能（GenerativeAI）的浪潮以摧枯拉朽之势重塑职业版图时，一个尖锐的问题正悬在无数人的心头：在技术迭代比眨眼更快的时代，如何证明自己具备驾驭AI的核心能力？这场认知革命的背后，一张认证证书的价值早已超越了纸面——它既是个人能力的“信用背书”，也是企业筛选人才的“技术密码”。而生成式人工智能认证（GAI认证）的诞生，恰似一把打开未来之门的密钥，其含金量究竟几何？答案藏在三个维度
SpringBoot多数据源动态切换方案：AbstractRoutingDataSource详解 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot多数据源动态切换
大学生HTML期末大作业——HTML+CSS+JavaScript传统文化无·糖 Web前端期末大作业 html 课程设计 css 大学生前端大作业期末作业
HTML+CSS+JS【传统文化】网页设计期末课程大作业web前端开发技术web课程设计网页规划与设计文章目录一、网站题目二、网站描述三、网站介绍四、网站效果五、️网站代码六、️‍如何学习进步七、‍☠️更多干货文章目录一、网站题目传统文化精美设计5页含注册登录二、网站描述总结了一些学生网页制作的经验：一般的网页需要融入以下知识点：div+css布局、浮动、定位、高级css、表格、表单及验证、js轮
Tesla的FSD 架构设计 WSSWWWSSW 智能驾驶汽车人工智能 FSD
特斯拉的FSD（完全自动驾驶）架构设计以端到端神经网络为核心，结合专用硬件加速、海量数据训练和持续OTA迭代，形成了一套高度集成的系统。以下从硬件、软件、算法、数据处理和安全机制五个维度展开分析：一、硬件架构：从HW3.0到AI5的算力跃迁HW3.0基础设计采用三星14nm工艺的定制SoC，包含12个Cortex-A72CPU核心、2个NPU（合计73.7TOPS算力）和Mali-G71GPU，支
深入解读MaaS技术架构：从模型服务到智能部署的全流程分析 Cc不爱吃洋葱架构人工智能大语言模型大模型智能部署 MaaS技术架构 LLM
随着人工智能（AI）的迅速发展，MaaS（ModelasaService，模型即服务）技术架构应运而生。它通过将复杂的AI模型封装为标准化服务，降低了模型的开发和部署门槛，帮助企业快速实现业务场景的智能化升级。本文将深入解析MaaS技术架构，详细阐述其各个组成部分以及如何在实际应用中高效发挥其功能。一、使用方层：从应用接入到业务赋能MaaS技术架构的顶层是使用方层，它主要面向第三方应用，是企业与M
《手把手教你》系列技巧篇（二十二）-java+ selenium自动化测试-webdriver处理浏览器多窗口切换上卷（详细教程）北京-宏哥 java selenium 测试工具开发语言自动化
1.简介上一篇讲解和分享了如何获取浏览器窗口的句柄，那么今天这一篇就是讲解获取后我们要做什么，就是利用获取的句柄进行浏览器窗口的切换来分别定位不同页面中的元素进行操作。2.为什么要切换窗口？Selenium在当前页面打开了新的窗口，此时就需要跳转到新的窗口去，就需要把窗口进行切换。宏哥这里简单举例一个测试场景，你在页面A点击一个连接，会在新的tab窗口打开页面B，这个时候，你在页面B点击一个连接，
Java技术栈/面试题合集(16)-SpringCloud篇霸道流氓气质 Java进阶 Java SpringCloud 微服务面试
场景Java入门、进阶、强化、扩展、知识体系完善等知识点学习、性能优化、源码分析专栏分享：Java入门、进阶、强化、扩展、知识体系完善等知识点学习、性能优化、源码分析专栏分享_java高级进阶-CSDN博客通过对面试题进行系统的复习可以对Java体系的知识点进行查漏补缺。注：博客：霸道流氓气质-CSDN博客实现什么是SpringCloud？一、SpringCloud的核心定位1.定义SpringC
LSTM 论文（Hochreiter & Schmidhuber, 1997）精读（三）
文章：SeppHochreiter,JürgenSchmidhuber;LongShort-TermMemory.NeuralComput1997;9(8):1735–1780.doi:https://doi.org/10.1162/neco.1997.9.8.1735第2节PreviousWork（已有研究），这是论文对以往方法的一个评述，总结了已有递归神经网络在面对时间序列学习、尤其是长时依赖
从0开始学习计算机视觉--Day08--卷积神经网络
之前我们提到，神经网络是通过全连接层对输入做降维处理，将输入的向量通过矩阵和激活函数进行降维，在神经元上输出激活值。而卷积神经网络中，用卷积层代替了全连接层。不同的是，这里的输入不再需要降维，而是可以保留输入的空间结构，例如输入的是32×32×3的图片，在全连接层中是3072×1的向量，而卷积层里则保持不变。这里的改变的地方是对于同样的WX的函数形式，这里是把5×5×3的权重矩阵（也叫卷积核）向量
人工智能LLM | 基础配置 | 通过环境变量配置API-KEY 一文通教程 H-大叔人工智能大模型实战与教程人工智能
在实战开发大语言模型的过程中，经常会遇到各种API-KEY的配置问题，例如GPTOpenAIKEY的配置，而且目前大部分都要求将其配置在环境变量中，下面将会讲解如何在Linux、macOS、Windows中配置，本文一文通教程。您可以使用配置环境变量的方法，避免在调用各种SDK时显式地配置API-KEY，从而降低泄漏风险。环境变量是操作系统中用于存储有关系统环境的信息的变量。您可以通过环境变量来配
【人工智能】ChatGPT、DeepSeek-R1、DeepSeek-V3 辨析 G皮T #大语言模型人工智能 LLM 大语言模型 chatgpt deepseek DeepSeek-R1 DeepSeek-V3
ChatGPT、DeepSeek-R1、DeepSeek-V3辨析1.ChatGPT对比DeepSeek1.1技术相似点1.2主要差异1.3关键区别1.4如何选择1.5总结2.DeepSeek-R1对比DeepSeek-V32.1DeepSeek-R12.2DeepSeek-V32.3核心区别总结2.4如何选择3.R1和V3有什么含义3.1DeepSeekR1的"R"3.2DeepSeekV3的"
微算法科技（NASDAQ: MLGO）探索Grover量子搜索算法，利用量子叠加和干涉原理，实现在无序数据库中快速定位目标信息的效果。 MicroTech2025 算法科技数据库
在信息爆炸的时代，数据的海量化带来了前所未有的挑战，如何从庞大的数据库中迅速找到所需信息，成为信息技术领域亟待解决的问题。传统的搜索算法在面对大规模数据时，效率逐渐下降，难以满足现代社会的需求。量子计算的出现为解决这一问题带来了新的思路和方法，Grover量子搜索算法作为量子计算领域的重要算法之一，在快速搜索目标信息方面具有巨大潜力。Grover量子搜索算法是一种基于量子力学原理的搜索算法，它利用
视频讲解：多层感知机MLP与卷积神经网络CNN在服装图像识别中的应用
原文链接：https://tecdat.cn/?p=42891原文出处：拓端数据部落公众号分析师：ZiqiYe视频讲解：多层感知机MLP与卷积神经网络CNN在服装图像识别中的应用作为数据科学领域的从业者，我们常面临这样的挑战：如何让机器真正“看懂”图像中的信息？在为客户完成服装零售行业的图像识别时，这一问题尤为突出。追溯图像识别技术的发展，早期依赖人工设计特征，如边缘检测、纹理分析等，效率低下且适
在学校研究学习的偏算法，秋招投递开发岗位还有希望吗程序员
前言Thelasttime,Ihavelearned这是星球同学，在周五晚上答疑聊天的时候对我的提问：如果简历上的项目偏算法，但是自学了一些操作系统和计网的知识，秋招的时候投递偏开发的岗位有希望吗？简历上是否也要加上相关项目？估计也是很多朋友的疑问，毕竟很多同学读研，有些老师疯狂push，要成果，发论文。要想尽快发论文，那只能“研究”人工智能、算法的一些东西了。但是众所周知，算法要求很高，不仅要求
2025 年机器学习工作流程的 7 个 AI 代理框架盖瑞理 AI Agent 人工智能
介绍机器学习从业者花费大量时间在重复性任务上：监控模型性能、重新训练流程、检查数据质量以及跟踪实验。虽然这些操作任务至关重要，但它们通常会占用团队60%到80%的时间，几乎没有留下任何创新和模型改进的空间。传统的自动化工具可以处理简单的、基于规则的工作流程，但它们难以应对机器学习操作所需的动态决策。何时应该根据性能漂移重新训练模型？当数据分布发生变化时，如何自动调整超参数？这些场景需要能够推理复杂
【AI论文】基于图像思维的多模态推理：理论基础、方法及未来前沿东临碣石82 人工智能
摘要：近期，文本思维链（Chain-of-Thought，CoT）显著推动了多模态推理的进展。在这一范式下，模型在语言层面进行推理。然而，这种以文本为中心的方法将视觉信息视为静态的初始语境，从而在丰富的感知数据与离散的符号思维之间造成了根本性的“语义鸿沟”。人类认知往往超越语言的局限，将视觉作为动态的心理草图板加以利用。如今，人工智能领域也正经历着类似的演变，标志着从仅能对图像进行思考的模型向真正
Manus AI与多语言手写识别 tonngw 人工智能
技术文章大纲：ManusAI与多语言手写识别引言手写识别技术的发展背景与市场需求ManusAI的定位与核心技术优势多语言场景下的挑战与机遇ManusAI的核心技术架构基于深度学习的端到端手写识别模型多模态数据融合（笔迹压力、书写轨迹等）自适应语言模型与字符集扩展机制多语言手写识别的关键技术非拉丁语系（中文、阿拉伯语等）的笔迹特征提取小样本语言数据的迁移学习策略上下文感知与语法纠错在低资源语言中的应
DeepSeek 帮助自己的工作
引言简述人工智能助手在职场中的普及趋势DeepSeek作为智能创作助手的核心功能概述DeepSeek的核心能力信息检索与整合：基于用户意图精准搜索并生成答案多场景应用：技术文档撰写、数据分析、代码生成等交互优化：遵循用户指定的格式与内容规范职场应用场景与实操案例技术文档撰写自动生成API文档框架根据需求补充技术细节示例代码块与公式的规范化输出数据分析支持快速检索行业数据并生成可视化建议数学建模中的
【DeepSeek实战】17、MCP地图服务集成全景指南：高德、百度、腾讯三大平台接入实战
引言：为什么MCP是地图服务的下一代革命？在数字化时代，位置服务已成为电商、出行、物流等行业的核心基础设施。但单一地图服务商的局限性日益凸显：某外卖平台因高德地图API突发故障导致30分钟订单配送延迟，某打车软件因百度地图路线规划偏差引发用户投诉激增，某物流企业因腾讯地图POI数据不全导致仓库定位错误……这些问题的根源，在于缺乏一套能统一管理多地图服务的智能平台。MCP（地图控制平台）应运而生。它
Python机器学习与深度学习：决策树、随机森林、XGBoost与LightGBM、迁移学习、循环神经网络、长短时记忆网络、时间卷积网络、自编码器、生成对抗网络、YOLO目标检测等 WangYan2022 机器学习/深度学习 Python 机器学习深度学习随机森林迁移学习
融合最新技术动态与实战经验，旨在系统提升以下能力：①掌握ChatGPT、DeepSeek等大语言模型在代码生成、模型调试、实验设计、论文撰写等方面的实际应用技巧②深入理解深度学习与经典机器学习算法的关联与差异，掌握其理论基础③熟练运用PyTorch实现各类深度学习模型，包括迁移学习、循环神经网络（RNN）、长短时记忆网络（LSTM）、时间卷积网络（TCN）、自编码器、生成对抗网络（GAN）、YOL
大学生HTML期末大作业——HTML+CSS+JavaScript游戏网站（英雄联盟）无·糖 Web前端期末大作业 html 课程设计 css 美食游戏 javascript 大作业
HTML+CSS+JS【游戏网站】网页设计期末课程大作业web前端开发技术web课程设计网页规划与设计文章目录一、网站题目二、网站描述三、网站介绍四、网站效果五、️网站代码六、️‍如何学习进步七、‍☠️更多干货文章目录一、网站题目游戏网站（英雄联盟）含注册登录13页二、网站描述总结了一些学生网页制作的经验：一般的网页需要融入以下知识点：div+css布局、浮动、定位、高级css、表格、表单及验证、
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod

ICCV 2021 | 腾讯优图17篇论文入选，含跨模态检索与分割、车辆识别、视频理解等领域...

你可能感兴趣的:(定位,神经网络,计算机视觉,机器学习,人工智能)