不吃香菜的zbw

综述论文阅读”A survey on contrastive self-supervised learning“（Technologies2020）

论文标题

A survey on contrastive self-supervised learning

论文作者、链接

作者：Jaiswal, Ashish and Babu, Ashwin Ramesh and Zadeh, Mohammad Zaki and Banerjee, Debapriya and Makedon, Fillia

链接：Technologies | Free Full-Text | A Survey on Contrastive Self-Supervised Learning

Introduction逻辑（论文动机&现有工作存在的问题）

深度学习在很多智能系统中表现出色：图像分类，目标检测，图像分割，行为识别，自然语言处理（NLP）——有监督的学习往往需要大量的人力对数据进行标注——无监督学习可以在没有人工标注的情况下对自己进行监督——生成对抗方法(GAN)，学习潜在的特征表达，任务诸如：图像上色，图像修补，拼图问题，超分辨率，视频帧预测，音频虚拟化——生成对抗方法有两个主要面对的问题：（1）非收敛性模型参数振荡很大，很少收敛，(b)鉴别器太成功了，导致生成器网络无法产生类真伪样本，导致学习无法继续（当然，生成器和鉴别器之间需要适当的同步，以防止鉴别器收敛和生成器发散。）

与生成模型不同，对比学习如图1所示，目标是将相似的样本聚集起来，将不同的样本推远——用相似性尺度去衡量两个嵌入之间的远近

对比学习的训练过程如图2所示，原样本的增广版本视为一个正样本，然后剩下的样本都视为负样本——训练过程就是学习区别正负样本的过程——训练完可以得到高质量的特征表示，然后将这些特征可以用于迁移学习或是直接用到下游任务

代理任务Pretext Tasks

代理任务是自监督任务，是学习使用伪标签表示数据的重要策略。伪标签是根据数据本身自动生成的。大多数代理任务分为以下几类：颜色转换，几何转换，基于内容的任务，基于跨通道的任务

颜色转换

如图4所示，颜色变换涉及图像中颜色层次的基本调整，比如：模糊，颜色扭曲，灰度。在代理任务中，模型的任务是识别相似的图片并且复原他们的颜色

几何转换

如图5所示，几何变换是一种空间变换，其中图像的几何位置被修改，而不改变其实际像素信息，包括：缩放，随机裁剪，翻转（水平，垂直）。原始图片被视为是一个全局视图，转换后的图片被视为是一个局部视图

基于内容Context-Based

拼图任务Jigsaw puzzle

拼图任务是通过训练一个编码器，识别打乱的图块的正确位置

基于帧的顺序Frame order based

这种方法适用于穿越时间的数据。理想的应用场景是用于传感数据或是视频数据。一个视频里包含大量有语义相关的帧，这意味着时间上相邻的帧相关性更高。还原帧的顺序的过程中，模型可以学习到有用的视觉信息。在这个任务中，正序的视频是正样本，乱序的视频是负样本。类似地，其他可能的方法包括从较长的视频中随机抽样两个相同长度的视频片段或对每个视频片段应用空间增强，然后任务目标是使用对比损失来训练模型，使来自同一视频的片段排列得更近，而来自不同视频的片段在嵌入空间中被推开。

未来预测Future prediction

常用策略是预测未来的信息，一般用于时序数据，根据过去的数据预测未来的高维信息。利用强大的自回归模型对潜在空间中的信息进行汇总，产生了如图7所示的上下文潜在表征。在预测未来信息时，目标(未来)和上下文被编码成一个紧凑的分布式向量表示，最大限度地保留了原始信号的互信息。

视图预测View Prediction（Cross modal-based）

视图预测倾向于在同一个场景下的视图的不同数据，同一个时刻下的同一个对象的不同视图为正样本。模型通过尝试同时识别不同角度的帧之间的相似特征，并试图找出序列中随后出现的帧之间的差异来进行学习。

判断正确的代理任务Identifying the right pre-text task

对代理任务的选择，取决于需要处理的问题。虽然出现了大量的对比学习算法，但是如何选择一个合适的代理任务仍然是一个问题。并且，代理任务的选择极大程度影响模型最后的性能结果。代理任务的主要目标是，使得模型对这些转换保持不变同时区别其他的数据点。但是，通过这种增广而引入的偏见可能是一把双刃剑，因为每一次增广都鼓励转换的不变性，这种不变性在某些情况下是有益的，在另一些情况下是有害的。比如，在图像识别中，旋转可能是有益的，但是可能对下有任务是有害的。相似的是，基于颜色的代理任务可能在图9这种精细的分类任务中无效。

在其他的情况下，除了旋转，其他的数据增广比如放缩或是改变比率可能对代理任务是不合时宜的，因为它们产生易于检测的视觉伪影。当目标数据集中的图像是由颜色纹理构成的时，旋转效果不佳，如图10所示

NLP中的代理任务

（本人不做NLP，略过）

结构Architectures

对比学习依赖于负样本的数量来生成高质量的特征表示。这个过程可以视为是一个字典查询任务，有时一整个训练集都是字典，有时是训练集的子集是字典。结构主要分成4种，如图11所示

端到端学习

端到端学习的模型是一种基于梯度下降的复杂学习系统，倾向于使用大的batch-size来聚集大数量的负样本。除了原本的图片及其增广的视图，batch内的其他图片都视为负样本。使用了两种编码器：查询编码器（Query encoder,Q）和键编码器（Key encoder,K），如图11（a）所示。这两个编码器是不同的，在训练过程中通过反向传播来端到端的更新参数。使用一个对比损失来训练这两个编码器，对每一个样本生成有区别的特征表达，使得正样本拉近负样本远离。Q是在原始样本上训练的，K是在增广视图上训练的。Q与K生成的特征记为q,k，通过相似性尺度来计算q和k的相似性。大多数使用余弦相似性来计算相似性尺度。

Memory Bank的使用

端到端的方法往往因为要在显存中存放大量的负样本，对batch-szie的要求比较高，对设备的要求高，于是可以通过使用memory bank来解决这些问题。

Memory Bank：维护memory bank的主要目标是聚集大量的样本特征，在训练过程中当成负样本来使用。为此，创建一个字典来保存和更新最近的训练轮次中的样本点的特征嵌入。memory bank（M）包含对每一个样本I的特征表达，这个表达是在每一个训练轮次根据特征表达的指数值平均移动的。使得memory bank可以代替负样本

memory bank中的特征是根据最新学到的特征进行更新的，所以样本的键（key）对编码器的多个步骤都非常重要。PIRL通过memory bank学习到不错的特征表达，如图13所示

但是维护memory bank其实也是一个复杂的任务，更新memory bank中的特征的计算代价可能是非常高昂的

Momentum Encoder的使用

为了解决memory bank的缺点，用momentum encoder代替memory bank。momentum encoder生成一个有编码后的键值构成的队列字典，最新的mini-batch的特征入队，最老的mini-batch的特征出队。字典键在训练过程中由batch中的一组数据样本动态定义。momentum encoder与Q编码器参数共享，如图11（c）所示。momentum encoder不进行反向传播，而是根据Q编码器的参数进行更新，公式如下：

其中， $m \in [0,1)$ 是动量参数。只有参数 $\theta_k$ 是通过反向传播更新的。动量更新使得 $\theta_k$ 比 $\theta_q$ 更新的更加平滑。于是，虽然队列中的键是通过不同的编码器进行编码的（在不同的mini-batch轮次中的编码器参数不一样），但是编码器之间的差异会比较小。

momentum encoder的优点是不用训练两个独立的分支，而且计算开销比memory bank小

对特征表达进行聚类

上面的三种方法主要是使用相似性尺度来保持正样本拉近，负样本推远。还有一种方法通过聚类将相似的特征聚集起来

如图14所示，SwAV不仅使得样本对靠近，而且从聚类层面上将相似的特征聚集起来。在基于实例的学习中，每个样本都被视为一个数据集中独立的类。这使得它在将输入样本与原始样本所属的同类中的其他样本进行比较时不可靠。比如，假设在训练batch中有一张猫的照片，所有其他图片都被视为负样本，当将其他猫的图片视为负样本的时候便出现问题了。这种情况下，会致使模型学习两个猫的图片作为不相似的负样本。这个问题通过聚类的方法隐式地解决了。

编码器

encoder将输入样本映射到潜在空间中。图15反映了encoder在自监督学习中的作用。没有有效特征提取，一个分类模型可能很难学习如何区分不同的类。大部分对比学习模型使用ResNet作为主干网络，其中ResNet-50应用最为广泛。

在编码器中，某一个具体的层的输出通过池化得到一个单维的向量，没有使用上\下采样。有实验表明，编码器最后一层提取到的特征比前面的层提取到的特征更好。还有研究用ResNet作为编码器，然后通过网络加一个平均池化层得到特征，然后用一个浅层的MLP（1层）将特征映射到潜空间，然后在潜空间上应用对比损失。

训练

对于编码器的训练，通过一个代理任务来为反向传播计算对比损失。核心思想是使得相似的实例靠近，不相似的实例推远，实现方法是通过计算两个嵌入之间的相似性尺度，常用余弦相似性，公式如下：

对比学习通过Noise Contrastive Estimation (NCE)损失函数对向量进行比较，如下：

其中是原始样本，代表正样本，代表负样本， $\tau$ 是温度参数。可以是任何相似性函数，不过常用余弦相似性。NCE的最初想法是执行非线性逻辑回归，区分观测数据和一些人为产生的噪声。

如果负样本的数量变大，则使用NCE的变种，成为InfoNCE，如下：

其中代表负样本。

与其他深度学习方法相似，对比学习也有多种优化器optimizer可以使用。随机梯度下降（SGD），Adam都是常用的优化器。SGD还有一种随着时间变化参数的变种，还有动量SGD。

在大batch-size的情况下，用SGD来训练可能会导致不稳定，于是利用Layer-wise Adaptive Rate Scaling (LARS)优化器，带余弦学习率。LARS对每一层的学习率都不一样，并且更新的幅度是基于权重准则，以更好地控制学习率。此外，使用余弦学习率涉及到SGD的周期性热重启，在每次重启中，学习率初始化为某个值，并计划随着时间的推移而降低。

下游任务

卷积核可视化以及特征图

本节，编码器的第一层是以自监督对比学习方式训练以及有监督的方式训练的。根据编码器中不同层级的注意力图用来评估一个方法使用奏效。有效性基于输入中观察到的激活区域，如图18

Benchmarks

略过

NLP中的对比学习

略过

未来发展方向

缺乏理论基础

训练方法高度依赖于训练过程中选择的代理任务。需要对模型有更多的理论分析

对于数据增广和代理任务的选择

很难直接比较这些对比学习方法来选择能够在任何数据集上产生最佳结果的特定任务和转换

合适的负样本

负样本引入了大量特定于训练集的超参数，并且很难推广到其他数据集。

数据集偏置

你可能感兴趣的:(论文阅读,深度学习,计算机视觉,人工智能)

深度学习模型：原理、应用与代码实践 accurater c++算法笔记人工智能深度学习
引言深度学习作为人工智能的核心技术，已在图像识别、自然语言处理、代码生成等领域取得突破性进展。其核心在于通过多层神经网络自动提取数据特征，解决复杂任务。本文将从基础理论、模型架构、优化策略、应用场景及挑战等多个维度展开，结合代码示例，系统解析深度学习模型的技术脉络与实践方法。一、深度学习基础理论神经网络基本原理神经网络由输入层、隐藏层和输出层构成，通过反向传播算法调整权重。以全连接网络为例，前向传
用于网络安全的生成式 AI：利用 AI 增强威胁检测和响应云上笛暮 AI for Security 人工智能
一、引言技术的进步彻底改变了我们的生活、工作和交流方式。然而，随着这些技术的进步，保护它们免受网络威胁的挑战也随之而来。网络安全已成为任何组织的重要组成部分，随着网络攻击越来越复杂，传统的威胁检测和响应方法已不再足够。这导致了生成人工智能等新技术的发展，这些技术在增强网络安全方面显示出巨大潜力。在这篇博客中，我们将探讨生成式人工智能的概念、它在网络安全中的重要性，以及它如何用于增强威胁检测和响应。
【TVM 教程】使用元组输入（Tuple Inputs）进行计算和归约编译器编程后端人工智能深度学习
ApacheTVM是一个端到端的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/作者：ZihengJiang若要在单个循环中计算具有相同shape的多个输出，或执行多个值的归约，例如argmax。这些问题可以通过元组输入来解决。本教程介绍了TVM中元组输入的用法。from__future__importabsolut
深度解构：DeepSeek大模型架构与前沿应用的未来探秘威哥说编程架构 ai
随着人工智能（AI）领域的快速发展，深度学习模型逐渐向着更加复杂和强大的方向演进。在这一波技术浪潮中，DeepSeek大模型作为一个重要代表，凭借其卓越的表现和广泛的应用，正在重新定义我们对AI的认知和期待。本篇文章将从架构到应用，全面解析DeepSeek大模型的技术特点，探索其在未来可能带来的创新与变革。1.DeepSeek大模型的架构设计DeepSeek大模型采用的是基于Transformer
T41LQ专为人工智能物联网（AIoT）应用设计，适用于智能安防、智能家居、机器视觉等领域软硬件资料+样品测试 li15817260414 君正人工智能物联网智能家居
君正（Ingenic）T系列芯片涵盖多个型号，每个型号根据不同应用需求提供了多个版本。以下是各型号及其主要版本：1.T23系列：T23N：标准版，适用于移动摄像机、安全监控、视频通话和视频分析等应用。T23ZN：佐罗标准版，功能与T23N类似，针对特定市场需求进行了优化。2.T31系列：T31L：简化版，适用于对成本和功耗有严格要求的应用场景。T31N：标准版，适用于广泛的智能视频应用。T31X：
人工智能生成内容（AIGC）对程序员的影响 AmHardy AIGC 人工智能 AIGC 程序员 chatgpt kimi
人工智能生成内容（AIGC）对程序员的影响引言AIGC技术正在深刻影响软件开发行业，给程序员带来诸多机遇和挑战。程序员不仅需要适应这些新兴技术，还要有效利用它们来提升自己的工作效率和创新能力。AIGC技术的优势效率提升代码生成:AI工具如GitHubCopilot可以预测代码片段、自动完成代码和生成文档，从而显著提升编程效率。自动化测试:AI可以自动生成测试用例和检测代码中的潜在问题，减少了手动测
【路径规划】基于A算法和Dijkstra算法的路径规划附Python代码天天Matlab科研工作室无人机matlab仿真电子资源算法 python 开发语言
✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。往期回顾关注个人主页：Matlab科研工作室个人信条：格物致知,完整Matlab代码及仿真咨询内容私信。内容介绍路径规划作为人工智能和机器人技术领域的核心问题之一，在导航、交通运输、游戏开发等领域有着广泛的应用。解决路径规划问题，旨在找到一条从起始点到目标点，并满足特定约束条件（如最短
【AI】如何理解与应对AI中的敏感话题：详细分析与实用指南丶2136 AI 人工智能 AI 敏感话题
引言随着人工智能（AI）技术的不断发展，我们在与AI交互时，可能会遇到敏感话题的讨论限制。在许多情况下，AI系统为了避免触及社会、政治或文化敏感点，会对用户输入进行一定的筛选和过滤。那么，这些敏感话题是如何定义的，AI如何识别并避免这些话题，以及作为开发者和用户，我们该如何应对这一问题？本文将详细探讨这些问题，并通过表格、图示等方式帮助大家更好地理解。目录引言一、AI中的敏感话题分类与处理策略1.
智能算法安全优化与关键技术实践智能计算研究中心其他
内容概要智能算法的安全优化与关键技术实践已成为人工智能发展的核心命题。在医疗影像分析、金融风控、自动驾驶等场景中，联邦学习的分布式协作机制有效解决了数据孤岛问题，而生成对抗网络通过对抗训练增强数据生成能力，为小样本场景提供技术支撑。与此同时，可解释性算法通过特征重要性分析与决策路径可视化，显著提升模型透明度，降低黑箱风险。在技术实现层面，特征工程的自动化筛选与超参数动态调整策略优化了模型性能，结合
深度学习系列71：表格检测和识别 IE06 深度学习系列深度学习人工智能
1.pdf处理如果是可编辑的pdf格式，那么可以直接用pdfplumber进行处理：importpdfplumberimportpandasaspdwithpdfplumber.open("中新科技：2015年年度报告摘要.PDF")aspdf:page=pdf.pages[1]#第一页的信息text=page.extract_text()print(text)table=page.extract
【实战项目】Python 手撕一个基于最新端到端大模型的语音聊天系统 kakaZhui 解码前沿多模态大模型：认知分析和工业级实战 python 开发语言 AIGC 人工智能 chatgpt
写在前面：为什么需要端到端语音交互近年来，随着深度学习技术的飞速发展，语音交互技术取得了显著的进步。从智能音箱到虚拟助手，语音交互已经渗透到我们生活的方方面面。然而，传统的语音交互系统往往采用“语音识别（ASR）-自然语言理解（NLU）-对话管理（DM）-自然语言生成（NLG）-语音合成（TTS）”的级联式架构，这种架构存在着诸多弊端，如：错误累积：每个模块的错误都会传递到下一个模块，导致最终结果
体育数据分析：竞技表现优化与商业价值挖掘的技术范式 Tina0898 数据分析数据挖掘
体育数据分析作为一门交叉学科，正在重塑现代体育产业的发展轨迹。通过多源数据采集、机器学习建模和商业智能分析，体育数据分析已经形成了完整的技术体系和应用生态。本文将深入探讨体育数据分析的技术架构、应用场景和商业价值。一、数据采集与处理技术架构现代体育数据采集系统采用分布式架构，集成了计算机视觉、惯性测量单元(IMU)和生物电传感器等多模态数据源。计算机视觉系统通过高速摄像机和深度学习算法，可实现运动
PyTorch 深度学习快速入门教程有人给我介绍对象吗 AI论文写作深度学习 pytorch 人工智能
PyTorch深度学习快速入门教程PyTorch是一个灵活且易用的深度学习框架，支持动态图计算，广泛用于学术研究和工业应用。本教程将带你快速掌握PyTorch的基本用法，涵盖张量（Tensor）操作、自动求导（Autograd）、构建神经网络以及模型训练。1.安装PyTorch在终端或命令行中运行以下命令安装PyTorch：pipinstalltorchtorchvisiontorchaudio安
开源跨平台大模型工具Ollama的安全隐患 X.Cristiano AI新闻 Ollama 漏洞大模型
源跨平台大模型工具Ollama的安全隐患及应对策略在当今数字化飞速发展的时代，人工智能技术尤其是大模型的应用已经渗透到我们生活的方方面面。从智能家居到医疗健康，从金融风控到教育娱乐，大模型为各个领域带来了前所未有的便利和创新。然而，随着技术的进步，安全问题也日益凸显。近期，清华大学网络空间测绘联合研究中心发布了一则关于开源跨平台大模型工具Ollama的安全通报，揭示了其默认配置中存在的严重安全隐患
第0节机器学习与深度学习介绍汉堡go 李哥深度学习专栏人工智能机器学习神经网络
人工智能：能够感知、推理、行动和适应的程序机器学习：能够随着数据量的增加而不断改进性能的算法（数学上的可解释性但准确率不是百分百，灵活度不高）深度学习：机器学习的一个子集：利用多层神经网络从大量数据中进行学习（设计一个很深的网络架构让机器自己学）（深度学习就是找一个函数f）机器学习算法简介（狭义）一般是基于数学，或者统计学的方法，具有很强的可解释性经典传统机器学习算法：KNN、决策树、朴素贝叶斯一
Python常见的第三方库：requests、numpy、pandas 大数据张老师 python numpy pandas
常见的第三方库：requests、numpy、pandasPython拥有丰富的第三方库，涵盖了数据分析、网络爬取、人工智能、科学计算等多个领域。其中，requests、numpy和pandas是最常用的三个库，分别用于网络请求、数值计算和数据处理。本节将详细介绍它们的基本功能，并通过示例代码帮助理解它们的使用方法。requests：处理网络请求的库requests是Python中用于处理HTTP
新型模型架构（参数化状态空间模型、状态空间模型变种）三月七꧁ ꧂ LLM 语言模型 gpt 文心一言 prompt embedding AIGC agi
文章目录参数化状态空间模型状态空间模型变种 Transformer模型自问世以来，在自然语言处理、计算机视觉等多个领域得到了广泛应用，并展现出卓越的数据表示与建模能力。然而，Transformer的自注意力机制在计算每个词元时都需要利用到序列中所有词元的信息，这导致计算和存储复杂度随输入序列长度的平方级别增长。在处理长序列时，这种复杂性会消耗大量的计算资源与存储空间。为了解决这个问题，研究人
【有啥问啥】深入浅出：大模型应用工具 Ollama 技术详解有啥问啥大模型科普人工智能深度学习
深入浅出：大模型应用工具Ollama技术详解引言近年来，大型模型（LargeModels，LLMs）技术突飞猛进，在自然语言处理、计算机视觉、语音识别等领域展现出强大的能力。然而，部署和运行这些庞大的模型往往面临着环境配置复杂、资源需求高昂等挑战。为了解决这些痛点，Ollama应运而生。本文将深入探讨Ollama，一个旨在简化大模型本地运行和管理的开源工具，帮助读者理解其核心概念、优势以及应用场景
基于YOLOv5深度学习的田间杂草检测系统：UI界面 + YOLOv5 + 数据集详细教程深度学习&目标检测实战项目 YOLO 深度学习 ui YOLOv5 人工智能计算机视觉
引言随着农业科技的进步，智能化农业越来越受到重视，尤其是通过计算机视觉技术对作物进行监测和管理。在农业生产中，杂草的生长对作物的生长产生了负面影响，因此准确地检测和识别田间杂草至关重要。本文将详细介绍如何构建一个基于深度学习的田间杂草检测系统，使用YOLOv5模型进行目标检测，并提供一个用户友好的界面。我们将分步骤进行，包括环境配置、数据集准备、模型训练、实时杂草检测系统的实现等内容。目录引言目录
人工智能与深度学习的应用案例解析及代码实现 accurater 人工智能深度学习科技机器人
引言人工智能（AI）与深度学习（DeepLearning）作为21世纪最具变革性的技术之一，已渗透到医疗、金融、交通、制造等各个领域。深度学习通过多层神经网络模拟人类认知过程，显著提升了复杂任务的自动化水平。本文将从技术原理、核心应用案例及代码实现三个维度，系统解析其实际应用，并探讨未来挑战与发展方向。一、深度学习技术概述1.1核心技术框架深度学习基于深度神经网络（DNN），其核心在于通过多层非线
深度学习笔记——基础部分肆—— 深度学习深度学习笔记人工智能 python pytorch
深度学习是一种机器学习的方式，通过模仿人脑吃力信息的方式，使用多层神经网络来学习数据的复杂模式和特征。深度学习和机器学习的区别：在机器学习中，特征提取通常需要人工设计和选择，依赖于领域专家的知识来确定哪些特征对模型最为重要;而在深度学习中，特征提取是自动进行的，通过多层神经网络结构直接从原始数据(也可能需要初步处理)中学习复杂特征，减少了对人工干预的依赖，使得模型能够处理更加复杂的数据和任务。计算
机器学习基础（4） yyc_audio 深度学习 python 机器学习神经网络人工智能
超越基于常识的基准除了不同的评估方法，还应该利用基于常识的基准。训练深度学习模型就好比在平行世界里按下发射火箭的按钮，你听不到也看不到。你无法观察流形学习过程，它发生在数千维空间中，即使投影到三维空间中，你也无法解释它。唯一的反馈信号就是验证指标，就像隐形火箭的高度计。特别重要的是，我们需要知道火箭是否离开了地面。发射地点的海拔高度是多少？模型似乎有15%的精度——这算是很好吗？在开始处理一个数据
人工智能之数学基础：对线性代数中逆矩阵的思考？每天五分钟玩转人工智能机器学习深度学习之数学基础线性代数人工智能矩阵机器学习逆矩阵向量
本文重点逆矩阵是线性代数中的一个重要概念，它在线性方程组、矩阵方程、动态系统、密码学、经济学和金融学以及计算机图形学等领域都有广泛的应用。通过了解逆矩阵的定义、性质、计算方法和应用，我们可以更好地理解和应用线性代数知识，解决各种实际问题。关于逆矩阵的思考现在我们有一个计算过程如上所示，我们知道矩阵的作用就是函数，向量a先经过矩阵1进行函数作用，然后再经过矩阵2函数作用最后可以得到输出向量c，这个过
上线DeepSeek大模型，黄山“大位”智算中心正式点亮人工智能
2月28日，智启黄山，算领未来——黄山“大位”智算中心点亮仪式在黄山市大位人工智能计算中心举行，标志着黄山“大位”智算中心正式投入运营。同日，DeepSeek-R1大模型在黄山“大位”正式上线，通过“顶尖大模型+普惠算力底座”的深度融合，构建黄山市人工智能创新生态。黄山市委常委、副市长王恒来出席并致辞。他表示，黄山“大位”智算中心的点亮，是黄山市贯彻落实习近平总书记关于"人工智能是引领这一轮科技革
00计算机视觉学习内容依旧阳光的老码农计算机视觉计算机视觉人工智能
计算机视觉（ComputerVision）开发需要掌握数学基础、编程语言、图像处理、机器学习、深度学习等多个方面的知识。以下是一个系统的学习路线：1️⃣数学基础（核心理论支撑）计算机视觉涉及很多数学概念，以下是必备数学知识：✅线性代数（矩阵运算是计算机视觉的核心）向量、矩阵运算（加减、乘法、转置）特征值与特征向量SVD（奇异值分解），用于图像压缩、降维齐次坐标变换（用于3D计算机视觉）✅概率统计（
DeepSeek大模型如何提升论文与代码效率智能计算研究中心其他
内容概要DeepSeek大模型作为人工智能领域的前沿成果，通过670亿参数的混合专家架构（Mixture-of-Experts,MoE），在多模态任务处理与专业场景应用中展现了显著优势。其核心技术突破体现在多语言处理能力、视觉语言理解模块以及深度优化的自然语言处理算法上，能够覆盖学术研究、代码开发、内容创作等多元场景。例如，在论文写作领域，模型通过智能选题推荐、文献综述生成及SEO关键词拓展功能，
Manus学习手册合集【建议收藏】周师姐学习 pdf 人工智能
这两天，一款通用AI智能体Manus还没发布就火了，因为还在内测中，用户需要邀请码才能够体验，这就导致原本免费的邀请码在二手平台最高被炒到8万8。相比于之前爆火的DeepSeek和ChatGPT这类AI对话工具，Manus是全球首款真正意义上的通用人工智能！没错，就是科幻电影里面能够独立思考，自主运行的人工智能！！manus学习资料：https://pan.xunlei.com/s/VOKk8Cq
10个热门AI API（2024年2月）程序员后端
人工智能（AI）在当今数字时代发挥着重要的作用，为企业带来了全新的机遇和变革。AI不再是一种陌生的科技概念，而是已经渗透到各行各业，成为推动创新和提升效率的关键引擎。其核心优势在于能够处理大规模的数据、执行复杂的任务、模拟人类思维过程，并以前所未有的方式改善业务流程。AIAPI作为连接企业和强大AI技术的桥梁，扮演着至关重要的角色。通过使用AIAPI，企业能够快速、轻松地将先进的人工智能功能集成到
人工智能学习大纲互联网搬砖老肖 AI 原力计划工具使用人工智能学习
前言人工智能正以惊人的速度发展，其潜力既令人兴奋，也引人深思。它既可能为解决全球性问题带来希望，也可能带来前所未有的挑战。人工智能时代的到来已是不可逆转的趋势，科幻电影中的某些场景或许将成为现实。我对人工智能的研究越深入，就越能感受到它的强大力量。我所担忧的不仅仅是它对就业市场的冲击，更是它可能对人类社会结构带来的深远影响。未来，对人工智能的理解可能像今天对电脑操作的掌握一样重要。掌握人工智能技术
01计算机视觉学习计划依旧阳光的老码农计算机视觉计算机视觉人工智能
计算机视觉系统学习计划（3-6个月）本计划按照数学→编程→图像处理→机器学习→深度学习→3D视觉→项目实战的顺序，确保从基础到高级，结合理论和实践。第一阶段（第1-2个月）：基础夯实✅目标：掌握数学基础、Python/C++编程、基本图像处理1️⃣数学基础（2周）每日2小时线性代数：矩阵运算、特征值分解（推荐《线性代数及其应用》）概率统计：高斯分布、贝叶斯定理微积分：偏导数、梯度下降傅里叶变换：图
JAVA中的Enum 周凡杨 java enum 枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。在实际问题中，有些变量的取值被限定在一个有限的范围内。例如，一个星期内只有七天我们通常这样实现上面的定义： public String monday; public String tuesday; public String wensday; public String thursday
赶集网mysql开发36条军规 Bill_chen mysql 业务架构设计 mysql调优 mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层； (2)控制单表数据量 int型不超过1000w，含char则不超过500w；合理分表；限制单库表数量在300以内； (3)控制列数量字段少而精，字段数建议在20以内
Shell test命令 daizj shell 字符串 test 数字文件比较
Shell test命令 Shell中的 test 命令用于检查某个条件是否成立，它可以进行数值、字符和文件三个方面的测试。数值测试参数说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真实例演示： num1=100 num2=100if test $[num1]
XFire框架实现WebService(二) 周凡杨 java webservice
有了XFire框架实现WebService(一)，就可以继续开发WebService的简单应用。 Webservice的服务端(WEB工程)：两个java bean类： Course.java package cn.com.bean; public class Course { private
重绘之画图板朱辉辉33 画图板
上次博客讲的五子棋重绘比较简单，因为只要在重写系统重绘方法paint（）时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。画图板重绘难在需要重绘的类型很多，比如说里面有矩形，园，直线之类的，所以我们要想办法将里面的图形加入一个队列中，这样在重绘时就
Java的IO流西蜀石兰 java
刚学Java的IO流时，被各种inputStream流弄的很迷糊，看老罗视频时说想象成插在文件上的一根管道，当初听时觉得自己很明白，可到自己用时，有不知道怎么代码了。。。每当遇到这种问题时，我习惯性的从头开始理逻辑，会问自己一些很简单的问题，把这些简单的问题想明白了，再看代码时才不会迷糊。 IO流作用是什么？答：实现对文件的读写，这里的文件是广义的； Java如何实现程序到文件
No matching PlatformTransactionManager bean found for qualifier 'add' - neither 林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match! 网上找了好多的资料没能解决，后来发现：项目中使用的是xml配置的方式配置事务，但是
Row size too large (> 8126). Changing some columns to TEXT or BLOB aigo column
原文：http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large 异常信息： Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
JS 格式化时间 alxw4616 JavaScript
/** * 格式化时间 2013/6/13 by 半仙 alxw4616@msn.com * 需要 pad 函数 * 接收可用的时间值. * 返回替换时间占位符后的字符串 * * 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数 * 如 YYYY 4占4位 YY 占2位<p></p> * MM DD hh mm
队列中数据的移除问题百合不是茶队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下; // package com.Thread0715.com; import java.util.ArrayList; public class Threa
Runnable接口使用实例 bijian1013 java thread Runnable java多线程
Runnable接口 a. 该接口只有一个方法：public void run(); b. 实现该接口的类必须覆盖该run方法 c. 实现了Runnable接口的类并不具有任何天
oracle里的extend详解 bijian1013 oracle 数据库 extend
扩展已知的数组空间，例： DECLARE TYPE CourseList IS TABLE OF VARCHAR2(10); courses CourseList; BEGIN -- 初始化数组元素，大小为3 courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 '); --
【httpclient】httpclient发送表单POST请求 bit1129 httpclient
浏览器Form Post请求浏览器可以通过提交表单的方式向服务器发起POST请求，这种形式的POST请求不同于一般的POST请求 1. 一般的POST请求，将请求数据放置于请求体中，服务器端以二进制流的方式读取数据，HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求，比如请求数据是字符串或者是二进制数据 2. Form
【Hive十三】Hive读写Avro格式的数据 bit1129 hive
1. 原始数据 hive> select * from word; OK 1 MSN 10 QQ 100 Gtalk 1000 Skype 2. 创建avro格式的数据表 hive> CREATE TABLE avro_table(age INT, name STRING)STORE
nginx+lua+redis自动识别封解禁频繁访问IP ronin47
在站点遇到攻击且无明显攻击特征，造成站点访问慢，nginx不断返回502等错误时，可利用nginx+lua+redis实现在指定的时间段内，若单IP的请求量达到指定的数量后对该IP进行封禁，nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在指定的封禁时间后实行自动解封的目的。一、安装环境： CentOS x64 release 6.4(Fin
java-二叉树的遍历-先序、中序、后序（递归和非递归）、层次遍历 bylijinnan java
import java.util.LinkedList; import java.util.List; import java.util.Stack; public class BinTreeTraverse { //private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 }; private int[] array={ 10,6,
Spring源码学习-XML 配置方式的IoC容器启动过程分析 bylijinnan java spring IOC
以FileSystemXmlApplicationContext为例，把Spring IoC容器的初始化流程走一遍： ApplicationContext context = new FileSystemXmlApplicationContext ("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
[科研与项目]民营企业请慎重参与军事科技工程 comsci 企业
军事科研工程和项目并非要用最先进，最时髦的技术，而是要做到“万无一失” 而民营科技企业在搞科技创新工程的时候，往往考虑的是技术的先进性，而对先进技术带来的风险考虑得不够，在今天提倡军民融合发展的大环境下，这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前，对
spring 定时器-两种方式 cuityang spring quartz 定时器
方式一：间隔一定时间运行 <bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" /> <bean id="updateSessionIdSchedule
简述一下关于BroadView站点的相关设计 damoqiongqiu view
终于弄上线了，累趴，戳这里http://www.broadview.com.cn 简述一下相关的技术点前端：jQuery+BootStrap3.2+HandleBars，全站Ajax（貌似对SEO的影响很大啊！怎么破？），用Grunt对全部JS做了压缩处理，对部分JS和CSS做了合并（模块间存在很多依赖，全部合并比较繁琐，待完善）。后端：U
运维 PHP问题汇总 dcj3sjt126com windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页解决方法：后台>系统>系统基本参数>核心设置>关键字替换（是/否），这里选择“是”。后台>系统>系统基本参数>其他选项>自动提取关键字，这里选择“是”。 2、解决PHP168超级管理员上传图片提示你的空间不足网站是用PHP168做的，反映使用管理员在后台无法
mac 下安装php扩展 - mcrypt dcj3sjt126com PHP
MCrypt是一个功能强大的加密算法扩展库，它包括有22种算法，phpMyAdmin依赖这个PHP扩展，具体如下：下载并解压libmcrypt-2.5.8.tar.gz。在终端执行如下命令： tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
MongoDB更新文档 [四] eksliang mongodb Mongodb更新文档
MongoDB更新文档转载请出自出处：http://eksliang.iteye.com/blog/2174104 MongoDB对文档的CURD，前面的博客简单介绍了，但是对文档更新篇幅比较大，所以这里单独拿出来。语法结构如下： db.collection.update( criteria, objNew, upsert, multi) 参数含义参数
Linux下的解压，移除，复制，查看tomcat命令 y806839048 tomcat
重复myeclipse生成webservice有问题删除以前的，干净 1、先切换到：cd usr/local/tomcat5/logs 2、tail -f catalina.out 3、这样运行时就可以实时查看运行日志了 Ctrl+c 是退出tail命令。有问题不明的先注掉 cp /opt/tomcat-6.0.44/webapps/g
Spring之使用事务缘由(3-XML实现) ihuning spring
用事务通知声明式地管理事务事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理，可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知，为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后，就需要将它与切入点关联起来。由于事务通知是在 <aop:
GCD使用经验与技巧浅谈啸笑天 GC
前言 GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”，本文就总结一些有关使用GCD的经验与技巧。 dispatch_once_t必须是全局或static变量这一条算是“老生常谈”了，但我认为还是有必要强调一次，毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug，正确的如下： 1
linux（Ubuntu）下常用命令备忘录1 macroli linux 工作 ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表：ls ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容，但这样直接运行所得到的信息也是比较少的，通常它可以结合以下这些参数运行以查询更多的信息： ls / 显示/.下的所有文件和目录 ls -l 给出文件或者文件夹的详细信息 ls -a 显示所有文件，包括隐藏文
nodejs同步操作mysql qiaolevip 学习永无止境每天进步一点点 mysql nodejs
// db-util.js var mysql = require('mysql'); var pool = mysql.createPool({ connectionLimit : 10, host: 'localhost', user: 'root', password: '', database: 'test', port: 3306 });
一起学Hive系列文章 superlxw1234 hive Hive入门
[一起学Hive]系列文章目录贴，入门Hive，持续更新中。 [一起学Hive]之一—Hive概述，Hive是什么 [一起学Hive]之二—Hive函数大全-完整版 [一起学Hive]之三—Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和分区 [一起学Hive
Spring开发利器：Spring Tool Suite 3.7.0 发布 wiselyman spring
Spring Tool Suite(简称STS)是基于Eclipse，专门针对Spring开发者提供大量的便捷功能的优秀开发工具。在3.7.0版本主要做了如下的更新：将eclipse版本更新至Eclipse Mars 4.5 GA Spring Boot(JavaEE开发的颠覆者集大成者，推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示，

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他