喜欢打酱油的老鸟

2020年，那些「引爆」了ML社区的热门论文、库和基准

2020 年出现了哪些引爆机器学习社区的论文和库呢？哪些模型和方法登顶各领域基准排行榜呢？这篇文章给你答案。

机器之心报道，作者：杜伟

不平凡的 2020 年终于过去了！这一年，由于新冠肺炎疫情的影响，CVPR、ICLR、NeurIPS 等各大学术会议都改为线上举行。但是，机器学习社区的研究者和开发者没有停下脚步，依然贡献了很多重大的研究发现。

不久前，资源网站 Papers with Code 发文总结了 2020 年 Top 10 热门的论文、库和基准，涵盖自然语言处理、图像分类、目标检测、语义分割、实例分割、姿态估计、行人重识别等诸多领域。

Top 10 热门论文

论文 1：EfficientDet: Scalable and Efficient Object Detection

论文链接：https://arxiv.org/pdf/1911.09070v7.pdf

简介：这项论文最初在 2019 年 11 月份发布首版，机器之心进行了报道，本文是最新版。谷歌大脑的研究者探讨了计算机视觉领域的模型效率问题，分别提出了加权双向特征金字塔网络和复合缩放方法，进而开发了一种新的 EfficientDet 目标检测器，实现了新的 SOTA 水平。本文被 CVPR 2020 会议接收。

论文 2：Fixing the train-test resolution discrepancy

论文链接：https://arxiv.org/pdf/2003.08237v5.pdf

简介：FixRes（Fixing Resolution）是一种能够提升任何模型性能的方法，可以在数个 epoch 期间用作卷积训练后的微调步骤，因而具有非常高的灵活性。FixRes 也可以轻松地集成到现有任何训练 pipeline。FAIR 的研究者将 FixRes 方法与 SOTA 模型 EfficientNet 结合，提出了新的架构 FixEfficientNet，并在 ImageNet 数据集上取得了 88.5% 的 top-1 准确率，实现了当时的 SOTA 性能。

论文 3：ResNeSt: Split-Attention Networks

论文链接：https://arxiv.org/pdf/2004.08955v2.pdf

简介：Facebook、加州大学戴维斯分校、字节跳动等机构的研究者提出了一种模块化 Split-Attention 块，可以将注意力分散到若干特征图组中。按照 ResNet 的风格堆叠这些 Split-Attention 块，他们得到一个 ResNet 的新变体，称为ResNeSt。其中，ResNeSt-50 在 ImageNet 数据集上取得了 81.13% 的 top-1 准确率，比此前最好的 ResNet 变体高 1% 以上。这一提升对于目标检测、实例分割、语义分割等下游任务来说很有意义。

论文 4：Big Transfer (BiT): General Visual Representation Learning

论文链接：https://arxiv.org/pdf/1912.11370v3.pdf

简介：谷歌大脑的研究者提出了迁移学习模型 Big Transfer (BiT)。BiT 是一组预训练的图像模型：即便每个类只有少量样本，经迁移后也能够在新数据集上实现出色的性能。BiT 分别在 ILSVRC-2012、CIFAR-10 和包含 19 项评估任务的 Visual Task Adaptation Benchmark (VTAB) 数据集上实现了 87.5%、99.4% 和 76.3% 的 top-1 准确率；在小型数据集上，BiT 也分别在每类 10 个样本的 ILSVRC-2012 和 CIFAR-10 数据集上实现了 76.8% 和 97.0% 的 top-1 准确率。本文被 ECCV 2020 会议接收。

论文 5：Object-Contextual Representations for Semantic Segmentation

论文链接：https://arxiv.org/pdf/1909.11065v5.pdf

简介：中科院计算所、微软亚研等机构的研究者旨在解决语义分割问题，并聚焦上下文聚合策略。他们提出了一种简单却有效的方法目标上下文表征（object-contextual representation, OCR），它利用相应目标类的表征来描述像素特征。实验结果表明，本文提出的 OCR 方法在 Cityscapes、ADE20K 以及 PASCAL-Context 等多种挑战性语义分割基准上实现了相当不错的性能。本文被 ECCV 2020 会议接收。

论文 6：Self-training with Noisy Student improves ImageNet classification

论文链接：https://arxiv.org/pdf/1911.04252v4.pdf

简介：机器之心在 2019 年 11 月对该论文 v1 版进行了报道，本文是 v2 版本。谷歌大脑和卡内基梅隆大学的研究者提出了一种半监督学习方法 Noisy Student Training，该方法在标注数据充足时也能运行良好。实验结果表明，Noisy Student Training 在 ImageNet 数据集上实现了 88.4% 的准确率，比需要 35 亿（3.5B）弱标注 Ins 图像的 SOTA 模型提升了 2.0%。在鲁棒性测试集中，Noisy Student Training 将 ImageNet-A 的 top-1 准确率从 61.0% 提升至了 83.7%，将 ImageNet-C 的 mean corruption error (MCR) 从 45.7 降至了 28.3，并将 ImageNet-P 的 mean flip rate(MFR) 从 27.8 降至了 12.2。本文被 CVPR 2020 会议接收。

论文 7：YOLOv4: Optimal Speed and Accuracy of Object Detection

论文链接：https://arxiv.org/pdf/2004.10934v1.pdf

简介：2020 年 4 月份，YOLO 的官方 Github 开源了YOLOv4，迅速引起了 CV 社区的关注。研究者对比了 YOLOv4 和当前最优目标检测器，发现 YOLOv4 在取得与 EfficientDet 同等性能的情况下，速度是 EfficientDet 的二倍！此外，与 YOLOv3 相比，新版本的 AP 和 FPS 分别提高了 10% 和 12%。

论文 8：An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale

论文链接：https://arxiv.org/pdf/2010.11929.pdf

简介：谷歌大脑的研究者受到 NLP 领域中 Transformer 缩放成功的启发，尝试将标准 Transformer 直接应用于图像，并尽可能减少修改。他们提出了一个新的Vision Transformer（ViT）模型，并在多个图像识别基准上实现了接近甚至优于当前 SOTA 方法的性能。

论文 9：Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer

论文链接：https://arxiv.org/pdf/1910.10683v3.pdf

简介：谷歌研究者通过引入一个将所有基于文本的语言问题转化为文本到文本格式的统一框架，对自然语言处理（NLP）的迁移学习方法进行了探索。他们提出了新的Text-to-Text Transfer Transformer (T5) 模型，参数量最高达到了 110 亿。T5 模型在涵盖摘要生成、问答以及文本分类等 17 项 NLP 任务上实现了新 SOTA。此外，研究者开源了新的 Colossal Clean Crawled Corpus (C4) 语料库，内含从网上爬取的数百个千兆字节干净英文文本。

论文 10：Hierarchical Multi-Scale Attention for Semantic Segmentation

论文链接：https://arxiv.org/pdf/2005.10821v1.pdf

简介：多尺度推理通常用于提升语义分割的结果。英伟达的研究者提出了一种分层注意力机制，通过这种机制，网络可以学习预测相邻尺度之间的相对权重。研究者在 Cityscapes 和 Mapillary Vistas 两个数据集上测试了分层注意力机制的效果，其中在拥有大量弱标注图像的 Cityscapes 数据集上，他们还引入了一种提升泛化性能的自动标注方法。实验结果表明，分层多尺度注意力机制均取得了 SOTA 结果，在 Mapillary 上实现了 61.1% 的 mIOU，在 Cityscapes 实现了 85.1% 的 mIOU。

Top 10 热门库

Transformers

项目地址：https://github.com/huggingface/transformers

简介：transformers 库由 Hugging Face 团队创建，旨在将这些 NLP 进展开放给更广泛的机器学习社区。该库包含多个精心设计的 SOTA Transformer 架构，并使用统一的 API。transformers 库汇集了社区构建的多个预训练模型，并向社区开放。目前，该库的 star 量高达 39.3k，transformers 论文获得了EMNLP 2020 最佳 demo 论文奖。

PyTorch Image Models

项目地址：https://github.com/rwightman/pytorch-image-models

简介：pytorch-image-models 库由热衷于构建 ML 和 AI 系统的加拿大人 Ross Wightman 创建，包含了图像模型、层、实用工具、优化器、调度器、数据加载器 / 扩增、推理训练 / 验证脚本等资源。该库旨在将多种多样的 SOTA 模型整合起来，以复现 ImageNet 数据集上的训练结果。目前，该库的 star 量为 6.6k。

detectron2

项目地址：https://github.com/facebookresearch/detectron2

简介：Detectron2 是 Facebook AI Research 的新一代软件系统，旨在实现 SOTA 目标检测算法。该库在以前版本Detectron上进行重新编写，并包含了 maskrcnn-benchmark 库（已被弃用）的所有模型实现。目前，该库的 star 量高达 14.5k。

insightface

项目地址：https://github.com/deepinsight/insightface

简介：insightface 由 Deep Insight 团队创建，是一个开源的 2D 和 3D 深度人脸分析工具箱，主要基于 MXNet 框架构建。该库的主分支（master branch）适用于 MXNet 1.2-1.6 版本以及 Python 3.x 版本。目前，该库的 star 量为 8.4k。

imgclsmob

项目地址：https://github.com/osmr/imgclsmob

简介：imgclsmob 库由高级软件工程师 Oleg Sémery 创建，主要研究计算机视觉任务的卷积网络。该库包含用于训练、评估和转换的各种分类、分割、检测和姿态估计模型和脚本的实现或复现。目前，该库的 star 量为 2k。

DarkNet

项目地址：https://github.com/pjreddie/darknet

简介：darknet 库由专注于计算机视觉研究的 Joseph Redmon 创建，是一个基于 C 语言和 CUDA 编写的开源神经网络框架。它的安装快速且方便，并且支持 CPU 和 GPU 计算。目前，该库的 star 量高达 19.8k。

PyTorchGAN

项目地址：https://github.com/eriklindernoren/PyTorch-GAN

简介：PyTorchGAN 库由 Apple 公司的 ML 工程师 Erik Linder-Norén 创建，收集了论文中各种生成对抗网络（GAN）的 PyTorch 实现。创建者认为模型架构并不总是能够反映论文中提出的观点，所以他聚焦于获取论文的核心理念而不只是确保每个层配置都正确。不过遗憾的是，由于创建者没有时间维护，该库已经过时了。目前，该库的 star 量为 8.4k。

MMDetection

项目地址：https://github.com/open-mmlab/mmdetection

简介：MMDetection是基于 PyTorch 的开源目标检测工具箱，由香港中文大学多媒体实验室（Multimedia Laboratory）创建，是 OpenMMLab 项目的组成部分。该库始于 MMDet 团队（赢得 2018 COCO 挑战赛检测赛道）的代码库，之后逐渐发展成为一个涵盖很多流行检测方法和模块的统一平台。该库不仅包含训练和推理代码，而且提供有 200 多个网络模型的权重。目前，该库的 star 量高达 13.3k。

FairSeq

项目地址：https://github.com/pytorch/fairseq

简介：Fairseq 由 PyTorch 团队创建，是一个序列建模工具包，使得研究者和开发者能够训练用于翻译、摘要生成、语言建模和其他文本生成任务的自定义模型。目前，该库的 star 量高达 11k。

Gluon CV

项目地址：https://github.com/dmlc/gluon-cv

简介：GluonCV 由分布式机器学习社区（DMLC）创建，提供了计算机视觉领域 SOTA 深度学习模型的实现，旨在使工程师、研究者和学生能够基于这些模型快速 prototype 产品和研究思路。该库具有以下几种主要特性：提供训练脚本以复现论文 SOTA 结果；支持 PyTorch 和 MXNet；提供大量预训练模型以及显著降低实现复杂度的精心设计的 API；社区支持。目前，该库的 star 量为 4.5k。

Top 10 热门基准

ImageNet 数据集上的图像分类基准

top-1 和 top-5 准确率排名第一的均为谷歌大脑团队提出的元伪标签（Meta Pseudo Labels）半监督学习方法，其中 top-1 准确率为 90.2%，top-5 准确率为 98.8%。

基准地址：https://paperswithcode.com/sota/image-classification-on-imagenet
Meta Pseudo Labels 论文地址：https://arxiv.org/pdf/2003.10580v3.pdf

COCO test-dev 数据集上的目标检测基准

box AP 数值最高的是谷歌大脑团队提出 Cascade Eff-B7 NAS-FPN，在 COCO 实例分割任务上实现了 49.1 的 mask AP 和 57.3 的 box AP，分别比之前 SOTA 高出了 0.6 和 1.5。

基准地址：https://paperswithcode.com/sota/object-detection-on-coco
Cascade Eff-B7 NAS-FPN 论文地址：https://arxiv.org/pdf/2012.07177v1.pdf

Cityscapes test 数据集上的语义分割基准

Mean IoU 最高的是英伟达提出的 HRNet-OCR（分层多尺度注意力机制），在 Cityscapes test 数据集上取得了 85.1% 的 mIoU。

基准地址：https://paperswithcode.com/sota/semantic-segmentation-on-cityscapes

HRNet-OCR 论文地址：https://arxiv.org/pdf/2005.10821v1.pdf

CIFAR-10 数据集上的图像分类基准

Percentage Correct 指标排名第一的是谷歌研究院提出的 EffNet-L2 (SAM)，取得了 99.7% 的 SOTA 得分。

基准地址：https://paperswithcode.com/sota/image-classification-on-cifar-10
EffNet-L2 (SAM) 论文地址：https://arxiv.org/pdf/2010.01412v2.pdf

CIFAR-100 数据集上的图像分类基准

Percentage Correct 指标排名第一的依然是谷歌研究院提出的 EffNet-L2 (SAM)，取得了 96.08% 的 SOTA 得分。

基准地址：https://paperswithcode.com/sota/image-classification-on-cifar-100

PASCAL VOC 2012 test 数据集上的语义分割基准

Mean IoU 最高的是谷歌大脑团队提出的 EfficientNet-L2+NAS-FPN，在 PASCAL VOC 2012 test 数据集上取得了 90.5% 的 mIoU。

基准地址：https://paperswithcode.com/sota/semantic-segmentation-on-pascal-voc-2012
EfficientNet-L2+NAS-FPN 论文地址：https://arxiv.org/pdf/2006.06882v2.pdf

MPII Human Pose 数据集上的姿态估计基准

PCKH-0.5 最高的是三星 AI Center 提出的 Soft-gated Skip Connections，在 MPII Human Pose 数据集上取得了 94.1% 的 PCKH-0.5。

基准地址：https://paperswithcode.com/sota/pose-estimation-on-mpii-human-pose
Soft-gated Skip Connections 论文地址：https://arxiv.org/pdf/2002.11098v1.pdf

Market-1501 数据集上的行人重识别基准

mAP（Mean Average Precision）最高的是中山大学于 2018 年提出的 st-ReID，在 Market-1501 数据集上取得了 95.5% 的 mAP 和 98.0% 的 rank-1 准确率，均显著优于以往的 SOTA 方法。

基准地址：https://paperswithcode.com/sota/person-re-identification-on-market-1501
st-ReID 论文地址：https://arxiv.org/pdf/1812.03282v1.pdf

MNIST 数据集上的图像分类基准

准确率最高的是布鲁内尔大学联合布拉德利大学提出的 Branching/Merging CNN + Homogeneous Filter Capsules，在 MNIST 数据集上取得了 99.84 的 SOTA 准确率，同时 Percentage Error 也最低，为 0.16%。

基准地址：https://paperswithcode.com/sota/image-classification-on-mnist
Branching/Merging CNN + Homogeneous Filter Capsules 论文地址：https://arxiv.org/pdf/2001.09136v4.pdf

Human3.6M 数据集上的 3D 人体姿态估计基准

三星 AI Center 提出的 Learnable Triangulation of Human Pose 在该数据集上取得了最低的 Average MPJPE ——17.7 mm。

基准地址：https://paperswithcode.com/sota/3d-human-pose-estimation-on-human36m

Learnable Triangulation of Human Pose 论文地址：https://arxiv.org/pdf/1905.05754v1.pdf

参考链接：https://medium.com/paperswithcode/papers-with-code-2020-review-938146ab9658

发布于 02-15

内容创作者必备！Deepseek赋能，让创作更高效小焱创作 AI改变未来人工智能人工智能写作 ai写作深度学习神经网络 ai chatgpt
内容创作者必备！DeepSeek赋能，让创作更高效在当今信息爆炸的时代，内容创作已成为自媒体博主们展现才华、吸引粉丝的重要途径。然而，面对日益增长的竞争压力和不断变化的用户需求，如何高效、高质量地产出内容成为了摆在我们面前的一大挑战。幸运的是，随着人工智能技术的飞速发展，一款名为DeepSeek的智能工具应运而生，为内容创作者提供了强大的赋能。本文将深入探讨DeepSeek的基本概念、深层次解读、
开源模型应用落地-Qwen2-VL-7B-Instruct-vLLM-OpenAI API Client调用开源技术探险家开源大语言模型-新手试炼深度学习 AI编程 AIGC
一、前言学习Qwen2-VL，为我们打开了一扇通往先进人工智能技术的大门。让我们能够深入了解当今最前沿的视觉语言模型的工作原理和强大能力。这不仅拓宽了我们的知识视野，更让我们站在科技发展的潮头，紧跟时代的步伐。Qwen2-VL具有卓越的图像和视频理解能力，以及多语言支持等特性。学习它可以提升我们处理复杂视觉信息的能力，无论是在学术研究中分析图像数据、解读视频内容，还是在实际工作中进行文档处理、解决
ChatGPT、DeepSeek、Grok 三者对比：AI 语言模型的博弈与未来一ge科研小菜菜人工智能人工智能
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注1.引言随着人工智能技术的飞速发展，AI语言模型已经成为人机交互、内容创作、代码生成、智能问答等领域的重要工具。其中，ChatGPT（OpenAI）、DeepSeek（中国团队研发）和Grok（xAI，ElonMusk旗下公司）是当前三大具有代表性的AI语言模型。它们在技术架构、应用场景、用户体验、生态开放性等多个维度各具特色，并针对不同的用户需
【go从入门到精通】探秘struct结构体转json为什么需要首字母大写？前网易架构师-高司机 golang从入门到精通 golang json go 结构体首字母大写 golang从入门到精通 go从入门到精通
目录作者简介：问题抛出分析结论作者简介：高科，先后在IBMPlatformComputing从事网格计算，淘米网，网易从事游戏服务器开发，拥有丰富的C++，go等语言开发经验，mysql，mongo，redis等数据库，设计模式和网络库开发经验，对战棋类，回合制，moba类页游，手游有丰富的架构设计和开发经验。并且深耕深度学习和数据集训练，提供商业化的视觉人工智能检测和预警系统（煤矿，工厂，制造业
为什么转行大模型行业？深度解析职业变革与技术红利大模型入门教程大模型学习语言模型人工智能 AI 大模型程序员大模型入门
引言2023年ChatGPT的爆发式发展，标志着AI大模型技术正式进入大众视野。这一技术不仅重塑了人工智能的边界，更催生了全新的职业赛道。从传统算法工程师到互联网从业者，越来越多的人开始将目光投向大模型领域。本文将深入探讨这一现象背后的核心动因，并结合行业现状、技术趋势与职业发展路径，为从业者提供系统性分析。一、行业变革：传统岗位萎缩与大模型崛起传统技术岗位的困境以推荐算法为例，随着移动互联网流量
DeepSeek 与云原生后端：AI 赋能现代应用架构一ge科研小菜菜后端人工智能后端
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注1.引言在当今快速发展的互联网时代，云原生（CloudNative）架构已成为后端开发的主流趋势。云原生后端的核心目标是利用云计算的弹性、可扩展性和高可用性，为现代应用提供稳定可靠的后端支持。而人工智能（AI）技术的发展，使得智能化成为云原生后端的新趋势。DeepSeek作为新一代AI技术，在云原生后端的自动化运维、智能资源调度、安全增强和高效数
AI 大模型应用数据中心建设：高性能计算与存储架构 AI智能涌现深度研究 AI大模型应用入门实战与进阶 java python javascript kotlin golang 架构人工智能
AI大模型、数据中心、高性能计算、存储架构、分布式训练、GPU加速、数据管理1.背景介绍近年来，人工智能（AI）技术取得了飞速发展，特别是深度学习模型的突破性进展，催生了一系列基于大规模数据训练的强大AI模型，例如GPT-3、BERT、DALL-E等。这些AI大模型在自然语言处理、计算机视觉、语音识别等领域展现出强大的应用潜力，但也对计算资源和数据存储提出了极高的要求。传统的计算架构难以满足AI大
人工智能直通车系列24【机器学习基础】（机器学习模型评估指标（回归））浪九天人工智能直通车开发语言 python 机器学习深度学习神经网络人工智能
目录机器学习模型评估指标（回归）1.均方误差（MeanSquaredError,MSE）2.均方根误差（RootMeanSquaredError,RMSE）3.平均绝对误差（MeanAbsoluteError,MAE）4.决定系数（CoefficientofDetermination,R2）机器学习模型评估指标（回归）1.均方误差（MeanSquaredError,MSE）详细解释均方误差是回归问
国央企AI落地：以智能客服系统为突破口的详细实施方案探讨数商云网络 B2B系统数字化电商平台人工智能大数据架构 java 微服务 spring
一、引言随着人工智能（AI）技术的飞速发展和广泛应用，国央企作为国民经济的重要支柱，正积极探索AI技术在企业管理、业务运营等方面的应用。智能客服系统作为AI技术的一个重要应用领域，具有提升服务效率、增强用户体验、降低运营成本等显著优势，成为国央企AI落地的重要突破口。本文将详细探讨国央企如何以智能客服系统为突破口，实施AI技术的落地应用，并结合数商云在智能客服系统领域的实践经验，为国央企提供一套切
CSDN社区，到底该不该用DeepSeek AI生成文章？ Small踢倒coffee_氕氘氚 python 经验分享
##引言在当今数字化时代，人工智能（AI）技术正以惊人的速度发展，逐渐渗透到各个行业和领域。作为AI技术的一个重要分支，自然语言处理（NLP）在内容创作、文本生成等方面展现出了巨大的潜力。DeepSeekAI作为一款先进的AI写作工具，能够自动生成高质量的文章，极大地提高了内容创作的效率。然而，随着AI生成内容的普及，CSDN社区中的开发者、技术爱好者和内容创作者们开始思考一个问题：我们到底该不该
AI大模型从入门到精通，2025终极指南！好卷啊，又不能躺平，只能悄悄卷你们了！大模型教程人工智能大模型训练 LLM 知识库大模型大模型入门大模型学习
什么是AI大模型？AI大模型是指使用大规模数据和强大的计算能力训练出来的人工智能模型。这些模型通常具有高度的准确性和泛化能力，可以应用于各种领域，如自然语言处理、图像识别、语音识别等。为什么要学AI大模型？2024人工智能大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用，大模型作为其中的重要组成部分，正逐渐成为推动人工智能发展的重要引擎。大模型以其强大的数据处理和模式识别能力，广泛应用于
AI大模型学习路线：从入门到精通的完整指南【2025最新】 AI大模型-大飞人工智能学习大模型 LLM AI 程序员大模型学习
引言近年来，以GPT、BERT、LLaMA等为代表的AI大模型彻底改变了人工智能领域的技术格局。它们不仅在自然语言处理（NLP）任务中表现卓越，还在计算机视觉、多模态交互等领域展现出巨大潜力。本文旨在为开发者、研究者和技术爱好者提供一条清晰的学习路径，帮助读者逐步掌握大模型的核心技术并实现实际应用。一、基础阶段：构建知识体系数学与理论基础线性代数：矩阵运算、特征值与奇异值分解是大模型参数优化的基础
Python与Web 3.0：重新定义数字身份验证的未来 Echo_Wish Python！实战！python 前端开发语言
Python与Web3.0：重新定义数字身份验证的未来随着Web3.0的迅猛发展，传统的身份验证方式正面临越来越大的挑战。从依赖中心化服务器存储用户数据，到如今去中心化、用户掌控数据的新时代，身份验证系统经历了前所未有的变革。而作为一个人工智能、区块链和Python技术的深度爱好者，我认为Python将成为构建Web3.0身份验证系统的重要工具。今天，我们就来聊聊如何结合Python与Web3.0
大模型和数据要素赋能实体零售行业数字化转型建设和实施方案优享智库大模型数据要素数据治理数据仓库主数据零售
大模型和数据要素赋能实体零售行业数字化转型建设和实施方案更多参考公众号：优享智库引言项目背景与意义数字化转型目标与期望实施方案概述零售行业现状及挑战实体零售行业现状数字化转型面临的挑战市场需求与趋势分析大模型与数据要素赋能策略大模型技术及应用场景数据要素采集、整合与治理赋能策略制定与实施路径数字化转型关键技术与解决方案人工智能技术及应用大数据分析与挖掘技术云计算、物联网等技术支持定制化解决方案设计
从LLM出发：由浅入深探索AI开发的全流程与简单实践（全文3w字）码事漫谈 AI 人工智能
文章目录第一部分：AI开发的背景与历史1.1人工智能的起源与发展1.2神经网络与深度学习的崛起1.3Transformer架构与LLM的兴起1.4当前AI开发的现状与趋势第二部分：AI开发的核心技术2.1机器学习：AI的基础2.1.1机器学习的类型2.1.2机器学习的流程2.2深度学习：机器学习的进阶2.2.1神经网络基础2.2.2深度学习的关键架构2.3Transformer架构：现代LLM的核
我们的AI人工智能，自动发布了一篇假新闻…… 数据断案数据人的故事人工智能数据库 sql oracle 数据分析
今天这个故事，还得从一个事故开始说起。前些日子，我们被XX公司投诉，说我们的资讯发布了关于他们公司授信额度的不实报道：告诉我们这篇资讯与他们公司最新公开披露的数据不一致，相关内容并不属实，可能对广大网友们造成严重误导，并对他们公司造成了严重负面影响……balabala一堆指责，并要求我们3小时内删除全部相关信息。然后，他们丢了2篇公告附件过来。我们对照着仔细一看，还真是我们搞错了：由于数据错误，“
深入解析两大AI模型的架构与功能草莓屁屁我不吃人工智能 chatgpt
在人工智能（AI）领域，自然语言处理（NLP）一直是研究的热点之一。随着技术的不断进步，我们见证了从简单的聊天机器人到复杂语言模型的演变。其中，Google的Gemini和OpenAI的ChatGPT作为两大代表性模型，各自在技术和应用上展现出了卓越的性能。本文将详细解析Gemini和ChatGPT的系统架构、功能特性及其背后的技术原理。Gemini模型详解技术背景与架构Gemini，顾名思义，意
建立高质量个人数据库：解锁DeepSeek的关键 CodeJourney. 人工智能算法 python
在人工智能飞速发展的时代，DeepSeek为普通人处理数据、提升工作效率带来了新的可能。然而，很多人在使用过程中存在误区，本文围绕如何正确利用DeepSeek搭建高质量个人数据库展开探讨，强调其对个人成长和发展的重要性，并通过具体实例展示其强大功能。重新理解DeepSeekDeepSeek的普及使普通人能够轻松搭建个人数据库，但不少人在使用时存在错误认知。他们将DeepSeek视为主角，把杂乱无章
如何减少跨团队交付摩擦？——基于 DevOps 与敏捷的最佳实践网罗开发实战实战源码 devops 运维
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
展望 AIGC 前景：通义万相 2.1 与蓝耘智算平台共筑 AI 生产力高地 accurater AIGC 人工智能神经网络深度学习
喜欢可以到主页订阅专栏引言人工智能生成内容（AIGC）技术正在重塑内容创作、影视制作、广告设计等行业的底层逻辑。作为该领域的革命性技术代表，通义万相2.1凭借其开源特性、多模态生成能力和技术突破，成为全球视频生成模型的标杆。而蓝耘智算平台则通过高性能算力支持与分布式架构优化，为AIGC技术的规模化应用提供了基础设施保障。两者的协同不仅推动了AI生产力的跃迁，更开启了从技术研发到商业落地的全链条创新
Python编码系列—Python代码重构：提升代码质量学步_技术 Python编码 python 重构开发语言
欢迎来到我的技术小筑，一个专为技术探索者打造的交流空间。在这里，我们不仅分享代码的智慧，还探讨技术的深度与广度。无论您是资深开发者还是技术新手，这里都有一片属于您的天空。让我们在知识的海洋中一起航行，共同成长，探索技术的无限可能。探索专栏：学步_技术的首页——持续学习，不断进步，让学习成为我们共同的习惯，让总结成为我们前进的动力。技术导航：人工智能：深入探讨人工智能领域核心技术。自动驾驶：分享自动
【人工智能】Model Context Protocol (MCP) 是一个开放协议，标准化了应用程序向大型语言模型（LLMs）提供上下文的方式本本本添哥 013 -AIGC 人工智能大模型人工智能语言模型 php
一、ModelContextProtocol(MCP)概述MCP，ModelContextProtocolMCP，是一个开放协议。MCP，标准化了应用程序向大型语言模型（LLMs）提供上下文的方式。‌MCP，旨在标准化应用程序如何为大型语言模型（LLM）提供上下文信息。MCP，提供了一个标准的接口，使得LLM可以无缝集成各种外部数据源和工具，从而扩展其能力和应用场景。二、MCP的定义和作用MCP定
从零开始大模型开发与微调：PyCharm的下载与安装 AI天才研究院 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
从零开始大模型开发与微调：PyCharm的下载与安装1.背景介绍随着人工智能和深度学习技术的不断发展,大型语言模型(LargeLanguageModels,LLMs)已经成为当前最引人注目的研究热点之一。LLMs能够在各种自然语言处理任务上展现出惊人的性能,例如机器翻译、文本生成、问答系统等。PyTorch和TensorFlow等深度学习框架为训练和微调大型语言模型提供了强大的支持。PyCharm
PyTorch从入门到精通：探索深度学习新境界 lmtealily 深度学习 pytorch 人工智能
引言PyTorch作为当前最受欢迎的深度学习框架之一，凭借其动态计算图的独特设计和与Python生态的无缝集成，正重塑着人工智能开发的新范式1。从NVIDIA的研究实践到Meta的产业应用，PyTorch的价值已渗透至学术研究、工业部署的每个角落。本文将带领您从张量操作基础开始，逐步探索GPU加速、动态图机制、框架生态集成等高级主题，最终实现理论与实战的双重突破。一、PyTorch核心基础构建1.
【Python】已解决：pip安装第三方模块（库）与PyCharm中不同步的问题（PyCharm添加本地python解释器）屿小夏 python pip pycharm
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
【AI大模型智能应用】Deepseek生成测试用例柳柳的博客 AI大模型测试用例
在软件开发过程中，测试用例的设计和编写是确保软件质量的关键。然而，软件系统的复杂性不断增加，手动编写测试用例的工作量变得异常庞大，且容易出错。DeepSeek基于人工智能和机器学习，它能够依据软件的需求和设计文档，自动生成高质量的测试用例，显著减轻人工编写测试用例的负担。体验一把用DeepSeek编写测试用例，还生成清晰直观的思维导图，整个流程十分顺畅。这篇文章讲解如何使用deepseek生成功能
人工智能之数学基础:线性代数中矩阵的初印象每天五分钟玩转人工智能机器学习深度学习之数学基础线性代数人工智能矩阵机器学习深度学习
本文重点从本篇文章开始，我们将开始学习矩阵的概念，矩阵，作为线性代数的核心概念之一，就像是一个个精心编织的网格，将复杂的数据和关系以一种简洁而直观的方式呈现出来。矩阵矩阵的初印象想象一下，你手里有一张空白的表格，上面布满了等待填充的格子。这些格子按照行和列整齐排列，形成了一个二维的平面结构。如果我们把数字、符号或者更复杂的元素填入这些格子中，那么这个表格就变成了一个“矩阵”。简单来说，矩阵就是一个
人工智能第五次笔记（python运算符）吴小白！笔记 python 开发语言
一.运算符运算符用于执行某种操作并返回一个结果，Python中的运算符可以分为：算数运算符，比较运算符，逻辑运算符，赋值运算符，位运算符，身份运算符，成员运算符，三目运算符八种1.1算数运算符用于执行基本的数学运算1.1.1常见的算数运算符+：加法-：减法*：乘法/：除法%：取模（取余数）**：幂运算//：整除（取整数部分）x1=5x2=2x3=(1,2)#元组x4=(3,4)x5=[1,2]x6
【人工智能基础2】机器学习、深度学习总结 roman_日积跬步-终至千里人工智能习题人工智能机器学习深度学习
文章目录一、人工智能关键技术二、机器学习基础1.监督、无监督、半监督学习2.损失函数：四种损失函数3.泛化与交叉验证4.过拟合与欠拟合5.正则化6.支持向量机三、深度学习基础1、概念与原理2、学习方式3、多层神经网络训练方法一、人工智能关键技术领域基础原理与逻辑机器学习机器学习基于数据，研究从观测数据出发寻找规律，利用这些规律对未来数据进行预测。基于学习模式，机器学习可以分为监督、无监督、强化学习
一文搞懂 AI Agent 与 AI 大模型的区别 a小胡哦人工智能 Manus Ai agent
在人工智能蓬勃发展的当下，新术语和新技术层出不穷。AIAgent和AI大模型便是其中的“明星”，但不少人对它们的区别感到困惑。今天，我们就以Manus这类AIAgent为例，深入剖析AIAgent与一般AI大模型的不同之处。Manus：Manus定义与核心能力AI大模型AI大模型是基于深度学习架构，通过海量数据训练得到的复杂模型，像GPT-4、文心一言等。它们具备强大的知识储备和语言理解生成能力，
VMware Workstation 11 或者 VMware Player 7安装MAC OS X 10.10 Yosemite iwindyforest vmware mac os 10.10 workstation player
最近尝试了下VMware下安装MacOS 系统，安装过程中发现网上可供参考的文章都是VMware Workstation 10以下， MacOS X 10.9以下的文章，只能提供大概的思路，但是实际安装起来由于版本问题，走了不少弯路，所以我尝试写以下总结，希望能给有兴趣安装OSX的人提供一点帮助。写在前面的话：其实安装好后发现，由于我的th
关于《基于模型驱动的B/S在线开发平台》源代码开源的疑虑？ deathwknight JavaScript java 框架
本人从学习Java开发到现在已有10年整，从一个要自学 java买成javascript的小菜鸟，成长为只会java和javascript语言的老菜鸟（个人邮箱：[email protected]）一路走来，跌跌撞撞。用自己的三年多业余时间，瞎搞一个小东西（基于模型驱动的B/S在线开发平台，非MVC框架、非代码生成）。希望与大家一起分享，同时有许些疑虑，希望有人可以交流下平台
如何把maven项目转成web项目 Kai_Ge maven MyEclipse
创建Web工程，使用eclipse ee创建maven web工程 1.右键项目,选择Project Facets,点击Convert to faceted from 2.更改Dynamic Web Module的Version为2.5.(3.0为Java7的,Tomcat6不支持). 如果提示错误,可能需要在Java Compiler设置Compiler compl
主管？？？ Array_06 工作
转载：http://www.blogjava.net/fastzch/archive/2010/11/25/339054.html 很久以前跟同事参加的培训，同事整理得很详细，必须得转！前段时间，公司有组织中高阶主管及其培养干部进行了为期三天的管理训练培训。三天的课程下来，虽然内容较多，因对老师三天来的课程内容深有感触，故借着整理学习心得的机会，将三天来的培训课程做了一个
python内置函数大全 2002wmj python
最近一直在看python的document，打算在基础方面重点看一下python的keyword、Build-in Function、Build-in Constants、Build-in Types、Build-in Exception这四个方面，其实在看的时候发现整个《The Python Standard Library》章节都是很不错的，其中描述了很多不错的主题。先把Build-in Fu
JSP页面通过JQUERY合并行 357029540 JavaScript jquery
在写程序的过程中我们难免会遇到在页面上合并单元行的情况，如图所示如果对于会的同学可能很简单，但是对没有思路的同学来说还是比较麻烦的，提供一下用JQUERY实现的参考代码 function mergeCell(){ var trs = $("#table tr"); &nb
Java基础冰天百华 java基础
学习函数式编程 package base; import java.text.DecimalFormat; public class Main { public static void main(String[] args) { // Integer a = 4; // Double aa = (double)a / 100000; // Decimal
unix时间戳相互转换 adminjun 转换 unix 时间戳
如何在不同编程语言中获取现在的Unix时间戳(Unix timestamp)？ Java time JavaScript Math.round(new Date().getTime()/1000) getTime()返回数值的单位是毫秒 Microsoft .NET / C# epoch = (DateTime.Now.ToUniversalTime().Ticks - 62135
作为一个合格程序员该做的事 aijuans 程序员
作为一个合格程序员每天该做的事 1、总结自己一天任务的完成情况最好的方式是写工作日志，把自己今天完成了什么事情，遇见了什么问题都记录下来，日后翻看好处多多 2、考虑自己明天应该做的主要工作把明天要做的事情列出来，并按照优先级排列，第二天应该把自己效率最高的时间分配给最重要的工作 3、考虑自己一天工作中失误的地方，并想出避免下一次再犯的方法出错不要紧，最重
由html5视频播放引发的总结 ayaoxinchao html5 视频 video
前言项目中存在视频播放的功能，前期设计是以flash播放器播放视频的。但是现在由于需要兼容苹果的设备，必须采用html5的方式来播放视频。我就出于兴趣对html5播放视频做了简单的了解，不了解不知道，水真是很深。本文所记录的知识一些浅尝辄止的知识，说起来很惭愧。视频结构本该直接介绍html5的<video>的，但鉴于本人对视频
解决httpclient访问自签名https报javax.net.ssl.SSLHandshakeException: sun.security.validat bewithme httpclient
如果你构建了一个https协议的站点，而此站点的安全证书并不是合法的第三方证书颁发机构所签发，那么你用httpclient去访问此站点会报如下错误 javax.net.ssl.SSLHandshakeException: sun.security.validator.ValidatorException: PKIX path bu
Jedis连接池的入门级使用 bijian1013 redis redis数据库 jedis
Jedis连接池操作步骤如下： a.获取Jedis实例需要从JedisPool中获取； b.用完Jedis实例需要返还给JedisPool； c.如果Jedis在使用过程中出错，则也需要还给JedisPool； packag
变与不变 bingyingao 不变变亲情永恒
变与不变周末骑车转到了五年前租住的小区，曾经最爱吃的西北面馆、江西水饺、手工拉面早已不在，各种店铺都换了好几茬，这些是变的。三年前还很流行的一款手机在今天看起来已经落后的不像样子。三年前还运行的好好的一家公司，今天也已经不复存在。一座座高楼拔地而起，
【Scala十】Scala核心四：集合框架之List bit1129 scala
Spark的RDD作为一个分布式不可变的数据集合，它提供的转换操作，很多是借鉴于Scala的集合框架提供的一些函数，因此，有必要对Scala的集合进行详细的了解 1. 泛型集合都是协变的，对于List而言，如果B是A的子类，那么List[B]也是List[A]的子类，即可以把List[B]的实例赋值给List[A]变量 2. 给变量赋值(注意val关键字，a，b
Nested Functions in C bookjovi c closure
Nested Functions 又称closure，属于functional language中的概念，一直以为C中是不支持closure的，现在看来我错了，不过C标准中是不支持的，而GCC支持。既然GCC支持了closure，那么 lexical scoping自然也支持了，同时在C中label也是可以在nested functions中自由跳转的
Java-Collections Framework学习与总结-WeakHashMap BrokenDreams Collections
总结这个类之前，首先看一下Java引用的相关知识。Java的引用分为四种：强引用、软引用、弱引用和虚引用。强引用：就是常见的代码中的引用，如Object o = new Object();存在强引用的对象不会被垃圾收集
读《研磨设计模式》-代码笔记-解释器模式-Interpret bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 解释器（Interpreter）模式的意图是可以按照自己定义的组合规则集合来组合可执行对象 * * 代码示例实现XML里面1.读取单个元素的值 2.读取单个属性的值 * 多
After Effects操作&快捷键 cherishLC After Effects
1、快捷键官方文档中文版：https://helpx.adobe.com/cn/after-effects/using/keyboard-shortcuts-reference.html 英文版：https://helpx.adobe.com/after-effects/using/keyboard-shortcuts-reference.html 2、常用快捷键
Maven 常用命令 crabdave maven
Maven 常用命令 mvn archetype:generate mvn install mvn clean mvn clean complie mvn clean test mvn clean install mvn clean package mvn test mvn package mvn site mvn dependency:res
shell bad substitution daizj shell 脚本
#!/bin/sh /data/script/common/run_cmd.exp 192.168.13.168 "impala-shell -islave4 -q 'insert OVERWRITE table imeis.${tableName} select ${selectFields}, ds, fnv_hash(concat(cast(ds as string), im
Java SE 第二讲（原生数据类型 Primitive Data Type） dcj3sjt126com java
Java SE 第二讲： 1. Windows: notepad, editplus, ultraedit, gvim Linux: vi, vim, gedit 2. Java 中的数据类型分为两大类： 1）原生数据类型（Primitive Data Type） 2）引用类型（对象类型）（R
CGridView中实现批量删除 dcj3sjt126com PHP yii
1，CGridView中的columns添加 array( 'selectableRows' => 2, 'footer' => '<button type="button" onclick="GetCheckbox();" style=&
Java中泛型的各种使用 dyy_gusi java 泛型
Java中的泛型的使用：1.普通的泛型使用在使用类的时候后面的<>中的类型就是我们确定的类型。 public class MyClass1<T> {//此处定义的泛型是T private T var; public T getVar() { return var; } public void setVa
Web开发技术十年发展历程 gcq511120594 Web 浏览器数据挖掘
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
openSession()与getCurrentSession()区别： hetongfei java DAO Hibernate
来自 http://blog.csdn.net/dy511/article/details/6166134 1.getCurrentSession创建的session会和绑定到当前线程,而openSession不会。 2. getCurrentSession创建的线程会在事务回滚或事物提交后自动关闭,而openSession必须手动关闭。这里getCurrentSession本地事务(本地
第一章安装Nginx+Lua开发环境 jinnianshilongnian nginx lua openresty
首先我们选择使用OpenResty，其是由Nginx核心加很多第三方模块组成，其最大的亮点是默认集成了Lua开发环境，使得Nginx可以作为一个Web Server使用。借助于Nginx的事件驱动模型和非阻塞IO，可以实现高性能的Web应用程序。而且OpenResty提供了大量组件如Mysql、Redis、Memcached等等，使在Nginx上开发Web应用更方便更简单。目前在京东如实时价格、秒
HSQLDB In-Process方式访问内存数据库 liyonghui160com
HSQLDB一大特色就是能够在内存中建立数据库，当然它也能将这些内存数据库保存到文件中以便实现真正的持久化。先睹为快！下面是一个In-Process方式访问内存数据库的代码示例：下面代码需要引入hsqldb.jar包（hsqldb-2.2.8） import java.s
Java线程的5个使用技巧 pda158 java 数据结构
Java线程有哪些不太为人所知的技巧与用法？　　萝卜白菜各有所爱。像我就喜欢Java。学无止境，这也是我喜欢它的一个原因。日常工作中你所用到的工具，通常都有些你从来没有了解过的东西，比方说某个方法或者是一些有趣的用法。比如说线程。没错，就是线程。或者确切说是Thread这个类。当我们在构建高可扩展性系统的时候，通常会面临各种各样的并发编程的问题，不过我们现在所要讲的可能会略有不同。
开发资源大整合：编程语言篇——JavaScript（1） shoothao JavaScript
概述：本系列的资源整合来自于github中各个领域的大牛，来收藏你感兴趣的东西吧。程序包管理器管理javascript库并提供对这些库的快速使用与打包的服务。 Bower - 用于web的程序包管理。 component - 用于客户端的程序包管理，构建更好的web应用程序。 spm - 全新的静态的文件包管
避免使用终结函数 vahoa.ma java jvm C++
终结函数（finalizer）通常是不可预测的，常常也是很危险的，一般情况下不是必要的。使用终结函数会导致不稳定的行为、更差的性能，以及带来移植性问题。不要把终结函数当做C++中的析构函数（destructors）的对应物。我自己总结了一下这一条的综合性结论是这样的： 1）在涉及使用资源，使用完毕后要释放资源的情形下，首先要用一个显示的方

2020年，那些「引爆」了ML社区的热门论文、库和基准

你可能感兴趣的:(人工智能)