fiersies

CVPR 2018 | 8篇论文、10+Demo、双项挑战赛冠军，旷视科技掀起CVPR产学研交流热潮

第 31 届计算机视觉和模式识别大会 CVPR 2018（Conference on Computer Vision and Pattern Recognition）在 6 月 18 日至 22 日于美国盐湖城召开。雷锋网 AI 科技评论作为唯一申请媒体通道的参会媒体，对 CVPR 2018 进行了全程专题报道，为国内读者带来更多的现场一手信息。

近年来，随着深度学习的蓬勃发展，国内企业深度参与人工智能学术顶会的态势十分火热，在一个享有国际声誉的、被全球学者所认可的学术会议上发出自己独特的声音，不仅是目前工业界涉足人工智能学术研究的一种展现形式，更是国内外企业在吸引、招募研发人才的「兵家必争之地」。

8 篇论文被 CVPR 收录，多项技术展现研究实力

CVPR 既然是人工智能计算机视觉领域最受关注的学术会议，论文的投递与收录自然是展现企业学术实力的一项「硬指标」。据了解，今年 CVPR 2018 共有 979 篇论文被主会收录，录用率约为 29%。而在众多来自工业界的论文中，成立于 2011 年的旷视科技今年在 CVPR 上共有 1 篇 spotlight 论文及 7 篇 poster 论文被主会收录。包括 ShuffleNet 移动端低功耗设备模型、语义分割的判别特征网络 DFN、优化解决密集遮挡问题的 RepLoss 、通过角点定位和区域分割检测场景文本的全新算法，以及能复原扭曲文档图像的 DocUNet 等多项技术，向与会学者们展现了他们在学术研究上的实力。

例如，判别特征网络 DFN 有效解决了语义分割的两个基本问题——类内不一致与类间无差别。新型损失函数 RepLoss 有效处理了行人检测中密集遮挡的难题。

DFN一作余昌黔与poster合影

RepLoss一作王鑫龙与poster合影

此外，还有两篇挑战赛冠军论文——人体姿态估计（CPN）及 COCO 2017 物体检测相关赛事的算法(MegDet)解读，也同样被 CVPR 2018 收录。

级联金字塔网络 CPN 以解决多人姿态估计问题，这一技术突破将促进人体姿态估计相关应用领域的发展，比如游戏动画、安防（异常行为检测等）和体育（裁判辅助等）。

MegDet 从 mini-batch 角度为加速深度神经网络的训练提供了一种新型检测方法，从精度和速度两个核心维度优化了物体检测技术，可以直接应用在安防、新零售和无人驾驶等领域。

MegDet作者与poster合影

「盐湖城 AI 之夜」，CV青年学者交流会

在主会议的前一天晚上，旷视科技于现场召开了「盐湖城 AI 之夜」，联合 Altizure 与叠境科技举办了一场计算机视觉青年学者交流会。旷视科技首席科学家、旷视研究院院长孙剑，旷视科技西雅图研究院长王珏，香港科技大学教授权龙及上海科技大学教授、叠境科技创始人虞晶怡出席了本次交流会，同时吸引了超过 250 名参会者。

孙剑博士在盐湖城 AI 之夜作开场致辞

孙剑博士首先代表旷视科技欢迎与会的老师同学们，并简要介绍了旷视科技目前的发展现状及举办青年学者交流会的目的。如何既做好基础研究，也做好产品技术？孙剑博士引用了大学自动控制老师的教导：既做神，也做鬼。既要脚踏实地，又要仰望星空，一家企业的基础研究建设绝非一朝一夕所能达成，它也将为产品的落地提供扎实的技术实力。王珏博士、权龙教授和虞晶怡教授也相继上台发表讲话。现场不仅有堪称本届CVPR最为美味的点心，还有各种品类的美酒供与会者享用，更重要的是，现场还进行了激动人心的抽奖环节。

这位获得一等奖的Phantom3SE 无人机套装的小哥哥已经乐得合不拢嘴

在孙剑博士看来，论文并不是工业界做研究的必然结果。以去年 7 月就已经被大家熟悉并被业界广泛使用的 ShuffleNet 为例，对于企业而言，不论是否有论文产出的需求，如何设计更为轻量级的模型结构一直是移动端应用落地的重要问题。因此，旷视科技团队以高效卷积层设计减少计算复杂度的方式，提升了内存访问效率和计算速度。在去年完成这一论文并投递 CVPR 2018 后，团队也并没有止步于此，早在 VALSE 2018 上已对 V2 版本有所披露。（超链接）

但是，产业界的研究与做学术研究其实也有着共通之处，在孙剑博士的理解中都会遵循某种 pattern：先从精度入手以探寻认知边界，再进一步考虑速度和效率因素，最终达成一个超过产品实用红线的平衡点。本次旷视科技举办「盐湖城 AI 之夜」，旨在吸引更多对计算机视觉、对AI感兴趣的志同道合者齐聚一堂，并在招贤纳才上提供更多的交流途径。

视频语义&自动驾驶，旷视斩获双料冠军

在今年 CVPR 2018 上，旷视科技也分别在两项挑战赛上斩获单项双料冠军——AVA 和 WAD。旷视科技累计获得过 15 项人工智能技术评测冠军，早在 2013 年 12 月便成为了世界上首个拿到人脸识别三项世界冠军的公司，并在 2017 年 10 月成为首个拿下 COCO、Places 全球图像识别大赛三项冠军的国内公司。

今年在 CVPR workshop上已举办至第三届的 ActivityNet Challenge（ActivityNet Large-Scale Activity Recognition Challenge）旨在进一步拓展视频语义理解的边界。其中的 Task B——时空行为定位（Spatio-temporal Action Localization）依据 AVA 数据集，试图评估算法对人类行为时空信息的定位能力，其中每个标注的视频片段连续且超过 15 分钟，包含多个主体，每个主体有多个行为；在 #1 (Vision Only) 以及 #2 (Full) 两个挑战赛中，旷视科技均获得第一名。

旷视科技 Research Leader、Detection 组负责人俞刚博士介绍，这一任务将动作细化到了原子级别，需要在任务中判断人类行为主体的位置，发生了哪些动作，又与其它物体/其它人发生了哪些交互。行为时空信息的定位能力在视频分析上有着非常大的意义。

WAD（Workshop on Autonomous Driving）同样是一项由 CVPR 2018 workshop 主办的自动驾驶识别挑战赛，其中的 Task 4 ——实例视频分割（Instance-level Video Segmentation）要求参赛者在一帧之内实现对移动物体（比如汽车和行人）实例级别的分割。这一赛事基于百度提供的标注精良的大规模数据集 ApolloScape，该数据集已经开放了 14.7 万帧的像素级语义标注图像，包括感知分类和路网数据等数十万帧逐像素语义分割标注的高分辨率图像数据，以及与其对应的逐像素语义标注，并将进一步涵盖更复杂的环境、天气和交通状况，添加更多的传感器来扩充数据的多样性。按照百度 Apollo 方面的说法，ApolloScape 的标注精细度已经超过同类型的 KITTI、Cityscapes 数据集，也超过 UC Berkley 最新发布的 BDD100K 数据集。

俞刚博士和在旷视科技实习的清华大学博士生黎泽明表示，尽管旷视科技目前并无涉足自动驾驶领域，但团队本次参加自动驾驶相关的挑战赛有两个主要目的。一个是验证自身算法的能力，测试在不同应用场景下的算法通用性；另一方面则是检验自身对算法的掌握性。而本次获得双料冠军，也印证了旷视科技在技术上的积累与对算法应用于不同场景的良好掌控。

好玩有趣的 10+实时 Demo，彰显 CV 威力

自然地，在一个聚集 6500 多名计算机视觉人才的学术顶会上，如何在现场更好地呈现自己的技术也成为了每个企业需要面临的命题。作为钻石赞助商的旷视科技也一口气展出了 10 余个 demo 正如孙剑博士所言：「做计算机视觉最好玩的就是可以做很多好看、好玩、好用的黑科技。」

除了艾瑞思 VSLAM 的仓储机器技术是唯一的演示视频，「街头霸王对打」出于场地和网络延迟的考虑也采用了视频演示的方式之外，旷视科技本次在 CVPR 2018 上的其它所有 demo 均是实时演示，以更好地与现场的与会者进行互动，而在体验的过程中，大家也能充分感受到旷视对于技术的一份实力和自信。

孙剑博士介绍道，「计算机视觉的真正威力在于线下场景的实时系统中。旷视本次带过来的一些 demo 都是组里觉得比较好玩，又具有实际意义的项目。像街头霸王这个 demo，也是两个星期前同事们测试完成的，用户可以借助肢体动作，实时控制街头霸王游戏中角色的操作。它的背后其实应用了人体检测（Human Detection）、多人姿态估计（Multi-Person Pose Estimation）和实时动作识别（Real-time Action Recognition）等多种技术，未来在零售、安防等领域都具有非常多的实际应用意义。」

艾瑞思（Ares）仓储机器人的 demo 视频演示了旷视 SLAM 机器人的技术与应用场景，在建图、定位、导航、避障等功能上，能够创建室内高精地图，拥有鲁棒精确的实时定位并能实时进行柔性行人避障，在物流、工业制造、新零售领域具有广泛应用前景。

艾瑞思（Ares）仓储机器人 demo

密集场景人群检测数据集 CrowdHuman 于今年 5 月开源，为密集场景下的检测难题提供了具有价值的研究工作。据俞刚博士表示，在密集场景之下做检测是一项非常有挑战、有实际需求的工作， CrowdHuman 数据集正是为此而生。这个 benchmark 的特点是主要做行人检测，一方面，数据标注涵盖头部位置，人体的可见框和完整框，并且人框与头框之间有绑定关系；另一方面，该数据集具有一定的泛化能力，包括 Caltech、CityPerson 和 COCO 。

本次在 CVPR 上展示的 Demo 算法基于特征金字塔网络 FPN，在 CrowdHuman 数据集上训练，使用了 Repulsion Loss 和一些其他目前还没有公开的方法（主要是为了解决 NMS 带来的瓶颈）。可以看到，在会场这种密集人群的典型场景下，系统的表现相当不错。

除了密集场景人类检测数据集 CrowdHuman外，非标准化商品智能收银和 CVPR 论文作者识别两个 demo 本次也在 CVPR 2018 上呈现。

旷视南京研究院带来的智能辅助收银解决了通常需要人工结算的非标准化商品的收银问题。以面包店为例的 demo 场景可以在确保精度的同时大幅提升结算效率。此外，该系统可轻易扩展到其它非标品收银的应用中，将成为辅助非标准化商品收银的 AI 利器。

「CVPR 作者识别」是为本次大会专门定制的 Koala 系统应用案例（Koala 是一款由旷视科技研发的智能迎宾机器人），通过使用 Google Scholar、Twitter 上的作者公开信息为底库，当人脸出现在摄像头可视范围内时，Koala 将自动检测出视频中的人脸并提取人脸特征。若被摄者是会议作者之一，姓名、H-index 以及本次会议发表的代表性论文将会展示在弹出卡片上。

「智能辅助收银」和「CVPR 作者识别」demo

在展会现场，雷锋网还看到了旷视科技带来的众多移动端 demo。像移动端实时通用物体和人体关键点检测这两个 demo，在精度与速度上都推动了产业化落地的速度，未来有期在各种场景的检测上发挥作用。

移动端实时通用物体和人体关键点检测 demo

再比如目前已经应用在数十款安卓手机的人脸实时解锁技术，融合识别、活体检测、注意力判断等多项技术的这一功能可以帮助手机在安全情境下进行高效自然解锁。

而 Animoji 是一款基于深度学习的三维重建应用，能将人类表情进行实时分析，并转移到可爱的卡通形象中，可应用于实时视频聊天、表情包制作等多项功能。

Animoji demo

此外，还有以手机背景虚化和手机人像光效技术为代表的移动端「黑科技」，目前都是北京研究院与西雅图研究院联合研发的工作。西雅图研究院负责人王珏表示，从去年一直到未来相当长一段时间，西雅图研究院的主要工作会集中在移动端，特别是手机方面。

手机所面临的人工智能相关命题主要有两方面，一个是安全，即解锁、支付等相关功能，涉及人脸识别、活体检测等功能；另一个是影像，即美颜、滤镜等图像视频处理需求，涵盖三维重建、图像分割等工作。

作为前美国 Adobe 研究院首席科学家，王珏博士在去年 5 月加入旷视科技之后，旷视也开始更多涉及影像领域的研究。手机作为一个复杂性极高的计算机系统，如何充分挖掘它的计算资源，这也对模型的性能及功耗提出了更高的要求。而在研发的过程中，王珏博士也深刻体会到旷视科技的扁平化管理在异地协作的高效率，让沟通和决策变得非常快速，这也让曾经囿于大公司冗长流程的他感到惊喜不已。

重视基础研究，追求「简单实用」

对于一个研发人员占比超过 50% 的企业，旷视科技密切关注研究体系的建设与投入。自2017 年起，从体系架构和学术合作领域向全球范围延伸。旷视科技先后在美国西雅图、南京及成都设立了研究分院，由孙剑博士统领，王珏任西雅图研究院负责人；在研究领域上，每个研究分院各有侧重和分工：如西雅图研究院注重北美市场的开拓，同时独立承担创新业务的研发；南京研究院和成都研究院则分别围绕金融智能（特别是智能零售）和智慧城市（重点关注智能仓储）业务线展开基础研发和产业落地的工作。

此外，与高校机构保持密切合作也同样成为旷视科技深化学术研究的一大途径。同样是在 2017 年开始，旷视先后与西安交通大学、香港科技大学、上海科技大学等高校建立人工智能联合实验室；并在 2017 年成立学术委员会，由图灵奖国内唯一得主姚期智院士担任首席顾问。

创业公司为何要做基础研究，在孙剑博士的理解中包括两个方面的原因：首先是自我实现，研究员如果发现了一个具有创新性的突破点，那么在发现的那一刻便已经得到了最大的满足感；其次是外部认可，在学术会议上发表论文、或是将产品落地到实际应用上，会让更多的人看到并认可你的想法，得到又一次的正向反馈。

「旷视是一家有追求的公司。这个追求包含两个方面的含义，一个是，团队的每个人都希望能做最顶尖的技术；另一个是，企业在商业化落地能脚踏实地，产品可以真正为用户带来价值。」王珏博士认为，从更长远的角度来看，旷视科技不仅希望在 AI 领域，更希望能在整个科技领域成为重要的助推者甚至是领导者。「为了人工智能终将创造的所有美好」，也是旷视科技对这一信念的最佳诠释。

「追求极致，简单可靠」，是旷视科技一直以来秉承的研究价值观。不论是理论还是算法，孙剑博士及其团队都希望能做出一些简单而实用的工作，也为吸引具有同样价值观的人才埋下注脚。「在创新的过程中，自我实现所带来的价值会不断地激励整个团队往前走，而外部的认可又会吸引更多的群体加入旷视科技，形成良性循环。」孙剑博士如是说。在本次 CVPR 2018 上，凭借 8 篇论文、10+ Demo、双料挑战赛冠军经验分享，加上同期的 CV 线下分享交流会，旷视科技向 6000 名 CVPR 2018 学者们带来了一场产学研紧密融合的盛宴，相信在未来，旷视也会持续向用户们带来更多精彩的最新落地成果，吸引更多的青年学生们加入这个务实求真的团队当中。

不同行业的 AI 数据安全与合规实践：7 大核心要点全解析观熵人工智能 DeepSeek 私有化部署
不同行业的AI数据安全与合规实践：7大核心要点全解析关键词AI数据安全、行业合规、私有化部署、数据分类分级、国产大模型、隐私保护、DeepSeek部署摘要随着国产大模型在金融、医疗、政务、教育等关键领域的深入部署，AI系统对数据安全与行业合规提出了更高要求。本文结合DeepSeek私有化部署实战，系统梳理当前各行业主流的数据安全合规标准与落地策略，从数据分类分级、访问控制、审计追踪到敏感信息识别与
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
AI MCP教程之什么是 MCP？利用本地 LLM 、MCP、DeepSeek 集成构建您自己的 AI 驱动工具知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 mcp deepseek
介绍利用模型上下文协议(MCP)的工具吸引了我们的注意力—将AI变成触手可及的生产力引擎。它们巧妙、高效，让人难以抗拒。但如果您可以将这样的功能添加到自己的工具中，会怎么样呢？在本指南中，我将引导您构建一个具有本地运行的大型语言模型(LLM)和MCP集成的AI工具-让您以类似的方式自动执行利用MCP的工具您喜欢的任务。推荐文章《AnythingLLM教程系列之12AnythingLLM上的Olla
使用 Ollama 、 DeepSeek和QWEN的模型上下文协议 (MCP) ，使用本地 LLM 教程的 MCP 服务器知识大胖 NVIDIA GPU和大语言模型开发教程服务器运维人工智能 qwen2vl deepseek
简介模型上下文协议：MCP服务器据称是AI领域的下一个重大改变者，它将使AI代理变得比我们想象的更加先进。MCP或模型上下文协议由Anthropic去年发布，它可以帮助LLM连接软件并对其进行控制。但有一个问题大多数MCP服务器都与ClaudeAI兼容，尤其是ClaudeAI桌面应用程序，但它们有自己的限制。有没有办法我们可以使用本地LLM运行MCP服务器？是的，在这个特定的逐步详细教程中，我们将
12 个强大的 DeepSeek AI 提示将彻底改变您的日常生活知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek
内容写作的最佳提示让我们从写作开始吧。无论您是博主、学生还是社交媒体创作者，这些提示都将帮助您创作出精彩的内容。提示1：“扮演专业文案撰稿人，为[产品/服务]撰写引人注目的广告文案。文案应引人入胜、具有说服力，且字数不得超过100个字。”这使得ChatGPT的响应结构就像真实的广告文案一样。提示2：“以更具吸引力和说服力的方式重写此段落，同时保持含义不变：[插入文本]。”推荐文章《Neo4j上使用
使用 Deepseek Zero Coding Experience 创建类似飞扬的小鸟游戏知识大胖 NVIDIA GPU和大语言模型开发教程游戏 deepseek ollama janus pro
简介Flappybird在苹果商店推出后，每天大约能赚5000美元，但后来被苹果故意下架。现在我正尝试使用Deepseek制作这样一款游戏。技术在不断变化，编码知识也在不断变化，只需修改代码即可获得结果。让我们在Deepseek上试试这款游戏：推荐文章《如何在本地电脑上安装和使用DeepSeekR-1》权重1，DeepSeek《Nvidia系列之使用NVIDIAIsaacSim和ROS2的命令行控
24GB GPU 中的 DeepSeek R1：Unsloth AI 针对 671B 参数模型进行动态量化知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek ollama
简介最初的DeepSeekR1是一个拥有6710亿个参数的语言模型，UnslothAI团队对其进行了动态量化，将模型大小减少了80%（从720GB减少到131GB），同时保持了强大的性能。当添加模型卸载功能时，该模型可以在24GBVRAM下以低令牌/秒的推理速度运行。推荐文章《本地构建AI智能分析助手之01快速安装，使用PandasAI和Ollama进行数据分析，用自然语言向你公司的数据提问为决策
在 Obsidian 中本地使用 DeepSeek — 无需互联网！知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek
简介您是否想在Obsidian内免费使用类似于ChatGPT的本地LLM？如果是，那么本指南适合您！我将引导您完成在Obsidian中安装和使用DeepSeek-R1模型的确切步骤，这样您就可以在笔记中拥有一个由AI驱动的第二大脑。推荐文章《24GBGPU中的DeepSeekR1：UnslothAI针对671B参数模型进行动态量化》权重1，DeepSeek类《在RaspberryPi上运行语音识别
使用 DeepSeek R1 和 Ollama 开发 RAG 系统使用 DeepSeek R1 和 Ollama 构建强大的 RAG 系统。了解开发智能 AI 解决方案的设置过程、最佳实践和技巧。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek ollama
简介DeepSeekR1和Ollama提供了用于构建检索增强生成(RAG)系统的强大工具。本指南介绍了使用这些技术开发RAG应用程序的设置、实施和最佳实践。为什么RAG系统会改变游戏规则检索增强生成(RAG)系统结合了搜索和生成AI的优点，可实现精确且准确的情境感知响应。借助DeepSeekR1和Ollama等工具，创建RAG系统不再令人生畏。无论您是构建聊天机器人、知识助手还是AI驱动的搜索引擎
【实战AI】macbook M1 本地ollama运行deepseek 东方鲤鱼 chat AI macos ai llama AIGC chatgpt
由于deepseek官网或者Aapi调用会有网络延迟或不响应的情况，故在本地搭建部署；前提条件1.由于需要拉取开源镜像，受网络限制，部分资源在前提中会下载的更快！请自行；2.设备macbookM132G下载ollamaOllama是一款跨平台推理框架客户端（MacOS、Windows、Linux），专为无缝部署大型语言模型（LLM）（如Llama2、Mistral、Llava等）而设计。通过一键式
DeepSeek解读道德经第五十九章 cal_ 道德经道德经
一、原文与译文原文：治人事天，莫若啬。夫唯啬，是谓早服；早服谓之重积德；重积德则无不克；无不克则莫知其极；莫知其极，可以有国；有国之母，可以长久。是谓深根固柢，长生久视之道。译文：治理百姓侍奉天道，没有比珍爱能量更重要的。唯有珍惜能量，才叫早作准备；早作准备就是厚积德性；厚积德性则无往不胜；无往不胜则力量无穷；力量无穷便可守护国家；掌握治国根本，方能长久延续。这便是根深柢固、长生久存之道。二、核心
用Python和OpenCV从零搭建一个完整的双目视觉系统（三） presenttttt 双目立体视觉数码相机
本系列文章旨在系统性地阐述如何利用Python与OpenCV库，从零开始构建一个完整的双目立体视觉系统。本项目github地址：https://github.com/present-cjn/stereo-vision-python.git在上一篇文章中，我们为项目设计了清晰的架构。现在，我们将深入第一个，也是整个双目视觉系统最关键的模块——相机标定(CameraCalibration)。如果说双目
Golang面试题二（slice,map,chan） os-lee go高级 golang 开发语言后端
目录1.slice的底层实现1.结构体定义2.slice四种初始化方式3.底层函数2.Go语言当中数组和slice的区别是什么？1.长度不同2.函数传参不同3.计算长度方式不同3.slice的扩容机制，有什么注意点扩容机制总结4.扩容前后的Slice是否相同5.深拷贝和浅拷贝浅拷贝（ShallowCopy）深拷贝（DeepCopy）总结6.slice为什么不是线程安全的7.map底层实现8.map
在mac m1基于llama.cpp运行deepseek
lama.cpp是一个高效的机器学习推理库，目标是在各种硬件上实现LLM推断，保持最小设置和最先进性能。llama.cpp支持1.5位、2位、3位、4位、5位、6位和8位整数量化，通过ARMNEON、Accelerate和Metal支持Apple芯片，使得在MACM1处理器上运行Deepseek大模型成为可能。1下载llama.cppgitclonehttps://github.com/ggerg
Python桌面应用开发的未来——智能化工具与大模型赋能 IronwoodStag78
开发AI智能应用，就下载InsCodeAIIDE，一键接入DeepSeek-R1满血版大模型！标题：Python桌面应用开发的未来——智能化工具与大模型赋能随着人工智能技术的飞速发展，传统软件开发模式正在被重新定义。Python作为一门功能强大且灵活的语言，在桌面应用开发领域一直占据重要地位。然而，面对日益复杂的用户需求和快速变化的技术环境，如何提升开发效率、降低开发门槛，成为开发者亟需解决的问题
OpenCV入门到精通：从基础到实战的全面指南
摘要：本文旨在为初学者和有一定经验的开发者提供OpenCV从入门到精通的全面指南。文章首先介绍了OpenCV的基本概念和安装方法，然后深入讲解了图像处理基础、特征检测与匹配、视频处理与分析等核心内容，最后通过实战案例展示了OpenCV在计算机视觉任务中的应用。关键词：OpenCV；图像处理；特征检测；视频分析；实战案例引言OpenCV（OpenSourceComputerVisionLibrary
AI在垂直领域的深度应用：医疗、金融与自动驾驶的革新之路
AI在垂直领域的深度应用：医疗、金融与自动驾驶的革新之路一、医疗领域：AI驱动的精准诊疗与效率提升1.医学影像诊断AI算法通过深度学习技术，已实现对X光、CT、MRI等影像的快速分析，辅助医生检测癌症、骨折等疾病。例如，GoogleDeepMind的AI系统在乳腺癌筛查中，误检率比人类专家低9.4%；中国的推想医疗AI系统可在20秒内完成肺部CT扫描分析，为急诊救治争取黄金时间。2.药物研发传统药
第35周—————糖尿病预测模型优化探索
目录目录前言1.检查GPU2.查看数据编辑3.划分数据集4.创建模型与编译训练5.编译及训练模型6.结果可视化7.总结前言本文为365天深度学习训练营中的学习记录博客原作者：K同学啊1.检查GPUimporttorch.nnasnnimporttorch.nn.functionalasFimporttorchvision,torch#设置硬件设备，如果有GPU则使用，没有则使用cpudevice=
强化学习之 DQN、Double DQN、PPO JNU freshman 强化学习强化学习
文章目录通俗理解DQNDoubleDQNPPO结合公式理解通俗理解DQN一个简单的比喻和分步解释来理解DQN（DeepQ-Network，深度Q网络），就像教小朋友学打游戏一样：先理解基础概念：Q学习（Q-Learning）想象你在教一只小狗玩电子游戏（比如打砖块）。小狗每做一个动作（比如“向左移动”或“发射球”），游戏会给出一个奖励（比如得分增加）或惩罚（比如球掉了）。小狗的目标是通过不断尝试，
计算机领域顶级会议汇总 hongyanee parallel performance processing 分布式计算 networking security
转自ustcxjt的专栏：http://blog.csdn.net/ustcxjt/article/details/7075534COREComputerScienceConferenceRankingsAcronymStandardNameRankAAAINationalConferenceoftheAmericanAssociationforArtificialIntelligenceA+AA
数据不Ready，一切AI Ready都是伪命题
2025年随着DeepSeekR1通用大模型的爆火，企业级AI应用元年正式来临。“AIReady”这个词随之火了起来，但什么是AIReady？是有了大模型接口，就是Ready？是买了GPU服务器，就能跑出结果？显然不是。在袋鼠云看来，AIReady不等于模型Ready，而是数据Ready。没有可用、可控、可理解的数据，AI只能是空中楼阁。AIReady，首先是DataReady。别让AIReady
小诗《苦》赏析（“诗人”我/智普清言/DeepSeek）梦幻精灵_cq 笔记学习
苦有万千分好坏，人成百样须努力。笔记模板由python脚本于2025-07-1107:22:06创建，本篇笔记适合喜欢中文诗的coder翻阅。学习的细节是欢悦的历程博客的核心价值：在于输出思考与经验，而不仅仅是知识的简单复述。Python官网：这里，才python前沿。英文原版，原汁原味，才是寻根溯源的正统。地址：https://www.python.org/Free：大咖免费“圣
目标检测之数据增强
数据翻转，需要把bbox相应的坐标值也进行交换代码：importrandomfromtorchvision.transformsimportfunctionalasFclassCompose(object):"""组合多个transform函数"""def__init__(self,transforms):self.transforms=transformsdef__call__(self,ima
DeepSeek 驱动智能交通调度：从传统到智慧的跃迁之路奔跑吧邓邓子 DeepSeek 实战 DeepSeek 智能交通调度应用
目录一、引言二、DeepSeek技术概述2.1DeepSeek简介2.2核心技术原理2.3技术特点与优势三、智能交通调度现状与挑战3.1智能交通调度系统构成3.2现存问题与挑战四、DeepSeek在智能交通调度中的应用4.1交通流量预测与优化4.2智能信号灯控制4.3公交智能排班与调度4.4地铁智能运维与调度4.5交通枢纽智能管理4.6事故预防与应急响应五、应用案例分析5.1某省会城市交通优化案例
一文搞懂怎么入门大模型
在人工智能飞速发展的当下，大模型已然成为推动众多领域创新变革的核心力量。无论是在智能客服、内容创作，还是数据分析、科学研究等方面，大模型都展现出了令人瞩目的能力。对于渴望踏入大模型领域的初学者而言，构建一个系统且全面的入门路径至关重要。接下来，我们将以DeepSeek为例，详细阐述如何系统地入门大模型。一、理论基础：搭建认知框架在深入实践之前，理解大模型的基础理论是关键。大模型，通常指具有海量参数
Spring AI 项目实战（十五）：DeepSeek驱动的智能问诊系统实战-从0到1构建AI医疗问诊平台（附完整源码）程序员岳彬 SpringAI 人工智能 spring java ai 后端
智能问诊系列文章序号文章名称1SpringAI项目实战（一）：SpringAI核心模块入门2SpringAI项目实战（二）：SpringBoot+AI+DeepSeek深度实战（附完整源码）3
vue 侦听器watch 之深度监听 deep 以及 immediate 别来打扰我 vue综合基础知识 vue
FullName:{{person.fullname}}FirstName:exportdefault{data(){return{person:{firstname:‘Menghui‘,lastname:‘Jin‘,fullname:‘‘}}},watch:{person:{handler(n,o){this.person.fullname=n.firstname+‘‘+this.person.
Vue 中监测路由变化时，通常不需要开启深度监听（deep: true）咔咔咔索菲斯 vue.js javascript 前端
1.路由变化的本质：引用地址改变Vue路由的核心对象是$route（或通过useRoute()获取的路由对象），当路由发生变化（如跳转页面、参数改变）时，VueRouter会创建一个新的$route对象，而不是修改原有对象的属性。例如：从/home?id=1跳转到/home?id=2时，$route是一个全新的对象（引用地址改变），而非在原对象上修改query.id。这种情况下，普通监听（不开启d
使用Python进行机器学习入门指南软考和人工智能学堂 Python开发经验 python 机器学习开发语言
使用Python进行机器学习入门指南机器学习（MachineLearning）是人工智能（ArtificialIntelligence,AI）的一个重要分支，旨在通过算法和统计模型，使计算机系统能够自动从数据中学习和改进。Python作为机器学习领域的主流编程语言，提供了丰富的库和工具来实现各种机器学习任务。本文将介绍如何使用Python进行机器学习，包括基本概念、常用库以及一个实战项目示例。目录
少样本图学习（few-shot learning on graph）知识背景 so.far_away 网络空间安全学习机器学习人工智能
Few-ShotLearningonGraph少样本学习简介少样本图学习简介1.SupportSet和QuerySet（针对单个任务）（1）SupportSet（支持集）（2）QuerySet（查询集）2.BaseData和NovelData（针对整个数据集）（1）BaseData/Classes（基类数据）（2）NovelData/Classes（新类数据）少样本学习简介少样本学习（FSL）旨在
log4j对象改变日志级别 3213213333332132 java log4j level log4j对象名称日志级别
log4j对象改变日志级别可批量的改变所有级别，或是根据条件改变日志级别。 log4j配置文件： log4j.rootLogger=ERROR,FILE,CONSOLE,EXECPTION #log4j.appender.FILE=org.apache.log4j.RollingFileAppender log4j.appender.FILE=org.apache.l
elk+redis 搭建nginx日志分析平台 ronin47 elasticsearch kibana logstash
elk+redis 搭建nginx日志分析平台 logstash,elasticsearch,kibana 怎么进行nginx的日志分析呢？首先，架构方面，nginx是有日志文件的，它的每个请求的状态等都有日志文件进行记录。其次，需要有个队列，redis的l
Yii2设置时区 dcj3sjt126com PHP timezone yii2
时区这东西，在开发的时候，你说重要吧，也还好，毕竟没它也能正常运行，你说不重要吧，那就纠结了。特别是linux系统，都TMD差上几小时，你能不痛苦吗？win还好一点。有一些常规方法，是大家目前都在采用的1、php.ini中的设置，这个就不谈了，2、程序中公用文件里设置，date_default_timezone_set一下时区3、或者。。。自己写时间处理函数，在遇到时间的时候，用这个函数处理（比较
js实现前台动态添加文本框，后台获取文本框内容 171815164 文本框
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://w
持续集成工具 g21121 持续集成
持续集成是什么？我们为什么需要持续集成？持续集成带来的好处是什么？什么样的项目需要持续集成？... 持续集成(Continuous integration ,简称CI)，所谓集成可以理解为将互相依赖的工程或模块合并成一个能单独运行
数据结构哈希表(hash)总结永夜-极光数据结构
1.什么是hash 来源于百度百科: Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入，通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
乱七八糟程序员是怎么炼成的
eclipse中的jvm字节码查看插件地址： http://andrei.gmxhome.de/eclipse/ 安装该地址的outline 插件后重启，打开window下的view下的bytecode视图 http://andrei.gmxhome.de/eclipse/ jvm博客： http://yunshen0909.iteye.com/blog/2
职场人伤害了“上司” 怎样弥补 aijuans 职场
由于工作中的失误，或者平时不注意自己的言行“伤害”、“得罪”了自己的上司，怎么办呢？　　在职业生涯中这种问题尽量不要发生。下面提供了一些解决问题的建议：　　一、利用一些轻松的场合表示对他的尊重　　即使是开明的上司也很注重自己的权威，都希望得到下属的尊重，所以当你与上司冲突后，最好让不愉快成为过去，你不妨在一些轻松的场合，比如会餐、联谊活动等，向上司问个好，敬下酒，表示你对对方的尊重，
深入浅出url编码 antonyup_2006 应用服务器浏览器 servlet weblogic IE
出处：http://blog.csdn.net/yzhz 杨争 http://blog.csdn.net/yzhz/archive/2007/07/03/1676796.aspx 一、问题：编码问题是JAVA初学者在web开发过程中经常会遇到问题，网上也有大量相关的
建表后创建表的约束关系和增加表的字段百合不是茶标的约束关系增加表的字段
下面所有的操作都是在表建立后操作的,主要目的就是熟悉sql的约束,约束语句的万能公式 1,增加字段(student表中增加姓名字段) alter table 增加字段的表名 add 增加的字段名增加字段的数据类型 alter table student add name varchar2(10); &nb
Uploadify 3.2 参数属性、事件、方法函数详解 bijian1013 JavaScript uploadify
一.属性属性名称默认值说明 auto true 设置为true当选择文件后就直接上传了，为false需要点击上传按钮才上传。 buttonClass ” 按钮样式 buttonCursor ‘hand’ 鼠标指针悬停在按钮上的样子 buttonImage null 浏览按钮的图片的路
精通Oracle10编程SQL(16)使用LOB对象 bijian1013 oracle 数据库 plsql
/* *使用LOB对象 */ --LOB(Large Object)是专门用于处理大对象的一种数据类型，其所存放的数据长度可以达到4G字节 --CLOB/NCLOB用于存储大批量字符数据，BLOB用于存储大批量二进制数据，而BFILE则存储着指向OS文件的指针 /* *综合实例 */ --建立表空间 --#指定区尺寸为128k,如不指定，区尺寸默认为64k CR
【Resin一】Resin服务器部署web应用 bit1129 resin
工作中，在Resin服务器上部署web应用，通常有如下三种方式：配置多个web-app 配置多个http id 为每个应用配置一个propeties、xml以及sh脚本文件配置多个web-app 在resin.xml中,可以为一个host配置多个web-app <cluster id="app&q
red5简介及基础知识白糖_ 基础
简介 Red5的主要功能和Macromedia公司的FMS类似，提供基于Flash的流媒体服务的一款基于Java的开源流媒体服务器。它由Java语言编写，使用RTMP作为流媒体传输协议，这与FMS完全兼容。它具有流化FLV、MP3文件，实时录制客户端流为FLV文件，共享对象，实时视频播放、Remoting等功能。用Red5替换FMS后,客户端不用更改可正
angular.fromJson boyitech AngularJS AngularJS 官方API AngularJS API
angular.fromJson 描述: 把Json字符串转为对象使用方法: angular.fromJson(json); 参数详解: Param Type Details json string JSON 字符串返回值: 对象, 数组, 字符串或者是一个数字示例: <!DOCTYPE HTML> <h
java-颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I bylijinnan java
public class ReverseWords { /** * 题目：颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I.词以空格分隔。 * 要求： * 1.实现速度最快,移动最少 * 2.不能使用String的方法如split,indexOf等等。 * 解答：两次翻转。 */ publ
web实时通讯 Chen.H Web 浏览器 socket 脚本
关于web实时通讯，做一些监控软件。由web服务器组件从消息服务器订阅实时数据，并建立消息服务器到所述web服务器之间的连接，web浏览器利用从所述web服务器下载到web页面的客户端代理与web服务器组件之间的socket连接，建立web浏览器与web服务器之间的持久连接；利用所述客户端代理与web浏览器页面之间的信息交互实现页面本地更新，建立一条从消息服务器到web浏览器页面之间的消息通路
[基因与生物]远古生物的基因可以嫁接到现代生物基因组中吗? comsci 生物
大家仅仅把我说的事情当作一个IT行业的笑话来听吧..没有其它更多的意思如果我们把大自然看成是一位伟大的程序员,专门为地球上的生态系统编制基因代码,并创造出各种不同的生物来,那么6500万年前的程序员开发的代码,是否兼容现代派的程序员的代码和架构呢?
oracle 外部表 daizj oracle 外部表 external tables
oracle外部表是只允许只读访问，不能进行DML操作，不能创建索引，可以对外部表进行的查询，连接，排序，创建视图和创建同义词操作。 you can select, join, or sort external table data. You can also create views and synonyms for external tables. Ho
aop相关的概念及配置 daysinsun AOP
切面(Aspect): 通常在目标方法执行前后需要执行的方法（如事务、日志、权限），这些方法我们封装到一个类里面，这个类就叫切面。连接点（joinpoint） spring里面的连接点指需要切入的方法，通常这个joinpoint可以作为一个参数传入到切面的方法里面（非常有用的一个东西）。通知（Advice）通知就是切面里面方法的具体实现，分为前置、后置、最终、异常环
初一上学期难记忆单词背诵第二课 dcj3sjt126com english word
middle 中间的，中级的 well 喔，那么；好吧 phone 电话，电话机 policeman 警察 ask 问 take 拿到；带到 address 地址 glad 高兴的，乐意的 why 为什么 China 中国 family 家庭 grandmother (外)祖母 grandfather (外)祖父 wife 妻子 husband 丈夫 da
Linux日志分析常用命令 dcj3sjt126com linux log
1.查看文件内容 cat -n 显示行号 2.分页显示 more Enter 显示下一行空格显示下一页 F 显示下一屏 B 显示上一屏 less /get 查询"get"字符串并高亮显示 3.显示文件尾 tail -f 不退出持续显示 -n 显示文件最后n行 4.显示头文件 head -n 显示文件开始n行 5.内容排序 sort -n 按照
JSONP 原理分析 fantasy2005 JavaScript jsonp jsonp 跨域
转自 http://www.nowamagic.net/librarys/veda/detail/224 JavaScript是一种在Web开发中经常使用的前端动态脚本技术。在JavaScript中，有一个很重要的安全性限制，被称为“Same-Origin Policy”（同源策略）。这一策略对于JavaScript代码能够访问的页面内容做了很重要的限制，即JavaScript只能访问与包含它的
使用connect by进行级联查询 234390216 oracle 查询父子 Connect by 级联
使用connect by进行级联查询 connect by可以用于级联查询，常用于对具有树状结构的记录查询某一节点的所有子孙节点或所有祖辈节点。来看一个示例，现假设我们拥有一个菜单表t_menu，其中只有三个字段：
一个不错的能将HTML表格导出为excel,pdf等的jquery插件 jackyrong jquery插件
发现一个老外写的不错的jquery插件，可以实现将HTML 表格导出为excel,pdf等格式，地址在： https://github.com/kayalshri/ 下面看个例子，实现导出表格到excel,pdf <html> <head> <title>Export html table to excel an
UI设计中我们为什么需要设计动效 lampcy UI UI设计
关于Unity3D中的Shader的知识首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，
如何禁止页面缓存 nannan408 html jsp cache
禁止页面使用缓存~ ------------------------------------------------ jsp:页面no cache： response.setHeader("Pragma","No-cache"); response.setHeader("Cache-Control","no-cach
以代码的方式管理quartz定时任务的暂停、重启、删除、添加等 Everyday都不同定时任务管理 spring-quartz
【前言】在项目的管理功能中，对定时任务的管理有时会很常见。因为我们不能指望只在配置文件中配置好定时任务就行了，因为如果要控制定时任务的 “暂停” 呢？暂停之后又要在某个时间点 “重启” 该定时任务呢？或者说直接 “删除” 该定时任务呢？要改变某定时任务的触发时间呢？ “添加” 一个定时任务对于系统的使用者而言，是不太现实的，因为一个定时任务的处理逻辑他是不
EXT实例 tntxia ext
（1）增加一个按钮 JSP: <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); Stri
数学学习在计算机研究领域的作用和重要性 xjnine Math
最近一直有师弟师妹和朋友问我数学和研究的关系，研一要去学什么数学课。毕竟在清华，衡量一个研究生最重要的指标之一就是paper,而没有数学，是肯定上不了世界顶级的期刊和会议的，这在计算机学界尤其重要！你会发现，不论哪个领域有价值的东西，都一定离不开数学！在这样一个信息时代，当google已经让世界没有秘密的时候，一种卓越的数学思维，绝对可以成为你的核心竞争力. 无奈本人实在见地

CVPR 2018 | 8篇论文、10+Demo、双项挑战赛冠军，旷视科技掀起CVPR产学研交流热潮

你可能感兴趣的:(computer,vision,deep,learning,CVPR)