深度学习技术前沿

鹅厂AI科学家，偷偷把无人摩托写进了年终总结

点击上方，选择星标或置顶，不定期资源大放送！

阅读大概需要15分钟

Follow小博主，每天更新前沿干货

‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍转载自：量子位‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

这一整年，腾讯AI Lab都搞出了些什么黑科技？

通用人工智能、AI+行业、前沿研究，是腾讯AI Lab给出的三个关键词。

除了线上的3D虚拟偶像“艾灵”、王者级AI对手“绝悟”，还有线下的“走梅花桩”机器狗、自平衡两轮机器人……

而在医疗、农业、游戏、药物……等行业上，腾讯AI Lab也都实现了AI+应用落地。

当然，在ECCV、CVPR等AI顶会上，同样能看见腾讯AI Lab的不少研究成果。

而通用人工智能（AGI），则是腾讯AI Lab整年里最核心的目标。

双轨并行，探索AGI的无限可能

迈向通用人工智能，创造能感知、理解真实世界，并能有效执行各种不同任务的 AI 系统，是腾讯 AI Lab 成立伊始，就确定的核心长远目标。

为了达成这一目标，除了软件突破、硬件迭代创新，还需要软硬件的有效整合与集成。

2020 年，腾讯 AI Lab 和 Robotics X 实验室主任张正友博士，共同提出了一个全新的概念：虚实集成世界 （Integrated Physical-Digital World，IPhD）。

它将当前在AI、虚拟现实（VR）、增强现实（AR）、混合现实（MR）领域的前景展望、互联网、物联网等思想进行了融合，并呈现出一个交互进化的软件与硬件、虚拟与现实、人与AI和机器人实现AGI的愿景。

目前，腾讯 AI Lab 的所有研究，都可以纳入虚实集成世界的整体框架之下。

在虚实集成世界框架下，现实虚拟化、虚拟真实化、全息互联网、智能执行体四大发展方向，将成为腾讯 AI Lab 和 Robotics X 实验室未来发展的重要指导。

而虚拟人和机器人，是腾讯 AI Lab 和 Robotics X 实验室在 2020 年取得的两项重大突破。

它们是虚拟集成世界框架下的软、硬件智能执行体，同时涵盖其它的一些核心技术，如数字版本人脸建模，就是其中一项将现实虚拟化的成果。

虚拟人：人类在虚拟世界的化身

虚拟人是一类多模态技术，涉及计算机视觉、语音识别/生成、自然语言理解/生成等多种技术。

根据来源的不同，虚拟人大致可以分为两类：人类的数字化模型和虚拟世界原生虚拟人。

2020 年 10 月，腾讯 AI Lab 提出了一种基于 RGB-D 自拍视频创建高拟真度 3D 虚拟人的方法。

这项技术的核心，是一项涉及 3D 人脸 Mesh 估计、高清纹理贴图、法线细节贴图的合成算法，实现了成本极低但速度很快的 3D 人脸合成：

手机拍摄视频输入后，只需要30秒处理时间。

基于人类建模的虚拟人，具有丰富的应用场景。

例如，作为人类在虚拟世界中的化身（avatar），让用户也能参与虚拟世界的各种互动。

这项技术还能用于数字祭奠（纪念已逝之人），或是让人类演员在动画、游戏中扮演角色（比如基努·李维斯在《赛博朋克2077》中扮演的 Johnny Sliverhand）等。

在创造虚拟世界原生虚拟人方面，腾讯 AI Lab 开发的多模态虚拟人「 AI 艾灵」，已于 2020 年 5 月与公众见面，并于儿童节当天，与青年演员歌手王俊凯、和雄安孩子，共同演绎了新歌《点亮》。

AI 艾灵，是腾讯 AI Lab 在视觉、语音、自然语言、人机交互等多模态方面的研究结晶。

它采用的 DurIAN 语音合成框架，融合了腾讯 AI Lab 在语音领域多年深耕的经验。

这项框架，不仅能实现精准且稳健的语音合成，而且还能生成与合成语音同步的高质量人脸表情。

△ DurIAN 工作过程示意图

虚拟世界原生虚拟人，在虚拟偶像、虚拟助理、在线教育、数字内容生成等领域有着广泛的应用前景。

AI 艾灵，就是一个虚拟主播兼虚拟歌手，而且还是创作型歌手。其采用的 SongNet 歌词创作模型，可以根据任意格式和模板，生成相契合的文本，唱出自己写的歌。

虚拟人，是虚实集成世界的重要组成部分。

为了实现虚实集成世界的长远目标，还需要高速实时的物联网、高精度的真实世界模型、更有趣有用的虚拟世界、更安全高效的自动化机器。

移动机器人：「AI+机器人」新进展

腾讯 AI Lab ，一直在与腾讯 Robotics X 机器人实验室合作，共同推进「AI+机器人」的发展。

2020 年 11 月，两项在移动机器人领域的新进展问世：让四足机器人 Jamoca 学会了走梅花桩、还提出了让轮式机器人自主平衡的新方法。

为了让 Jamoca 具备走梅花桩的能力，腾讯 Robotics X 实验室，基于自研的机器人控制技术，为 Jamoca 打造了一个能应对复杂环境的智能大脑。

这个大脑，让 Jamoca 能行走、小跑和跳跃，且能自主定位和避障。

这是腾讯 Robotics X 实验室在机器人感知、运动规划与控制等核心技术的一次展示，体现出腾讯 Robotics X 实验室整机系统设计、搭建的重要能力。

此外，腾讯 Robotics X 实验室还研究了能自行保持平衡的两轮式移动机器人，这是实验室的首个整机自研机器人。

在传统轮式移动机器人的基础上，研究人员增加了动量轮、及电机驱动系统，使得机器人可以在静止及行进状态下，均保持平衡不倒。

基于这个移动机器人平台的两篇研究论文，均被机器人行业国际顶会 IROS 2020 接收为 Oral 展示论文。

这一项目，可以视作腾讯在机器人机械设计、整机系统设计，以及搭建方向能力上的一大里程碑。

移动机器人，是虚实集成世界框架中「智能执行体」的核心组成部分之一，也是实现通用人工智能终极目标的重要途径。

之后，除了让移动机器人更好地理解周围的环境、及时采取合理动作，腾讯 Robotics X 实验室

、和腾讯 AI Lab ，还会继续在多模态 AI 能力与机器人结合领域探索，创造出能密切参与人类生产生活的智能机器人。

AI+行业，让应用真正落地

「科技向善」，是腾讯的核心使命愿景，作为腾讯大家庭的一员，腾讯 AI Lab 也同样秉承着这一使命。

腾讯 AI Lab ，深知 AI 变革世界的潜力。因此，在积极探索最前沿的 AI 技术时，他们也致力于将技术转化为应用，更好地服务用户、造福社会。

总体而言，这些应用，可归纳为AI+医疗、AI+医药、AI+游戏、AI+农业、AI+内容几大方向。

例如，使用 AI 助力抗击新冠疫情的实际应用、更经济高效的药物发现平台。

又比如，智慧农业的进一步发展、机器翻译服务的再度升级、在复杂游戏场景中攻克难题……

一起来看看。

AI+医疗：用AI抗击疫情和辅助病理医生

「AI+医疗」，是腾讯 AI Lab 的核心研究方向之一，这是一个有望造福全人类的研究课题。

去年，新冠疫情肆虐全球，AI 技术在医疗领域，也拥有了更多的应用前景。

2020 年 7 月，钟南山院士团队与腾讯 AI Lab ，利用AI，做出了一款预测COVID-19患者病情发展至危重概率的模型。

这个模型，可分别预测5天、10天和30天内病情危重的概率，有助于合理地为病人进行早期分诊，相关研究发表于国际顶级期刊 Nature 子刊 Nature Communications。

腾讯 AI Lab 在第一时间对代码进行了开源，并构建了一个免费的在线查询服务平台，为抗击新冠疫情贡献了自己的力量。

△ 新冠重症患者早期分期生存模型计算工具

在之前的4月份，腾讯 AI Lab 联合研发的智能显微镜，获得了 NMPA 注册证，成为国内首个获准进入临床应用的智能显微镜产品。

这款智能显微镜产品，集成了目前病理分析与诊断方面的最新技术，针对病理医生工作流程和习惯，进行了多次产品迭代。

测试表明，这款智能显微镜能有效提升病理医生的工作效率、病理分析精确度和一致性，有望缓解医院（尤其是基层医院）病理医生数量短缺、经验不足的问题，是精准医疗从前沿研究走向落地探索的一个良好例证。

11月25日，在中华医学会病理分会细胞学组专家们的见证下，安必平、腾讯 AI Lab 以及腾讯觅影，正式启动了「科技部医疗影像国家人工智能开放创新平台——宫颈液基细胞学AI数据库建设」项目。

这一项目，助力宫颈液基细胞学数据库的建设、标准规范的制定，也将推进病理科数字化、病理大数据、人工智能应用等多个方向的探索。

AI+药物：首个AI驱动的药物发现平台问世

2020年7月，腾讯 AI Lab 重磅发布了首个 AI 驱动的药物发现平台「云深智药」。

云深智药，整合了腾讯 AI Lab和腾讯云在前沿算法、优化数据库以及计算资源上的优势，提供覆盖临床前新药发现流程的五大模块：

蛋白质结构预测、虚拟筛选、分子设计/优化、 ADMET 属性预测及合成路线规划……

在蛋白质结构预测方面，云深智药采用了腾讯 AI Lab 自研的冠军级蛋白质结构预测技术，涵盖两项关键技术突破：基于自监督学习的蛋白质折叠方法、基于深度学习的可迭代方法。

半年内，这项技术在全球唯一的蛋白质结构预测自动评估平台CAMEO上，夺得了五次月度冠军，领先众多国际知名研究团队。

11月，腾讯AI Lab在国际顶级期刊Nature子刊《Nature Communications》上发表了一项研究，介绍了采用「从头折叠」的蛋白质结构预测方法。

这项研究，帮助解析了 SRD5A2 晶体结构的成果，揭示了治疗脱发、和前列腺增生的药物分子「非那雄胺」对于该酶的抑制机制。

在虚拟筛选方面，「云深智药」平台的虚拟筛选模块，首次将元学习和深度神经网络算法用于LBDD（基于配体的药物设计）任务。

通过迁移学习，模块将从其他靶点上面学习到的知识（如分子局部结构对靶点结合强度的影响），应用到目标靶点上，以提高模型的预测精度。

目前，这一算法在数千个实验数据集上预测精度（预测活性与实验测量活性的相关性）的中位数，从目前最高记录的0.36提升至0.42。

而筛选可用模型的百分比，则从56%提升到60%，突破了业界标准。

在分子生成方面，云深智药的分子生成算法，利用AI学习现有数据库中小分子的各种结构信息和靶点关系，进而学习分子空间。

现有模型，目前支持对 319 个Kinase和 52 个 GPC R靶点进行分子生成。

在分子生成这一过程中，云深智药的算法，能够针对不同靶点在分子空间中的映射，完成针对性采样，从而生成可能的靶点活性分子。

而在 ADMET 属性预测方面，云深平台也有出色表现。

目前，药物小分子 ADMET 属性预测模块，已在多个数据集上优于学术界现有最好模型 3%~11%；在合作伙伴的反馈中，平台的自研算法精度超过现有商业软件 6%~37% 不等。

此外，云深智药还采用了注意力等机制，来可视化分子中的子结构对结果的影响，提供模型的可解释性。

当然，平台也提供本地版本等灵活的部署形式，保障用户的数据安全。

腾讯 AI Lab 也会继续推进基于 AI 的药物发现技术，为云深智药平台提供更多、范围更广的功能。

此外，腾讯 AI Lab 还开源了一个大规模自监督分子图预训练模型GROVER。

GROVER，是业界首个开源的、基于深度图神经网络的、图数据的大规模预训练模型。

研究人员可以快速将其作为基础组件，应用到需要对小分子进行编码的药物研发相关研究中，助力药物研发相关应用，例如分子属性预测、虚拟筛选等任务。

AI+农业：iGrow 再获丰收，农业仿真落地现实世界

农业，是事关人类生存的基础性行业。

2020 年，是腾讯 AI Lab 的「AI+农业」方向的又一个「丰收年」。

6 月份，腾讯 AI Lab 与世界著名农业学府荷兰瓦赫宁根大学（WUR）联办的「第二届国际智慧温室种植挑战赛」落幕。

复赛的五支队伍，挑战用 AI 和 IoT 物联网等前沿技术优化种植决策，并远程自动控制温室种植小番茄。

复赛队中，五个 AI 的收成，均超过有20年经验的农业种植专家组。

其中，冠军组 Automatoes 得到满分，实现亩产资源消耗减少16%，净利增加121%，充分展现了农业智能决策与温室自动控制的技术价值，和为农民减负的未来潜力。

此外，腾讯 AI Lab 还携手腾讯TEG架构平台部，借助在第一届比赛中自研的 AI 算法、技术经验，打造的云原生「腾讯AIoT智慧种植方案 iGrow」，在 2020 年已落地中国农业大省辽宁。

第一期番茄试点迎来「小丰收」，每亩每季净利润增加数千元，iGrow 的商业价值得到了初步验证。

△iGrow方案在辽宁温室试点

11 月 27 日，腾讯云（莘县）农业数字经济产业基地开园，这是腾讯集团在全国布局的首个农业数字经济产业基地。

在新的一年里，腾讯 AI Lab 研发的 iGrow 解决方案，将在该基地得到进一步研究和应用。

继化肥、农药和大规模机械化种植之后，AI 和物联网，有望让农业更进一步摆脱靠天吃饭的传统模式。

通过分析和预测天气条件、温湿度、二氧化碳浓度变化动态调整种植策略，可让产量得到最优的提升。

未来，如果再配合自动化温室和垂直农场等新型农业技术，农业的生产效率可望实现质的飞跃，甚至可推广到原本不适宜农业生产的地区，助力消除人类社会仍未解决的饥饿问题。

AI+游戏：游戏仿真世界，「绝悟」AI 策略协作能力再升级

「AI+游戏」，也是腾讯 AI Lab 深耕的研究领域。

基于围棋、《王者荣耀》、《毁灭战士》、《星际争霸》等游戏平台，腾讯 AI Lab 已经研发许多有价值的前沿技术，并创造了中国国家队围棋训练专用 AI 等真实应用。

此外，基于游戏环境开发的深度强化学习方法，在机器人等领域也有重要应用前景。

4 月份，腾讯 AI Lab 开发的围棋 AI「绝艺」，与中国国家围棋队续约三年。

作为「教练」，绝艺能从对弈、复盘、拆解、分析等多个维度，为中国围棋事业的发展提供助力，与人类顶尖棋手一起探索围棋的更多可能。

立足于国民手游《王者荣耀》，腾讯 AI Lab 开发出了策略协作型 AI 「绝悟」。

2020年，通过开放挑战和职业竞技，腾讯 AI Lab 在复杂环境决策、多智能体合作与博弈以及策略预测与规划方面的成果得到了展现。

2020年5月1~4日，「绝悟」首次向玩家大规模开放。

在此期间，从职业玩家、到游戏主播、再到普通业余玩家，都向绝悟发起了挑战，并见识了绝悟在战术规划、玩家行为预测、多英雄配合等方面的能力。

8月18日，腾讯牵头构建的 AI 多智能体与复杂决策开放研究平台「开悟」正式对高校开放，同时开启了首届「开悟AI+游戏高校大赛」。

依托于腾讯 AI Lab 和「王者荣耀」在算法、数据（脱敏）、算力方面的核心优势，「开悟」致力于发展成为国内领先、国际一流的研究与应用探索平台。

11月28日，「绝悟完全体」进入王者峡谷，并在28-30日间开启了三天公众体验。

不同于5月份开放的版本，完全体版本的绝悟解禁了全部英雄池，掌握了所有英雄的所有技能，同时其它多项策略也得到优化。

相关论文，已被AI顶级会议NeurIPS 2020与顶级期刊TNNLS收录。

为了让绝悟 AI 掌握全部英雄，腾讯 AI Lab 提出了一种新方法：课程自对弈学习 （CSPL）。

这是一种让 AI 从易到难的渐进式学习方法：

先引入「老师分身」模型，让每个AI老师通过深度强化学习技术，在单个阵容上训练至精通。

再引入一个AI学生，模仿学习所有的AI老师。

最终，让绝悟掌握所有英雄的所有技能，成为一代宗师。

△CSPL流程图

《王者荣耀》等 MOBA 类游戏非常复杂，同时，涉及多样化的合作与对抗博弈，非常适合作为策略型 AI 的开发平台、用于研发适用于不同场景的通用型 AI 技术。

这类技术，在许多真实世界场景中也有重要的应用价值。

例如，在路况复杂的城市道路上，协调自动驾驶汽车；为快递员或快递无人机，规划配送区域和路线。

除此之外，2020 年 12 月，腾讯 AI Lab 绝悟团队借助「开悟」平台开发的足球 AI 「绝悟-WeKick 版本」，在 Google Research 与英超曼城俱乐部联合举办的足球 AI Kaggle 竞赛上获得冠军。

这项竞赛，使用 Google Brain 基于开源足球游戏 Gameplay Football 开发的强化学习环境 Google Research Football。

这场 Kaggle 竞赛，也是首场相关竞赛。

不同于《王者荣耀》，足球 AI 比赛涉及到 11 个智能体的相互配合、以及与另外 11 个智能体的对抗，同时奖励相比于 MOBA 游戏还更稀疏。

即便如此，WeKick 依然以显著优于第二名的成绩获得了冠军。这体现了完全体「绝悟」底层技术和框架的通用性。

虽然都是 RTS （即时战略）游戏，星际争霸中需要控制多种不同类型不同数量的单位，这些单位又有各自的运动和攻击特点，因而动作空间更大、策略空间更丰富。

腾讯 Robotics X ，开源了首个通用的大规模多智能体博弈训练框架TLeague，并据此训练出能击败大师级选手的星际争霸强AI TStarBot-X。

这个星际AI，只使用了AlphaStar的50分之一的算力。

AI+内容：TranSmart再升级，用AI赋能人工翻译

腾讯交互翻译TranSmart，是目前业界唯一可实现人机交互的互联网机器翻译产品。

经过三年积累，TranSmart的功能，已经覆盖人工翻译全流程，如按键、词、短语、句子、翻译记忆等。

2020年，TranSmart开启商业化探索之旅，获得了业界伙伴的积极认可：

阅文集团的海外编辑人员，将通过网文定制翻译引擎，翻译上千部出海的小说作品；华泰证券的证券分析师，将通过翻译记忆融合与交互翻译，高效发布中英双语研报。

腾讯云官网，在国际版官网和技术文档翻译过程中，将定制翻译引擎准确处理Markdown、XML等标记文本，高效复用术语、双语句对等语言资产，助力腾讯云数百款产品出海远航。

TranSmart继承和发展了交互翻译的技术概念，在保证人作为翻译主体的同时，也具备量身定制的个性化机器翻译，全方位赋能人工翻译过程：

①自动翻译质量：在目标场景中，通过语料增强和模型优化，自动翻译质量稳居行业前列；
②实时译文建议：译文片段智能推荐和整句补全，显著减少用户反复修改错误译文的困扰，大幅改善人工翻译体验；
③翻译记忆融合：动态结合用户已完成的双语句对，生成更符合期望的自动译文，性能显著优于传统静态和增量式训练的机器翻译；
④翻译输入法：参照原文上下文和机器翻译知识，实现精准组词，加快人工翻译过程中的输入效率。

行业应用以外，腾讯 AI Lab在前沿研究上也有不少进展。

前沿研究进展

作为国内领先、世界一流的企业级人工智能实验室，腾讯 AI Lab 一直秉承开放合作的理念，与全球高校和研究机构，共同探索 AI 技术前沿。

2020 年，腾讯AI Lab的高校合作项目「犀牛鸟专项研究计划」，完成了第三年度闭环，共发表高水平论文 50 多篇，项目的多项成果，已应用于智能语音交互产品、直播自动解说系统、和视觉识别系统等。

新的一年，「犀牛鸟」还将继续飞翔，继续发现前沿研究中的挑战性问题并开展原创性研究，同时探索新技术的行业应用案例，打造持续共赢的产学研合作生态和科研成果转化平台。

此外，腾讯 AI Lab 还启动了「开悟」AI多智能体、与复杂决策开放研究平台产学研生态建设，发起了首届王者荣耀开悟 AI 学术交流赛。

此外，腾讯AI Lab还邀请清华大学、北京大学、中科院等 18 所高校师生，开展了百人专项培训和竞赛，为今后向高校进一步开放「开悟」，打下了良好基础。

在学术成果上，2020 年腾讯 AI Lab 和 Robotics X 实验室，在计算机视觉、语音、自然语言处理、多模态、知识图谱、机器学习、机器人等更众多 AI 领域，都做出了业界领先的贡献。

当然，实验室也通过学术会议、期刊和公开平台，分享了这些劳动成果。

在 ACL、INTERSPEECH、IROS、NeurIPS、AAAI 等主要顶级学术会议上，腾讯 AI Lab 和 Robotics X 实验室，整体发表的论文数量位居国内企业实验室前列。

据上海交通大学 Acemap 学术地图统计，腾讯 2020 年在 AI 领域的论文（其中相当大一部分来自腾讯 AI Lab）发表数位列全球大学与机构第 8 位，H-index 全球并列第 5 位。

在中国的大学和机构排名中，腾讯的 AI 论文数量排名第 4， H-index 并列第 2，大幅领先国内其它企业。

下面，将分为几个主题，简单梳理腾讯 AI Lab 在2020年的重要研究成果。

多模态研究

多模态研究的目标，是让 AI 或机器人通过整合多种不同来源的信号，来理解环境和做出判断，比如视觉、雷达、GPS、语音、语言和互联网数据等。

因此，多模态研究，对通用人工智能、虚实集成世界两大长期愿景来说，具有极为重要的价值。

多模态研究虽然重要，但 AI 领域，目前还没有专门面向多模态研究的顶级会议或顶级期刊。

也因此，腾讯 AI Lab 的多模态研究成果，分散地发表在不同的学术会议和期刊上。

2020 年腾讯 AI Lab 在多模态方向上的研究，主要集中于音频/视频/图像与文本的多模态学习。

除了前文已经介绍过的虚拟人成果，腾讯 AI Lab 还提出了一种针对视频中时序句子定位、和事件描述学习模态间交互的新方法，能学习成对模态交互，并改善两项任务的性能。

另外，腾讯 AI Lab 还研究了如何基于场景图分解来生成自然语言描述、通过递归子查询构造改善视觉和自然语言匹配、以及一种新的视觉-文本匹配模型。

△ 用于描述并定位视频事件的视频-文本多模态学习框架

除了视频-文本多模态，腾讯 AI Lab 也在视频-音频多模态上，取得了一些研究成果。

比如发表在INTERSPEECH 2020的一项研究中，腾讯 AI Lab 提出了一种利用跨域视觉，生成特征辅助障碍语音识别的方法。

这种方法利用大量域外音频-视觉数据进行训练，从而为有限、或没有视觉数据的说话人，生成视觉特征。

这项语音识别技术，能够帮助有发音障碍的说话人，有望实现一些重要的「科技向善」应用。

△ 多模态语音分离框架

另外，在多模态人机交互上, 腾讯 AI Lab 还提出了多模态说话人diarization、多模态语音分离、以及多模态语音识别方案。

这是融合音频、视频、声纹、空间信息等多个模态，针对「鸡尾酒会」一类复杂场景的人机交互整体解决方案。

△ 多模态语音分离、识别的联合训练框架

腾讯 AI Lab 还提出了一种新的深度多模融合框架：信道交换网络(CEN) [12]。

这一框架通过在训练中自我引导地、动态地交换特定通道的特征，在保持足够的模态内学习特征的同时，还能促进模态间的特征交互。

机器学习

机器学习，是 AI 的核心过程和标志性能力。

近些年的 AI 发展热潮，正是源自深度学习等机器学习技术的突破。

机器学习领域的研究重心，除了继续优化深度学习方法、和拓展其应用范围外，还在积极探索其与其它学习范式的组合。

由此，诞生了深度强化学习、生成对抗网络的成功技术。而擅长梳理网络关系的深度图学习，也成为领域的热门研究方向。

2020 年，腾讯 AI Lab 在多个机器学习方向上都得到了重要的研究成果，也为机器学习模型的可解释性、鲁棒性等理论分析做出了贡献。

这些研究成果，多数在NeurIPS 2020 等 AI 领域顶级会议、和 Nature Communications 等顶级期刊上发表。

其中，深度强化学习，是腾讯 AI Lab 的一大核心研究方向。

立足于围棋和《王者荣耀》等视频游戏等场景，腾讯 AI Lab 在深度强化学习方面的探索，已达世界前列水平。

基于这项技术开发的围棋 AI 「绝艺」，已在中国国家围棋队的训练中得到了实际应用。

而《王者荣耀》AI 「绝悟」，也已进化为「完全体」，并通过首次大规模 MOBA AI 智能体性能测试，接受了广大玩家的检验。

完全体绝悟的成功，基于腾讯 AI Lab 对新方法与成熟方法的有效组合，包括课程自博弈学习、多头价值估计、策略注入、蒙特卡洛树搜索和离策略等。

在深度图学习方面，腾讯 AI Lab 也成绩斐然，包括前文提到的，完全基于自监督训练的图神经网络框架 GROVER。

通过在原子、化学键、分子级别的自监督任务设计，GROVER可以从海量的无标签分子中学习到大量结构/语义信息。

同时，为了编码分子中海量的复杂信息，GROVER 还整合了消息传播网络和Transformer，得到一个有更强表达能力的图神经网络模型 GTransformer。

在药物研发上，这一模型具有广阔的应用潜力。

此外，腾讯 AI Lab 还提出了一种基于狄利克雷分布的图变分自编码器框架，并证明了该框架与经典平衡图分割方法的等价性。

腾讯 AI Lab 还通过分子逆合成分析，探索了深度图学习在化学领域的应用。

此外，在 2020 年的 ACM SIGKDD 会议上，腾讯AI Lab、清华大学、香港中文大学等机构联合组织，通过一场为期一天的课程，系统性地讲解了图神经网络。

腾讯 AI Lab 还有一项将深度强化学习与图学习组合起来的研究成果，这是一种针对文字游戏提出的基于分层堆叠注意力机制的深度强化学习算法。

这项研究使用了知识图进行显式推理以进行决策，从而通过可解释的推理程序生成并支持智能体的决策。加上一种新提出的分层堆叠注意力机制，可通过利用知识图的结构来构造推理过程的显式表示。

△ 分层堆叠注意力网络架构

腾讯 AI Lab 在网络架构搜索方面也取得了一些进展。

相较于人工设计网络架构，自动化网络架构搜索效率更高，而且还可能找到人类难以构想出的结构，目前该技术已经在诸多领域得到了广泛应用。

在用于提升网络架构搜索的计算效率方面，腾讯 AI Lab 提出了一种过渡性的仿射参数共享训练策略。

这一策略，对参数共享的程度进行了量化分析，并动态地调整搜索训练速度、和备选网络结构的可区分性，以提升网络搜索的效率与精度。

在结合多任务学习方面，腾讯 AI Lab 采用了基于任务的结构控制器，来针对不同的任务产生针对性的网络结构，并采用元学习的方式，使得网络参数可以快速适应到新的任务上。

此外，腾讯 AI Lab 还在相关理论分析方面做出了一些贡献，包括一项评估神经机器翻译的可解释性方法，可帮助打开深度学习黑箱。

腾讯 AI Lab ，还研究了选择性机制对自注意网络的改善情况。

这项研究，解释了该机制在顺序编码和结构建模上的主要贡献，对于进一步改进自注意力网络，有一定的启发和指导意义。

最后，腾讯 AI Lab 的一篇 ECCV 2020 论文也提出了一种基于神经科学研究的新式卷积：语境门限卷积（Context-Gated Convolution）。

这是一种轻量级的组件，可以很好地应用在现有的卷积神经网络中，在图像识别、视频理解、机器翻译上都可以显著提升现有模型性能。

△ 门限卷积示意图

自然语言处理

随着 BERT 与 OpenAI GPT 等基于 Transformer 的大规模语言模型的出现，一些专家认为，NLP将在未来十年内迎来重大突破。

腾讯 AI Lab 正开展研究工作，为推动自然语言处理技术的发展努力。

在 2020 年 7 月举办的自然语言处理领域顶级会议 ACL 2020 上，腾讯 AI Lab 贡献了 20 篇论文，位列国内企业研究机构前列。

在文本理解方面，腾讯AI Lab在2020年4月，开放了文本理解系统TexSmart，可对中文和英文两种语言的文本进行词法、句法和语义分析。

△TexSmart的特色功能

与其它现有公开的文本理解工具相比，TexSmart除了支持分词、词性标注、粗粒度命名实体识别（NER）、句法分析、语义角色标注等常见功能外，还提供细粒度命名实体识别、语义联想、深度语义表达等特色功能。

TexSmart 系统，获得了2020 中国计算语言学大会（CCL）的最佳系统演示奖。

在对话理解方面，腾讯AI Lab提出了对话语义角色标注（Conversational Semantic Role Labeling）技术，将对话的语义表示成多个「谓词-论元」结构。

这项技术可以同时处理对话中常见的信息缺失和指代问题，有效地提升了对话的理解和下游任务的性能，如对话改写和对话生成。

同时，腾讯AI Lab将这项技术与对话理解其他技术结合，在京东智能客服对话比赛中获得第一名。

此外，腾讯 AI Lab 还在长文本阅读理解、从高资源语言向低资源语言的泛化、基于对话的关系抽取等方面取得了一些研究进展。

在语言生成与对话方面，除了前文的SongNet，腾讯 AI Lab 还在如何更好地理解对话上下文、如何打造千人千面的对话机器人、如何融合常识等知识、流畅且符合逻辑的自然语言生成等课题上取得了进展。

相关研究成果，包括面向多轮对话的语义角色标注与对话改写、利用灰度数据增强多轮对话理解、知识融合型对话生成、基于开放领域表格的逻辑性自然语言生成、提升对话一致性的三阶段生成模型等。

在机器翻译方面，腾讯AI Lab致力于改善翻译模型的效果。

腾讯AI Lab提出的数据重生、和多领域通用翻译模型，可以更有效地利用大规模、多领域，混合训练数据。

同时，腾讯AI Lab继续深耕于理解并改进Transformer模型，包括理解选择性机制对自注意力网络的重要性，推理置信度校准研究、评估神经机器翻译的可解释性方法。

受益于此，腾讯AI Lab的自动翻译（中英和英中）系统准确度继续保持国内前列，在国际翻译比赛WMT2020中也取得了1项第一，3项第二的成绩。

计算机视觉

2020 年，腾讯 AI Lab 在计算机视觉方面成果颇丰。

在计算机视觉领域顶级会议 CVPR 和 ECCV 上，腾讯 AI Lab 各有 11 和 18 篇论文入选，包括多模态学习、视频内容理解、对抗攻击与对抗防御、基于生成模型的图像编辑等多项课题。

此外，腾讯AI Lab在 NeurIPS 2020 上，也有多篇相关论文入选。

先来看针对视觉的对抗攻击问题，这是基于深度神经网络的计算机视觉模型的一大核心弱点，也是很多实际计算机视觉应用的最后一道门槛。

当然，这也是腾讯 AI Lab 的一大重要研究课题。

2020 年，腾讯 AI Lab 提出了一些实现对抗攻击的新策略，比如一种针对深度聚类的对抗策略。

这项策略可以挖掘易于使聚类层出现预测偏差，但不会影响深度嵌入网络性能的样本。

论文所提出的无监督对抗聚类网络，能利用对抗攻击与防御训练方法，提升深度聚类网络的鲁棒性。

另一项发表在ECCV上的研究也提出了利用扰动分解实现稀疏对抗攻击的新思路。

△ 稀疏对坑攻击示例

同时，腾讯 AI Lab 也提出了一些用于防御对抗攻击的技术，包括一种针对对抗攻击的鲁棒目标跟踪方法，能在产生轻量对抗扰动时候，将时序信息纳入考虑、从而提升模型鲁棒性。

在图像去模糊和超分辨率方面，腾讯AI Lab也成果颇丰。

在 ECCV 入选论文中，腾讯 AI Lab 有两篇论文研究了如何消除视觉场景的雨滴，包括一种基于语义理解的双目去雨方法、和一种利用雨痕和雨雾分析进行图像去雨的技术。

超分辨率方面，腾讯 AI Lab 提出了一种结合3D脸部结构先验的人脸超分辨算法，该算法能充分利用脸部结构、及身份信息，来辅助处理困难的脸部姿态变化。

当然，腾讯 AI Lab 也没有缺席热门的视频研究领域。

2020 年的相关研究，包括一种可用于时序动作分割的边界感知级联网络，这种新的级联模式，能让模型自适应地调整感受野，并对语义模糊的视频帧做出置信率更高的预测。

此外，腾讯 AI Lab 还提出了一种新的短时序动作检测框架——移动中心点检测器（MOC-Detector），其可将动作实例视为运动点的轨迹，实现高质量的长时动作检测。

手语自动翻译上，腾讯 AI Lab 也做出了一些研究进展。

它提出了一种基于多粒度视频片段的、手语翻译层次化特征学习方法。

这种方法，能自适应地利用多粒度时序信息，对视频语义进行局部和全局建模，从而极大缓解对手势分割的需求，提升翻译质量。

希望这项研究，能更进一步转化为「科技向善」的应用成果。

语音

高质量语音数据识别，是一个已经基本得到解决的问题，但在现实生活应用中，语音领域还面临着鸡尾酒会问题，以及在人们自由聊天时，口语化表达、风格多样等问题。

高自然度和表现力的合成语音，仍旧是语音合成的研究目标。

2020 年，语音技术顶级会议INTERSPEECH，共接收了 16 篇腾讯 AI Lab 论文。

其中，既有腾讯在语音前沿技术方向的进一步探索，也包含一些理论研究和分析，同时还有在科技向善与文化遗产保护等方面的应用成果。

在这其中，腾讯 AI Lab 为解决鸡尾酒会问题，提出了多项潜在的解决策略。

例如，使用视觉数据，进行辅助识别。

又或者，使用带强干扰的声源数据，来进行学习。这能「迫使」模型在非常糟糕的干扰条件下，学习到足够具有区分、泛化性能的表征。

此外，也可以改进多通道语音增强波束形成技术。

通过提出全新的基于递归神经网络的波束形成方法，领域首次突破了传统波束形成技术，在PESQ等客观指标、和WER等语音识别指标上，同时达到最优。

腾讯AI Lab还提出了一种端到端的多通道语音分离技术, 相比传统的多通道技术，性能提高了10%。

另外，在语音识别方面，腾讯 AI Lab 着力提升复杂条件下的识别性能。

研究人员通过有效结合分离和识别技术，将在各种干扰下的语音识别准确率，相对提升了20% ，该技术正广泛应用于信息流产品视频内容理解、短视频及直播视频字幕生成中。

而在语音合成方面，DurIAN 是腾讯 AI Lab 多年研究的重要结晶，也是腾讯虚拟人语音系统的核心组件。

DurIAN 不仅能合成更加自然流畅的说话语音，还能用于合成歌声，腾讯 AI Lab 甚至还探索了其在京剧合成方面的应用，从技术角度为中国传统文化的保护和传承提供一个方向。

腾讯 AI Lab 的语音合成技术，在2020 年完成端到端合成工业化落地之后，不断朝着更高的目标演进。

目前在语言合成上，不但发音人音色数量大幅增加，每个音色都具有多种情感和多种不同风格的语音合成能力，还可以综合不同风格和情感，实现针对不同场景、不同文本的、更自然的表达。

在此基础上，腾讯 AI Lab 还实现了韵律词、字级别的细粒度控制能力，可以灵活地对单个字、词的语气情感进行调节。

在一句话内部，也能实现丰富的变化，大幅提升了合成语音的表现力和感染力。

细粒度控制的合成技术，正在落地到游戏解说和小说合成等应用场景中。

秉承「科技向善」的信念和「Make AI Everywhere」的愿景，以通用人工智能和虚实集成世界为长期目标，腾讯 AI Lab 在这一年中做出了更多积极的应用和研究贡献。

这些贡献，涵盖虚拟人、多智能体、农业、医疗、药物研发和机器人等诸多领域。

期待腾讯AI Lab在2021年的表现。

开源项目&论文传送门：
https://mp.weixin.qq.com/s/OjQj7ZLe9vfadidSKT22zg

重磅！DLer-AI顶会交流群已成立！

大家好，这是DLer-AI顶会交流群！首先非常感谢大家的支持和鼓励，欢迎各位加入DLer-AI顶会交流群！本群旨在学习交流人工智能顶会（CVPR/ICCV/ECCV/NIPS/ICML/ICLR/AAAI等）、顶刊（IJCV/TPAMI/TIP等）写作与投稿事宜。包括第一时间发布论文信息和公开演讲视频，以及各大会议的workshop等等。希望能给大家提供一个更精准的研讨交流平台！！！

添加请备注：AI顶会+学校/公司+昵称（如CVPR+上交+小明）

???? 长按识别添加，即可进群！

你可能感兴趣的:(大数据,微软,机器学习,人工智能,xhtml)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
[转载] NoSQL简介 weixin_30325793 大数据数据库运维
摘自“百度百科”。NoSQL，泛指非关系型的数据库。随着互联网web2.0网站的兴起，传统的关系数据库在应付web2.0网站，特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心，暴露了很多难以克服的问题，而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战，尤其是大数据应用难题。虽然NoSQL流行语
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$