腾讯AI实验室

腾讯 AI Lab 2020 年度回顾

感谢阅读腾讯AI Lab微信号第116篇文章。本文将进行2020年度回顾。

前言

刚刚过去的 2020 年算不上是平静的一年。贯穿全年的新冠肺炎疫情仍未平息，各类偶发事件也层出不穷。即便如此，秉承「科技向善」信念和「Make AI Everywhere」愿景的腾讯 AI Lab 仍在这一年中做出了许多有价值的成果，其中包括将 AI 技术应用于疫情防控及病理筛查等其它医疗应用。同时，在以往研究的基础上，腾讯 AI Lab 在虚实集成世界与虚拟人、机器人、智慧药物研发、智慧农业、数据安全等领域都取得了进一步的重要进展。除了通过研究论文与开源项目与社区共享研究成果，腾讯 AI Lab 也在积极与高校、企业和研究机构合作，共同探索 AI 技术的潜在可能性。

下面首先将介绍 2020 年腾讯 AI Lab 在虚拟集成世界与机器人两大研究方向上的重要探索，然后会分 AI+医疗、AI+医药、AI+游戏、AI+农业、AI+内容几大主题总结这一年的行业应用成果，最后会概述这一年腾讯 AI Lab 在不同研究方向上的前沿进展。

一、双轨并行迈向通用人工智能：

虚实集成世界与机器人

通用人工智能（AGI）是腾讯 AI Lab 成立伊始便已确立的核心长远目标，即创造能感知和理解真实世界并能有效执行各种不同任务的 AI 系统。为了实现这一目标，我们既需要软件上的突破，也需要硬件的迭代创新，还更需要目前行业普遍缺乏的软硬件的有效整合与集成。

2020 年，腾讯 AI Lab 和 Robotics X 实验室主任张正友博士提出了一个全新的概念：虚实集成世界（Integrated Physical-Digital World，IPhD）。它将当前在 AI、虚拟现实（VR）、增强现实（AR）、混合现实（MR）领域的前景展望乃至互联网和物联网的思想融合到了一起。在此基础上，一个通过互相交织和共同进化的软件与硬件、虚拟与现实、人与人工智能和机器人实现通用人工智能的愿景呈现在了世人眼前。目前腾讯 AI Lab 的所有研究都可以纳入到虚实集成世界的整体框架之下，有关该概念的更详细说明可参看张博士的演讲《Hello，虚实集成世界》。

在虚实集成世界框架下，现实虚拟化、虚拟真实化、全息互联网、智能执行体四大发展方向将成为腾讯 AI Lab 和 Robotics X 实验室未来发展的重要指导。

下面将呈现腾讯 AI Lab 和 Robotics X 实验室在 2020 年取得的两项重大突破：虚拟人和机器人。我们也可将它们描述为虚拟集成世界框架下的软件和硬件智能执行体，同时也涵盖其它三大方向的一些核心技术，比如将人脸建模成数字版本就是一项现实虚拟化成果。

虚拟人：或是人类的虚拟化身，或是数字世界原住民

虚拟人是一类多模态技术，涉及计算机视觉、语音识别和生成、自然语言理解和生成等多种技术。根据来源的不同，虚拟人可大致分为两类：人类的数字化模型和虚拟世界原生虚拟人。

在建造人类的数字化模型方面，其实腾讯早在 2018 年就公布了一个基于演员姜冰洁建模得到的虚拟人 Siren。Siren 的动作和表情的拟真度都非常高，但由于采用了业内顶尖的动作捕捉和实时渲染技术，Siren 也具有相对较高的制作成本。

2020 年 10 月，腾讯 AI Lab 提出了一种基于 RGB-D 自拍视频创建高拟真度 3D 虚拟人的方法[1]。这项技术的核心是 3D 人脸 Mesh 估计、高清纹理贴图及法线细节贴图的合成算法，实现了成本极低但速度很快的 3D 人脸合成——仅需手机拍摄的视频作为输入和 30 秒处理时间即可！

基于人类建模的虚拟人具有丰富的应用场景，首当其冲的是作为人类在虚拟世界中的化身（avatar），让用户能以自然的形象参与虚拟世界的各种互动。另外，这项技术还能用于数字祭奠，纪念已逝之人；还能让人类演员在动画或游戏中扮演角色（比如基努·李维斯在《赛博朋克2077》中扮演的 Johnny Sliverhand）等应用。

而在创造虚拟世界原生虚拟人方面，腾讯 AI Lab 开发的多模态虚拟人「 AI 艾灵」已于 2020 年 5 月与公众见面并于儿童节与青年演员歌手王俊凯和雄安孩子共同演绎了新歌《点亮》。现在，你也能在哔哩哔哩直播间观看艾灵 24 小时不间断卖力表演：

https://live.bilibili.com/21927742

AI 艾灵是腾讯 AI Lab 多年来在视觉、语音、自然语言、人机交互等多模态方面的研究结晶。比如其采用的 DurIAN 语音合成框架[2]融合了腾讯 AI Lab 在语音领域多年深耕的经验，其不仅能实现精准且稳健的语音合成，而且还能生成与合成语音同步的高质量人脸表情。

DurIAN 工作过程示意图

虚拟世界原生虚拟人在虚拟偶像、虚拟助理、在线教育、数字内容生成等领域有着广泛的应用前景。比如 AI 艾灵就是一个虚拟主播兼虚拟歌手，而且她还是一个创作型歌手，其采用的 SongNet 歌词创作模型可以根据任意格式和模板来生成相契合的文本，结合上面的 DurIAN 模型，艾灵就能以自然动听的声音唱出自己写的歌。有关 DurIAN 和 SongNet 的更多描述请参阅《唱作俱佳腾讯AI艾灵领唱中国新儿歌》。

虚拟人是虚实集成世界的重要组成部分。为了实现虚实集成世界的长远目标，我们还需要打造高速实时的物联网基础设施，构建高精度的真实世界模型和更有趣有用的虚拟世界，创造更安全高效的自动化机器。面向这一目标，腾讯正在砥砺前行。

移动机器人新突破：夯实 AI+机器人双基础

自 2018 年在深圳建立以来，腾讯 Robotics X 机器人实验室一直在与腾讯 AI Lab 合作推进「AI+机器人」的发展。2020 年 11 月，两项在移动机器人领域的新进展问世：一是让四足机器人 Jamoca 学会了走梅花桩，二是提出了一种能让轮式机器人自主平衡的新方法。

为了让 Jamoca 具备走梅花桩的能力，腾讯 Robotics X 实验室基于自研的机器人控制技术为 Jamoca 打造了一个能应对复杂环境的智能大脑。这个大脑让 Jamoca 能行走、小跑和跳跃，并赋予了它自主定位和避障的能力。这是腾讯 Robotics X 实验室在机器人感知以及运动规划与控制这些核心技术方向的一次能力展示，也显现了腾讯 Robotics X 实验室在整机系统设计与搭建方面的重要能力。

Jamoca 讲解视频

而在自平衡研究上，腾讯 Robotics X 研究了能自行保持平衡的两轮式移动机器人，这是腾讯 Robotics X 实验室的首个整机自研机器人。它在传统轮式移动机器人的基础上，增加了动量轮及其电机驱动系统，使得机器人可以在静止及行进状态下均保持平衡不倒。基于该移动机器人平台的两篇研究论文被机器人行业国际顶会 IROS 2020 接受为 Oral 展示论文。该项目可以视作腾讯在机器人的机械设计和整机系统设计与搭建方向能力上的一大里程碑。

自平衡轮式移动机器人视频

更多详情请参阅《腾讯 Robotics X 实验室首次「开箱」移动机器人，能走梅花桩，还能自平衡》。

移动机器人是虚实集成世界框架中「智能执行体」的核心组成部分之一，也是实现通用人工智能终极目标的重要途径。接下来，除了继续让移动机器人能以更高的精度理解周围环境并能及时采取合理动作，腾讯 Robotics X 实验室和腾讯 AI Lab 还会继续研究如何将多模态 AI 能力与机器人相整合，从而创造出能密切参与人类生产生活，甚至可作为人类的同事和朋友的智能机器人。

二、行业应用，科技向善

「科技向善」是腾讯整个公司层面的核心使命愿景。作为腾讯大家庭的一员，腾讯 AI Lab 也同样秉承着这一使命。同时，作为 AI 科技的前沿探索者，腾讯 AI Lab 深知 AI 变革世界的潜力。因此，腾讯 AI Lab 在积极探索最前沿的 AI 技术的同时，也致力于将这样的潜力转化为切实可行的应用，以更好地服务用户和造福社会。

总体而言，这些探索可归纳为 AI+医疗、AI+医药、AI+游戏、AI+农业、AI+内容几大方向；其中包括使用 AI 助力抗击新冠疫情的实际应用、更经济高效的药物发现平台、智慧农业的进一步发展、机器翻译服务的再度升级以及基于复杂游戏场景攻坚真实世界难题的前沿探索成果。

AI+医疗：用AI抗击疫情和辅助病理医生

「AI+医疗」是腾讯 AI Lab 的核心研究方向之一，这也是一个有望造福全人类的研究课题。尤其是在新冠疫情肆虐全球一整年的背景下，AI 技术在医疗领域更是具有无可比拟的应用前景。

2020 年 7 月，钟南山院士团队与腾讯 AI Lab 联合发布了一项利用AI预测COVID-19患者病情发展至危重概率的研究成果，可分别预测5天、10天和30天内病情危重的概率，有助于合理地为病人进行早期分诊。该研究发表于国际顶级期刊 Nature 子刊 Nature Communications。同时，腾讯 AI Lab 也在第一时间开源了相关源代码并构建了一个免费的在线查询服务平台，为抗击新冠疫情贡献了自己的力量。相关报道请参阅《Nature子刊重磅：腾讯AI Lab与钟南山团队发布新冠危重症预测模型》。

重症 COVID-19 患者早期分期的深度学习生存模型计算工具

而在之前的 4 月份，腾讯 AI Lab 联合研发的智能显微镜获得 NMPA 注册证，成为国内首个获准进入临床应用的智能显微镜产品。该智能显微镜产品集成了目前病理分析与诊断方面的最新技术，并针对病理医生工作流程和习惯进行多次产品迭代。测试表明，这款智能显微镜能有效提升病理医生的工作效率、病理分析的精确度和一致性，有望缓解医院（尤其是基层医院）病理医生数量短缺且经验不足的问题，也是精准医疗从前沿研究走向落地探索的一个良好例证。详见《腾讯AI Lab宣布中国首款智能显微镜获药监局批准进入临床应用》。

之后的 11 月 25 日，在中华医学会病理分会细胞学组专家们的见证下，安必平、腾讯 AI Lab 以及腾讯觅影正式启动「科技部医疗影像国家人工智能开放创新平台——宫颈液基细胞学AI数据库建设」项目，共同助力宫颈液基细胞学数据库建设与标准规范的制定，同时还将共同推进病理科数字化、病理大数据、人工智能应用等多个方向的探索。

AI+药物：首个AI驱动的药物发现平台问世

2020 年 7 月，腾讯 AI Lab 重磅发布了首个 AI 驱动的药物发现平台「云深智药」。云深智药整合了腾讯 AI Lab和腾讯云在前沿算法、优化数据库以及计算资源上的优势，提供覆盖临床前新药发现流程的五大模块，包括蛋白质结构预测、虚拟筛选、分子设计/优化、 ADMET 属性预测及合成路线规划。

云深智药平台地址：drug.ai.tencent.com

在蛋白质结构预测方面，云深智药采用了腾讯 AI Lab 自研的冠军级蛋白质结构预测技术，其中涵盖两项关键技术突破：一种基于自监督学习的蛋白质折叠方法和一种基于深度学习的可迭代方法。该技术在全球唯一的蛋白质结构预测自动评估平台 CAMEO 半年内五次夺得月度冠军，领先众多国际知名研究团队。11 月，腾讯 AI Lab 在国际顶级期刊 Nature 子刊《Nature Communications》发表了一项研究，介绍了采用「从头折叠」的蛋白质结构预测方法帮助解析 SRD5A2 晶体结构的成果，揭示了治疗脱发和前列腺增生的药物分子「非那雄胺」对于该酶的抑制机制。

在虚拟筛选方面，「云深智药」平台的虚拟筛选模块首次将元学习和深度神经网络算法用于LBDD（基于配体的药物设计）任务，通过AI「迁移」从其他靶点上面学习到的知识（如分子局部结构对靶点结合强度的影响），应用在目标靶点上来提高模型预测精度。目前该算法在数千个实验数据集上预测精度（预测活性与实验测量活性的相关性）的中位数从目前最高记录0.36提升到0.42，且筛选可用模型的百分比从56%提升到60%，突破业界标准。

在分子生成方面，云深智药的分子生成算法通过人工智能来学习现有数据库中小分子的各种结构信息和靶点的关系，进而能够学习到一个分子空间。现有模型目前支持对 319 个Kinase和 52 个 GPC R靶点进行分子生成。在分子生成这一过程中，云深智药的算法能够针对不同靶点在分子空间中的映射进行针对性采样，从而生成新的可能对靶点有活性的分子。

而在 ADMET 属性预测方面，云深平台也有出色表现，其药物小分子 ADMET 属性预测模块已在多个数据集上优于学术界现有最好模型 3%~11%；在合作伙伴的反馈中，平台的自研算法精度超过现有商业软件 6%~37% 不等。不仅如此，云深智药还采用了注意力等机制来可视化分子中的子结构对结果的影响，提供模型的可解释性。此外，平台还可提供本地版本等灵活的部署形式，保障用户的数据安全。

腾讯 AI Lab 还在继续推进基于 AI 的药物发现技术并为云深智药平台提供更多且范围更广的功能。有关「云深智药」平台的更多信息，请参阅《腾讯发布「云深智药」平台，新基建助力药物研发全流程》或项目官网。

除此之外，腾讯 AI Lab 还开源了一个大规模自监督分子图预训练模型GROVER。GROVER 是业界首个开源的基于深度图神经网络的图数据的大规模预训练模型，研究人员可以快速将其作为基础组件应用到需要对小分子进行编码的药物研发相关研究中，助力药物研发相关应用，例如分子属性预测、虚拟筛选等任务。

GROVER模型：https://drug.ai.tencent.com/cn/news/5

论文：https://arxiv.org/abs/2007.02835

AI+农业：iGrow 再获丰收，农业仿真落地现实世界

农业是事关人类生存的基础性行业。2020 年是腾讯 AI Lab 的「AI+农业」方向的又一个「丰收年」。

6 月份，腾讯 AI Lab 与世界著名农业学府荷兰瓦赫宁根大学（WUR）联办的「第二届国际智慧温室种植挑战赛」落幕。复赛的五支队伍挑战用 AI 和 IoT 物联网等前沿技术优化种植决策，并远程自动控制温室种植小番茄。复赛队的五个 AI 收成均超过有20年经验的农业种植专家组，其中冠军组 Automatoes 得到满分，实现亩产资源消耗减少16%，净利增加121%，充分展现了农业智能决策与温室自动控制的技术价值，和为农民减负的未来潜力。

此外，腾讯 AI Lab 还携手腾讯TEG架构平台部借助在第一届比赛中自研的 AI 算法和技术经验打造的云原生「腾讯AIoT智慧种植方案 iGrow」在 2020 年已落地中国农业大省辽宁。第一期番茄试点迎来「小丰收」，每亩每季净利润增加数千元，iGrow 的商业价值得到了初步验证。

iGrow方案在辽宁温室试点

11 月 27 日，腾讯云（莘县）农业数字经济产业基地开园，这是腾讯集团在全国布局的首个农业数字经济产业基地。在新的一年里，腾讯 AI Lab 研发的 iGrow 解决方案将在该基地得到进一步的研究和应用。

继化肥、农药和大规模机械化种植之后，AI 和物联网有望让农业更进一步摆脱靠天吃饭的传统模式。通过分析和预测天气条件、温湿度、二氧化碳浓度变化动态调整种植策略，可让产量得到最优的提升。未来如果再配合自动化温室和垂直农场等新型农业技术，农业的生产效率可望实现质的飞跃，甚至可推广到原本不适宜农业生产的地区，助力消除人类社会仍未解决的饥饿问题。

AI+游戏：游戏仿真世界，「绝悟」AI 策略协作能力再升级

「AI+游戏」也是腾讯 AI Lab 深耕的研究领域。基于围棋、《王者荣耀》、《毁灭战士》、《星际争霸》等游戏平台，腾讯 AI Lab 已经研发许多有价值的前沿技术，并创造了中国国家队围棋训练专用 AI 等真实应用。此外，基于游戏环境开发的深度强化学习方法也在机器人等领域也有着非常重要的应用前景。

4 月份，腾讯 AI Lab 开发的围棋 AI「绝艺」与中国国家围棋队续约三年。作为「教练」，绝艺能从对弈、复盘、拆解、分析等多个维度，为中国围棋事业的发展提供助力，与人类顶尖棋手一起探索围棋的更多可能。

立足于国民手游《王者荣耀》，腾讯 AI Lab 开发出了策略协作型 AI 「绝悟」。2020 年，通过开放挑战和职业竞技，腾讯 AI Lab 在复杂环境决策、多智能体合作与博弈以及策略预测与规划方面的成果得到了展现：

● 2020 年 5 月 1-4 日，「绝悟」首次向玩家大规模开放。在此期间，从职业玩家到游戏主播再到普通业余玩家，大量不同游戏水平的游戏玩家向绝悟发起了挑战，见识了绝悟在战术规划、玩家行为预测、多英雄配合等方面的能力。

● 8 月 18 日，腾讯牵头构建的 AI 多智能体与复杂决策开放研究平台「开悟」正式对高校开放，同时开启了首届「开悟AI+游戏高校大赛」。依托于腾讯 AI Lab 和「王者荣耀」在算法、数据（脱敏）、算力方面的核心优势，向学术研究人员和算法开发者开放的开悟致力于发展成为国内领先、国际一流的研究与应用探索平台。

● 11 月 28 日，「绝悟完全体」进入王者峡谷并在 28-30 日间开启了三天公众体验。不同于 5 月份开放的版本，完全体版本的绝悟解禁了全部英雄池，掌握了所有英雄的所有技能，同时其它多项策略也得到优化，相关已被 AI 顶级会议 NeurIPS 2020 与顶级期刊 TNNLS 收录。

「开悟」官网链接：aiarena.tencent.com

为了让绝悟 AI 掌握全部英雄，腾讯 AI Lab 提出的一种新方法：课程自对弈学习（CSPL）。这是一种让 AI 从易到难的渐进式学习方法：先引入「老师分身」模型，每个 AI 老师通过深度强化学习技术在单个阵容上训练至精通；再引入一个 AI 学生模仿学习所有的 AI 老师；最终让绝悟掌握了所有英雄的所有技能，成为一代宗师。

CSPL流程图

设计思想：任务由易到难，模型从简单到复杂，知识逐层深入

《王者荣耀》等 MOBA 类游戏具有非常的复杂度，同时还涉及到非常多样化的合作与对抗博弈方式，因此非常适合作为策略型 AI 的开发平台，用于研发适用于不同场景的通用型 AI 技术。这类技术在许多真实世界场景中也有重要的应用价值，比如可以协调在路况复杂的城市道路上行驶的自动驾驶汽车以及为快递员或快递无人机规划配送区域和路线。

除此之外，2020 年 12 月，腾讯 AI Lab 绝悟团队借助「开悟」平台开发的足球 AI 「绝悟-WeKick 版本」在 Google Research 与英超曼城俱乐部联合举办的足球 AI Kaggle 竞赛上获得冠军。该竞赛使用 Google Brain 基于开源足球游戏 Gameplay Football 开发的强化学习环境 Google Research Football。这场 Kaggle 竞赛也是首场相关竞赛。不同于《王者荣耀》，足球 AI 比赛涉及到 11 个智能体的相互配合以及与另外 11 个智能体的对抗，同时奖励相比于 MOBA 游戏还更稀疏。

WeKick 踢足球

即便如此，WeKick 依然以显著优于第二名的成绩获得了冠军。这体现了完全体「绝悟」底层技术和框架的通用性。

虽然都是 RTS （即时战略）游戏，星际争霸中需要控制多种不同类型不同数量的单位，这些单位又有各自的运动和攻击特点，因而动作空间更大、策略空间更丰富。腾讯 Robotics X 开源了首个通用的大规模多智能体博弈训练框架TLeague[3]，并据此训练出能击败大师级选手的星际争霸强AI TStarBot-X。这个星际AI只使用了AlphaStar的50分之一的算力。

AI+内容：TranSmart再升级，用AI赋能人工翻译

腾讯交互翻译TranSmart是目前业界唯一可实现人机交互的互联网机器翻译产品。经过三年积累，功能已覆盖人工翻译全流程，如按键、词、短语、句子、翻译记忆等。2020年，TranSmart开启商业化探索之旅，获得业界伙伴积极认可：

● 阅文集团：国内排名第一的正版数字阅读平台，将通过网文定制翻译引擎赋能海外编辑人员，翻译上千部出海的小说作品。

● 华泰证券：国内前五的券商，其证券分析师通过翻译记忆融合与交互翻译，高效发布中英双语研报；

● 腾讯云官网：在国际版官网和技术文档翻译过程中，定制翻译引擎准确处理Markdown、XML等标记文本，高效复用术语、双语句对等语言资产，助力腾讯云数百款产品出海远航。

TranSmart继承和发展了交互翻译的技术概念，在保证人作为翻译主体的同时，量身定制的个性化机器翻译全方位赋能人工翻译过程：

● 自动翻译质量：在目标场景中，通过语料增强和模型优化，自动翻译质量稳居行业前列；

● 实时译文建议：译文片段智能推荐和整句补全，显著减少用户反复修改错误译文的困扰，大幅改善人工翻译体验；

● 翻译记忆融合：动态结合用户已完成的双语句对，生成更符合期望的自动译文，性能显著优于传统静态和增量式训练的机器翻译；

● 翻译输入法：参照原文上下文和机器翻译知识，实现精准组词，加快人工翻译过程中的输入效率。

三、前沿研究进展

作为国内领先、世界一流的企业级人工智能实验室，腾讯 AI Lab 一直秉承开放合作的理念与全球高校和研究机构共同探索 AI 技术前沿。

2020 年腾讯AI Lab的高校合作项目「犀牛鸟专项研究计划」完成第三年度闭环，共发表高水平论文 50 多篇，项目的多项成果已应用于智能语音交互产品、直播自动解说系统和视觉识别系统等。新的一年，「犀牛鸟」还将继续飞翔，继续发现前沿研究中的挑战性问题并开展原创性研究，同时探索新技术的行业应用案例，打造持续共赢的产学研合作生态和科研成果转化平台。

此外，腾讯 AI Lab 还启动了「开悟」AI多智能体与复杂决策开放研究平台产学研生态建设，发起首届王者荣耀开悟 AI 学术交流赛，邀请清华大学、北京大学、中科院等 18 所高校师生开展百人专项培训和竞赛，为今后开悟平台向高校的更大规模开放打下良好基础。

在学术成果上，2020 年腾讯 AI Lab 和 Robotics X 实验室在计算机视觉、语音、自然语言处理、多模态、知识图谱、机器学习、机器人等更众多 AI 领域都做出了业界领先的贡献，并通过学术会议、期刊和公开平台分享了这些劳动成果。在 ACL、INTERSPEECH、IROS、NeurIPS、AAAI 等主要顶级学术会议上，腾讯 AI Lab 和 Robotics X 实验室都做出了较为显著的贡献，整体发表的论文数量位居国内企业实验室前列。

据上海交通大学 Acemap 学术地图统计，腾讯 2020 年在 AI 领域的论文（其中相当大一部分来自腾讯 AI Lab）发表数位列全球大学与机构第 8 位，H-index 全球并列第 5 位。在中国的大学和机构排名中，腾讯的 AI 论文数量排名第 4， H-index 并列第 2，大幅领先国内其它企业。

腾讯 2020 年在 AI 领域的论文发表情况，其中论文发表数全球第 8 位，H-index 全球并列第 5 位，来自 https://www.acemap.info/ranking

下面将分主题简单梳理腾讯 AI Lab 在 2020 年发布的一些重要研究成果。

多模态研究

多模态研究的目标是让 AI 或机器人能通过整合多种不同来源的信号来理解环境和做出判断，比如视觉、雷达、GPS、语音、语言和互联网数据等。也因此，多模态研究对通用人工智能和虚实集成世界两大长期愿景而言具有极其重要的价值。虽然多模态研究非常重要，但 AI 领域目前还没有专门面向多模态研究的顶级会议或顶级期刊，也因此腾讯 AI Lab 的多模态研究成果分散地发表在不同的学术会议和期刊上。

2020 年腾讯 AI Lab 在多模态方向上的研究主要集中于音频/视频/图像与文本的多模态学习。除了前文已经介绍过的虚拟人成果，腾讯 AI Lab 还提出了一种针对视频中时序句子定位和事件描述学习模态间交互的新方法[4]，该方法能学习成对的模态交互，从而改善两项任务的性能。

另外，腾讯 AI Lab 还研究了如何基于场景图分解来生成自然语言描述[5]，通过递归子查询构造改善视觉和自然语言匹配[6]以及一种新的视觉-文本匹配模型[7]。

用于描述并定位视频事件的视频-文本多模态学习框架

除了视频-文本多模态，腾讯 AI Lab 也在视频-音频多模态上取得了一些研究成果。比如在一项 INTERSPEECH 2020 研究中，腾讯 AI Lab 提出了一种利用跨域视觉生成特征辅助障碍语音识别的方法[8]。该方法可利用大量域外的音频-视觉数据进行训练，从而为那些只有有限或者没有视觉数据的说话人生成视觉特征。这项帮助有发音障碍的说话人，提出的语音识别技术，有望实现一些重要的「科技向善」应用。

多模态语音分离框架

另外，在多模态人机交互上, 腾讯 AI Lab 还提出了多模态说话人diarization [9]；多模态语音分离[10]; 以及多模态语音识别方案[11]。这是融合音频、视频、声纹、空间信息等多个模态，针对「鸡尾酒会」一类复杂场景的人机交互整体解决方案。

多模态语音分离和识别的联合训练框架

腾讯 AI Lab 还提出了一种新的深度多模融合框架：信道交换网络(CEN) [12]。该框架通过在训练中自我引导地、动态地交换特定通道的特征，从而可在保持足够的模态内自身特征学习的同时，促进模态间的特征交互。

机器学习

机器学习是 AI 的核心过程和标志性能力，近些年的 AI 发展热潮正是源自深度学习这种机器学习技术的突破。近段时间，机器学习领域的研究重心除了继续优化深度学习方法和拓展其应用范围外，也在积极探索其与其它学习范式的组合，并由此诞生了深度强化学习和生成对抗网络的成功技术，此外，擅长梳理网络关系的深度图学习也已成为领域的一大热门研究方向。

2020 年，腾讯 AI Lab 在多个机器学习方向上都得到了重要的研究成果，也为机器学习模型的可解释性、鲁棒性等理论分析做出了贡献。这些研究成果可见于 NeurIPS 2020 等 AI 领域顶级会议和 Nature Communications 等顶级期刊。

在这其中，深度强化学习是腾讯 AI Lab 的一大核心研究方向。立足于围棋和《王者荣耀》等视频游戏等场景，腾讯 AI Lab 在深度强化学习方面的探索已达世界前列水平。基于此技术开发的围棋 AI 「绝艺」已在中国国家围棋队训练中得到了实际应用，《王者荣耀》AI 「绝悟」也已进化为「完全体」并通过首次大规模 MOBA AI 智能体性能测试接受了广大玩家的检验。完全体绝悟的成功基于腾讯 AI Lab 对新提出的方法与成熟方法的有效组合，其中包括课程自博弈学习、多头价值估计、策略注入、蒙特卡洛树搜索和离策略等。

腾讯 AI Lab 在深度图学习方面也成绩斐然，其中包括前文已提到的完全基于自监督训练的图神经网络框架 GROVER。通过在原子、化学键、分子级别的自监督任务设计，GROVER可以从海量的无标签分子中学习到大量结构/语义信息。与此同时，为了可以编码分子中海量的复杂信息，GROVER 还整合了消息传播网络和Transformer，得到一个有更强表达能力的图神经网络模型 GTransformer。这对药物研发方面具有广阔的应用潜力。腾讯 AI Lab 还提出了一种基于狄利克雷分布的图变分自编码器框架[13]并证明了该框架与经典平衡图分割方法的等价性。另外腾讯 AI Lab 还通过分子逆合成分析探索了深度图学习在化学领域的应用[14]。此外，在 2020 年的 ACM SIGKDD 会议上，腾讯AI Lab、清华大学、香港中文大学等机构联合组织，通过一场为期一天的课程系统性地讲解了图神经网络，详见《腾讯AI Lab联合清华、港中文，万字解读图深度学习历史、最新进展与应用》。

腾讯 AI Lab 还有一项将深度强化学习与图学习组合起来的研究成果，这是一种针对文字游戏提出的基于分层堆叠注意力机制的深度强化学习算法[15]。这项研究使用了知识图进行显式推理以进行决策，从而通过可解释的推理程序生成并支持智能体的决策。加上一种新提出的分层堆叠注意力机制，可通过利用知识图的结构来构造推理过程的显式表示。

分层堆叠注意力网络架构

腾讯 AI Lab 在网络架构搜索方面也取得了一些进展。相较于人工设计网络架构，自动化网络架构搜索效率更高，而且还可能找到人类难以构想出的结构，目前该技术已经在诸多领域得到了广泛应用。在用于提升网络架构搜索的计算效率方面，腾讯 AI Lab 提出了一种过渡性的仿射参数共享训练策略[16]，对参数共享的程度进行了量化分析，并动态地调整搜索训练速度和备选网络结构的可区分性，以提升网络搜索的效率与精度。

在结合多任务学习方面，腾讯 AI Lab 采用了基于任务的结构控制器，来针对不同的任务产生针对性的网络结构，并采用元学习的方式，使得网络参数可以快速适应到新的任务上[17]。

此外，腾讯 AI Lab 还在相关理论分析方面做出了一些贡献，包括一项评估神经机器翻译的可解释性方法[18]，可帮助我们打开深度学习黑箱。另外，腾讯 AI Lab 还研究了选择性机制对自注意网络的改善情况[19]，解释了该机制在顺序编码和结构建模上的主要贡献，这对于进一步改进自注意力网络有一定的启发和指导意义。

最后，腾讯 AI Lab 的一篇 ECCV 2020 论文也提出了一种基于神经科学研究的新式卷积：

语境门限卷积（Context-Gated Convolution）[20]。这是一种轻量级的组件，可以很好地应用在现有的卷积神经网络中，在图像识别、视频理解、机器翻译上都可以显著提升现有模型性能。

门限卷积示意图

自然语言处理

随着 BERT 与 OpenAI GPT 等基于 Transformer 的大规模语言模型的出现，一些专家认为自然语言处理领域将在未来十年内迎来重大突破。腾讯 AI Lab 正在为推动自然语言处理技术的发展而开展研究工作。在 2020 年 7 月举办的自然语言处理领域顶级会议 ACL 2020 上，腾讯 AI Lab 贡献了 20 篇论文，位列国内企业研究机构前列，详情参阅《ACL 2020 | 腾讯AI Lab解读三大前沿方向及入选论文》。

在文本理解方面，2020 年 4 月腾讯 AI Lab 开放了文本理解系统TexSmart，可对中文和英文两种语言的文本进行词法、句法和语义分析。与其它现有公开的文本理解工具相比，TexSmart除了支持分词、词性标注、粗粒度命名实体识别（NER）、句法分析、语义角色标注等常见功能外，还提供细粒度命名实体识别、语义联想、深度语义表达等特色功能。TexSmart 系统获得了2020 中国计算语言学大会（CCL）最佳系统演示奖。在对话理解方面，腾讯AI Lab提出了对话语义角色标注（Conversational Semantic Role Labeling）技术，该技术将对话的语义表示成多个「谓词-论元」结构，可以同时处理对话中常见的信息缺失和指代问题，有效地提升了对话的理解和下游任务的性能，如对话改写[21]和对话生成。同时，腾讯AI Lab将该项技术和对话理解的其他技术结合，在京东智能客服对话比赛中获得第一名。

此外，腾讯 AI Lab 还在长文本阅读理解[22]、从高资源语言向低资源语言的泛化[23]、基于对话的关系抽取[24]等方面取得了一些研究进展。

在语言生成与对话方面，除了前文已经描述过的能生成格式可控的歌词、诗词文本的 SongNet[25]，腾讯 AI Lab 还研究了如何更好地理解对话上下文、如何打造千人千面的对话机器人、如何融合常识等知识、如何在保证流畅性的同时生成符合逻辑的自然语言等课题。相关研究成果包括面向多轮对话的语义角色标注与对话改写[26]、利用灰度数据增强多轮对话理解[27]、知识融合型对话生成[28]、基于开放领域表格的逻辑性自然语言生成[29]、提升对话一致性的三阶段生成模型[30]等。

在机器翻译方面，我们致力于改善翻译模型的效果。我们提出的数据重生[31]和多领域通用翻译模型[32]可更有效利用大规模多领域混合训练数据。同时，我们继续深耕于理解并改进Transformer模型，其中包括理解选择性机制对自注意力网络的重要性[33]，推理置信度校准研究和评估神经机器翻译的可解释性方法[34]。受益于此，我们的自动翻译（中英和英中）系统准确度继续保持国内前列，在国际翻译比赛WMT2020中也取得了1项第一，3项第二的成绩。

计算机视觉

2020 年，腾讯 AI Lab 在计算机视觉方面成果颇丰。在计算机视觉领域顶级会议 CVPR 和 ECCV 上，腾讯 AI Lab 各有 11 和 18 篇论文入选，多模态学习、视频内容理解、对抗攻击与对抗防御、基于生成模型的图像编辑等多项课题。此外在 NeurIPS 2020 上也有多篇相关论文入选。

首先来看针对视觉的对抗攻击问题，这是基于深度神经网络的计算机视觉模型的一大核心弱点，也是很多实际计算机视觉应用的最后一道门槛。当然，这也是腾讯 AI Lab 的一大重要研究课题。2020 年，腾讯 AI Lab 提出了一些实现对抗攻击的新策略，比如一种针对深度聚类的对抗策略可以挖掘易于使聚类层出现预测偏差，但却不会影响深度嵌入网络性能的样本，这种无监督对抗聚类网络能利用对抗攻击与防御训练方法提升深度聚类网络的鲁棒性[35]；另一项发表在ECCV上的研究也提出了利用扰动分解实现稀疏对抗攻击的新思路[36]。

稀疏对坑攻击示例

同时，腾讯 AI Lab 也提出了一些用于防御对抗攻击的技术，包括一种针对对抗攻击的鲁棒目标跟踪方法[37]，它能在产生轻量对抗扰动时候将时序信息纳入考虑，从而提升模型鲁棒性。

腾讯 AI Lab 在图像去模糊和超分辨率方面也成果颇丰。比如在 ECCV 入选论文中，腾讯 AI Lab 有两篇论文研究了如何消除视觉场景的雨滴，其中包括一种基于语义理解的双目去雨方法[38]和一种利用雨痕和雨雾分析进行图像去雨的技术[39]。超分辨率方面，腾讯 AI Lab 提出了一种结合3D脸部结构先验的人脸超分辨算法[40]，该算法能充分利用脸部结构及身份信息来辅助处理困难的脸部姿态变化。

当然，腾讯 AI Lab 也没有缺席热门的视频研究领域，这能帮助机器理解不断动态变化的世界，对多模态学习而言也具有重要价值。2020 年的相关研究包括一种可用于时序动作分割的边界感知级联网络，这种新的级联模式能让模型自适应地调整感受野以及对语义模糊的视频帧做出更加有信心的预测。此外，腾讯 AI Lab 还提出了一种新的短时序动作检测框架——移动中心点检测器（MOC-Detector）[41]，其可将动作实例视为运动点的轨迹，实现高质量的长时动作检测[42]。

腾讯 AI Lab 也在手语自动翻译上做出了一些研究进展，其提出了一种基于多粒度视频片段的手语翻译层次化特征学习方法[43]，该方法能自适应地利用多粒度时序信息，对视频语义进行局部和全局的建模，从而能极大缓解对手势分割的需要，提升翻译质量。希望这项研究能更进一步转化为「科技向善」的应用成果。

语音

高质量语音数据识别是一个已经基本得到解决的问题，但在现实生活应用中，语音领域还面临着鸡尾酒会问题以及人们自由聊天口语化表达风格多样的问题。而在语音合成方面，高自然度和表现力的合成语音仍旧还是需要不断努力到达的目标。

2020 年，语音技术顶级会议 INTERSPEECH 共接收了 16 篇腾讯 AI Lab 论文，其中既有在语音前沿技术方向的进一步探索，也包含一些理论研究和分析，同时还有在科技向善与文化遗产保护等方面的应用成果。详情参阅《INTERSPEECH 2020 | 腾讯AI Lab解读语音识别与合成方向及入选论文》。

在这其中，腾讯 AI Lab 为解决鸡尾酒会问题提出了多项潜在的解决策略。一是前面多模态学习部分已经介绍的使用视觉数据辅助识别；二是使用带强干扰的声源数据来进行学习[44]，这能「迫使」模型在非常糟糕的干扰条件下学习到足够具有区分和泛化性能的表征，三是不断改进多通道语音增强波束形成技术，通过提出全新的基于递归神经网络的波束形成方法[45]，首次突破传统波束形成技术，在PESQ等客观指标和WER等语音识别指标上同时达到最优。四是提出了一种端到端的多通道语音分离技术[46], 比传统的多通道技术性能提高10%。

另外，在语音识别方面，腾讯 AI Lab 着力提升复杂条件下的识别性能，通过有效结合分离和识别技术，使得在背景音乐及干扰人声下的语音识别准确率获得相对20% 的大幅提升，该技术正广泛应用于信息流产品视频内容理解、短视频及直播视频字幕生成中。

而在语音合成方面，DurIAN 是腾讯 AI Lab 多年研究的重要结晶，也是腾讯虚拟人语音系统的核心组件。DurIAN 不仅能合成更加自然流畅的说话语音，还能用于合成歌声，腾讯 AI Lab 甚至还探索了其在京剧合成方面的应用[47]，从技术角度为中国传统文化的保护和传承提供一个方向。腾讯 AI Lab 的语音合成技术在2020 年完成端到端合成工业化落地之后，不断朝着更高的目标演进，不但发音人音色数量大幅增加，每个音色都具有多种情感和多种不同风格的语音合成能力，可综合不同风格和情感实现针对不同场景不同文本更自然的表达。在此基础上，腾讯 AI Lab 还实现了韵律词、字级别的细粒度控制能力，可以灵活地对单个字、词的语气情感进行调节，在一句话内部也可有丰富的变化，大幅提升了合成语音的表现力和感染力。细粒度控制的合成技术正在落地到游戏解说和小说合成这样对表现力和感染力要求更高的应用场景中。

四、总结与展望

过去的 2020 年是必然会被写入历史书的一年，如何让这个世界变得更好已成为更多人积极思考和探索的问题，而科技必将在其中发挥至关重要的作用。

继续秉承「科技向善」的信念和「Make AI Everywhere」的愿景，以通用人工智能和虚实集成世界为长期目标，腾讯 AI Lab 在这一年中做出了更多积极的应用和研究贡献，涵盖虚拟人、多智能体、农业、医疗、药物研发和机器人等诸多领域。

面对未知的未来，腾讯 AI Lab 还将继续砥砺前行，努力用科学技术攻克这个世界所面临的的许多宏观难题和日常生活中的许多微观任务。新的一年，我们不会放松在前沿科技上的进一步探索，同时还将拓展 AI 技术的更多行业应用。

如果你曾在王者峡谷与完全体「绝悟」对战过，如果你曾在 AI 艾灵的舞台前点歌并倾听过她的演唱，或者如果你也曾借鉴腾讯 AI Lab 的思路开展自己的项目，不妨与我们分享一下你的经历和感受。

2021，新年快乐！

开源项目

● hifi3dface：高速低成本创建高拟真度 3D 虚拟人

https://github.com/tencent-ailab/hifi3dface

● SongNet：可以根据任意格式和模板来生成相契合的文本（诗词歌赋），该项目还发布了一个预训练汉语模型和一个已经过微调的宋词模型。

https://github.com/lipiji/SongNet

● GROVER：大规模自监督分子图预训练模型（可用于 ADMET 分子属性预测等任务）

https://ai.tencent.com/ailab/ml/gnnpretrain.html

● 重症COVID-19患者早期分期的深度学习生存模型

https://github.com/cojocchen/covid19_critically_ill

● LogicNLG：基于开放领域表格的逻辑性自然语言生成

https://github.com/wenhuchen/LogicNLG

● Graph2Tree：用于自动解数学应用题的图到树学习

https://github.com/2003pro/Graph2Tree

● recurrent-transformer：用于生成更连贯视频语言描述的记忆增强型循环Transformer

https://github.com/jayleicn/recurrent-transformer

● InfECE：神经机器翻译中推理阶段的置信度校准研究

https://github.com/shuo-git/InfECE

● SSAN：选择性自注意网络

https://github.com/xwgeng/SSAN

● Data Rejuvenation：数据重生：让神经机器翻译中的不活跃样本「复活」

https://github.com/wxjiao/Data-Rejuvenation

● metaHypernymy：基于元学习的低资源语言上下位预测的方法

https://github.com/ccclyu/metaHypernymy

● DialogRE：基于对话的关系抽取（RE）数据集

https://github.com/nlpdata/dialogre

与https://dataset.org/dialogre

● AMR-multiview：图到文本生成中的结构化信息保留

https://github.com/Soistesimmer/AMR-multiview

● lab-zp-joint：基于多任务训练框架的联合零指代还原和消解训练

https://github.com/freesunshine0316/lab-zp-joint

● Sub-GC：基于场景图分解的自然语言描述生成

https://github.com/YiwuZhong/Sub-GC

● FeatherWave：一种高效的多频带并行式高质量语音合成器

https://wavecoder.github.io/FeatherWave/

● TSPNet：基于时序语义金字塔的手语翻译层次化特征学习

https://github.com/verashira/TSPNet

● ALRDC：基于对抗学习的鲁棒性深度聚类

https://github.com/xdxuyang/ALRDC

● ProxyGML：使用更少代理的深度图度量学习方法

https://github.com/YuehuaZhu/ProxyGML

● CEN：信道交换网络

https://github.com/yikaiw/CEN

● TStarBot-X：纯机器学习的星际争霸II强AI

https://github.com/tencent-ailab/tleague_projpage

● TLeague：通用的大规模多智能体博弈训练框架

https://github.com/tencent-ailab/tleague_projpage

开放项目

开悟：用游戏探索通用人工智能，现已面向高校开放

● https://aiarena.tencent.com/aiarena/zh/index/

重症COVID-19患者早期分期的深度学习生存模型查询服务

● https://aihealthcare.tencent.com/COVID19-Triage.html

AI安全攻击矩阵：业内首个 AI 安全攻击矩阵，一份具有高实用性的AI安全技术指导框架

● https://share.weiyun.com/8InYhaYZ

TexSmart：开放自然语言理解系统，详见《腾讯AI Lab开放文本理解系统TexSmart，让AI想得更深更广》

论文链接：

应用项目

[1]基于 RGB-D 自拍视频创建高拟真度 3D 虚拟人

https://arxiv.org/abs/2010.05562

[2]DurIAN 语音合成框架

https://tencent-ailab.github.io/durian/

[3]通用大规模多智能体博弈训练框架TLeague

https://github.com/tencent-ailab/tleague_projpage

[4]一种针对视频中时序句子定位和事件描述学习模态间交互的新方法

https://www.ecva.net/papers/eccv_2020/papers_ECCV/papers/123490324.pdf

多模态研究

[5]基于场景图分解来生成自然语言描述

https://www.ecva.net/papers/eccv_2020/papers_ECCV/html/2115_ECCV_2020_paper.php

[6]通过递归子查询构造改善视觉和自然语言匹配

https://arxiv.org/abs/2008.01059

[7]一种新的视觉-文本匹配模型

https://arxiv.org/abs/2007.08883

[8]一种利用跨域视觉生成特征辅助障碍语音识别的方法

https://isca-speech.org/archive/Interspeech_2020/abstracts/2282.html

[9]多模态说话人diarization

https://arxiv.org/pdf/2002.05314.pdf

[10]多模态语音分离

https://arxiv.org/pdf/2003.07032.pdf

[11]多模态语音识别方案

https://arxiv.org/abs/2005.08571

[12]一种新的深度多模融合框架：信道交换网络(CEN)

https://proceedings.neurips.cc/paper/2020/hash/339a18def9898dd60a634b2ad8fbbd58-Abstract.html

机器学习

[13]一种基于狄利克雷分布的图变分自编码器框架

https://proceedings.neurips.cc/paper/2020/hash/38a77aa456fc813af07bb428f2363c8d-Abstract.html

[14]通过分子逆合成分析探索深度图学习在化学领域的应用

https://proceedings.neurips.cc/paper/2020/hash/819f46e52c25763a55cc642422644317-Abstract.html

[15]一种针对文字游戏提出的基于分层堆叠注意力机制的深度强化学习算法

https://arxiv.org/abs/2010.11655

[16]一种过渡性的仿射参数共享训练策略

https://proceedings.neurips.cc/paper/2020/hash/42cd63cb189c30ed03e42ce2c069566c-Abstract.html

[17]多任务学习-基于任务的结构控制器

https://doi.org/10.1609/aaai.v34i04.6084

[18]一项评估神经机器翻译的可解释性方法

https://arxiv.org/abs/2005.01672

[19]选择性机制对自注意网络的改善情况

https://arxiv.org/abs/2005.00979

[20]语境门限卷积（Context-Gated Convolution）

https://arxiv.org/abs/1910.05577

自然语言处理

[21]对话语义角色标注（Conversational Semantic Role Labeling）技术-对话改写

https://arxiv.org/pdf/2010.01417.pdf)

[22]长文本阅读理解

https://arxiv.org/abs/2005.08056

[23]从高资源语言向低资源语言的泛化

https://www.aclweb.org/anthology/2020.acl-main.336/

[24]基于对话的关系抽取

https://arxiv.org/abs/2004.08056

[25]SongNet

https://arxiv.org/abs/2004.08022

[26]面向多轮对话的语义角色标注与对话改写

https://arxiv.org/pdf/2010.01417.pdf

[27]利用灰度数据增强多轮对话理解

https://arxiv.org/abs/2004.02421

[28]知识融合型对话生成

https://arxiv.org/abs/2005.06128

[29]基于开放领域表格的逻辑性自然语言生成

https://arxiv.org/abs/2004.10404

[30]提升对话一致性的三阶段生成模型

https://arxiv.org/abs/2004.07672

[31]数据重生

https://www.aclweb.org/anthology/2020.emnlp-main.176.pdf

[32]多领域通用翻译模型

https://arxiv.org/abs/1911.09912

[33]选择性机制对自注意力网络的重要性

https://arxiv.org/abs/2005.00979

[34]推理置信度校准研究和评估神经机器翻译的可解释性方法

https://arxiv.org/abs/2005.00963

https://arxiv.org/abs/2005.01672

计算机视觉

[35]一种针对深度聚类的对抗策略

https://proceedings.neurips.cc/paper/2020/hash/6740526b78c0b230e41ae61d8ca07cf5-Abstract.html

[36]利用扰动分解实现稀疏对抗攻击的新思路

https://paperswithcode.com/paper/sparse-adversarial-attack-via-perturbation

[37]一种针对对抗攻击的鲁棒目标跟踪方法

https://arxiv.org/abs/2007.09919

[38]一种基于语义理解的双目去雨方法

https://link.springer.com/chapter/10.1007/978-3-030-58583-9_5

[39]一种利用雨痕和雨雾分析进行图像去雨的技术

https://arxiv.org/abs/2008.00823

[40]一种结合3D脸部结构先验的人脸超分辨算法

http://www.ecva.net/papers/eccv_2020/papers_ECCV/papers/123490732.pdf

[41]一种新的短时序动作检测框架——移动中心点检测器（MOC-Detector）

https://arxiv.org/abs/2001.04608

[42]边界感知级联网络

https://www.ecva.net/papers/eccv_2020/papers_ECCV/papers/123700035.pdf

[43]手语自动翻译

https://proceedings.neurips.cc/paper/2020/hash/8c00dee24c9878fea090ed070b44f1ab-Abstract.html

语音

[44]使用带强干扰的声源数据来进行学习

https://www.isca-speech.org/archive/Interspeech_2020/pdfs/1545.pdf

[45]全新的基于递归神经网络的波束形成方法

https://arxiv.org/abs/2008.06994

[46]一种端到端的多通道语音分离技术

https://arxiv.org/pdf/2003.03927.pdf

[47]DurIAN在京剧合成方面的应用

https://arxiv.org/abs/2008.03029

* 欢迎转载，请注明来自腾讯AI Lab微信（tencent_ailab）

你可能感兴趣的:(腾讯,makefile,大数据,opensource,hashtable)

疫情下，我的健康码首次变成了黄码唯我一心
3月中旬，老公在广州白云区接了一单生意，要很久才回来，就在那里租了一间房，带我和孩子一起住。房子在七楼，步梯，因孩子小，自己就很少下楼，都是他买菜回来，4月8号，订单完成，返程回了佛山。过了两天突然接到短信通知，白云区要大规模核酸筛查，又过一天收到短信:通过大数据分析，您近期行程涉及疫情防控重点区域，您的健康码将被赋予2次黄码并需开展2次核酸检测，请注意健康码状态，尽快凭码到附近黄码核酸检测点进行
到底应该怎么抓语文成绩山东董纯
上学期期末考试，全区统一采用网上阅卷的形式。在这个大数据时代，在这个极为透明的数据时代，一旦采用这样网络统一阅卷的形式。那丑媳妇就要真的见公婆了。再这样一个要生源没生源。要学习积极性没有学习积极性的氛围里。想取得好的成绩是真的难上加难。尽管已经预料到跟其他兄弟学校有一定的差距。但是没有想到差距如此之大。领导们坐不住了，反复约谈备课组长。理由是其他科目差距不大，甚至有优势。为什么语文学科会有如此大的
Java零基础-三维数组详解！喵手零基础学Java java 开发语言
哈喽，各位小伙伴们，你们好呀，我是喵手。运营社区：C站/掘金/腾讯云/阿里云/华为云/51CTO；欢迎大家常来逛逛今天我要给大家分享一些自己日常学习到的一些知识点，并以文字的形式跟大家一起交流，互相学习，一个人虽可以走的更快，但一群人可以走的更远。我是一名后端开发爱好者，工作日常接触到最多的就是Java语言啦，所以我都尽量抽业余时间把自己所学到所会的，通过文章的形式进行输出，希望以这种方式
Java零基础-数组
全文目录：开篇语前言摘要简介源代码解析应用场景案例优缺点分析类代码方法介绍Java代码测试用例全文小结总结文末开篇语哈喽，各位小伙伴们，你们好呀，我是喵手。运营社区：C站/掘金/腾讯云/阿里云/华为云/51CTO；欢迎大家常来逛逛今天我要给大家分享一些自己日常学习到的一些知识点，并以文字的形式跟大家一起交流，互相学习，一个人虽可以走的更快，但一群人可以走的更远。我是一名后端开发爱好者，工作
Java零基础-数组：数组的遍历和操作喵手零基础学Java java 算法
全文目录：开篇语前言摘要简介源代码解析应用场景案例优缺点分析类代码方法介绍Java代码测试用例全文小结总结文末开篇语哈喽，各位小伙伴们，你们好呀，我是喵手。运营社区：C站/掘金/腾讯云/阿里云/华为云/51CTO；欢迎大家常来逛逛今天我要给大家分享一些自己日常学习到的一些知识点，并以文字的形式跟大家一起交流，互相学习，一个人虽可以走的更快，但一群人可以走的更远。我是一名后端开发爱好者，工作
Java零基础-数组：多维数组喵手零基础学Java java 算法
全文目录：开篇语前言摘要简介源代码解析应用场景案例优缺点分析类代码方法介绍具体的Java代码测试用例全文小结总结文末开篇语哈喽，各位小伙伴们，你们好呀，我是喵手。运营社区：C站/掘金/腾讯云/阿里云/华为云/51CTO；欢迎大家常来逛逛今天我要给大家分享一些自己日常学习到的一些知识点，并以文字的形式跟大家一起交流，互相学习，一个人虽可以走的更快，但一群人可以走的更远。我是一名后端开发爱好者
Java零基础-数组：数组长度和属性喵手零基础学Java java 开发语言
全文目录：开篇语前言摘要简介源代码解析应用场景案例优缺点分析类代码方法介绍Java代码测试用例全文小结总结文末开篇语哈喽，各位小伙伴们，你们好呀，我是喵手。运营社区：C站/掘金/腾讯云/阿里云/华为云/51CTO；欢迎大家常来逛逛今天我要给大家分享一些自己日常学习到的一些知识点，并以文字的形式跟大家一起交流，互相学习，一个人虽可以走的更快，但一群人可以走的更远。我是一名后端开发爱好者，工作
Java零基础-数组：声明和初始化数组喵手零基础学Java java 开发语言
全文目录：开篇语前言摘要简介静态初始化动态初始化源代码解析应用场景案例优缺点分析类代码方法介绍java代码测试用例全文小结总结文末开篇语哈喽，各位小伙伴们，你们好呀，我是喵手。运营社区：C站/掘金/腾讯云/阿里云/华为云/51CTO；欢迎大家常来逛逛今天我要给大家分享一些自己日常学习到的一些知识点，并以文字的形式跟大家一起交流，互相学习，一个人虽可以走的更快，但一群人可以走的更远。我是一名
Java零基础-数组：访问和修改数组元素
全文目录：开篇语前言摘要简介源代码解析数组的定义和初始化访问数组元素修改数组元素应用场景案例优缺点分析优点缺点类代码方法介绍int[]getArray()voidprintArray(int[]arr)Java代码测试用例全文小结总结文末开篇语哈喽，各位小伙伴们，你们好呀，我是喵手。运营社区：C站/掘金/腾讯云/阿里云/华为云/51CTO；欢迎大家常来逛逛今天我要给大家分享一些自己日常学习到的
上岸大厂Day4: 面试官说你没有产品sense
#我的求职思考(29864)##牛客福利打卡(51895)#大家都做的简历是什么样子的，学院本Jav如何确定自己是学生思维还是职场思维？mark缓解焦虑华黑子的暑期实习总结给HR整不会了一个大学毕业生在河边哭，他哭的如此伤心，连河神都动容了。河神拿着一份月薪两万但996的工作offerJAVA-hashmqp连环夺命二十问暑期实习上岸终章！腾讯pcg应用架构（录用评估挂）校招经验|三无菜鸡水硕如何
告别内存焦虑！用Dask打开Python大数据并行计算的“任意门“ 小张在编程 python 大数据开发语言
引言当你在Jupyter里用Pandas读取20GB的CSV文件，看到内存占用率从10%飙升到90%，最后弹出"MemoryError"时；当你想对亿级数据做分组聚合，却发现单线程计算要等上半小时——这些场景是不是像极了用小推车搬运万吨货物？Python生态中，Dask库就像一台"并行计算推土机"，能把大数据拆分成小块并行处理，让你的普通电脑也能拥有分布式计算的能力。本文将从原理到实战，带你掌握这
网络爬虫-07 YEGE学AI算法 Python-网络爬虫
网络爬虫-07）**Spider06回顾****scrapy框架****完成scrapy项目完整流程****我们必须记住****爬虫项目启动方式****数据持久化存储****Spider07笔记****分布式爬虫****scrapy_redis详解****腾讯招聘分布式改写****机器视觉与tesseract****补充-滑块缺口验证码案例****豆瓣网登录****Fiddler抓包工具****移
python大数据论文_大数据环境下基于python的网络爬虫技术 weixin_39775976 python大数据论文
软件开发大数据环境下基于python的网络爬虫技术作者/谢克武，重庆工商大学派斯学院软件工程学院摘要：随着互联网的发展壮大，网络数据呈爆炸式增长，传统捜索引擎已经不能满足人们对所需求数据的获取的需求，作为搜索引擎的抓取数据的重要组成部分，网络爬虫的作用十分重要，本文首先介绍了在大数据环境下网络爬虫的重要性，接着介绍了网络爬虫的概念，工作原理，工作流程，网页爬行策略，python在编写爬虫领域的优势
Redis性能测试：工具、参数与实战示例 Seal^_^ 数据库专栏 #数据库--Redis redis 数据库 Redis性能测试
Redis性能测试：工具、参数与实战示例1.Redis性能测试概述2.redis-benchmark基础使用2.1基本语法2.2简单示例3.性能测试参数详解4.实战测试示例4.1基础测试4.2指定命令测试4.3带随机key的测试4.4大数据测试4.5管道测试5.性能测试流程图6.测试结果分析与优化建议6.1结果解读6.2优化建议7.高级测试场景7.1持久化影响测试7.2集群测试7.3长时间稳定性测
2025年各细分产业链企业数据(汽车、数字经济、食品、制造业) 经管数据库汽车智能手机数据分析
本数据包含2025年及之前的所有上中下游企业信息，67个细分产业。汽车专区、数字经济专区、数字创意专区、未来产业专区、高端装备专区、新能源专区、食品农业专区、传统制造业专区等71个文件。汽车专区：充电桩制造动力电池汽车材料制造汽车制造汽车制造设备汽车座椅制造驱动电机制造燃料电池汽车制造燃料电池系统制造新能源汽车制造智能驾驶智能视觉数字经济专区：5g边缘计算大数据类服务器光通信集成电路区块链人工智能
C#语法基础总结（超级全面）（二） inwith C#语法基础 c#开发语言
文章目录c#语法基本元素关键字操作符（operator）类型转换标识符（Identifier）语句try语句迭代语句（循环语句）索引器文本（字面值）五大数据类型引用类型：值类型：变量、对象与内存装箱和拆箱类类的实例化类的三大成员（属性、方法、事件）属性（property）方法（函数）方法参数值参数引用参数输出参数数组参数具名参数可选参数扩展方法（this参数）方法的重载构造器（constructo
【AIGC工具箱】AIGC重塑生活神器
【AIGC工具箱】AIGC重塑生活神器（一）数字人（1）Sonic（腾讯）（2）HUMVA（二）视频生成（1）HumanDiT（字节跳动）（2）AnimateAnyone2（阿里巴巴）（3）Recraft（4）MIMO（阿里巴巴）（5）Wan2.1（阿里巴巴通义万象）（三）代码辅助（1）Cursor（2）Trae（字节跳动）（3）Qwen2.5-Coder(32B)（阿里巴巴）（4）Roo-Cli
SQL 常用版本语法概览：标准演进与关键语法分析
一、引言SQL（StructuredQueryLanguage，结构化查询语言）是关系型数据库系统的核心语言，自1986年成为ANSI和ISO标准以来，经历了多次版本演进，不断增强语义表达能力以适应复杂的企业数据需求。随着数据库技术的不断发展，各大数据库厂商（如Oracle、SQLServer、PostgreSQL、MySQL等）在实现标准的基础上扩展了大量方言语法，使得掌握SQL的标准语法版本成
主流数据库语言语法对比两圆相切数据库
以下是五大数据库（MySQL、PostgreSQL、Oracle、SQLServer、SQLite）核心语法对比，涵盖DDL、DML、查询、函数、事务等全场景，包含底层原理差异和实用示例。##一、数据一、类型深度对比分类MySQLPostgreSQLOracleSQLServerSQLite整数TINYINT,INT,BIGINTSMALLINT,INT,BIGINTNUMBER(10)TIN
Hadoop与云原生集成：弹性扩缩容与OSS存储分离架构深度解析
Hadoop与云原生集成的必要性Hadoop在大数据领域的基石地位作为大数据处理领域的奠基性技术，Hadoop自2006年诞生以来已形成包含HDFS、YARN、MapReduce三大核心组件的完整生态体系。根据CSDN技术社区的分析报告，全球超过75%的《财富》500强企业仍在使用Hadoop处理EB级数据，其分布式文件系统HDFS通过数据分片（默认128MB块大小）和三副本存储机制，成功解决了P
深入TA-Lib：量化技术指标详解
深入TA-Lib：量化技术指标详解本文系统讲解TA-Lib技术指标分析，涵盖基础、数据处理、趋势与动量指标、均量线、布林线等，并结合Python代码与大数据、机器学习实战案例，助力读者掌握量化交易实战技巧。本文系统梳理了TA-Lib技术指标分析的核心内容，包括TA-Lib基础、数据处理、趋势与动量指标、均量线、布林线等关键技术指标分析方法，并结合Python代码示例与大数据、机器学习的融合实战案例
大数据时代下的时序数据库选型指南：基于工业场景的IoTDB技术优势与适用性研究 Loving_enjoy 计算机学科论文创新点机器学习 facebook 经验分享课程设计
>在宝钢集团的智能工厂里，5万多个传感器每秒产生150万+数据点，传统数据库系统每天积压3TB未处理数据——这揭示了工业4.0时代的核心矛盾：**海量时序数据处理能力已成为智能制造的关键瓶颈**。###工业时序数据的四大特殊性工业场景下的时序数据与传统互联网数据存在本质差异：1.**高精度时间要求**-数控机床振动监测需微秒级时间戳-电网故障定位要求时间同步精度≤1μs2.**多源异构性**```
斗鱼大数据面试题及参考答案大模型大数据攻城狮大数据大数据面试 hadoop面试 spark面试 flink面试手撕SQL 手撕代码
GC（垃圾回收）相关知识一、常见的GC收集器SerialGCSerialGC是最基本的垃圾收集器，它是单线程的。在进行垃圾收集时，会暂停所有的用户线程，直到垃圾收集完成。它的工作过程比较简单，首先标记出所有的垃圾对象，然后将它们清除。例如，在一个小型的、对响应时间要求不高的Java应用程序中，如简单的命令行工具，SerialGC可以满足垃圾收集的需求。因为这种应用程序通常没有很高的并发要求，暂停用
Java 大视界 -- Java 大数据机器学习模型在金融市场情绪指数构建与投资决策支持中的应用（339）青云交大数据新视界 Java 大视界 java 大数据机器学习金融情绪指数投资决策量化策略情绪分析
Java大视界--Java大数据机器学习模型在金融市场情绪指数构建与投资决策支持中的应用（339）引言：正文：一、Java构建的金融市场情绪数据采集与预处理体系1.1多源异构数据接入引擎1.2数据采集延迟测试报告1.3情绪数据预处理管道二、Java驱动的金融市场情绪指数构建模型2.1多维度情绪指数计算框架2.2情绪指数与投资决策的映射模型三、Java在金融投资决策支持中的实战应用3.1量化私募情绪
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
HashMap的Get(),Put()源码解析 Ttang23 哈希算法散列表算法
1、什么是HashMap？HashMap是Java中用于存储键值对（Key-Value）的集合类，它实现了Map接口。其核心特点是：无序性：不保证元素的存储顺序，也不保证顺序恒定不变。唯一性：键（Key）不能重复，若插入重复键会覆盖原有值。允许null：允许一个null键和任意数量的null值。非线程安全：相比HashTable，HashMap不支持同步，性能更高。2.核心数据结构：哈希表（Has
提升企业级数据处理效率！TDengine 四个集群优化点详解 TDengine （老段） TDengine 运维大数据数据库物联网时序数据库服务器运维 tdengine
为了帮助企业更好地进行大数据处理，我们在此前TDengine3.x系列版本中进行了几项与集群相关的优化和新功能开发，以提升集群的稳定性和在异常情况下的恢复能力。这些优化包括clusterID隔离、leaderrebalance、raftlearner和restorednode。本文将对这几项重要优化进行详细阐述，以解答企业在此领域的疑问，并帮助大家更好地应对相关挑战。clusterID隔离问题fi
Python3 内置函数 AI老李 python python
关键要点Python3的内置函数是解释器直接提供的，无需导入即可使用，涵盖数据类型转换、数学操作、序列处理等多种功能。推荐使用官方文档、菜鸟教程和腾讯云开发者社区的中文资源，适合初学者和中级学习者。资源提供详细解释和示例，学习时可结合实际项目实践。简介Python3的内置函数是编程中常用的工具，方便用户快速实现各种操作。以下是几个主要资源，帮助您学习这些函数的用法。资源推荐Python官方文档：内
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
全面探索Kafka：架构、应用与流处理
Kafka：企业级消息系统与流处理平台的深度解析ApacheKafka作为分布式流处理平台，广泛应用于大数据处理和实时分析领域。本文将基于其官方文档，详细探讨Kafka的核心功能、应用场景以及如何进行有效管理。背景简介Kafka作为高吞吐量的消息系统，支持企业级的发布-订阅模式。它能够处理大量实时数据，并支持高并发读写操作。本文将依据Kafka官方文档的内容，逐层深入，从入门到高级应用，帮助读者全
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod