a1424262219

（转）2018年国外主要实验室和科研团队成果和动向

2018年国外主要实验室和科研团队成果和动向

作者简介：SIGAI人工智能平台

全文PDF下载：2018年国外主要实验室和科研团队成果和动向

This blog is copied from: https://zhuanlan.zhihu.com/p/56818027

Geoffrey Hinton

Geoffrey Hinton，被称为“神经网络之父”、“深度学习鼻祖”，他曾获得爱丁堡大学人工智能的博士学位，并且为多伦多大学的特聘教授。在2012年，Hinton还获得了加拿大基廉奖(Killam Prizes，有“加拿大诺贝尔奖”之称的国家最高科学奖)。2013年，Hinton 加入谷歌并带领一个AI团队，他将神经网络带入到研究与应用的热潮，将“深度学习”从边缘课题变成了谷歌等互联网巨头仰赖的核心技术，并将BP算法应用到神经网络与深度学习。

Hinton在2017年的NIPS会议上提出的胶囊网路，基于一种新的结构，通过与现有的卷积神经网络（CNN）相结合，在一些图像分类的数据上取得了非常优越的性能，成为了2018年的发展新趋势。

2018年4月，Hinton 团队发布《Large Scale Distributed Neural Network Training Through Online Distillation》（https://arxiv.org/pdf/1804.03235.pdf ），通过online distillation进行大规模分布式神经网络训练。该工作提出了Codistillation的概念，通过大规模实验，发现codistillation方法提高了准确性并加快了训练速度，并且易于在实践中使用。

在11月发表的《DARCCC:Detecting Adversaries by Reconstruction from Class Conditional Capsules》（https://arxiv.org/abs/1811.06969?context=cs ）中，他的团队提出重构网络可以视作检测对抗性攻击的非常有效的方法：从获胜的顶层胶囊的身份和姿态参数中重构输入，以验证网络能够感知我们期望它从某个类的典型样例中感知的东西。

Yann LeCun

Yann LeCun 是美国工程院院士、Facebook前人工智能研究院院长、纽约大学Sliver教授，同时还兼职于科学数据中心，数学科学交流学院，神经科学中心，以及电子工程计算机系。他于2003年加入纽约大学，之后还在普林斯顿的NEC研究院短暂任职。在2012年，他创建了纽约大学数据科学中心，并担任主任。2013年底，他被任命为Facebook人工智能研究总监, 并继续在纽约大学做兼职教授。2015-2016年，他在巴黎法兰西工学院做客座教授。Lecun创立的卷积网络模型，被广泛地应用于计算机视觉和语音识别应用里，也因此他被称为卷积网络之父，是公认的世界人工智能三巨头之一。

2018年4月，Yann LeCun 等人发表了一篇针对未来实例分割预测的论文《Predicting Future Instance Segmentation by Forecasting Convolutional Features》（https://arxiv.org/abs/1803.11496）。
该论文提出了一种预测模型，可通过预测卷积特征来对未来实例分割进行预测。

前不久，Lecun等人在论文《Model-Predictive Policy Learning with Uncertainty Regularization for Driving in Dense Traffic》（http://arxiv.org/abs/1901.02705v1 ）中提出通过随多个时间步骤展开环境动态学到的模型来训练一个策略的方法，同时明确地惩罚了两个成本：优化策略时的原始成本；表示训练状态离散的不确定成本。最后，研究人员使用大规模驾驶行为数据集对此方法进行了评估，结果显示能够从存粹的观察数据中有效学习驾驶策略，不去要环境交互。

Yoshua Bengio

yoshua bengio，蒙特利尔大学（Université de Montréal）的终身教授，同时是蒙特利尔大学机器学习研究所（MILA）的负责人，是CIFAR项目的负责人之一，负责神经计算和自适应感知器等方面，又是加拿大统计学习算法学会的主席，是ApSTAT技术的发起人与研发大牛。Bengio在蒙特利尔大学任教之前，是AT&T贝尔实验室&MIT的机器学习博士后。他的主要贡献在于他对循环神经网络（RNN, Recurrent Neural Networks）的一系列推动，包括经典的neural language model，gradient vanishing 的细致讨论，word2vec的雏形，以及machine translation。Bengio是Deep Learning一书的合著者，且Bengio的”A neural probabilistic language model”论文开创了神经网络的语言模型 language model先河，里面的思路影响了之后的很多基于神经网络做NLP的文章。

9月份，Bengio 等研究者在论文《Learning deep representations by mutual information estimation and maximization》提出了 Deep INFOMAX（DIM）（https://arxiv.org/abs/1808.06670v2）。该方法根据信息内容和统计或架构约束来学习表示，可用于学习期望特征的表示，并且在分类任务上优于许多流行的无监督学习方法。他们认为，这是学习好的和更有条理的表示的一个重要方向，有利于未来的人工智能研究。

10月份，Bengio 研究团队提出了一种称为 BabyAI 的研究平台，支持将人类加入到语言学习的基本循环中。BabyAI 平台由难度递增的 19 个层级组成。支持智能体获取具有丰富组合的合成语言，并提供了用于模拟人类教师的启发式专家。

NIPS2018中，Bengio的《Dendritic cortical microcircuits approximate the backpropagation algorithm》（http://papers.nips.cc/paper/8089-dendritic-cortical-microcircuits-approximate-the-backpropagation-algorithm.pdf ），介绍了一个简化的树突室的多层神经元网络模型，其中错误驱动（error-driven）的突触可塑性使网络适应一个全面性的期望输出。这个框架框架与最近观察到的大脑区域和皮质微电路结构之间的学习是一致的。

Bengio 等研究者在前不久的最新论文《Quaternion Recurrent Neural Networks》中，提出了一种新的四元循环神经网络（QRNN）以及相应的四元长短期记忆网络（QLSTM），将四元代数的外部关系和内部架构依赖性皆考虑在内。实验证明，与 RNN 和 LSTM 相比，QRNN 和 QLSTM 都在自动语音识别等实际应用中达到了更好的性能。

吴恩达Andrew Ng

吴恩达，华裔美国人，是斯坦福大学计算机科学系和电子工程系副教授，人工智能实验室主任。吴恩达是人工智能和机器学习领域国际上最权威的学者之一。吴恩达也是在线教育平台Coursera的联合创始人（with Daphne Koller）。

2018年5月，吴恩达团队在MURA数据集上发起了一项深度学习挑战赛，这个数据集是他们团队在2018年1月开源的一个骨骼 X 光片的大型数据集，总共有 40561 份多视图放射线影像。

7月的时候，该团队开发出了一种使用人工智能来预测病人死亡时间的系统，该系统可以为病人提供更好的临床关怀。研究人员提出了一种新的预报检验方法 Survival-CRPS，通过优化连续分级概率评分（continuous ranked probability core, CRPS）来提高预报的锐度（sharpness, 评价模式预测极值的倾向），同时保持预报的校准度（calibration, 评价模型预测值的数值大小和结局事件发生概率的大小是否一致）。这是科学界首次将最大似然法之外的评分方法成功应用于大型生存预测任务。

11月底，团队发布了一个名为CheXNeXt的X光诊断算法。与曾经的肺炎检测专门算法不同，该模型可以诊断14种疾病，包括肺炎、胸腔积液、肺肿块等等。在其中10种疾病的诊断上，AI都与人类放射科医生的表现相当，还有一种超过了人类。并且，AI的诊断速度是人类的160倍。团队说，这样的算法有希望填补医疗资源的短缺，也可以用来减少人类医生因为疲劳而导致的诊断错误。

11月28日，团队宣布在《公共科学图书馆》期刊发表关于膝关节磁共振成像的深度学习辅助诊断的最新研究。该团队表示，他们开发了一种算法来预测膝关节核磁共振检查中的异常，并测量了在解释过程中向放射科医师和外科医生提供算法预测的临床效用。此外在年底的时候，吴恩达又发布了《AI 转型指南》，面向公司管理层，介绍AI产业转型的一些方法。

2019年年初，也就是前不久，他们斯坦福团队又在Nature Medicine上发表了一项研究，开发了一种深度神经网络，可基于单导程 ECG 信号分类 10 种心率不齐以及窦性心律和噪音，性能堪比心脏病医生，准确度高达83.7%，超过了人类心脏病医生的78.0%。

Ian Goodfellow

Ian Goodfellow，人工智能领域的顶级专家，因提出了生成对抗网络（GANs）而闻名，被誉为“GANs之父”。他从斯坦福大学获得计算机科学学士、硕士学位以及博士学位。毕业后，Goodfellow加入Google，成为Google Brain研究团队的一员。然后他离开谷歌加入新成立的OpenAI研究所。Ian Goodfellow 在OpenAI短暂工作后，于2017年3月从OpenAI重回谷歌Goodfellow最出名的是发明了生成性对抗网络，这是Facebook经常使用的机器学习方法。他也是Deep Learning教科书的主要作者。2017年，Goodfellow被麻省理工学院技术评论评为35位35岁以下的创新者之一。

2018年年初，William Fedus、Ian Goodfellow和Andrew M. Dai在ICLR 2018共同提交的论文中使用 GAN 和强化学习方法在 NLP 中做了自己的探索(https://arxiv.org/abs/1801.07736)。

2018年7月，Ian等人提出一种新型对抗攻击（对抗攻击通常会使得神经网络分类错误），对神经网络重新编程，诱导模型执行攻击者选定的新任务。该研究首次表明了神经网络惊人的脆弱性和灵活性。(https://arxiv.org/pdf/1806.11146.pdf )。

8月的一篇论文中，和Augustus Odena共同提出了一种新方法覆盖引导模糊测试（coverage guided fuzzing，CGF），将其应用于神经网络的测试（https://arxiv.org/pdf/1808.02822.pdf ），该方法能够自动Debug神经网络。Goodfellow表示，希望这将成为涉及ML的复杂软件回归测试的基础，例如，在推出新版本的网络之前，使用fuzz来搜索新旧版本之间的差异。

此外开源了名为TensorFuzz的CGF软件库。此外，Ian与团队的人提出对抗正则化方法（https://arxiv.org/pdf/1807.07543v2.pdf ）显著改善了自编码器的平滑插值能力，这不仅能提高自编码器的泛化能力，对于后续任务的表征学习也会大有帮助。

何恺明

何恺明，2003年广东9名高考状元之一，本科就读于清华大学，。博士毕业于香港中文大学多媒体实验室，研究生导师为汤晓鸥。何恺明与他的同事开发了深度残余网络（ResNets），目前是计算机视觉领域的流行架构。ResNet也被用于机器翻译、语音合成、语音识别和AlphaGo的研发上。 2009年，何恺明成为首获计算机视觉领域三大国际会议之一CVPR“最佳论文奖”的中国学者。何恺明作为第一作者获得了CVPR 2009，CVPR 2016和ICCV 2017（Marr Prize）的最佳论文奖，并获得了ICCV 2017最佳学生论文奖。 2017年4月，何恺明获选香港中文大学（中大）工程学院杰出校友。

进入FAIR部门之后，何恺明的动向一直备受关注，在3月份左右，他和FAIR 研究工程师吴育昕提出了组归一化（Group Normalization）方法，试图以小批尺寸实现快速神经网络训练，这种方法对于硬件的需求大大降低，并在实验中超过了传统的批归一化方法。这篇论文也获得了ECCV 2018最佳论文（2018年9月13日，ECCV 2018 获奖论文公布，吴育昕与何恺明合作的《Group Normalization》获得了最佳论文荣誉提名奖。）

6月19日，CVPR 2018奖项出炉，何恺明获得本届大会的 PAMI 年轻学者奖。

8月份的时候，何何恺明等多名研究者发表了一项独特的迁移学习研究，无需数据清洗和手工标记数据，通过训练大型卷积网络可以预测数十亿社交媒体图像的hashtag，在图像分类和目标检测任务上都得到了迄今最高的精度。

11月22日，何恺明等人在arxiv贴出一篇重磅论文，题为《Rethinking ImageNet Pre-training》，表明ImageNet 预训练模型并非必须，ImageNet 能做的只是加速收敛，对最终物体检测的精度或实例分割的性能并无帮助。

陈天奇

陈天奇，华盛顿大学计算机系博士生，研究方向为大规模机器学习。他曾获得 KDD CUP 2012 Track 1 第一名，并开发了 SVDFeature，XGBoost，cxxnet 等著名机器学习工具，是 Distributed (Deep) Machine Learning Common 的发起人之一。

2018年5月份，陈天奇以及上海交通大学和复旦大学的研究团队提出一个基于学习的框架(https://arxiv.org/pdf/1805.08166.pdf )，以优化用于深度学习工作负载的张量程序。该研究使用基于机器学习的方法来自动优化张量运算核心并编译AI工作负载，从而可以将最优的性能部署到所有硬件。实验结果表明，该框架能够为低功耗CPU，移动GPU和服务器级GPU提供与最先进手工调优库相媲美的性能。

7月12日，陈天奇团队推出 Versatile Tensor Accelerator（VTA），这是一种开放、通用、可定制的深度学习加速器。VTA是一种可编程加速器，提供了 RISC风格的编程抽象来描述张量级的操作。VTA的设计体现了主流深度学习加速器最突出和最常见的一些特征，比如张量操作、DMA加载 /存储和显式的计算 /内存调节。

谷歌：Deep Mind人工智能实验室

DeepMind位于英国伦敦，是由人工智能程序师兼神经科学家戴密斯·哈萨比斯(DemisHassabis)等人联合创立，是前沿的人工智能企业，其将机器学习和系统神经科学的最先进技术结合起来，建立强大的通用学习算法。最初成果主要应用于模拟、电子商务、游戏开发等商业领域。谷歌于2014年收购了该公司。目前，Google旗下的 DeepMind 已经成为 AI 领域的明星。

2018年2月27日，Deepmind提出了命名为“独角兽（Unicorn）”的智能体架构，它展示出优秀的持续学习能力，已经胜过很多基准智能体。研究人员表示，独角兽通过利用并行的off-policy学习策略，统一表示和学习多种策略，才达到了这样的表现。

7月28日，发表的论文《Machine Theory of Mind》中，研究人员提出了一种新型神经网络 ToMnet，具备理解自己以及周围智能体心理状态的能力。该论文已被 ICML 2018 接收为 Oral 论文。

8月13日，与伦敦 Moorfields 眼科医院合作，已经训练其算法能够检测出超过 50 种威胁视力的病症，其准确度与专家临床医生相同。它还能够为患者正确推荐最合适的行动方案，并优先考虑那些最迫切需要护理的人。

10月，发表了一篇题为《Do Deep Generative Models Know What They Don’t Know?》（https://arxiv.org/abs/1810.09136?context=stat.ML ）的论文。该论文提出，过去学界普遍认为神经网络在面对和训练数据分布不同的数据时容易产生错误的预测，而生成模型则在这个问题上鲁棒性更强。不过他们发现基于流程的模型，VAE和PixelCNN的模型密度无法区分常见物体。

11月14日，宣布旗下的健康部门DeepMind Health、以及负责推进“Streams”（帮助医生更快识别和诊断患者病情的移动APP）团队将调整合并到Google 最新成立的“Google Health”部门中。原子公司DeepMind Health将不再作为独立品牌存在，但是，DeepMind的其他部门仍将保持独立。

11月16日，DeepMind表示其与英国眼科医院Moorfields合作的人工智能医疗研究项目已进入下一阶段。该项目旨在探索人工智能技术在眼部疾病诊疗方面的应用。8月时DeepMind发布了该项目的第一批结果，该结果表明人工智能可以与专家人类医生的表现相匹配，为50多种眼病的正确疗程提供建议。DeepMind表示，基于这项研究成果，该项目已经进行到下一个研究阶段，在症状出现之前预测眼病和预防严重疾病。

12月5日，DeepMind宣布推出全新的AlphaFold系统，能够预测并生成蛋白质的3D结构。这一系统在国际蛋白质结构预测竞赛（CASP）上击败了其余的参会选手。

12月，ICLR 2019 接收论文名单放出，DeepMind & Google 的唇读技术论文《LARGE-SCALE VISUAL SPEECH RECOGNITION》（https://openreview.net/pdf?id=HJxpDiC5tX ）未被接收。评审们认为即使它在工程上和数据上都非常突出，但大模型加上大数据会提升性能是共识，这类改进不能被看作是贡献。

今年年初，DeepMind和牛津大学提出了注意力神经过程。研究者认为，神经过程（NP）存在着一个根本的不足——欠拟合，对其所依据的观测数据的输入给出了不准确的预测。他们通过将注意力纳入NP来解决这个问题，允许每个输入位置关注预测的相关上下文点。研究表明，这大大提高了预测的准确性，显著加快了训练速度，并扩大了可以建模的函数范围。

谷歌：Google Brain团队

Google Brain是谷歌的人工智能研究小组，由Jeff Dean, Greg Corrado和Andrew Ng共同成立。成立于2011年的谷歌大脑，目前有正式成员48名，团队负责人是传奇人物Jeff Dean。在这个团队中，还包括部分供职的泰斗级人物Geoffrey E. Hinton，以及Martín Abadi、Michael Burrows等资深科学家。另外，谷歌首席科学家Vincent Vanhoucke也在谷歌大脑团队中。

2018年2月，Ilya Tolstikhin 等人提出了生成模型新算法：Wasserstein 自编码器，其不仅具有VAE的一些优点，更结合了GAN结构的特性，可以实现更好的性能。该研究的论文《Wasserstein Auto-Encoders》（https://arxiv.org/abs/1711.01558 ）被在 4 月 30 日于温哥华举行的 ICLR 2018 大会接收。

2018年4月，谷歌架构调整。谷歌大脑(Google Brain)联合创始人杰夫·迪恩(Jeff Dean)将领导谷歌所有人工智能领域的项目。

在5月份的ICLR 2018中，和卡内基梅隆大学的研究者提出一种新型问答模型 QANet （https://openreview.net/pdf?id=B14TlG-RW），该模型去除了该领域此前常用的循环神经网络部分，仅使用卷积和自注意力机制，性能大大优于此前最优的模型。来自谷歌大脑的研究者在arXiv上发表论文（https://arxiv.org/abs/1805.09501 ），提出一种自动搜索合适数据增强策略的方法 AutoAugment，该方法创建一个数据增强策略的搜索空间，利用搜索算法选取适合特定数据集的数据增强策略。此外，从一个数据集中学到的策略能够很好地迁移到其它相似的数据集上。

8月初，同柏林工业大学的研究人员在最新发表的论文Backprop Evolution (https://arxiv.org/pdf/1808.02822.pdf )，提出一种自动发现反向传播方程新变体的方法。该方法发现了一些新的方程，训练速度比标准的反向传播更快，训练时间也更短。

Ian等人还提出了对抗正则化方法（https://arxiv.org/pdf/1807.07543v2.pdf ）显著改善了自编码器的平滑插值能力，这不仅能提高自编码器的泛化能力，对于后续任务的表征学习也会大有帮助。此外，Ian和Augustus Odena共同提出了一种新方法覆盖引导模糊测试（coverage guided fuzzing，CGF），将其应用于神经网络的测试（https://arxiv.org/pdf/1808.02822.pdf ），该方法能够自动Debug神经网络。Goodfellow表示，希望这将成为涉及ML的复杂软件回归测试的基础，例如，在推出新版本的网络之前，使用fuzz来搜索新旧版本之间的差异。此外开源了名为TensorFuzz的CGF软件库。

在11月的时候公开了一篇论文“Simple, Distributed, and Accelerated Probabilistic Programming”(https://arxiv.org/pdf/1811.02091v1.pdf )，发表于NIPS 2018。论文提出了一种简单的方法，用于将概率编程嵌入到深度学习生态系统。这种简单分布式、加速的概率编程，可以将概率程序扩展到512个TPUv2、1亿+参数的模型。

年底的NeurIPS 2018上，密歇根大学和谷歌大脑的研究人员提出了一种新的面向NLP任务的机器学习新架构（https://papers.nips.cc/paper/7757-content-preserving-text-generation-with-attribute-controls.pdf ），不仅能够根据给定的实例生成句子，而且能够在保留句子意思的情况下，改变句子表达的感情、时态、复杂度等属性。

今年初，CMU联合谷歌大脑、谷歌 AI 发表了一篇论文《Transformer-XL: Attentive Language Models Beyond a Fixed-Length Context》(https://arxiv.org/pdf/1901.02860v1.pdf )。Transformer 网络具有学习更长期依赖性的潜力，但这种潜力往往会受到语言建模中上下文长度固定的限制。在此论文中，研究人员提出了一种叫做 Transformer-XL 的新神经架构来解决这一问题，它可以在不破坏时间一致性的情况下，让 Transformer 超越固定长度学习依赖性。

Facebook : FAIR（Facebook’s Artificial Intelligence Research）

五年前，Yann Lecun创立了 Facebook 人工智能研究院（FAIR），旨在通过开放研究推进人工智能的发展，并惠及所有人。FAIR 的目标是理解智能的本质，以创造真正的智能机器。自此以后，FAIR不断发展，并成长为一个国际研究组织，在门洛帕克、纽约、巴黎、蒙特利尔、特拉维夫、西雅图、匹兹堡、伦敦都设有实验室。人工智能已经成为 Facebook 的核心，因此 FAIR 现在是更大的 Facebook AI组织的组成部分，该组织致力于人工智能研发的各个方面，从基础研究到应用研究和技术开发。FAIR团队经常早早地发布前沿研究成果，并尽可能地开源研究代码、数据集和工具（如PyTorch、fastText、FAISS、Detectron）。这种方法也成功地推动了人工智能的研究发展。今年，FAIR 的研究人员已经获得了广泛认可，在 ACL、EMNLP、CVPR、ECCV 等大会获得了最佳论文奖，在 ECCV、ICML 和 NeurIPS会议上获得了时间检验奖（Test of Time award）。开放的工作可以让每个人在人工智能领域取得更快的进步。

4月初，FAIR 研究人员提出两种机器翻译模型的变体，一种是神经模型，另一种是基于短语的模型。研究者结合了近期提出的两种无监督方法，并简化了结构和损失函数，得出的新模型性能更优，且易于训练和调参。

5月13日，开源了围棋 AI ELF OpenGo训练模型及代码，它基于现有的强化学习研究平台 ELF，击败了世界围棋冠军。

6月19日，FAIR开源了 DensePose，这是一个能将人体所有像素的 2D RGB 图像实时映射到 3D 人体模型的应用。这一模型利用 COCO 数据集中 50K 张密集型人体对应关系的标注，并在有遮挡和尺度变换等自然情况下能准确实现密集型人体姿态估计。

11月初，FAIR 和纽约大学的研究者合作开发了一个新的自然语言推断语料库 XNLI，该语料库将 MultiNLI 的测试集和开发集扩展到 15 种语言，包括斯瓦西里语和乌尔都语等低资源语言。XNLI 是跨语言句子理解的基准，实际可用且具备一定难度，有助于带来更好的跨语言理解方法。在年底，FAIR宣布推出 PyText 的开源版本，它是Facebook正在使用的主要自然语言处理（NLP）建模框架，目前每天在为 Facebook 及其应用程序系列的用户提供超过 10 亿次 AI 任务处理；同时FAIR开源了全卷积语音识别工具包wav2letter++。

今年年初，FAIR Alexander Kirillov、何恺明等人在《Panoptic Feature Pyramid Networks》(http://cn.arxiv.org/pdf/1901.02446v1)提出全景特征金字塔网络。该论文提出的全景特征金字塔网络结合了分别用于语义分割和实例分割的 FCN 和 Mask R-CNN，在两种任务基线上有很好的稳健性和准确率。

MIT : CSAIL(Computer Scienceand Artificial Intelligence Laboratory)

MIT的CSAIL最初是两个实验室：计算机实验室创办于1963年，人工智能实验室创办于1959年，两个实验室在2003年正式合并。 CSAIL是MIT最大的实验室，也是世界上最重要的信息技术研发中心。CSAIL的成员创立了多于100家知名公司，包括机器人之父科林·安格尔，iRobot公司创始人之一海伦·格雷纳，波士顿动力公司创始人马克·雷伯特，还有卡内基·梅隆大学机器人研究所的负责人马特·梅森。

4月初，CSAIL研发出一种名为Pixel Player系统（https://arxiv.org/abs/1804.03160 ），能够通过大量无标签的视频来学习声音定位，更强大的是，Pixel Player能够把声音与声源的像素点进行分离，并完美做到视觉与声音的同步，“想听哪里点哪里”。同时，利用Pixel Player系统，用户能够对图像中不同的声音分别进行音量调节，实现简单的音频编辑。此外还提出了一款名为 RoadTracer 的道路采集系统。针对道路交汇路段，RoadTracer 的采集准确率能达到 45%，远高于传统图像分割方法的 19%。

5月初，CSAIL1的研究人员开发了一种全新的系统 MapLite，这种系统允许无人车在不依赖 3D 地图的情况下，在未知的道路上驾驶。此外，该系统还能将 Google 地图上的 GPS 数据与一系列传感器收集到的路况信息结合起来。

7月，CSAIL和电子工程与计算机科学系( EECS )的研究人员开发了一种模型用于更有效的选择先导分子。该模型输入分子结构数据，创建分子图片，详细展示分子结构，节点代表原子，边线代表化学键。这些图又被分解成更小的有效官能团簇，成为“构件”，用于实现更精确的分子重构和修饰。

8月，CSAIL正式发布编程语言Julia 1.0，这门由MIT CSAIL 实验室开发的编程语言结合了 C 语言的速度、Ruby 的灵活、Python 的通用性，以及其他各种语言的优势于一身，并且具有开源、简单易掌握的特点。

10月4日，CSAIL和QRCI（卡塔尔计算研究所）宣布研究出一种可以识别虚假新闻在传播前的来源和个人政治偏见的AI系统。他们所使用的机器学习算法利用现有文章集合来衡量给定出口的准确性和偏差，该系统或可将不可信赖的新闻信息自动分类。

在12月发表的论文Deep sequential models for sampling-based planning（https://arxiv.org/abs/1810.00804 ）中，研究人员展示了他们的模型在两个环境中的优势：通过具有陷阱和狭窄通道的具有挑战性的房间导航，以及在避免与其他Agent碰撞的区域导航。一个有前途的现实世界应用程序正在帮助自动驾驶汽车在十字路口行驶，在那里他们必须在并入交通之前快速评估其他汽车将做什么。目前，研究人员正通过丰田凯撒尔联合研究中心来研究这些应用。 NeurIPS 2018中，CSAIL和谷歌的研究人员发表了一篇论文，描述了一个能够生成具有逼真纹理的人工智能系统——视觉对象网络（Visual Object Networks，VON），不仅生成的图像比当前最先进的方法还要逼真，还可以进行形状和纹理编辑、视角转换以及其它3D调整。

UC Berkeley : BAIR(Berkeley Artificial Intelligence Research)

加州大学伯克利分校的人工智能研究室（Berkeley Artificial Intelligence Research）主要研究领域涵盖计算机视觉、机器学习、自然语言处理、规划和机器人等（computer vision,machine learning,natural language processing, planning, and robotics）。其中的机器人和智能机器实验室，致力于用机器人复制动物的行为。其自动化科学和工程实验室从事更广泛的机器人功能的研究，如机器人辅助外科手术和自动化制造。还有计算机可视化小组，学生可以学到如何帮助机器人能“看的见”。

4月的时候，BAIR介绍了他们对于运动建模的最新研究成果DeepMimic模型，他们使用动作捕捉片段训练自己的模型。训练中着力减小跟踪误差并采用提前终止的方法来优化训练结果。训练模型最终表现优秀。

6月，BAIR发表博客论文Delayed Impact of Fair Machine Learning，讨论了静态公平性准则的长期影响，发现结果和人们的期望相差甚远。相关论文被 ICML 2018 大会接收（https://arxiv.org/pdf/1803.04383.pdf ）。

6月的时候还发布了迄今为止规模最大、最多样化的开放驾驶视频数据集BDD100K。该数据集共包含 10 万个视频，BAIR 研究者在视频上采样关键帧，并为这些关键帧提供注释。此外，BAIR 还将在 CVPR 2018 自动驾驶 Workshop 上基于其数据举办三项挑战赛。

10月18日，BAIR开源了DeepMimic（https://xbpeng.github.io/projects/DeepMimic/index.html ）。DeepMimic使用强化学习技术，用动作捕捉片段训练模型，教会了AI智能体完成24种动作，包括翻跟斗、侧翻跳、投球、高踢腿等等，动作非常流畅自然。

BAIR的研究人员还提出了一种从视频中学习技能的框架（skills from videos，SFV），结合了前沿的计算机视觉和强化学习技术构建的系统可以从视频中学习种类繁多的技能，包括后空翻和很滚翻等高难度动作。同时智能体还学会了在仿真物理环境中复现这些技能的策略，而无需任何的手工位姿标记。

BAIR年末的一篇Visual Foresight: Model-Based Deep Reinforcement Learning for Vision-Based Robotic Control（https://arxiv.org/abs/1812.00568 ）论文中，提出了一种自我监督的基于模型的方法，在这种方法中，预测模型学习直接从原始感官读数（如摄像机图像）预测未来，证明了可视化MPC可以概括为从未见过的对象并使用相同的模型解决一系列用户定义的对象操作任务。

蒙特利尔大学 : MILA（Montreal Institute for Learning Algorithms）

加拿大蒙特利尔现在被媒体称作是人工智能的“新硅谷”。加拿大广播公司报道说，这个功劳，主要归功于“深度学习三巨头”之一的Yoshua Bengio。他是MILA（Montreal Institute for Learning
Algorithms）的创始人，带领团队进行人工智能研究已经有超过10年的时间。由蒙特利尔大学 (University of Montreal )的计算机学教授Yoshua Bengio带领，MILA在深度学习（deep learning）和深度神经网络（辨别型和生成型）(deep neural networks, both discriminative and generative)等领域都有开创性研究，并应用到视觉、语音和语言方面等领域。

4月，MILA提出了一种有助于提升深度网络在应对对抗攻击方面的稳健性的模型：防御增强型网络（Fortified Networks）。该研究已提交 ICML 2018 （https://arxiv.org/abs/1804.02485v1 ）。

10月，Yoshua Bengio及其小组提出了一个叫做「BabyAI」的研究平台用来训练人工智能从头学习和理解人类语言，每个单词背后的意思到底是什么。该平台包括一个有效模拟的网格世界环境（MiniGrid）和一些被称之为Level的指令跟随任务，全部由合成语言的子集（婴儿语言）形成。平台还提供了一个模拟人类的启发式专家，用于模拟人类教师。

斯坦福：SAIL（Stanford Artificial Intelligence Laboratory）

去年一年里，SAIL所获得的最佳论文：
Yuanzhi Li, Tengyu Ma, Hongyang Zhang. Algorithmic Regularization in Over-parameterized Matrix Sensing and Neural Networks with Quadratic Activations. Best paper award at COLT 2018.
在论文中探讨了了梯度下降法为训练过参数化的矩阵分解模型，以及使用二次函数作为激活函数的单隐含层神经网络提供了隐式的正则化效果。
Pranav Rajpurkar, Robin Jia, Percy Liang. Know What You Don’t Know : Unanswerable Questions for SQuAD.. Best short paper ACL 2018. 在这篇论文中，SAIL提供了SQuAD 2.0，这是斯坦福问答数据集（SQuAD）的最新版本。SQuAD 2.0将现有的SQuAD数据与5万多个无法回答的问题结合在一起，这些问题由众包人员以相反的方式撰写，看起来与可回答问题类似。为了在SQuAD 2.0上取得好成绩，系统不仅必须尽可能回答问题，还要确定何时段落不支持答案并且不回答问题。SQuAD 2.0对于现有模型来说是一个具有挑战性的自然语言理解任务：在SQuAD 1.1上获得86% F1的强大的神经系统在SQuAD 2.0上仅获得66%F1。
Rob Voigt, Nicholas P. Camp, Vinodkumar Prabhakaran, William L. Hamilton, Rebecca C. Hetey, Camilla M. Griffiths, David Jurgens, Dan Jurafsky, and Jennifer L. Eberhardt. Language from police body camera footage shows racial disparities in officer respect. Cozzarrelli Prize (best paper in PNAS).
这篇论文利用随身携带的摄像机拍摄的录像，分析了警察语言在日常交通中对白人和黑人社区成员的尊重程度，发现即使在控制了警察的种族、违法行为的严重程度、停车地点和停车结果之后，警察对黑人和白人社区成员的尊重程度也一直较低。 Amir Zamir, Alexander Sax, William Shen, Leonidas Guibas, Jitendra Malik, Silvio Savarese. Taskonomy：Disentangling Task Transfer Learning. Best paper award at CVPR 2018.
这篇论文提出了一种计算不同任务相似性的方法，以及利用不同任务相似性，在少量训练数据条件下进行多任务组合学习的分配方法。文章的最终目标是通过计算任务相似性，进一步计算选取针对目标任务的多任务组合进行训练，并实现以少量数据尽可能接近全监督学习的性能。
Zi Ye, Olga Diamanti, Chengcheng Tang, Leonidas Guibas, Tim Hoffmann. A unified discrete framework for intrinsic and extrinsic Dirac operators for geometry processing. 1st Place best paper award at SGP 2018.
本文考虑了一对离散的Dirac算子，后者对应于每个面上定义了多边形面和正态线的离散面，并证明了光滑理论的许多关键性质。特别地，讨论了相应的自旋变换、它们的保角不变量以及这一算符与其内在对应算符之间的关系。
Jingwei Huang, Yichao Zhou, Matthias Nießner, Jonathan Shewchuk, Leonidas Guibas. QuadriFlow: A Scalable and Robust Method for Quadrangulation. 2nd Place best paper award at SGP 2018.
本文提出的算法是在Instant Field-Aligned Meshes 这篇文章的基础提出的。本文提出了一种有效的方法，通过将实时网络目标与线性和二次约束系统相结合来最小化奇点。通过解决全局最小成本网络流问题和本地布尔满意度问题来实施这些约束。利用本文算法生成的四边形质量与其他方法一样好，而且运行速度较快。其他的外部算法产生的奇点比较慢，本文的算法花费不到10秒钟来处理每个模型。

Hongseok Namkoong, John Duchi. Variance-based Regularization with Convex Objectives. Best paper award at NIPS 2017.

这篇文章研究了一种风险最小化和随机优化的方法，该方法可以为方差提供一个凸属性的替代项，并允许在逼近和估计误差间实现近似最优与高效计算间的权衡。

卡内基梅隆大学

卡内基梅隆大学（Carnegie Mellon University）一直是众所周知的计算机领域大牛。自人工智能（ArtificalIntelligence）领域创建以来，卡内基梅隆大学一直在全球引领AI的研究、教育和创新。在18年秋季，其计算机学院开设全美第一个人工智能本科专业。

CMU团队最新的主要研究成果如下：

CMU的陈鑫磊（现Facebook 研究科学家）、Abhinav Gupta，谷歌的李佳、李飞飞等人提出的一种新型推理框架《Iterative Visual Reasoning Beyond Convolutions》（https://arxiv.org/abs/1803.11189 ），其探索空间和语义关系的推理性能大大超过了普通卷积神经网络，被评为 CVPR 2018 大会 Spotlight 论文。

年中时候，在读博士刘寒骁、DeepMind 研究员 Karen Simonyan 以及 CMU 教授杨一鸣提出的「可微架构搜索」DARTS 方法基于连续搜索空间的梯度下降，可让计算机更高效地搜索神经网络架构。该研究的论文《DARTS: Differentiable Architecture Search》（https://arxiv.org/abs/1806.09055 ）一经发出便引起了 Andrew Karpathy、Oriol Vinyals 等学者的关注。研究者称，该方法已被证明在卷积神经网络和循环神经网络上都可以获得业内最优的效果，而所用 GPU 算力有时甚至仅为此前搜索方法的 700 分之 1，这意味着单块 GPU 也可以完成任务。

10月份的时候，来自英特尔实验室和卡内基梅隆大学的研究员提出了一种用于序列建模的新架构Trellis Network。研究员声称，Trellis Network吸收了循环神经网络和卷积神经网络中的结构和算法元素。实验证明，Trellis Network在各种具有挑战性的基准测试中表现都优于当前的技术水平，包括Penn Treebank和WikiText-103。

在年底，NIPS 2018 对抗视觉挑战赛中， CMU 邢波团队包揽两项冠军，另一项冠军则由来自加拿大的 LIVIA 团队斩获，清华 TSAIL 团队获得“无针对性攻击”的亚军。本次比赛共分为三个单元：防御、无针对性攻击和有针对性攻击。

CMU、北大和 MIT 的研究者在年底发表了论文《Gradient Descent Finds Global Minima of Deep Neural Networks》（https://arxiv.org/abs/1811.03804v1 ），该论文证明了对于具有残差连接的深度超参数神经网络（ResNet），梯度下降可以在多项式时间内实现零训练损失。研究者的分析依赖于神经网络架构引入的格拉姆矩阵的多项式结构。这种结构帮助研究者证明格拉姆矩阵在训练过程中的稳定性，而且这种稳定性意味着梯度下降算法的全局最优性。

伊利诺伊大学大学厄本那香槟分校

伊利诺伊大学厄巴纳-香槟分校(University of Illinoisat Urbana-Champaign，缩写为UIUC)，建立于1867年，是一所享有世界声望的一流研究型大学。该大学从美国国家科学基金会(NSF)获得研究经费量年年在全美名列第一。位於该大学的美国国家超级计算应用中心(NCSA)在高性能计算、网路和资讯技术的研究和部署领域，一直处于世界领先的地位。

UIUC的最新研究成果如下：

来自北京邮电大学和UIUC的研究者们提出一种适用于密集人群计数的空洞卷积神经网络模型 CSRNet，论文《CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes》（https://arxiv.org/pdf/1802.10062.pdf）。该网络模型摆脱以往广泛应用于人群计数的多通道卷积网络方案，在大幅削减网络参数量和网络训练难度的同时，显著提升了人群计数的精度和人群分布密度图的还原度。该研究已被 CVPR 2018 接收。

UIUC 和 Zillow 的研究者发表《LayoutNet: Reconstructing the 3D Room Layout from a Single RGB Image》（https://arxiv.org/abs/1803.08999 ）论文提出了 LayoutNet，它是一个仅通过单张透视图或全景图就能估算室内场景 3D 布局的深度卷积神经网络（CNN）。该方法在全景图上的运行速度和预测精度比较好，在透视图上的性能是最好的方案之一。该方法也能够推广到非长方体的曼哈顿布局中，例如“L”形的房间。

极低照明度下，传统增加亮度的方法会放大噪点和色彩失真。而 UIUC 和英特尔的研究者在《Learning to See in the Dark》（https://arxiv.org/abs/1805.01934 ）中通过全卷积网络处理这一类黑黑的照明度图像，并在抑噪和保真的条件下将它们恢复到正常亮度。这种端到端的方法将为机器赋予强大的夜视能力，且还不需要额外的硬件。

转载于:https://www.cnblogs.com/wangxiaocvpr/p/10385594.html

你可能感兴趣的:(（转）2018年国外主要实验室和科研团队成果和动向)

HDU杭电OJ基础100题2010-2019（C语言版）雁于飞算法专栏 c语言开发语言
文章目录@[TOC](文章目录)[原题出处](https://acm.hdu.edu.cn/listproblem.php?vol=11)前言p2010.水仙花数问题描述解题思路代码核心思想：p2011多项式求和问题描述代码p2003求绝对值问题描述解题思路代码扩展p2004成绩转换问题描述解题思路代码重点p2005第几天问题描述解题思路代码扩展p2006求奇数的乘积p2007平方和与立方和问题描
ONLYOFFICE二次开发文档架构、集成和部署史剑咪Nessa
ONLYOFFICE二次开发文档架构、集成和部署【下载地址】ONLYOFFICE二次开发文档架构集成和部署ONLYOFFICE二次开发文档为开发者提供了全面的架构解析、集成指南和部署方案。通过深入剖析ONLYOFFICE的底层设计，开发者能够更好地理解其工作原理，为后续开发奠定坚实基础。集成篇详细介绍了如何将ONLYOFFICE无缝融入现有项目，涵盖接口调用和数据交互等关键步骤，确保功能顺利对接。
数据结构学习之栈楼田莉子数据结构学习笔记算法数据结构 c语言
本篇博客我们将深入学习数据结构中栈与队列相关的内容作者的个人gitee：楼田莉子(riko-lou-tian)-Gitee.com目录概念栈的实现初始化销毁入栈判空出栈获取栈顶元素栈的有效元素个数源代码与栈相关的算法题（力扣）有效的括号编辑概念栈是一种特殊的线性表，只允许在固定的一端进行插入删除元素的操作。进行数据插入和删除操作的一端叫栈顶，另一端叫栈底。遵循“后进先出”的原则。下图就是对栈后进先
使用 Kafka 优化物流系统的实践与思考 nlog3n Java学习 kafka 分布式
使用Kafka优化物流系统的实践与思考在现代物流系统中，订单处理、仓储管理、运输调度等环节复杂且实时性要求高。为了满足异步解耦、高吞吐、高可用、事件驱动和数据可靠性等需求，Kafka作为分布式消息队列和流处理平台，成为了我们的首选。本文将分享我们在物流系统中使用Kafka的设计方案、优化实践以及遇到的问题和解决方案。一、系统背景和需求物流系统涉及多个业务模块，如订单处理、仓储管理、运输调度和状态跟
Kafka 核心机制面试题--自问自答亲爱的非洲野猪 kafka 分布式
基础篇Q1:Kafka为什么能这么快？A:Kafka的高性能主要来自三大核心技术：零拷贝(Zero-Copy)：通过sendfile()系统调用，数据直接从磁盘到网卡，避免了内核态和用户态之间的多次拷贝页缓存(PageCache)：消息直接写入操作系统页缓存而非JVM内存，减少GC影响并利用OS缓存机制内存映射(mmap)：索引文件通过内存映射实现，操作内存即操作文件Q2:Kafka的存储结构是怎
基于STM32的智能农业灌溉系统设计与实现 STM32发烧友 stm32 嵌入式硬件单片机
目录引言环境准备2.1硬件准备2.2软件准备系统架构与基础3.1控制系统架构3.2功能描述代码实现：实现智能农业灌溉系统4.1环境监测模块4.2灌溉控制模块4.3通信与远程监控实现4.4用户界面与数据可视化应用场景：农业灌溉与节水控制问题解决方案与优化收尾与总结1.引言随着农业现代化进程的推进，传统的灌溉方式逐渐无法满足节水、高效的需求。智能农业灌溉系统通过集成传感器、嵌入式控制技术和无线通信模块
基于STM32开发的智能花园灌溉系统 STM32发烧友 stm32 嵌入式硬件单片机
目录引言环境准备工作硬件准备软件安装与配置系统设计系统架构硬件连接代码实现系统初始化土壤湿度监测与处理灌溉控制与状态指示Wi-Fi通信与远程监控应用场景家庭花园智能灌溉农业田地的智能灌溉管理常见问题及解决方案常见问题解决方案结论1.引言随着智能家居技术的发展，智能花园灌溉系统逐渐成为家庭园艺和农业生产中提高水资源利用效率的重要工具。该系统通过集成土壤湿度传感器、雨滴传感器、Wi-Fi模块等硬件，实
Tensorflow 回归模型 FLASK + DOCKER 部署至 Ubuntu 虚拟机
准备工作：安装虚拟机，安装ubuntu，安装python3.x、pip和对应版本的tensorflow和其他库文件,安装docker。注意事项：1.windows系统运行的模型文件不能直接运行到虚拟机上，需在虚拟机上重新运行并生成模型文件2.虚拟机网络状态改为桥接Flask代码如下：fromflaskimportFlask,request,jsonifyimportpickleimportnump
基于PLC的智能楼宇控制系统设计（源码+万字报告+部署讲解等) 炳烛之明科技 PLC
目录摘要2第一章绪论51.1引言51.2智能楼宇的课题背景51.3智能楼宇的功能和优势6第二章智能楼宇系统总体方案确定72.1智能楼宇系统总体方案的设计72.1.1智能楼宇概述72.1.2智能楼宇的分类71、建筑设备自动化系统(BA)72、通讯自动化系统（CA）73、办公自动化系统（OA）74、火灾报警于消防联动自动化系统（FA）85、安全保卫自动化系统（SA）82.1.2总体控制方案的设计82.
STM32 驱动矩阵键盘详解与完整示例深入黑暗单片机开发 stm32 矩阵嵌入式硬件单片机驱动开发
STM32驱动矩阵键盘详解与完整示例矩阵键盘在嵌入式开发中是一种常见的输入设备，广泛应用于工业控制、人机界面、消费电子等领域。本文将详细介绍如何在STM32平台上驱动一个4x4矩阵键盘，涵盖原理分析、硬件连接、软件编程、防抖处理、问题排查与优化技巧等，适合初学者和进阶用户参考。一、矩阵键盘基本原理1.1什么是矩阵键盘？矩阵键盘是将按键按行列排布形成网格状结构的键盘，通过行线（Row）和列线（Col
基于土壤湿度信息的智能农田灌溉系统设计
自己淋过雨，想为你撑把伞之所以会把自己三年前的本科毕业设计发布至平台上，其主要原因是对自己以前的过往再做个总结。人生嘛，只有一路走来回头再看的时候，才会感慨万千，触目良多，时不时会想，到底什么样的结局才配得上我这二十几年的颠沛流离（狗头^_^）。个人强烈建议高中学弟学妹们一定要好好学习，考上一个都是传道授业()的好大学（表达的可能有些不妥，但懂得都懂……）。本文为2021年本人本科毕业设计。时间跨
Java面试题100道及答案编程大全面试题 java 开发语言
一、Java基础Java17中的sealed类和record类的作用和区别？答案：sealed类：限制继承关系，通过permits指定允许的子类。示例代码：publicsealedclassShapepermitsCircle,Square{...}；record类：不可变数据类，自动生成equals()、hashCode()和toString()。示例代码：publicrecordUser(St
为什么要使用消息队列？编程大全后端 rabbitmq rocketmq kafka 消息队列
总结一下，主要三点原因：解耦、异步、削峰。1、解耦。比如，用户下单后，订单系统需要通知库存系统，假如库存系统无法访问，则订单减库存将失败，从而导致订单操作失败。订单系统与库存系统耦合，这个时候如果使用消息队列，可以返回给用户成功，先把消息持久化，等库存系统恢复后，就可以正常消费减去库存了。2、异步。将消息写入消息队列，非必要的业务逻辑以异步的方式运行，不影响主流程业务。3、削峰。消费端慢慢的按照数
基于SpringBoot的餐厅点餐系统的设计与实现毕设小助手 spring boot 后端 java
收藏关注不迷路//项目拿到就可以直接使用，但是用于作业或者毕设需要自己懂代码之后进行自行修改//支持毕设定制//远程支持//可联系博主----------同类型文章可以联系博主----------争取每天三篇，有需要的用户可以关注查看哦~今日第三篇-发布的文章皆有源码，私信联系可获取源码~本项目设计与实施了一个基于SpringBoot的餐厅点餐系统，探讨了该系统在提高点餐效率、优化订单管理和提升顾
比斯特自动点焊机批发厂商概览
自动点焊机批发厂商主要集中于珠三角、长三角等制造业发达地区，如广东东莞、深圳及江苏无锡等地。这些厂商通过直销或供应链合作模式，为电子、汽车、电池等行业提供高性价比的自动化焊接设备，满足大规模生产需求。产品与技术特点批发厂商的产品涵盖多类点焊设备：精密电子点焊机：适用于微电子元件、漆包线、线路板焊接，强调高精度与无损伤加工。动力电池专用设备：如锂电池双面点焊机，支持18650/21700等电芯的高速
动力电池PACK线标配：18650电池自动点焊机的规模化应用 b***2511 人工智能大数据制造
在新能源汽车产业高速发展的背景下，动力电池作为核心部件，其生产效率与质量直接关系到整车的性能与市场竞争力。动力电池PACK线作为电池模组组装的关键环节，正经历着从手工操作向自动化、智能化转型的深刻变革。在这一进程中，18650电池自动点焊机凭借其高效、精准的特性，已成为动力电池PACK线的标配设备，推动着行业规模化应用的深入发展。在传统的动力电池组装过程中，电池极耳的焊接主要依赖手工操作，不仅效率
圆柱电池自动分选机：电池生产线的智能守护者 b***2511 大数据人工智能
在新能源产业的浪潮中，圆柱电池作为电动汽车、储能系统及各类便携式电子设备的核心能量单元，其性能与质量的优化成为了行业发展的关键。随着技术的不断进步和市场的日益成熟，圆柱电池的生产效率与品质要求也越来越高。而圆柱电池自动分选机，作为电池生产线上的关键设备，正以其高效、精准、智能的特点，成为提升电池生产效率与品质的重要力量。一、圆柱电池自动分选机的工作原理圆柱电池自动分选机主要利用先进的机器视觉技术和
AI掌柜失守记：AI Agent商业自动化边界实验 TGITCIC AI-大模型的落地之道 AI零售零售大模型 AI Agent AI大模型大模型AI AI落地 AI智能体
1.实验设计：数字掌柜接管实体货架1.1硬件载体与虚拟人格构建位于旧金山的实验场地被改造成微型零售生态系统：智能冰箱搭配商品篮构成实体货架，iPad自助结账系统连接Venmo支付接口，Slack通讯平台成为人机交互窗口。ClaudeSonnet3.7被赋予独立法人身份——Claudius，拥有电子邮箱、仓库地址和初始运营资金，其认知边界被限定在"自动售货机经营者"角色。1.2决策工具链的完整配置实
FAISS 简介及其与 GPT 的对接（RAG）言之。 AI faiss gpt easyui
什么是FAISS？FAISS(FacebookAISimilaritySearch)是FacebookAI团队开发的一个高效的相似性搜索和密集向量聚类的库。它主要用于：大规模向量相似性搜索高维向量最近邻检索向量聚类https://github.com/facebookresearch/faissFAISS特别适合处理高维向量数据，能够快速找到与查询向量最相似的向量，广泛应用于推荐系统、图像检索、自
【赵渝强老师】达梦数据库的闪回技术数据库达梦数据库信创
达梦数据库提供的闪回技术主要是在数据库发生逻辑错误的时候，能提供快速且最小损失的恢复。闪回技术旨在快速恢复数据库的逻辑错误。对于物理介质的损坏或者物理文件丢失，就不能使用闪回进行恢复。闪回特性可应用在以下方面：自我维护过程中的修复：当一些重要的记录被意外删除，用户可以向后移动到一个时间点，查看丢失的行并把它们重新插入现在的表内恢复。用于分析数据变化：可以对同一张表的不同闪回时刻进行链接查询，以此查
知识积累----空转转录因子TF活性的计算框架追风少年ii 空间数据分析 hotspot 傅里叶变换机器学习
作者，EvilGenius关于我们外显子的分析课程，我们来一次预报名吧，课表如下第一节：外显子分析基础知识与框架（包括基础文件的格式等）第二节：fastq数据处理到callSNV+基础认知（简单判断谱系突变和体系突变、以及GT:AD:AF:DP等基础信息）第三节（可能需要拆分成2节课）：各大数据库如何注释突变信息（clinvar、cosmic、gnomad、HGMD、hotspot、oncoKB、
[转载] [Mark]分布式存储必读论文 weixin_30945039 大数据数据库
原文:http://50vip.com/423.html分布式存储泛指存储存储和管理数据的系统，与无状态的应用服务器不同，如何处理各种故障以保证数据一致，数据不丢，数据持续可用，是分布式存储系统的核心问题，也是极具挑战的问题。本文总结了分布式存储领域的经典论文，供大家参考。TheGoogleFileSystem.SanjayGhemawat,HowardGobioff,andShun-TakLeu
golang实现从request请求返回的response中提取网站图标的faviconMMH3, faviconMD5, faviconPath, faviconData, faviconURL
golang实现从request请求返回的response中提取网站图标的faviconMMH3,faviconMD5,faviconPath,faviconData,faviconURL，其中faviconData类型为[]byte，其余为string类型。在Go中提取网站的favicon（网站图标）并计算其MMH3和MD5哈希值，同时获取路径、原始数据和URL，可以通过以下步骤实现：packa
大模型-FlashAttention 算法分析清风lsq 大模型推理算法算法大模型推理 LLM flashattention
一、FlashAttention的概述FlashAttention是一种IO感知精确注意力算法。通过感知显存读取/写入，FlashAttention的运行速度比PyTorch标准Attention快了2-4倍，所需内存也仅是其5%-20%。随着Transformer变得越来越大、越来越深，但它在长序列上仍然处理的很慢、且耗费内存。（自注意力时间和显存复杂度与序列长度成二次方），现有近似注意力方法，
可编程电子安全相关系统_编程中的安全生态系统概述 danpu0978 编程语言 python java 人工智能 linux
可编程电子安全相关系统就像近年来的情况一样，安全漏洞已越来越被接受。仅以最近的Equifax违规为例。无论我们在哪里看，似乎总有人会遭受某种形式的恶意攻击或其他形式的攻击。尽管我们最近想到了最近的漏洞，但我还是想花一点时间来概述有关软件开发的安全生态系统。我将从建设性和积极的角度介绍您可以做的一些关键事情，以提高您的应用程序的安全性，以应对安全漏洞。为此，我将研究四个关键领域。他们将主要讨论具体的
LabVIEW用户界面设计
LabVIEW用户界面设计如需将一个VI作为用户界面或对话框，前面板的外观和布局非常重要。前面板的设计应类似于仪器或其它设备，以使用户更容易识别进行何种操作。使用前面板控件、分隔栏和窗格、窗口设置等等，改进前面板的易用性。也可使用事件增强用户界面的功能。编辑添加图片注释，不超过140字（可选）设计前面板输入控件和显示控件是前面板的重要组成部分。设计用户界面类前面板时需遵循下列规范：考虑用户如何与V
教育技术资源大全（05-11-28） Shidi123 技术文摘教育网络出版设计模式工作交通
教育技术资源大全1、国内教育技术综合网站2、国外教育技术资源索引网站：3、远程教育网站；4、教学设计网站；5、教育技术论坛网站；6、国内67所远程教育试点院校网(点击校名可看该网院的介绍，点击网址可进入网院。)7、教育技术协会网；国内教育技术期刊：国外教育技术期刊：全美远程教育杂志列表http://ccc.commnet.edu/HP/pages/darling/journals.htm教育技术相
Red Bull红牛携手Fortinet，全球能量饮料巨头筑牢网安防线 Fortinet_CHINA 网络安全 web安全
作为全球知名的能量饮料品牌，在网络安全威胁日趋严峻的当下，RedBull（红牛）面临着诸多网络安全挑战。为应对这些挑战，RedBull选择了Fortinet的网络安全解决方案，通过部署FortiEDR和FortiGuardMDR服务等，成功提升了公司的安全防护能力。客户简介全球能量饮料领军者RedBull作为全球能量饮料领域的巨头，其品牌影响力遍及五大洲，产品畅销175个国家和地区。RedBull
【Python多线程】晟翰逸闻 Python python
文章目录前言一、Python等待event.set二、pythonracecondition和lock使用使用锁(Lock)三.pythonDeadLock使用等综合运用总结前言这篇技术文章讨论了多线程编程中的几个重要概念。它首先介绍了等待事件的使用，并强调了避免使用“ForLoop&Sleep”进行等待的重要性。接着，文档解释了竞态条件，并提供了处理共享资源的建议，即在使用共享资源时进行加锁和解
给pycharm配置conda环境无响应...如何解决？ bug菌¹ 全栈Bug调优(实战版)pycharm conda java python
本文收录于《全栈Bug调优(实战版)》专栏，主要记录项目实战过程中所遇到的Bug或因后果及提供真实有效的解决方案，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！备注：部分问题/疑难杂症搜集于互联网。全文目录：问题描述解决方案（请知悉：如下方案不保证一定适配你的问题）问题分析解决方案总结文末福利，等你来拿！✨️WhoamI?问题描
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$