量子位

一文看尽谷歌AI全年重大研究突破，Jeff Dean执笔，全程干货

晓查郭一璞栗子乾明发自凹非寺
量子位报道 | 公众号 QbitAI

刚刚，Jeff Dean代表Google AI，完整总结了2018。

这也是姐夫作为全球AI第一大厂总负责人的第一次年度汇报。

他说，2018真是令AI工作者兴奋的一年。

学术和应用两开花，开源和新技术同步推进。

从重要AI技术应用突破讲起，到展望2019结束。Jeff Dean总结了14个大方面的AI成果，并透露全年AI论文发表数达608篇。

涵盖量子计算、感知技术、计算摄影、算法框架、AutoML、机器人、医疗AI，计算力和TPU……

桩桩件件，不仅在当前推动了AI作用社会方方面面，而且也是对未来趋势的小小展示。

毫不夸张地说，欲知2018 AI技术进展，看Jeff这篇总结再合适不过；欲知2019 AI会走向何方，看Jeff这篇也能获益良多。

为了方便阅读，我们先整理了一个小目录给你：

智能助手：打电话回邮件，都靠AI
量子计算：72量子比特设备、开源框架、可行的量子神经网络……
自然语言理解：从Transformer到BERT，碾压各项NLP任务
感知：图像识别和场景理解，语音增强与合成
拍照：照片动起来，夜景亮起来
算法和理论：谷歌帝国基石，从优化、算法选择到应用
软件系统：Mesh TensorFlow、TF-Ranking、JAX、隐私与安全
AutoML：自动找出最高效的网络结构
TPU：给全世界提供大量算力
开源软件和数据集：远不止多巴胺，大量资源预警
机器人学：从多个角度入手，让机器人更独立，更强大
人工智能在其他领域的应用：物理学、生命科学、天文学
医疗：从视网膜诊断病症到癌症预测，从辅助诊断到拓展到临床预测
合作研究：投入大量资源资助教师、学生和各方面研究人员进行研究
新地方、新面孔：持续在世界各地扩张，并广纳人才
展望2019：对谷歌以及更广泛的研究和工程领域产生更大影响
AI原则：Google AI历史性指导准则，争议性军事项目之后制定了7大原则
AI社会公益：展示Google利用AI技术推动社会公益的案例

完整报告如下：

智能工具们

Google AI也在不断打造新技术应用帮助用户提升效率，创造更大的社会价值。

简而言之：努力打造Google AI小助手工具产品。

2018最典型的莫过于Google Duplex，这是一个汇集语音识别、语义理解和对话的AI系统，可以作为你的虚拟电话助手，订餐厅、预约会议时间都不在话下。

还有Smart Compose——智能回复。能够基于语义分析和文本预测，帮助用户提升邮件回复的效率。

同样的还有Sound Search和Smart Linkify，都是AI提升用户效率的尝试。

Google目前也在围绕上述AI产品，展开多语言支持的努力，希望类似的产品通过小数据训练学习，就能对全球更多地区和用户产生更好的影响。

相关报道：

Google AI打电话以假乱真

量子计算

量子计算是一种新兴的计算范式，有望解决经典计算机无法解决的问题。

在过去的几年里，我们一直积极进行相关的研究，我们相信该领域正处在实现量子霸权能力的转折阶段，这将是量子计算领域的一个分水岭。

2018年，我们取得了许多令人兴奋的成果，开发了一种新的72量子比特的量子计算设备Bristlecone。在迈向量子霸权的过程中，这台设备扩展了量子计算机可以解决问题的规模。

△科学家Marissa Giustina在圣巴巴拉的量子AI实验室安装了Bristlecone芯片

相关报道：

首个72量子比特的量子计算机问世，谷歌出品

我们还发布了量子计算机的开源编程框架Cirq，并探讨了量子计算机如何用于神经网络。

此外，我们还分享了理解量子处理器性能波动的经验与技术，以及量子计算机如何作为神经网络计算底层的一些想法。

相关报道：

谷歌证明量子神经网络可训练图像分类

2019年，我们期待在量子计算领域取得激动人心的成果！

自然语言理解

谷歌的自然语言研究在2018年取得了令人兴奋的成果，既有基础研究，也有以产品为中心的研究。

从2017年起，我们开始对Transformer进行改进，去年开发了一个名为“通用Transformer”模型的新的并行时间版本，该版本显示了包括翻译和语言推理在内的许多自然语言任务上的巨大进步。

相关论文：

Universal Transformers
https://arxiv.org/pdf/1807.03819.pdf

我们还开发了BERT，这是第一个深度双向、无监督的语言表示，仅使用纯文本语料库进行预训练，然后可以使用迁移学习对各种自然语言任务进行微调。

相关报道：

全面超越人类！Google称霸SQuAD，BERT横扫11大NLP测试

在11项自然语言任务上，BERT比以往最先进成果有显著的改进。

△BERT在极具挑战性的GLUE基准测试中提高了7.6％的成绩

除了与各种研究团队合作以实现AI帮助写邮件（Smart Compose）和虚拟电话助手（Duplex）外，我们还努力使谷歌智能助手能够更好地处理多语言使用案例，目标是使助手能与所有用户进行自然的对话。

相关报道：

谷歌助手超进化：可以同时识别两种语言了

感知

我们的感知研究解决了让计算机理解图像、声音、音乐和视频的难题，并为图像捕捉、压缩、处理、创造性表达和增强现实提供了更强大的工具。

2018年，我们的技术提高了Google Photos组织照片的能力，这项功能也是用户最关心的内容，比如给人和宠物照片分组。

△Google Lens能识别狗的种类

Google Lens和Google Assistant使用户能够了解周围世界，实时获取问题的答案，还能在让你在谷歌图像搜索中做更多的事情。

△Google Lens让你从照片中直接拷贝文字

谷歌AI使命的一个关键方面是让其他人从我们的技术中受益，我们在改进Google API一部分的功能和构建模块方面取得了很大进展。

例如Cloud ML API中视觉和视频方面的改进和新功能，以及通过ML工具包在面部识别相关的设备上构建模块。

相关论文：

Stereo Magnification: Learning View Synthesis using Multiplane Images
https://arxiv.org/abs/1805.09817

我们正在进行关于更好地理解图像和视频的研究，使用户能够在谷歌产品中找到、组织、增强和改善图像和视频，比如Google Photos、YouTube、搜索等等。

2018年，我们取得了多项显著的进步，包括：

快速自下而上的联合姿态估计和人物实例的分割模型

PersonLab: Person Pose Estimation and Instance Segmentation with a Bottom-Up, Part-Based, Geometric Embedding Model
https://arxiv.org/abs/1803.08225

将复杂运动可视化的系统

MoSculp: Interactive Visualization of Shape and Time
http://mosculp.csail.mit.edu

对人和物体之间时空关系建模的系统

Actor-Centric Relation Network
https://arxiv.org/abs/1807.10982

基于distillation和3D卷积的视频动作识别的改进

D3D: Distilled 3D Networks for Video Action Recognition
https://arxiv.org/abs/1812.08249

Rethinking Spatiotemporal Feature Learning: Speed-Accuracy Trade-offs in Video Classification
https://arxiv.org/abs/1712.04851

在音频领域，我们提出了一种无监督学习语义音频表示的方法，并且显著改进了语音合成，让它更生动、更像人类。

相关论文：

Unsupervised Learning of Semantic Audio Representations
https://ieeexplore.ieee.org/abstract/document/8461684

Towards End-to-End Prosody Transfer for Expressive Speech Synthesis with Tacotron
https://arxiv.org/abs/1803.09047

多模态感知是一个越来越重要的研究课题。Looking to Listen将输入视频中的视觉和听觉提示结合起来，分离并增强视频中说话者的声音。

相关论文：

Looking to Listen at the Cocktail Party: A Speaker-Independent Audio-Visual Model for Speech Separation
https://arxiv.org/abs/1804.03619

这项技术可以支持一系列应用：从视频中的语音增强和识别，到视频会议，再到改进的助听器，尤其是在有多人说话的情况下。

在资源受限的平台上实现感知变得越来越重要。MobileNetV2是谷歌的下一代移动计算机视觉模型，广泛应用于学术界和工业界。

相关论文：

MobileNetV2: Inverted Residuals and Linear Bottlenecks
http://openaccess.thecvf.com/content_cvpr_2018/papers/Sandler_MobileNetV2_Inverted_Residuals_CVPR_2018_paper.pdf

MorphNet提出了一种学习深层网络结构的有效方法，这种方法可以在计算资源受到限制时，全面提高图像和音频模型的性能，最近在自动生成移动网络架构方面的工作表明，实现更高的性能也是可能的。

相关论文：

MorphNet: Fast & Simple Resource-Constrained Structure Learning of Deep Networks
http://openaccess.thecvf.com/content_cvpr_2018/html/Gordon_MorphNet_Fast__CVPR_2018_paper.html

拍照算法

过去几年中，手机相机的拍照质量和功能提升十分显著，虽然手机实际物理传感器的进步是一方面，不过更大的进步则是拍照算法方面的。

我们的研究团队发布了新技术，与Google的安卓和消费者硬件团队密切合作，让这项新技术在最新的Pixel等安卓手机和其他设备上落地。

2014年，我们发布了HDR+，一种依靠计算机软件将单帧对齐融合的技术。HDR+最初应用的主要目的是为了让图片比单次曝光有更大的动态范围，但随后，拍摄动态帧并计算分析成为了2018年相机进步的一种通用方式。例如Pixel 2中的动态照片（Motion Photos）功能和动态剧照（Motion Stills）里的AR模式。

△ Pixel 2中的动态照片功能

△ 动态剧照里的AR鸡

相关报道：

宛如白昼，谷歌发布最强夜景拍照AI算法，单摄秒杀一众苹果华为三星

当然，夜视只是我们团队开发的多种帮助用户摄影的软件功能之一，另外还有用机器学习提供更好的人像模式、用Super Res Zoom看得更清晰更远、用Top Shot和Google Clips捕捉更好的瞬间。

△ 左为iPhone XS的效果，右为Pixel夜视

算法和理论

算法是Google系统的基干，关系到我们所有产品，从Google Trips旅行App背后的路径选择算法，到谷歌云的哈希一致性校验都是如此。

相关论文：

Consistent Hashing with Bounded Loads
https://arxiv.org/abs/1608.01350

过去一年，我们继续研究算法和理论，覆盖了从理论基础到应用算法，从图数据挖掘到隐私保护计算。

我们在优化方面的工作涉及到机器学习的持续优化、分布式组合优化等领域。

在持续优化上，我们研究随机优化算法训练神经网络的收敛性的工作，展示了ADAM变体等一些流行的基于梯度优化方法存在的问题，但也为新的基于梯度的优化算法提供了监视的基础，获得了ICLR 2018最佳论文。

相关论文：

On the Convergence of Adam and Beyond
https://openreview.net/forum?id=ryQu7f-RZ

上图就是ADAM和AMSGRAD在一个简单一维凸问题模拟例子上的性能对比，左中两幅是在线设置，最右一幅是随机设置。

在分布式优化上，我们努力提高一些经过充分研究的组合优化问题的循环和通信复杂性，比如通过round compression、core-sets、以及子模块最大化、k核分解等进行图匹配。

相关论文：

Round Compression for Parallel Matching Algorithms
https://dl.acm.org/citation.cfm?id=3188764

Optimal Distributed Submodular Optimization via Sketching
https://dl.acm.org/citation.cfm?id=3220081

Parallel and Streaming Algorithms for K-Core Decomposition
http://proceedings.mlr.press/v80/esfandiari18a/esfandiari18a.pdf

在更多应用层面，我们开发的算法技术，能通过sketching实现大规模集合覆盖，能为数万亿边的图解决平衡分区和分层聚类问题。

我们关于online delivery services的工作，还获得了WWW’18会议的最佳论文呢提名。

相关论文：

Minimizing Latency in Online Ride and Delivery Services
https://dl.acm.org/citation.cfm?doid=3178876.3186104

最后，我们的开源优化平台OR-tools在Minizinc约束规划竞赛中获得了4枚金牌。

平台主页：
https://developers.google.com/optimization/

在算法选择理论中，我们提出了新的模型，研究了重建（reconstruction）问题、学习多项logit混合问题。我们还研究了可通过神经网络学习的函数类，以及如何使用机器学习来改进经典在线算法。

相关论文：

A Discrete Choice Model for Subset Selection
https://dl.acm.org/citation.cfm?doid=3159652.3159702

Discrete Choice, Permutations, and Reconstruction
https://epubs.siam.org/doi/10.1137/1.9781611975031.38

Learning a Mixture of Two Multinomial Logits
http://proceedings.mlr.press/v80/chierichetti18a.html

Convergence Results for Neural Networks via Electrodynamics
http://drops.dagstuhl.de/opus/volltexte/2018/8352/

Improving Online Algorithms via ML Predictions
http://papers.nips.cc/paper/8174-improving-online-algorithms-via-ml-predictions

对Google来说还有一件事非常重要，那就是理解具有强隐私保障的学习技术。

在这一领域，我们开发了两种新方法，分析如何通过迭代和混排来强化差分隐私。

我们还运用差分隐私技术，设计了对博弈具有鲁棒性的激励感知学习方法。这样的学习技术可以用于高效在线市场设计。

相关论文：

Privacy Amplification by Iteration
https://ieeexplore.ieee.org/abstract/document/8555134

Amplification by Shuffling: From Local to Central Differential Privacy via Anonymity
https://epubs.siam.org/doi/abs/10.1137/1.9781611975482.151

Incentive-Aware Learning for Large Markets
https://dl.acm.org/citation.cfm?id=3186042

我们在市场算法领域的新研究，还包括帮助广告主测试广告竞价激励兼容性的技术，优化App内广告刷新的技术等。

相关论文：

Testing Incentive Compatibility in Display Ad Auctions
https://pdfs.semanticscholar.org/30a7/773faea229efa6a47178c396ef7b9617fcef.pdf

Optimizing Ad Refresh In Mobile App Advertising
https://dl.acm.org/citation.cfm?id=3186045

我们也推动了重复拍卖动态机制的发展，展示了对缺乏未来预测、对嘈杂预测、对异质买方行为具有鲁棒性的动态拍卖机制，还把研究结果扩展到动态双重拍卖上。

最后，关于在线优化、在线学习的鲁棒性，我们开发了新的在线分配算法，用于流量峰值的随即输入，以及对损坏的数据具有鲁棒性的新型bandit算法。

软件系统

我们在软件系统方面的一大部分研究依然是在建设机器学习模型和TensorFlow上。

例如，我们发布了TensorFlow 1.0动态流程控制的动态设计与实践，我们的一些新研究引入了一个我们称之为Mesh TensorFlow的系统，这使得用模型并行指定大规模分布式计算变得容易，有时会有数十亿个参数。

相关论文：

The Case for Learned Index Structures
https://arxiv.org/abs/1712.01208

Dynamic Control Flow in Large-Scale Machine Learning
http://delivery.acm.org/10.1145/3200000/3190551/a18-yu.pdf

Mesh-TensorFlow: Deep Learning for Supercomputers
https://papers.nips.cc/paper/8242-mesh-tensorflow-deep-learning-for-supercomputers

另一个例子是，我们发布了一个使用TensorFlow的可扩展深度神经排序库。

△ TF-Ranking支持多项目评分体系结构，这是传统单项评分的扩展。

相关论文：
TF-Ranking: Scalable TensorFlow Library for Learning-to-Rank
https://arxiv.org/abs/1812.00073

我们还发布了JAX，这是一个加速器支持的NumPy变体，支持自动将Python函数区分为任意顺序。虽然JAX不是TensorFlow的一部分，但它利用了一些相同的底层软件基础架构（例如XLA），并且它的一些想法和算法对我们的TensorFlow项目有所帮助。

相关开源项目：
JAX
https://github.com/google/jax

最后，我们继续研究机器学习的安全性和隐私性，以及在人工智能系统中老发安全和隐私的开源框架，如CleverHans和TensorFlow Privacy。

相关开源项目：
CleverHans
https://github.com/tensorflow/cleverhans

TensorFlow Privacy
https://github.com/tensorflow/privacy

我们的另一个重要的研究方向是将机器学习在软件系统中在堆栈的许多层面上应用。

例如，我们继续努力使用分层模型将计算部署到设备上，并且我们有助于学习内存访问模式。我们还继续探索如何使用学习指数来取代数据库系统和存储系统中的传统索引结构。正如我去年写下的，我们在计算机系统中使用机器学习仅仅停留在表面。

相关论文：
A HIERARCHICAL MODEL FOR DEVICE PLACEMENT
https://openreview.net/pdf?id=Hkc-TeZ0W

Learning Memory Access Patterns
http://proceedings.mlr.press/v80/hashemi18a/hashemi18a.pdf

2018年，得益于Google的Project Zero团队与其他人的合作，我们发现了Spectre和Meltdown，现代计算机处理器中新的严重安全漏洞，这两者以及其他相关的漏洞让计算机架构研究者们相当忙碌。

在我们继续努力模拟CPU行为时，我们的编译器研究团队将他们用于测量机器指令延迟和端口压力的工具集成到LLVM中，从而可以做出更好的编译决策。

相关文档：
llvm-exegesis - LLVM Machine Instruction Benchmark
https://llvm.org/docs/CommandGuide/llvm-exegesis.html

Google产品，我们的云产品和机器学习模型推理决定了计算、存储和网络提供大规模、可靠、高效的技术基础架构的能力。

过去一年的一些研究亮点包括Google软件定义网络WAN的发展，一个独立的联合查询处理平台，可以在许多存储系统中对基于不同文件格式存储的数据执行SQL查询（BigTable、Spanner、Google Spreadsheets等）以及我们广泛使用的代码审查报告，调查Google代码审查背后的动机，当前的实践以及开发人员的满意度和挑战。

相关论文：
Modern Code Review: A Case Study at Google
https://storage.googleapis.com/pub-tools-public-publication-data/pdf/80735342aebcbfc8af4878373f842c25323cb985.pdf

F1 Query: Declarative Querying at Scale
https://storage.googleapis.com/pub-tools-public-publication-data/pdf/fa380016eccb33ac5e92c84f7b5eec136e73d3f1.pdf

运行内容托管等大型Web服务需要在动态环境中实现稳定的负载平衡。我们开发了一致的哈希方案，对每台服务器的最大负载提供了严格的可证明保证，并将其部署到Google Cloud Pub/Sub中的云客户。

在提供了我们论文的早期版本后，Vimeo的工程师找到了论文，在haproxy中实现并开源，并将其用于Vimeo的负载平衡项目。结局是戏剧性的：应用这些算法思想帮助他们将缓存带宽减少了近8倍，消除了缩放瓶颈。

AutoML

AutoML，是用机器学习来加速机器学习的一种方法。

在这个领域，我们已经做了很多年的研究，长期目标是开发出那种拿到一个新问题，也能自动解决的学习系统：

从之前解决的问题里面获得的启发、习得的能力，就是处理新问题的依据。

这一领域的早期研究，大多是用强化学习做的，不过我们也对进化算法感兴趣。

去年我们就展示过，怎样用进化算法自动找到各种不同的视觉任务里，最先进 (State-of-the-Art) 的神经网络结构是什么。

我们还探索过，怎样把强化学习用到神经网络结构搜索以外的其他地方。发现有这些用途：

1) 自动生成图像变换序列 (Image Transformation Sequence) ，来提高各种图像模型的准确性。

2）找到新的符号优化表达方式 (Symbolic Optimization Expressions)，比常用的优化更新规则更有效。

我们在AdaNet上的成果，展示了如何造出一个快速灵活的AutoML算法：

另外一个关注点，是自动发现计算效率高的神经网络结构，让网络在手机、自动驾驶汽车这样的环境下也能跑起来：不论是计算资源有限，还是时间有限。

在这个问题上，我们证明了：把模型准确度和推理计算时间结合到一起，来设置强化学习的奖励函数，就可以找到高准确度的那些模型，应对不同的环境限制。

除此之外，我们也探索了用机器学习自动压缩机器学习模型，减少参数，就会减少计算资源的占用。

TPU

TPU是谷歌内部用的机器学习硬件加速器，从一开始就是设计用来支持大规模训练和大规模推理的。

谷歌的许多重大突破都是在TPU的加速下实现的，比如刚才讨论过的BERT自然语言处理模型。TPU也能让世界各地的研究人员在谷歌开源研究的基础之上，寻求自己的研究突破。

还是以BERT为例，任何人都可以在TPU上，用Colab来给BERT做微调。TensorFlow Research Cloud已经为数千研究人员，提供了大量的云TPU算力。

我们还把多代TPU硬件，用云TPU的形式做了商用：比如名叫Cloud TPU Pods的机器学习超级计算机，支持大规模训练。

而在谷歌内部，除了让机器学习研究进步更快之外，TPU也驱动了谷歌核心产品的重大改进：搜索、YouTube、Gmail、谷歌助手、谷歌翻译，等等。

希望不论是谷歌还是谷歌以外的机器学习团队，都能在TPU提供的、前所未有的计算规模之下，达成更多的成就。

开源软件和数据集

发布开源软件、创建新的公共数据集，是我们为学界和业界做出贡献的两种主要方式。

TensorFlow

在这一方面，我们做过最大的努力之一就是TensorFlow。2015年11月发布的机器学习系统，不久前才庆祝了三岁生日。

三年间，TensorFlow已被下载了超过3000万次，贡献者超过1700个，添加过45000多次代码 (Commits) 。

2018年，TensorFlow经历了8次主要版本更新，增加了重要功能：比如Eager Execution，以及分布策略 (Distribution Strategies) 。

我们还在开发过程中启用了大众评审，让广大贡献者都参与进来。

随着TensorFlow Lite、TensorFlow.js和TensorFlow Probability这些相关产品的推出，TensorFlow生态系统在2018年茁壮成长。

我们很高兴地发现，TensorFlow的GitHub的用户留存率 (User Retention) ，在主流机器学习/深度学习框架里面是最高的。

除此之外，TensorFlow团队也在加快处理GitHub上面讨论的问题 (Issue) ，给外部贡献者提供一个更好的体验。

研究方面，TensorFlow还在继续为这个世界大量的机器学习和深度学习研究提供支持，从Google Scholar论文发表的数据上就能看出。

另外，TensorFlow Lite仅仅上线一年，就有15亿台设备搭载了这套系统。

还有，TensorFlow.js是JavaScript机器学习框架里面的第一名：推出9个月，CDN (内容分发网络) 点击量已经超过200万，下载25万次，GitHub标星10000多。

其他框架

除了继续发展开源生态系统，2018年还发布了一个新框架“多巴胺 (Dopamine) ”，用来做灵活、可重复的强化学习。量子位报道在此：

令人激动！谷歌推强化学习新框架「多巴胺」，基于TensorFlow，已开源丨附github

发布了What-If可视化工具，可以快速了解数据集的特征（无需编写任何代码）：

pair-code.github.io/what-if-tool/

发布了TF-Ranking高级库，用来表达涉及排名的机器学习问题 (报道如下) ：

谷歌开源TF-Ranking可扩展库，支持多种排序学习

发布了AdaNet，一个快速灵活的AutoML框架 (报道如下) ：

谷歌开源集成学习工具AdaNet：2017年提出的算法终于实现了

还发布了能在浏览器里实时做tSNE可视化的框架，基于TensorFlow.js：

https://github.com/tensorflow/tfjs-tsne

数据集

公开数据集是很好的灵感来源，可以让整个学界看到有趣的数据和有趣的问题，在许多不同的任务上获得更好的结果。

这一年，我们很高兴地发布了谷歌数据集搜索引擎，可以在全网搜索数据集：

Google数据集搜索神器上线，和搜索论文一样简单 | 还不去训练网络？

发布了Open Images V4，一个包含190万张图1540万个边界框、600个类别的图像数据集：

https://storage.googleapis.com/openimages/web/index.html

发布了动作识别AVA数据集，提供视听双重标注：

https://research.google.com/ava/download.html

还发布了新版本的Youtube-8M数据集，包含610万个调视频，3862个类别，26亿次视听特征标注：

https://research.google.com/youtube8m/download.html

HDR+连拍数据集 (HDR+ Burst Photography Dataset)，是计算摄影领域的数据集：

https://hdrplusdata.org/

Google-Landmarks，地标识别数据集：

https://www.kaggle.com/google/google-landmarks-dataset

其中，许多数据集都是伴随着挑战赛一同发布的，HDR+连拍数据集也是，地标数据集也是，Youtube-8M也是。还有一场Kaggle比赛，内容是识别“Quick, Draw!” (猜画小歌) 数据集里的涂鸦：

https://quickdraw.withgoogle.com/data

机器人

2018年，我们朝着理解机器学习如何教机器人在世界上行动的目标，取得了重大进展，教机器人抓取新物体的能力也达到了一个新的里程碑，并通过这种方式帮助机器人在没有人类监督的情况下了解物体。

将机器学习、基于抽样的方法和机器人几何学结合，我们在机器人运动学习方面也取得了进展。机器人在通过自主观察来更好地理解世界结构的能力上，取得了巨大的进步。

我们首次成功地在真实的机器人上在线训练了深度强化学习模型，并且正在寻找新的理论基础方法来让机器人控制更稳定。

相关报道：

受婴儿抓阄启发，谷歌让机器臂自学抓取物体，不用标注数据

人工智能在其他领域的应用

2018年，我们将机器学习应用到了物理和生物科学中的各种问题上。使用机器学习，我们可以向科学家提供“成百上千的研究助理”，来帮他们助挖掘数据，从而使他们变得更有创造力和生产力。

我们发表在《Nature Methods》上关于神经元高精度自动重建的论文提出了一种新的模型，与以前的深度学习技术相比，这个模型将自动解释连接组学数据的精度提高了一个层次。

△我们的算法正在运行，它在鸣禽大脑中以3D的方式追踪单个神经突。

相关论文：

High-precision automated reconstruction of neurons with flood-filling networks
https://www.nature.com/articles/s41592-018-0049-4

其他一些将机器学习应用到科学问题中的例子包括：

通过数据挖掘恒星的光变曲线寻找太阳系外的新行星

http://iopscience.iop.org/article/10.3847/1538-3881/aa9e09/meta

识别短DNA序列的起源或功能

https://www.biorxiv.org/content/early/2018/06/22/353474

自动检测离焦显微镜图像

https://link.springer.com/epdf/10.1186/s12859-018-2087-4

用数字技术制作同一细胞的多重染色图像

http://www.cell.com/cell/fulltext/S0092-8674(18)30364-7

自动将质谱输出映射到肽链上

https://arxiv.org/pdf/1808.06576.pdf

△一个预训练的TensorFlow模型评估Fiji (ImageJ)细胞的显微镜图像的聚焦质量。边界的色调和亮度分别表示预测的聚焦质量和预能测的不确定性。

医疗

在过去的几年里，我们一直在将机器学习应用到医疗领域。我们相信，机器学习可以通过增强医疗专业人员的直觉和经验而产生巨大影响。

在这个领域，我们通常与医疗保健组织合作，解决基础研究问题(利用临床专家的反馈使我们的结果更加可靠) ，然后在备受尊敬的、有同行评审的科学和临床期刊上发表研究结果。

一旦这项研究得到临床和科学验证，我们将进行用户和人机交互研究，以了解我们如何在真正的临床环境中部署这项技术。

2018年，我们将研究范围从计算机辅助诊断扩展到了临床任务预测中。

在2016年年底，我们发表的一项回顾性研究显示，一个经过训练的、根视眼底图像来评估糖尿病病变的模型，能够与经过美国医学委员会认证的眼科医生相媲美。

2018年，我们得到了一个与视网膜专家水平相当的模型。我们发表了一篇评估报告，展示了眼科在医生与机器学习模型结合，诊断上比单独使用任何一种方法都更准确。

我们与Alphabet的其他兄弟公司合作，在印度的Aravind眼科医院和泰国卫生部下属的 Rajavithi 医院等10多个地点部署了这套糖尿病视网膜病变检测系统。

△左边是视网膜眼底图像，由眼科医生评定为中度DR (“Mo”)(ground truth)。右上角是模型预测分数的图示(“n”=无 DR,”Mi”=轻度 DR,”Mo”=中度 DR)。右下角是医生未经协助(“Unassisted”)的情况下和看到模型预测后，医生给出的分数(“Grades Only”)。

相关论文：

Improving the Effectiveness of Diabetic Retinopathy Models
http://www.aaojournal.org/article/S0161-6420(18)31575-6/fulltext

我们还推出了其他的机器学习模型，可以从视网膜图像中评估人们患有心血管疾病的风险。

相关论文：

Assessing Cardiovascular Risk Factors with Computer Vision
https://www.nature.com/articles/s41551-018-0195-0.epdf

这一年，我们还在继续关注病理学，展示了如何使用机器学习改善前列腺癌的分级状况，通过深度学习来检测转移性乳腺癌。

并开发了一种增强现实显微镜的原型，将计算机视觉模型中的视觉信息实时叠加到显微镜操作员的视野中，来帮助病理学家和其他科学家进行分析诊断。

前列腺癌论文：

Development and Validation of a Deep Learning Algorithm for Improving Gleason Scoring of Prostate Cancer
https://arxiv.org/abs/1811.06497

乳腺癌论文：

Artificial Intelligence–Based Breast Cancer Nodal Metastasis Detection
https://doi.org/10.5858/arpa.2018-0147-OA

Impact of Deep Learning Assistance on the Histopathologic Review of Lymph Nodes for Metastatic Breast Cancer
https://doi.org/10.1097/PAS.0000000000001151

在过去的四年里，在使用深度学习技术，基于电子健康记录做出临床相关的预测记录方面，我们进行了大量的研究工作。

2018年，我们与芝加哥大学医学院、加州大学旧金山分校和斯坦福大学医学院合作，在《Nature Digital Medicine》杂志上发表了我们的研究成果，展示了机器学习模型在识别电子医疗记录中的应用，能够比当前的临床最佳实践更准确地预测各种临床相关的任务。

相关论文：

Scalable and accurate deep learning with electronic health records
https://www.nature.com/articles/s41746-018-0029-1

在进行这些研究时，我们还开发了一些工具，使得创建这些模型变得非常容易。这些工具也能够应用到完全不同的任务和数据集上。

我们还开发了与快速医疗互操作性资源(FHIR)标准相关的开源软件，目的是帮助医疗数据处理变得更加容易和标准化。

GitHub链接：

https://github.com/google/fhir

我们还提高了基于深度学习的变体调用程序 DeepVariant 的准确性、速度和实用性。研究团队与合作伙伴一起努力，最近在《Nature Biotechnology》杂志上发表了经过同行评审的论文。

相关论文：

A universal SNP and small-indel variant caller using deep neural networks
https://www.nature.com/articles/nbt.4235

使用历史收集的数据训练机器学习模型时，重要的是了解哪些数据有偏差，以它们及是如何被编入数据中的。

机器学习提供了一个发现和解决偏见的机会，以及推进卫生公平的机会，我们正在设计这样的系统。

合作研究情况

我们以许多不同的方式与外部研究团体互动，包括教师参与和学生支持。

我们感到自豪的是，在2018 学年期间，我们招收了数百名本科生、硕士生和博士生作为实习生，并为北美、欧洲和中东的学生提供多年期博士研究生奖学金。

除了财务支持，每个奖学金获得者都被指派一个或多个谷歌研究人员作为导师，我们把所有的研究人员聚集在一起，参加一年一度的谷歌博士奖学金峰会。

在这里，他们可以接触到谷歌最先进的研究成果，并有机会与谷歌的研究人员以及来自世界各地的其他博士研究员交流。

作为对奖学金项目的补充，我们还有一个Google AI Residency项目，可以让那些想要学习进行深度学习研究的人花一年时间在谷歌工作，并接受谷歌研究人员的指导。

2018年是这个项目的第三个年头，很多研究人员都加入了谷歌遍布全球的各种团队，从事诸如机器学习、感知、算法和优化、语言理解、医疗保健等领域的研究。

每年，我们还通过Google Faculty Research Awards项目支持一些教师和学生的研究项目。

2018年，我们还在谷歌的办公地点为特定领域的教师和研究生举办研讨会。如：

在印度班加罗尔办事处举办的AI/ML研究和实践研讨会；
在苏黎世办事处举办的算法和优化研讨会；
在桑尼维尔举办的ML医疗应用研讨会；
在马在诸塞州剑桥办事处举办的ML公平和偏见研讨会。

我们认为，公开地为更广泛的研究群体做出贡献是支持健康和富有成效的研究生态系统的关键部分。

除了发布开源代码和数据集，我在们顶级会议和期刊上公开发表了大部分研究成果，并积极参与组织和赞助各种不同学科的会议。

比如ICLR 2018、NAACL 2018、ICML 2018、CVPR 2018、NeurIPS 2018、ECCV 2018和EMNLP 2018。

2018年，谷歌还广泛参与了ASPLOS、HPCA、ICSE、IEEE Security & Privacy、OSDI、SIGCOMM以及许多其他会议。

新的地方，新的面孔

2018年，我们非常高兴地欢迎许多背景广泛的新人加入我们的研究组团队我们在非洲开设了第一个人工智能研究办公室。

我们扩大了在巴黎、东京和阿姆斯特丹的人工智能研究领域，并在普林斯顿开设了一个研究实验室。

我们继续在世界各地广纳人才，你可以在这里了解更多关于工作的信息。

展望2019年

这篇博客文章，只是总结了2018年所做研究的一小部分。

当我们回顾2018年时，我们很兴奋，也很自豪！

2019年，我们期待着能够对谷歌以及更广泛的研究和工程领域产生更大的影响！

One more great thing

AI原则

实际上，这篇报道最开篇，首先谈到的是Google在2018年发布的AI原则。

在过去几年中，Google关注到AI的重大进步及其对产品和用户日常生活的积极影响。

但作为搞AI的人，保证AI向善，始终对社会有益，也是责任所在、题中之义。

2018年，Google发布了AI 七原则，并围绕这些原则展开应用实践。

AI原则为Google AI应用和发展提供了指导，让我们知道在AI实践中该做什么、不该做什么，哪些值得做、哪些则要避免。

比如在实践过程中，Google AI原则就让我们对“AI公平”、“对所有人负责”等有更强使命感。

在机器学习公平性、模型可解释性方面，投入精力，展开新研究。

在Google翻译中，利用AI消除性别偏见。

并发布更多更具包容性的图像数据集和模型，让计算机视觉能够适合全球多元文化。

值得一提的是，这也促进我们可以更广泛地与全球研究组织一起努力，进一步推动AI公平和机器学习普及。

相关报道：

Google AI 七原则

AI for Good

接着，AI原则之后，紧接着“汇报”Google AI这一年在社会公益方面的努力。

第一个例子，用AI来进行洪水预测工作。Google内部许多团队通力合作，希望对洪水变化有更精准及时的信息监测，以便洪水多发地区的人，可以更有效保护自己的生命及财产安全。

第二个例子是地震余震的预测工作。

Google展示的机器学习模型，可以比传统余震预测方式更精准，而且该机器学习模型可解释，利于地震科学家围绕余震数据展开更多研究，不仅能进一步促进余震精准预测，还对地质等信息有更深了解。

而且“Google AI+外部跨领域科学家”这样的合作模式也越来越多，更多工程师、科学家开始使用TensorFlow来解决科学和社会问题。比如识别并精准保护濒危鲸鱼、探索发现行星，以及识别虫患木薯植物等。

为了进一步推动AI for Good的创新。

Google还设立了2500万美元基金，专门用来支持AI为公益的项目，而且参与者不必一定是AI方面的专家，只要你的点子好、对社会有益，谷歌愿意让AI专家提供技术支持，此外还为你提供谷歌云服务。

一句话：只要你的出发点有益社会公益，Google就会给钱、给资源，做到AI技术最大化支援。

或许，通过AI原则和AI公才能益，真洁解释Google何以为Google。

相关报道：

Google AI for Good

报告传送门

https://ai.googleblog.com/2019/01/looking-back-at-googles-research.html

Google 2018论文传送门

https://ai.google/research/pubs/?year=2018

— 完 —

加入社群

量子位AI社群开始招募啦，欢迎对AI感兴趣的同学，在量子位公众号（QbitAI）对话界面回复关键字“交流群”，获取入群方式；

此外，量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募，面向正在从事相关领域的工程师及研究人员。

进专业群请在量子位公众号（QbitAI）对话界面回复关键字“专业群”，获取入群方式。（专业群审核较严，敬请谅解）

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 !

你可能感兴趣的:(一文看尽谷歌AI全年重大研究突破，Jeff Dean执笔，全程干货)

Vibe Coding开发微信小程序实战案例程序员陆通微信小程序 notepad++小程序 AI编程
在AI编程时代，人人都能编程。我以"个人记账助手"小程序为例，详细演示整个开发过程。项目概述项目名称：个人记账助手功能描述：用户可以记录日常收支，查看统计图表，管理账单分类技术栈：微信小程序原生开发+云开发开发方式：VibeCoding+AI辅助第一阶段：需求分析与架构设计与AI对话进行需求梳理开发者描述：我想开发一个微信小程序，功能是个人记账。用户可以：1.添加收入和支出记录2.选择消费分类（餐
Rust中struct、impl、trait、enum关系解析
在Rust中，struct、enum、impl和trait是面向对象编程的核心概念，它们协同工作以实现数据抽象、封装和多态。以下是详细解释及它们之间的关系：1.struct（结构体）作用：定义自定义数据类型，封装多个相关字段（数据）。特点：类似于其他语言中的"类"，但仅包含数据（不包含方法）。支持泛型、生命周期参数等。通过impl块添加方法。示例：structRectangle{width:u32
pytorch官方文档60分钟入门笔记 xiaodidadada 机器学习
文章目录1.张量（Tensors）定义张量张量操作2.自动求导（autograd）变量Variable3.神经网络4.训练一个分类器载入数据5.数据并行day63参考：官方文档https://blog.csdn.net/u014630987/article/details/786690511.张量（Tensors）tensors和numpy的ndarray类似,但是tensors可以使用GPU加快
vue3导出 excel、word 满楼、 excel word javascript
importaxiosfrom'axios'import{http}from'@/plugins/axios'import{useMessage}from'naive-ui'constmessage=useMessage()constinstance=axios.create({responseType:'arraybuffer',onDownloadProgress:function(Progr
Prompt 精通之路（四）- AI 赋能：10 个超实用的 Prompt 模板，覆盖写作、编程、学习和办公程序员阿超的博客 Prompt 精通之路：从零基础到 AI 高效玩家人工智能 prompt 学习 Prompt模板 AI工作流 ChatGPT应用生产力工具
Prompt精通之路：系列文章导航第一篇：[本文]AI时代的新语言：到底什么是Prompt？为什么它如此重要？第二篇：告别废话！掌握这4个黄金法则，让你的Prompt精准有效第三篇：像专业人士一样思考：Zero-Shot,Few-Shot和思维链（CoT）技巧详解第四篇：AI赋能：10个超实用的Prompt模板，覆盖写作、编程、学习和办公第五篇：构建你的“AI指令系统”：超越简单提问的CRISPE
YII2配置SQLSERVER 大智001
php5.3以后，没有对sqlserver的支持的动态链接文件了，要php支持sqlserver。记住下面两个链接：https://github.com/Microsoft/msphpsql1.根据要求下载SRV32.EXE文件。（Php5.5以上的可以安装SQL）https://www.microsoft.com/en-us/download/details.aspx?id=20098将其安装到
多租户多会话隔离存储架构的完整实现方案敲键盘的小夜猫大语言模型 python langchain python 人工智能
导读：在构建企业级AI应用的道路上，多租户隔离和会话管理往往成为架构师们面临的核心难题。当系统需要同时服务数百乃至数千个用户时，如何确保用户数据的完全隔离？如何让每个用户的多个对话会话保持独立运行而互不干扰？这篇文章通过深入剖析LangChain框架中的history_factory_config机制，为你展示了一套完整的多租户多会话隔离存储方案。文章不仅详细解析了ConfigurableFiel
DeepSeek打破AI天花板：MoE架构+RL推理，效率提升5倍的底层逻辑 m0_74825409 面试学习路线阿里巴巴人工智能架构
文章目录一、引言二、MoE架构：高效计算的核心支撑（一）MoE架构概述（二）DeepSeekMoE架构的创新点（三）MoE架构的代码实现示例三、RL推理：智能提升的关键驱动（一）RL推理概述（二）R1的训练流程（三）RL推理中的关键技术（四）RL推理的代码实现示例四、MoE架构与RL推理的结合：效率提升的奥秘（一）计算效率的提升（二）推理能力的增强（三）整体性能的飞跃五、结论与展望《DeepSee
边缘人工智能与医疗AI融合发展路径：技术融合与应用前景（下） Allen_Lyb 数智化医院2025 人工智能健康医疗数据库矩阵
医疗边缘AI的市场趋势医疗边缘AI市场正经历着显著的增长，根据市场研究公司的数据，2024年的边缘AI市场价值为125亿美元，估计在2025至2034年之间，由于各部门越来越多地采用边缘装置，CAGR为24.8%。保健、制造业、零售业和汽车业的企业拥有综合边缘计算解决方案[36]。这一增长趋势表明，边缘AI技术正在各行各业得到广泛应用，其中医疗保健是一个重要的应用领域。2023年全球边缘人工智能市
ubuntu/centos环境下玩android系统(二): linux下的android模拟器运行！刀客777 linux开发 android linux path swt list java
上一篇完成了Android的编译，想必一定心里痒痒了！这一篇将开始玩转android模拟器！如果不喜欢在linux下运行emulator，可直接看第三篇，第三篇讲述windows下的模拟器，相对linux下，要简单很多！一.下载AndoirdSDK,这次我选择的是android-sdk_r15-linux.tgz安装很简单，直接解压到opt目录下！最好配制一下PATH,以便运行时不用设置PATH环
spring mvc详解 Jessysong spring mvc详解
http://blog.csdn.net/chichengit/article/details/12098111
AI 编程对决：Gemini CLI vs Claude Code，谁是最佳 AI 编码工具？ charieli-fh 人工智能大模型
1.引言：AI编码工具的崛起在软件开发的快节奏世界中，人工智能（AI）工具正迅速从辅助角色转变为不可或缺的伙伴。它们不再仅仅是提供代码补全，而是能够理解复杂上下文、执行多步骤任务，甚至自动化整个工作流的智能代理。这种转变正在重塑开发者的日常工作，提高生产力，并加速创新。在众多涌现的AI编码工具中，Google的GeminiCLI和Anthropic的ClaudeCode脱颖而出，各自代表了AI辅助
深入剖析AI大模型：关于模型训练 chilavert318 熬之滴水穿石人工智能
今天说的是模型训练，在AI模型里，它是点亮智慧星辰的关键引擎。今天将围绕开源预训练模型的使用、数据与模型的集成、模型的部署管理，以及大规模模型的可扩展性与效率提升展开，带大家开启一场深入浅出的模型训练实战之旅。一、使用开源预训练模型1、如何利用开源模型（如BERT、GPT）进行微调开源预训练模型就像是已经搭建好框架的摩天大楼，BERT、GPT等模型便是其中声名赫赫的标志性建筑。它们经过海量数据的“
RAG技术栈详解：构建智能问答系统的核心组件认知超载 AI 人工智能
本文深度剖析RAG（Retrieval-AugmentedGeneration）技术栈的核心构成，助你快速搭建企业级知识增强系统一、RAG技术架构全景图二、核心组件技术选型1.检索模块（Retriever）向量数据库主流选择：Pinecone、Milvus、Qdrant、Weaviate新兴势力：ChromaDB（开源轻量级）、腾讯云向量数据库嵌入模型（Embedding）OpenAItext-e
量子算法：微算法科技用于定位未知哈希图的量子算法，网络安全中的哈希映射突破 MicroTech2025 量子计算哈希算法
近年来，量子计算的飞速发展使其成为各个领域的变革力量。特别是在网络安全领域，量子算法展示了加速并增强威胁检测（如恶意软件识别）方法的巨大潜力。微算法科技（NASDAQ:MLGO）用于定位未知哈希图的量子算法，是针对未知哈希图定位而设计的量子算法。这项技术可能会彻底改变在数据处理中利用哈希值的方式，特别是在恶意软件模式识别中。传统网络安全框架通常依赖哈希函数来生成不同数据结构的唯一标识符，或称之为“
是真是假？飞算JavaAI如何帮助开发者减少无效劳动？飞算JavaAI开发助手人工智能开发语言 java ide 大数据
在软件开发这一充满挑战与创新的领域中，开发者们时常面临着繁琐而复杂的工作流程。从最初的需求理解阶段开始，他们就需要投入大量的时间和精力去深入剖析客户的需求，确保每一个细节都被准确捕捉并转化为可实施的功能点。这一过程往往充满了反复沟通与确认，稍有不慎就可能导致后续的开发偏离轨道。紧接着，复杂的设计工作接踵而至，开发者需要运用专业的知识和丰富的经验，将需求转化为清晰、可行的设计方案，这其中包括了架构规
百度颠覆了自己，飞算JavaAI造福了中国程序员！飞算JavaAI开发助手百度
在当今这个科技日新月异的时代，企业纷纷寻求技术突破，以期在激烈的市场竞争中脱颖而出。百度，作为中国互联网行业的领军企业之一，凭借其强大的科技实力和创新能力，在人工智能等多个领域取得了显著成就，并正在逐步颠覆自身的传统形象。百度自成立之初，就将技术创新视为企业的生命线。从最初的搜索引擎技术，到如今的深度学习、自然语言处理、计算机视觉等前沿领域，百度始终走在技术革新的前沿。其自主研发的飞桨深度学习平台
颠覆传统！飞算JavaAI：一键自动化开发流程，复制粘贴从此成为传说！飞算JavaAI开发助手自动化 java 人工智能开发语言
在软件开发的漫长历史中，程序员们长期被繁琐的流程所困扰。从理解业务需求，到设计接口、搭建架构，再到一行行地敲下代码，每一个环节都充满了挑战和艰辛。而复制粘贴，这个看似便捷的操作，却也常常伴随着代码冗余、错误传播等隐患，更无法从根本上解决开发效率低下的问题。然而，飞算JavaAI的横空出世，犹如一场科技风暴，彻底颠覆了传统的开发模式，让一键自动化开发流程成为现实，也让复制粘贴彻底成为了过去式的传说。
Java AI 开发智能体：从入门到实践培风图南以星河揽胜 java java 人工智能开发语言
在人工智能（AI）技术蓬勃发展的今天，智能体作为AI领域的核心概念之一，正逐渐渗透到各个行业与应用场景。而Java凭借其跨平台性、丰富的类库和强大的生态系统，成为开发智能体的热门选择。本文将深入探讨如何使用Java进行AI开发智能体，从基础概念到实践应用，解答常见问题，为你揭开JavaAI开发智能体的神秘面纱。一、Java在AI开发中的优势1.跨平台性Java的“一次编写，到处运行”特性，使得基于
Prompt 精通之路（五）- 构建你的“AI 指令系统”：超越简单提问的 CRISPE 与 APE 框架
Prompt精通之路：系列文章导航第一篇：[本文]AI时代的新语言：到底什么是Prompt？为什么它如此重要？第二篇：告别废话！掌握这4个黄金法则，让你的Prompt精准有效第三篇：像专业人士一样思考：Zero-Shot,Few-Shot和思维链（CoT）技巧详解第四篇：AI赋能：10个超实用的Prompt模板，覆盖写作、编程、学习和办公第五篇：构建你的“AI指令系统”：超越简单提问的CRISPE
Linux 虚拟机里面系统自动校准时间， wushuang443 linux
首先查看下系统时间：输入date或者timedatectlstatus查看时间信息先启用NTP(网络时间协议)timedatectlset-ntptrue1现在发现日期对上了，但是准确的时钟分钟没对上，输入：这点时区的设置很重要timedatectlset-timezone"Asia/Shanghai"1修改时区为上海注意：若提示权限不足可以加上sudo提权或者使用root账户
ollama v0.9.4 详解：联网功能、模型目录自定义及macOS性能优化全面升级
近年来，随着人工智能技术的快速发展，模型管理与调用变得尤为重要。作为一款备受关注的本地AI模型管理工具，Ollama在最新发布的v0.9.4版本中带来了多项重磅改进和全新功能，提升了用户体验和应用场景的灵活性。本文将深入解析Ollamav0.9.4版本的功能亮点、技术改进以及实用操作指南，帮助广大开发者和AI爱好者全面掌握这款工具的最新动态。一、版本概述Ollamav0.9.4版本于2025年7月
ubuntu环境搭建四：安装和使用git 小坚学Linux ubuntu环境搭建 git ubuntu github
1.安装gitsudoapt-getinstallgit2.配置git的名字和邮箱gitconfig--globaluser.name"jian"gitconfig--globaluser.email"[email protected]"gitconfig--globalcore.editorvim提交内核patch的配置gitconfig--globaluser.name"RuijianLi"gi
【V5.0 - 视觉篇】AI的“火眼金睛”：用OpenCV量化“第一眼缘”，并用SHAP验证它的“审美” 爱分享的飘哥 AI 人工智能 opencv 计算机视觉
系列回顾：在上一篇《给AI装上“写轮眼”：用SHAP看穿模型决策的每一个细节》中，我们成功地为AI装上了“透视眼镜”，看穿了它基于数字决策的内心世界。但一个巨大的问题暴露了：它的世界里，还只有数字。它能理解“时长60秒”，却无法感受画面的震撼。它是一个强大的“盲人数学家”。计算机视觉我们没有必要为每个视频进行切帧，可以针对开头的视频或者中间关键点视频进行切帧，让计算机识别。承上启下：“现在，我们来
QT读写excel FlechazoCLF 嵌入式软件开发代码库 qt excel 单片机
最近呢在做一个生产工具，这样的需要将这表格里的元素存下来，支持导入导出首先需要这几个头文件#include"QFileDialog"#include"QAxObject"#include#include"QFile"读取excel//读取excelvoidMainWindow::vexcelReadInfo(QStringbutton){staticQStringstrFile=QFileDial
Python Day44 别勉. python机器学习 python 开发语言
Task：1.预训练的概念2.常见的分类预训练模型3.图像预训练模型的发展史4.预训练的策略5.预训练代码实战：resnet181.预训练的概念预训练（Pre-training）是指在大规模数据集上，先训练模型以学习通用的特征表示，然后将其用于特定任务的微调。这种方法可以显著提高模型在目标任务上的性能，减少训练时间和所需数据量。核心思想：在大规模、通用的数据（如ImageNet）上训练模型，学习丰
智慧城市的安全密码：商用密码如何守护万物互联？南京首传信安科技有限公司密码应用智慧城市商用密码密码安全
目录一、筑牢网络通信安全防线1.网络身份可信认证2.通信传输全程加密二、守护数据全生命周期安全1.数据存储加密防护2.数据安全使用与共享3.数据完整性保障三、赋能核心应用场景安全1.智慧政务2.智慧交通3.智慧医疗4.智慧能源(电网)5.公共安全与应急四、构建统一密码服务支撑体系体系化密码安全防护框架智慧城市需建设集约化密码基础设施五、首传信安-防护方案六、未来发展趋势七、总结智慧城市依托物联网、
〖Python零基础入门篇⑮〗- Python中的字典哈哥撩编程 #① -零基础入门篇 Python全栈白宝书 python 开发语言后端 python中的字典
>【易编橙·终身成长社群，相遇已是上上签！】-点击跳转～<作者：哈哥撩编程（视频号同名）图书作者：程序员职场效能宝典博客专家：全国博客之星第四名超级个体：COC上海社区主理人特约讲师：谷歌亚马逊分享嘉宾科技博主：极星会首批签约作者文章目录⭐️什么是字典？⭐️字典的结构与创建方法⭐️字典支持的数据类型⭐️在列表与元组中如何定义字典
【LangChain编程：从入门到实践】使用LangServe提供服务 AI天才研究院计算 AI大模型企业级应用开发实战 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【LangChain编程：从入门到实践】使用LangServe提供服务作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：LangChain,LangServe,微服务架构,API设计,端到端解决方案1.背景介绍1.1问题的由来随着云计算和互联网技术的发展，企业级应用越来越倾向于采用微服务架构。微服务架构允许将大型应用拆分为一组小的服务，每项服务
零基础起步：基于GpuGeek的文本生成模型实战昊昊该干饭了人工智能 nlp 深度学习 gpu算力 gru
在自然语言处理（NLP）领域，文本生成任务广泛应用于问答系统、智能摘要、内容创作等方向。本文将带领读者使用GpuGeek平台，从注册、上传数据到实例部署与训练，完整构建一个基于GPT2模型的文本生成系统，实战掌握AI模型的云端开发流程。目录一、GpuGeek平台使用流程详解1.注册与登录2.数据上传3.创建训练实例4.启动与使用实例5.关闭实例（手动&自动）二、文本生成实战任务：微调GPT-21.
JVM StackMapTable 属性的作用及理解 lijingyao8206 jvm 字节码 Class文件 StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率，在字节码规范中添加了Stack Map Table属性，以下简称栈图，其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
回调函数调用方法百合不是茶 java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记记录一下代码很简单: MainDemo :调用方法得到方法的返回结果
[时间机器]制造时间机器需要一些材料 comsci 制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质和材料... 甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
开口埋怨不如闭口做事邓集海邓集海做人做事工作
“开口埋怨，不如闭口做事。”不是名人名言，而是一个普通父亲对儿子的训导。但是，因为这句训导，这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子，叫张明正。　　　　张明正出身贫寒，读书时成绩差，常挨老师批评。高中毕业，张明正连普通大学的分数线都没上。高考成绩出来后，平时开口怨这怨那的张明正，不从自身找原因，而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。　　　　
jQuery插件开发全解析，类级别与对象级别开发 IT独行者 jquery 开发插件　函数
jQuery插件的开发包括两种：一种是类级别的插件开发，即给 jQuery添加新的全局函数，相当于给 jQuery类本身添加方法。 jQuery的全局函数就是属于 jQuery命名空间的函数，另一种是对象级别的插件开发，即给 jQuery对象添加方法。下面就两种函数的开发做详细的说明。 1 、类级别的插件开发类级别的插件开发最直接的理解就是给jQuer
Rome解析Rss 413277409 Rome解析Rss
import java.net.URL; import java.util.List; import org.junit.Test; import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S
RSA加密解密无量加密解密 rsa
RSA加密解密代码代码有待整理 package com.tongbanjie.commons.util; import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerat
linux 软件安装遇到的问题 aichenglong linux 遇到的问题 ftp
1 ftp配置中遇到的问题 500 OOPS: cannot change directory 出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了修改方法:1 修改/etc/selinux/config 中SELINUX=disabled 2 source /etc
面试心得 alafqq 面试
最近面试了好几家公司。记录下；支付宝，面试我的人胖胖的，看着人挺好的；博彦外包的职位，面试失败；阿里金融，面试官人也挺和善，只不过我让他吐血了。。。由于印象比较深，记录下； 1，自我介绍 2，说下八种基本类型；（算上string。楼主才答了3种，哈哈，string其实不是基本类型，是引用类型） 3，什么是包装类，包装类的优点； 4，平时看过什么书？NND，什么书都没看过。。照样
java的多态性探讨百合不是茶 java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况 //package 1; class A{ public void test(){ System.out.println("A"); } } class D extends A{ public void test(){ S
网络编程基础篇之JavaScript-学习笔记 bijian1013 JavaScript
1.documentWrite <html> <head> <script language="JavaScript"> document.write("这是电脑网络学校"); document.close(); </script> </h
探索JUnit4扩展：深入Rule bijian1013 JUnit Rule 单元测试
本文将进一步探究Rule的应用，展示如何使用Rule来替代@BeforeClass，@AfterClass，@Before和@After的功能。在上一篇中提到，可以使用Rule替代现有的大部分Runner扩展，而且也不提倡对Runner中的withBefores()，withAfte
[CSS]CSS浮动十五条规则 bit1129 css
这些浮动规则，主要是参考CSS权威指南关于浮动规则的总结，然后添加一些简单的例子以验证和理解这些规则。 1. 所有的页面元素都可以浮动 2. 一个元素浮动后，会成为块级元素，比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动，会向最近的块级父元素的左上角移动，直到浮动元素的左外边界碰到块级父元素的左内边界；如果这个块级父元素已经有浮动元素停靠了
【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景 bit1129 partition
0.Kafka服务器配置 3个broker 1个topic，6个partition，副本因子是2 2个consumer，每个consumer三个线程并发读取 1. Producer package kafka.examples.multibrokers.producers; import java.util.Properties; import java.util.
zabbix_agentd.conf配置文件详解 ronin47 zabbix 配置文件
Aliaskey的别名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用户ID。你可以使用key：vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1]，也可以使用ttlsa.userid。备注: 别名不能重复，但是可以有多个
java--19.用矩阵求Fibonacci数列的第N项 bylijinnan fibonacci
参考了网上的思路，写了个Java版的： public class Fibonacci { final static int[] A={1,1,1,0}; public static void main(String[] args) { int n=7; for(int i=0;i<=n;i++){ int f=fibonac
Netty源码学习-LengthFieldBasedFrameDecoder bylijinnan java netty
先看看LengthFieldBasedFrameDecoder的官方API http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html API举例说明了LengthFieldBasedFrameDecoder的解析机制，如下：实
AES加密解密 chicony 加密解密
AES加解密算法，使用Base64做转码以及辅助加密： package com.wintv.common; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import sun.misc.BASE64Decod
文件编码格式转换 ctrain 编码格式
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream;
mysql 在linux客户端插入数据中文乱码 daizj mysql 中文乱码
1、查看系统客户端，数据库，连接层的编码查看方法： http://daizj.iteye.com/blog/2174993 进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+------
好代码是廉价的代码 dcj3sjt126com 程序员读书
长久以来我一直主张：好代码是廉价的代码。当我跟做开发的同事说出这话时，他们的第一反应是一种惊愕，然后是将近一个星期的嘲笑，把它当作一个笑话来讲。当他们走近看我的表情、知道我是认真的时，才收敛一点。当最初的惊愕消退后，他们会用一些这样的话来反驳： “好代码不廉价，好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。” 我只
Android网络请求库——android-async-http dcj3sjt126com android
在iOS开发中有大名鼎鼎的ASIHttpRequest库，用来处理网络请求操作，今天要介绍的是一个在Android上同样强大的网络请求库android-async-http，目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库，网络处理均基于Android的非UI线程，通
ORACLE 复习笔记之SQL语句的优化 eksliang SQL优化 Oracle sql语句优化 SQL语句的优化
转载请出自出处：http://eksliang.iteye.com/blog/2097999 SQL语句的优化总结如下 sql语句的优化可以按照如下六个步骤进行：合理使用索引避免或者简化排序消除对大表的扫描避免复杂的通配符匹配调整子查询的性能 EXISTS和IN运算符下面我就按照上面这六个步骤分别进行总结：
浅析：Android 嵌套滑动机制（NestedScrolling） gg163 android 移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后，为了更好的用户体验，Google为Android的滑动机制提供了NestedScrolling特性 NestedScrolling的特性可以体现在哪里呢？ 比如你使用了Toolbar，下面一个ScrollView，向上滚
使用hovertree菜单作为后台导航 hvt JavaScript jquery .net hovertree asp.net
hovertree是一个jquery菜单插件，官方网址：http://keleyi.com/jq/hovertree/ ，可以登录该网址体验效果。 0.1.3版本：http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm hovertree插件包含文件： http://keleyi.com/jq/hovertree/css
SVG 教程（二）矩形天梯梦 svg
SVG <rect> SVG Shapes SVG有一些预定义的形状元素，可被开发者使用和操作：矩形 <rect> 圆形 <circle> 椭圆 <ellipse> 线 <line> 折线 <polyline> 多边形 <polygon> 路径 <path>
一个简单的队列 luyulong java 数据结构队列
public class MyQueue { private long[] arr; private int front; private int end; // 有效数据的大小 private int elements; public MyQueue() { arr = new long[10]; elements = 0; front
基础数据结构和算法九：Binary Search Tree sunwinner Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
项目出现的一些问题和体会 Steven-Walker DAO Web servlet
第一篇博客不知道要写点什么，就先来点近阶段的感悟吧。这几天学了servlet和数据库等知识，就参照老方的视频写了一个简单的增删改查的，完成了最简单的一些功能，使用了三层架构。 dao层完成的是对数据库具体的功能实现，service层调用了dao层的实现方法，具体对servlet提供支持。 &
高手问答：Java老A带你全面提升Java单兵作战能力！ ITeye管理员 java
本期特邀《Java特种兵》作者：谢宇，CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答，欢迎网友积极提问，与专家一起讨论! 作者简介：淘宝网资深Java工程师，CSDN超人气博主，人称“胖哥”。 CSDN博客地址： http://blog.csdn.net/xieyuooo 作者在进入大学前是一个不折不扣的计算机白痴，曾经被人笑话过不懂鼠标是什么，

一文看尽谷歌AI全年重大研究突破，Jeff Dean执笔，全程干货

晓查 郭一璞 栗子 乾明 发自 凹非寺 量子位 报道 | 公众号 QbitAI

智能工具们

量子计算

△科学家Marissa Giustina在圣巴巴拉的量子AI实验室安装了Bristlecone芯片

自然语言理解

△BERT在极具挑战性的GLUE基准测试中提高了7.6％的成绩

感知

△Google Lens能识别狗的种类

△Google Lens让你从照片中直接拷贝文字

拍照算法

△ Pixel 2中的动态照片功能

△ 动态剧照里的AR鸡

△ 左为iPhone XS的效果，右为Pixel夜视

算法和理论

软件系统

△ TF-Ranking支持多项目评分体系结构，这是传统单项评分的扩展。

AutoML

TPU

开源软件和数据集

TensorFlow

其他框架

数据集

机器人

人工智能在其他领域的应用

△我们的算法正在运行，它在鸣禽大脑中以3D的方式追踪单个神经突。

△一个预训练的TensorFlow模型评估Fiji (ImageJ)细胞的显微镜图像的聚焦质量。边界的色调和亮度分别表示预测的聚焦质量和预能测的不确定性。

医疗

合作研究情况

新的地方，新的面孔

展望2019年

One more great thing

AI原则

AI for Good

报告传送门

Google 2018论文传送门

你可能感兴趣的:(一文看尽谷歌AI全年重大研究突破，Jeff Dean执笔，全程干货)

晓查郭一璞栗子乾明发自凹非寺
量子位报道 | 公众号 QbitAI