北京时间 5 月 12 日凌晨 1 点,Google 在海岸线圆形露天剧场举办了 Google I/O 2022 大会。作为今年首场面向全球开发者、合作伙伴和 Google 用户的年度科技盛会,此次活动时隔三年首次回归线下,与来自全球的用户通过线上共同见证精彩。
今年的大会,也是由 Google CEO Sundar Pichai 三年来首次亲自出席并主持的盛会。在主题演讲中,Google 带来了下一代操作系统 Android 13 的更新,并正式推出了 Pixel 6A 智能手机、Pixel Watch 和 Pixel Buds Pro 耳机。(此外,还提前透露了 Pixel 平板电脑以及 Pixel 7 和 Pixel 7 Pro 手机的预告片,后者定于秋季推出)。
会上,Google 还强调了即时翻译、Flutter 3.0 等智能功能,并对其正在开发的 AR 眼镜进行了快速预览。除此之外,还有不少让开发者和 Google 用户惊喜的新技术新亮点,接下来赶快回顾一下吧!
推进知识和计算:Translation、Maps
大会一开始,我们便看到了 Google CEO Sundar Pichai 带来的一段关于“Google I/O 的最新进展——推进知识和计算”的分享,以及这些新技术进展是如何帮助更多人无障碍沟通、让所有人都过得更好的。
Google Translation:众所周知,一直以来翻译都是是语言的一个技术难题,因为用来训练翻译模型的文本经常是双语文本。Google 翻译新增了 24 种语言,可通过机器学习,能让翻译模型在从来没有见过某种新语的直译版本的情况下直接学习翻译新语言。
Google Maps:基于 3D 制图和机器学习技术,使用计算机视觉和神经网络技术实现对高质量图像和清晰建筑类型进行绘制,让 Google 从 2020 年 7 月以来 Google Maps 上的地区性建筑物数量增加了一倍,在全球范围内 Google Maps 上超过 20%。
YouTube 视频可以自动生成章节和转录:应用 DeepMind 的多模式技术,可同时让文本、音频和视频以更高的准确性和速度自动生成章节;通过使用语音识别模型来转录视频(所有安卓和 iOS 用户都可使用视频转录)。基于该技术,Google 下一步目标是将自动生成章节的视频数量增加 10 倍,从当前的 800 万个增加至明年的 8000 万个。
YouTube 视频自动翻译字幕:此次 Google 将把 YouTube 视频的自动翻译字幕功能带到手机上。也就是说,用户现在就可以自动翻译 16 种语言的视频字幕,创作者可以扩大全球观众。
Google Workspace:Google 文档通过机器学习模型之一进行文本摘要,Google 文档将自动解析单词并提取要点,这也标志着自然语言处理的一大飞跃。目前,Google 正在为 Workspace 中的其他产品发布摘要,并将在在接下来的几个月里出现在 Google Chat 上,提供一个有用的聊天对话摘要,用户可直接进入群聊或回顾关键的亮点。
Google Meet 上的视觉改进:去年 Google 在 I/O 上引入了“Starline 计划”后,便一直在测试反馈不断改进,以不断提高“虚拟空间”里的音频和视频质量。而受 Starline 启发的机器学习支持图像处理,可在 Google Meet 中自动提高图像质量。
计算的下一个前沿:增强现实/AR
本次大会上,Google 还透露了关于 AR 技术的进展及计划 —— 增强现实/AR,未来新的计算前沿,有可能进一步扩展所有。“Google 的设计方式是为现实世界而设计的,不会让你离开现实世界。AR 为我们提供了实现这一点的新方法。”
目前,Google 已经在该领域投入了大量资金,且一直在将 AR 技术应用到许多谷歌产品中,如 Google 镜头、搜索、场景探索以及地图中的实时和沉浸式视图等。
尽管未来还有很长的路要走,但 Google 依旧乐观的相信“ AR 技术能够打破语言障碍”,理解和被理解,这也是 Google 今天对知识和计算的关注的意义。
更广泛的愿景:Multisearch、Monk 肤色量表
在 Google 高级副总裁 Prabhakar Raghavan 带来的关于 Google Search 改进的分享里,为我们带来了 Google 今年关于“Search reimagined. Any way and anywhere”的新愿景——如何帮助人们以更直观的方式在搜索中找到有用的信息。
Multisearch“场景识别”:通过该功能,可以让我们日常生活中遇到所有无法描述的东西时,都能直接以拍照和提问的形式在 Google 应用中进行搜索。
此次 Google 还带来了“Multisearch Near Me”“场景探索”等新功能,更方便为我们日常生活场景中提供“想你所想”的搜索需求。
Monk Skin Tones:此次大会上,Google 还带来了“Monk 肤色量表”,这是一种 Google AI 提供的一种新的免费和开源开发工具,是 Google 与哈佛大学 Ellis Monk 博士共同合作的旨在为肤色较深的人拍摄准确照片的工具,为建立更具包容性的AI 体验。Google 现已正式开放了 Monk Skin Tones 源代码,意在与业界共同合作以不断完善改进相关领域技术。
Google Assistant 大改进:Look and Talk
目前,全球已经有 7 亿用户使用 Google Assistant,今天 Google 带来了 2 个新的技术——Look and Talk,可实施评估用户“心思”,让你不用每次都说两次“嘿 Google!”了,让大家能实现与设备互动的更自然、更类似对话的方式。
LaMDA 2 模型:这是 Google 迄今为止最先进的即时对话 AI,生成的语言模型用于对话应用程序,可以就任何话题进行对话,以此来实现“对话和自然语言处理是让每个人都能更容易地使用计算机的强大方式”的愿景。目前,Google 已向数千名 Google 用户开放了 LaMDA,在不断改进下,LaMDA 大大提高了质量,减少了不准确或冒犯性的反应。
AI Test Kitchen:该功能可以让更多的人了解人工智能的功能,通过“Imagine It”“TalkAbout It”“List It”三部步,来轻松帮助创建列表。此外,还可通过 AI Test Kitchen 来用 LaMDA 做你关心的事情。
为了探索自然语言处理和人工智能的其他方面,Google 还宣布了一个新模型—— Pathways 语言模型,简称 PaLM。这是 Google 迄今为止最大的模型,训练了 5400 亿个参数。PaLM 在许多自然语言处理任务上表现出突破性的性能,例如从文本生成代码、回答数学单词问题,甚至能解释笑话。
8 个 TPU v4 吊舱加持:全球最大、公开的机器学习中心
随着 Google 在基础设施方面不断创新,近年来 Google 在诸多领域取得了不少进展。今天,Google 还宣布计划在美国各地的数据中心和办公室投资 95 亿美元,并宣布于美国俄克拉荷马州为 Google Cloud客户推出有着 8 个 TPU v4 吊舱的世界上最大、公开可用的机器学习中心,以推动从医学到物流、可持续发展等多个领域的创新。
值得强调的是,这个机器学习中心已经以 90% 的无碳能源运行,且在即将到来的 2030 年,成为全球第一家以全天候无碳能源运营所有数据中心和校园的大公司。
Android 协同下的多设备世界
此次 I/O 大会上,Google 还正式更新了旗下智能手机、手表和平板电脑设备软硬件,除 Android 13 操作系统之外,还包括 Pixel 6a、Pixel Buds Pro、Google Pixel Watch、Pixel 7 和 Pixel 平板电脑,以帮助用户的所有设备更好地协同工作。
Android 13 操作系统大升级
Android 13 Beta 2 :备受期待的 Android 13 已测试了一段时间,尽管目前正式版暂未公布,但在本次大会上,Google 发布了 Android 13 Beta 2 版本,以打造一个“Android 的多设备世界”的新远景。
Android 13 改进:扩展了 Material You 设计风格,改进了 Google Messages 的 RCS (融合通信)支持方面的隐私与安全问题,通过端到端加密对群聊进行测试。此外,Android 13 还对“应用程序默认可以使用的个人数据和手机功能的限制”以及“照片选取器”做了更新。
Google 硬件新品惊喜登场
Google Pixel Buds Pro 耳机:这是首款结合了主动噪声消除技术和谷歌技术的耳机,可实现更好的隔离度和透明度(降噪)。在发布后将会有小更新(加入空间音频),可通过 Android 的 Find My 设备对其进行追踪。该耳机售价199 美元,将于 7 月 21 日开始预购。
Google Pixel 6A、Pixel 7、Pixel 7 Pro:本次大会上,Google 发布了售价 449 美元的 Google Pixel 6 入门级手机,该机将于 7 月 21 日开始预购。此外,Google 还透露了 Pixel 7 系列,新机有一个可回收的铝制摄像头阵列和一个玻璃背板设计,还有一个基于人工智能优化的国产移动 Tensor 处理器的更新版本,新机将于今年秋季正式搭载 Android 13。
Pixel Watch、Pixel 平板:Google 新发布了 Pixel Watch 手表、Pixel 平板设备,新设备搭载改进的 Wear 操作系统界面,且配备了曲面玻璃屏幕。新设备将支持 Google Wallet,并支持与 Fitbit 进行广泛兼容,预计将在秋季上市。而这款平板电脑是对 Pixel 手机的补充,预计将于 2023 年推出。
其他技术更新亮点
Flutter 3.0:今天 Google 正式推出了 Flutter 3.0,完成了从以移动为中心到多平台框架的路线图,提供了对 macOS 和 Linux 桌面应用的支持,以及对 Firebase 集成的改进,新的生产力和性能特性,并支持 Apple Silicon。此外,Flutter 3.0 还进一步改进了不透明动画相关的性能,支持 iPhone 13 Pro 和 iPad Pro 等 iOS 上的 ProMotion 刷新率,还支持可折叠的移动设备。
Google Wallet:本次大会上 Google 还推出了 Google Wallet,可以直接作为驾照、银行卡、登机牌、门票使用,还支持 WearOS 用户使用。
作为一款与 Apple Wallet 和 Samsung Pay 等公司相互抗衡的产品,相信Google Wallet 会有不一样的惊喜体验。
综述
过去的一段时间里,先进的科技不仅帮助人类度过了一个个新挑战,也为全球性技术难题提供了助力。记得去年 Google I/O 2021大会上,Google 就重点讨论了计算机科学中一些最具技术挑战性领域的新突破如何让 Google 产品在关键时刻变得更有帮助。今年的 Google I/O 2022 上,Google 再携新技术抢先在微软 Bulid 大会、苹果 WWDC 之前重磅“首发”,可谓有备而来,且来势汹汹。
本次大会上,Google 携手一系列软硬件以及 AI 等大升级的新技术亮相活动,可谓是给接下来全球开发者的下一步计划带来了令人兴奋的动力。这些新技术所带来的创新,也恰好印证了本次 Google I/O 大会上所强调的“推进知识与计算”以及广泛愿景——“让更多人无障碍沟通,让更多人有公平的竞技场,科技让所有人都过得更好,持续努力创建未来”。
点击链接,查看 Google I/O 2022 精彩回顾~