上周末,当我掰着指头在算还有几天才放假的时侯,微软秉持着一贯的做法,深夜开了发布会。
这次发布会的核心嘉宾你肯定不陌生,谁让微软总是钟情于「Copilot」这个名字,仿佛给用户搞个正儿八经的副驾是其最终的使命。
过去半年来的很多场发布会,你问微软磨磨唧唧更新了啥,都可以用「更新了 Copilot」去概括。
比如把 GPT-4 应用在了浏览器的 Edge Bing 上的功能叫 Copilot,再比如把 GPT-4 添加进了 Office 的诸多办公软件中的功能也叫 Copilot。
而这次发布会,终于轮到操作系统了,并把 Copilot 做了整合——
从这周二开始,最新版的 Win11 将搭载「Microsoft Copilot」,迎来 GPT-4 的加持。
在展示微软整啥活前,不妨先说两个你可能会关心的大前提——
1、Microsoft Copilot 有地区限制:上周和大家聊 AI 绘画网站被封,其实里面就提到了 AI 模型到应用需要备案的问题,如果 GPT-4加持的Copilot 会有地区限制,也不奇怪。
2、Microsoft Copilot 并非全免费:这里的免费当然不是指你需要花钱订阅,才能接受最新的 Win11 推送,而是说肯定会有次数额度限制,亦或正版 Microsoft 365 的要求。
至于它到底值不值咱翻山越岭尝试,值不值花钱体验,先看这些功能 cue 不 cue 你再说。
Microsoft Copilot 的本体,是一款软件应用,更新 Win11 后,任务栏上会出现 Copilot 的图标。
点击也好,「Win+C」也罢,都能唤出这个深植在系统上的 AI 小助手。
与之聊天是基操,语音输入少不了,让它放个曲,Copilot 就能帮你找到可执行的解决方案,点了就能唤出播放器。
如果说,听曲找方案,点击就跳转不能体现 Copilot 与 Windows 的亲密关系,那打开夜间模式,直接切换主题呢?
让它整理窗口,直接把多窗口平铺排列呢?
Edge Bing 的 Copilot 给了 AI 联网的权限;Office 的 Copilot 给了 AI 读取文件的权限;这次发布会上的 Copilot 就给了 AI 对于系统的操作权限。
以至于当 Copilot 和其他应用联动起来,又可以做到,选定窗口总结文字:
网页任意位置生成文字:
甚至利用截图工具,多模态输入,一键去除背景,并可直接上传到其他应用:
以上是 Copilot 基于过去存在的系统操作实现的功能,发布会上还预告了不少 Windows 的新变化——
没人用的「画图」功能即将迎来图层,还一口气上新了 PS 最先推出的生成式填充。
截图有了像微信图片那般 OCR 提取文字的功能;照片有了一键 AI 模糊背景;存储在 OneDrive 网盘上的图片有了像度盘、阿里云盘那些智能搜索功能等等。
这一次 Win11 的更新,可以说是迄今为止规模最大的更新之一,零零总总超过 150 项的新功能、新变化。
微软算是在这个秋天打出了自己 Copilot 全家桶里的最后一张牌,同时必应 Copilot、Office Copilot 也在随着 DALL·E 3 模型的发布,随着插件的出现有所升级。
发布会上有相当冗长的,关于使用场景介绍,按发布会上的说法,总结起来一句话:用户将在下半年,迎来「Copilot 时代」。
什么是 Copilot 时代?
发布会上有这么一句话,大意是 80 年代的突破是个人电脑,90 年代的主角是互联网,千禧年代的核心是移动设备,2010 年代的产物是云端技术,现在又一个十年,2020 年代轮到 AI 当道了。
虽然微软发布会上有意把这个时代用 Copilot 命名,王婆卖瓜自卖自夸,但你想想,好像是那么回事。
一直以来,有 3 个摆在我们这种普通用户面前的隔阂:设备、操作系统、应用程序。
人作为三者间的协调者,总是会有妥协,Copilot,或者说集成度高的 AI 应用的出现,正好作为桥梁,而这些 AI 助手使用起来越无缝,越证明其价值。
如果你看了微软的发布会,相信你也能感觉到,发布会上少了半年前我要 All in AI 的霸气,多了证明自己的急切。
说到这,不知道大家发现有意思的没,半年前,当 ChatGPT 掀起序幕的一角,引起大家对 AI讨论时,基础模型是解决问题的全部。
走红了 ChatGPT,跑通了 Midjourney,可时至今日,当李彦宏都在说「卷模型,不如卷应用」的时侯,基础模型成了解决问题的一部分。
如何让产品证明价值,如何带给用户体验,成了 AI 应用落地的守门员。
只是,当我在微软发布会上看到用语音操控系统的操作,想到前些天 iOS17 更新后那些从“母公司”挤出来的技术,好像几年前的那个雨夜,有一个声嘶力竭,喊着理解万岁的胖子,他的身影越发清晰了......