7、8月份,中文互联网领域进入了年度财报月,其中最值得关注的阿里、腾讯、百度三大巨头在最新一季财报中不约而同的提到了对人工智能领域的布局和预期。在这样的背景下,人工智能已悄然迎来了新时代。但相较这些大开大阖的战略规划,那些已经落地实用且更加小而美、具有我国文化底蕴的产品功能其实更值得我们细细回味,最新上线的360搜索App 5.0版本中主打的国内首款“拍图写诗”人工智能应用就是一个典型的例子。
会创作古诗的360搜索,更智能的触景生“诗”
据了解,用户只需触碰360搜索App搜索框右侧拍照图标(如下图),即可使用“拍图写诗”功能,无论是在旅游,出行、约会等任意生活场景、每当邂逅美好情景时、想要表达此刻心情,只需拍摄一张照片,就能触发写诗功能,通过360搜索人工智能引擎可以智能理解和识别图片内容,自动感知图片风格与情景,最终为用户生成一首触景生情的七言古诗,留存美好记忆。
拍照作诗功能背后, 360搜索所做的并不是将图像理解和文本生成两种技术简单整合在一起。事实上,机器写诗这一功能需要在自然语言处理和计算机视觉都具有着深厚的技术储备,其工作原理简单描述如下:
在用户上传图片后,图片将进入到360搜索人工智能引擎,通过先进的深度学习图片理解技术将原始图片内容进行深度理解和解析,并将其映射到一个隐语义空间;在此基础上,结合隐语义以及注意力机制(Attention Mechanism),采用深度学习自然语言文本生成技术输出文本诗句,这是一种图像和文本之间跨模态统一深度学习建模的技术,具有较高的技术壁垒。
简单的说,机器写诗就是在机器深度学习海量诗歌相关数据之外,对当前场景中所见景色景物进行意象化处理,提取关键信息,最终结合诗歌语料完成创作。如果说微软小冰、谷歌AI这类在相应领域发展超过多年的产品实现机器写诗并不令人意外,那么切入AI领域不到两年时间的360搜索同样做出“拍图写诗”,而且具有更好的用户体验,无疑体现了360在人工智能领域迅捷的开拓推进,尤其是在产品功能落地方面对多项AI功能整合应用的独到之处,可以说,360正在低调中完成相应人工智能技术领域的弯道超车。
同样是写诗,为什么说360搜索存在更多突破?
事实上,正如上文所说,机器人写诗并不是什么新鲜事物,微软小冰在今年5月就推出首部现代诗集《阳光失了玻璃窗》,谷歌旗下AI同样也有现代诗产出。国内也有部分厂商基于用户输入主体文本关键字进行机器作诗。但相较于前者们,360搜索实现的“拍图写诗”功能所突破的技术壁垒相对更高。
这其中的决定性因素在于,360搜索产出的诗歌是古体诗(严格意义上讲是更偏向于唐代以后的近体诗)。现代体诗歌的形式非常自由,内涵也更加开放,不拘泥于修辞,只需要表达出对意境意向的理解和展示即可。相比之下,近体诗对于格律、结构甚至韵脚都有严格的限制和要求,这就意味着机器创作近体诗不能只有和现代诗一样的华丽辞藻,还要兼顾韵律、平仄、内涵,所能展现的文体形式相较现代诗也更局限一些。所以,“拍图写诗”产出的近体诗意味着360搜索的人工智能具有着更强的自然语言理解和计算机视觉技术。
我们举几个简单的例子,唐代诗人王维的诗歌一向被誉为是“诗中有画,画中有诗”,现如今智能机器人或许可以轻易的用一段话来描绘长河与落日的壮观景象,却写不出“大漠孤烟直,长河落日圆”这样令人拍案叫绝的诗句,同样是简简单单的十个字的组合,经由人类写出自己的感受,正是当前的机器智能所欠缺的。
再比如,一些写诗机器人可以写出:微明的灯影里/我知道她的可爱的土壤/是我的心灵成为俘虏了,这样自成一派的现代体诗歌,但是诸如 “飞流直下三千尺,疑是银河落九天”、“但使龙城飞将在,不教胡马度阴山”这类激昂壮丽同时注入了作者想象力的诗句,就不是当前绝大部分智能机器人所能企及的。
这其中的道理也并不难理解,大部分会写诗的机器人产出的都是现代诗、打油诗,其实写诗作为一种技艺,无非就是技术+艺术。所谓技术,就是对文字的使用和处理,基于远超人类大脑的统计学习算法和数据信息储备,机器可以在文字堆砌使用方面“炫技”,比如严格执行音节声调和韵律的要求等,甚至可以做的比人类更好。但在古体诗和近体诗真正表达作者情感的艺术体现上,现阶段由于技术的局限性,智能机器人很难在包括思想感情、联想以及比拟夸张在内的诗歌表现力方面传递出古体或近体诗的艺术性。简单地说,就是机器无法像人类一样拥有感情和情绪。
相比之下,360搜索的“拍图写诗”功能通过生成古诗展示了更加出彩的艺术造诣,这可以视为是人工智能在学习乃至表达类人情绪方面的更进一步,让机器人能够表达出喜怒哀乐甚至拥有喜怒哀乐,无疑是在整合数据与处理文字基础上的进步,所需要突破的技术难度更大也在情理之中。
必须指出的是,尽管360搜索写出的更具艺术造诣的古诗或许只是人工智能在理解人类感情方面的更近一步,但这已经给包括语音助理、智能机器人等更多涉及人机交互的人工智能硬件产品带来了新的驱动力和想象空间。
不能为人工智能而做人工智能,初心即落点
如今看来,正如周鸿祎在多次谈及人工智能的讲话中所说的那样,不能为了人工智能而去做人工智能,不能落地应用的纯粹AI技术与空谈无异,更没有商业模式。这并不难理解,早在微软小冰能够完成对话、写诗的时候,就有人提出了这样的疑问:我们究竟需要的是一个有趣的智能机器人,还是一个有用的智能机器人?
换言之,写诗本来就是人类表达自己审美、感情、思辨的一种方式,机器为什么要写诗?机器写诗的意义何在?
或许正是基于这样的思考,360“拍图写诗”并没有成为一个猎奇方向的噱头产品,而是架构在了360搜索引擎下的一个满足用户搜索需求的高附加值服务。在我看来,这一功能服务通过深刻理解人们创作诗歌具体场景及背后隐藏的心理诉求,一方面通过文学创作超出预期的满足了用户自我娱乐的需求,另一方面增强了搜索引擎的社交性,美图+古诗的结合正可以成为用户之间互相赠送进而达成良好社交关系的一个重要媒介。
事实上,纵观360在人工智能领域的产出,如应用人脸识别技术和人机交互技术的360儿童手表;结合了AI高级辅助驾驶和语音助理功能的360行车记录仪;以及本次包含了“拍图写诗”、“扫码识药”等功能的360搜索App5.0版本,都印证了360在人工智能领域同步推进技术开发和垂直落地的布局思路,称得上是两手抓两手都要硬。
而这种始终将技术与产品紧密结合,让每一次技术推进都能切实的服务到用户的人工智能,相较于那些鼓吹概念的人工智能泡沫、大而无当的纸上谈兵布局,或许才是如今的消费者群体更需要的,这也更加值得人工智能行业中其他企业的思考和借鉴。