态势感知——推荐系统的高级形态

——读《追问人工智能》有感

1.推荐系统历史与现状

随着信息技术与互联网技术飞速进步,电子商务、社交媒体、影音娱乐等领域蓬勃发展。特别是随着移动互联网的兴起与社交网络的繁荣,互联网用户正在从以前的信息接收者变为信息生产者与参与者。据中国互联网络信息中心(CNNIC)发布的《第45次中国互联网络发展状况统计报告》,截至2020年3月,中国网民规模已达9.04亿,网络购物用户规模达7.01亿,网络视频(含短视频)、网络音乐和网络游戏的用户规模分别为8.50亿、6.35亿和 5.32亿,使用率分别为94.1%、70.3%和58.9%。互联网产生的数据是海量的,根据统计,YouTube全球用户超过10亿,每分钟上传超过500小时新内容;微信公众号每天发布超过70万篇新文章;QQ音乐有1500万首歌,全部听完需要142年。面对如此大规模的数据信息,使得我们不再受制于信息匮乏给我们日常生活带来的便,但随之而来的是从这些巨量信息中查找到自己所需要的有用信息变得越来越困难,这就是“信息过载”。

面对“信息过载”问题,目前主要有三类解决方案:分类目录,搜索引擎和推荐系统。分类目录即通过在互联网中对网络资源进行分类整理,从而降低查找难度,类似的比较著名的分类目录网站如Hao123等。搜索引擎通过关键词过滤掉大量的无关信息,直接为用户呈现与关键词相关的结果信息。推荐系统则是根据用户的兴趣特点和购买行为,向用户直接推荐用户感兴趣的信息和商品。

推荐系统的研究起源被认为是20世纪90年代的Tapestry系统,其为用户提供文档过滤、检索服务,该系统的一个重要贡献就是首次提出了使用协同过滤思想来进行推荐。随后在1994年,明尼苏达大学GroupLens研究组提出完全自动的GroupLens推荐系统,该系统向用户推荐新闻及电影。在这之后,推荐系统成为在人机交互、机器学习和信息检索领域的热门研究课题,大量推荐应用系统被提出。

随着推荐系统在购物网站中的潜在作用逐步被认识到,其在商业领域的应用愈发广泛。Amazon根据用户的购物记录、浏览记录和正在查看的物品记录,向用户推荐一些其可能喜欢的物品,其所提供的个性化推荐服务使其销售额提升了30%;Netfilx宣称其60%左右的会员根据推荐名单定制影片订阅顺序。推荐系统目前正以一种更快的速度在影音娱乐、内容信息服务、电子商务、社交网络、中介服务等领域中被部署应用,并在其中扮演了重要的角色。推荐系统所取得的巨大成功,也促进了更多的学者对该领域的关注,2007年,ACM成立并召开了推荐系统会议(RecSys),其已经成为目前最新的推荐技术和应用的顶级年度盛会,此外,像数据库、信息系统和自适应系统领域等更传统的大会也经常会包括以推荐系统为主题的会议,如ACM SIGIR、ACM SIGMOD、WWW、NIPS、KDD等重要国际会议每年都有大量与推荐系统相关的研究成果发表。

 

2.推荐系统中的“休谟之问”

休谟在他的哲学体系里边,提出了很重要的“休谟之问”:“是”推不出“应该”,这句话的意思是从事实里边,推不出价值观。中国古代著名的一句话“天行健,君子必自强不息”是不成立的。天行健是一个事实,君子必自强不息,是一种价值观,二者不能划等号,这里面涉及到一个很重要的词“change”,“变”,人会不断的“change”,而机器则不能,只会按部就班、因循守旧、刻舟求剑。”

《追问人工智能》一书中认为智能的起点不仅包括“being”,还存在着“should”。人类智能比机器智能的优越性体现在人有“want”、“can”、“change”,即个体欲望、行为约束与意识变化。机器只能在已定规则下按部就班。如此这般,机器智能永远是“死”的而不是“活”的。其实推荐系统中也有类似问题:推荐系统如何真正实现个性化?推荐系统如何破除信息茧房?推荐系统如何自我迭代?

目前的推荐系统通过在多源异构的事实性数据中发掘出隐性的兴趣、爱好、情感等价值类信息。现在常规的做法从传统的协同过滤算法、矩阵分解算法到目前基于长短期记忆神经网络、注意力机制、图神经网络等深度学习方法,通过挖掘用户和对象的隐性特征,基于特征相似关联的原理,将不同的对象分配给不同的目标用户。目前看来,这些方法都以准确率为首要追求目标,推荐的对象很多是与之前自己喜欢的对象类似的,而非挖掘到对象的潜藏的爱好,即惊喜度并不高。现在在推荐系统中开始加入知识图谱,即为推荐系统引入了逻辑性,如此使推荐系统更具有实用性,但是推荐系统对人的非逻辑即思维的跳跃性仍没有较好的解决方式。所谓个性化推荐应该是系统了解个体的差异性,不只是推荐与之前喜好相关的事物,而是能够帮助用户发掘新的爱好。

在当前时代中,人们已经处于海量信息中,每个人都有海量的选择,但个体往往只会选择自己感兴趣的信息。推荐算法通过分析用户行为数据,不断向用户推荐与用户兴趣相似的对象,用户只能获得特定领域的信息,便与其他领域的信息之间形成一道无形的墙,就像蚕宝宝一样被束缚在“茧房”之中。长此以往,在互联网空间中,用户因为血缘、地缘、学缘、业缘等关系产生分化和类聚,乃至形成了网络群体的极化,进而形成“信息茧房”。每个人活在由推荐算法造就的“信息茧房”中,只能看到自己的观点被认同被肯定,而缺少相反或更多元化的呈现,算法推荐开始代替个人的自主选择,用户的认知不断固化,现在的网络环境如微博、贴吧已经展现出这种趋势,大家观念对立,并且群体的观点容易极化,社会的包容性与多元性被大大打击。目前解决信息茧房的手段主要在信源管理,后台尽量引导用户拓宽信息接收渠道,并对偏激的立场观点和不良信息进行过滤和筛选。但在算法层如何引导用户破除信息茧房仍未有较好的措施,是未来推荐系统需要重点考虑的问题。

推荐系统的自我迭代是一个比较前沿的问题,自我迭代听起来仿佛通用人工智能一样,能够自我进化,自我完善,其实目前的推荐系统主要是缺乏对自身的反馈调节机制。目前的推荐系统都是基于已定规则下构建的不变系统,一旦规则确定,推荐系统便已定型,之后可以想要改变,只能是人为的再去调整,而其自身不会对自身的好坏进行判别。如何实现推荐系统的自我迭代会是未来思考并要解决的问题。

 

3.推荐系统与态势感知

“20世纪八十年代,美国空军首席科学家Mica R. Endsley提出了态势感知模型,该模型中态势感知被分成三级,每一阶段都是必要但不充分地先于下一阶段,该模型沿着一个信息处理链,逐步地从环境感知到环境理解最后到预测规划,实现了从低级到高级的态势感知过程,具体为:第一级是对环境中各成分的感知,即信息的输入;第二级是对目前的情境的综合理解,即信息的处理;第三级是对随后情境的预测和规划,即信息的输出。”

态势感知目前在军事领域与网络安全领域得到广泛利用,它是一种基于环境、人、机器之间的关系,能够通过理解状态从而动态、整体地洞悉趋势的能力。整体来说,推荐系统是态势感知的简单应用,而态势感知则是推荐系统的高级形态。目前态势感知普遍依靠人类的行为数据与状态信息,而没有深入考虑人与机器、人与环境、机器与环境的关系。依据《追问人工智能》一书,推荐系统可以考虑从以下三个方便去提升:动机性、常识、决策。

首先是动机性。动机,在心理学上一般被认为涉及行为的发端、方向、强度和持续性。动机也是有层次的,不同层级可以互相转换。马斯洛(Abraham Maslow)于1943年在《人类激励理论》一文中将社会需求层次与生理需求、安全需求、尊重需求和自我实现需求并列为人类五大需求。推荐系统目前考虑最多的是准确率,应该从人类的五大需求的方面综合考虑推荐系统的发展方向。

然后是常识。常识的定义为在一定的文化背景下,人们拥有的相同的经验知识。比较常见的有空间、时间、文化、物理常识。常识对于我们日常生活十分重要,尤其是在我们做出决定与判断的时候尤为如此。很多常识是潜移默化形成的,是文化与背景学习的产物。融入常识的推荐系统将会更加符合用户的行为习惯。是否可以构建常识图谱,使之与推荐系统进行结合。

最后是决策。无论是人类的日常生活,还是人工智能,最为关键的一步就是决策。如何让机器更加智能的进行决策,这是一个关乎到未来人工智能走向的问题。人类的决策机制主要分为三大部分:理性决策、描述性决策与自然决策。理性决策即认为人在决策时遵循着理性价值最大化的原则,比较具有代表性的有冯•诺伊曼提出的最大期望效用理论,伦纳德•萨维奇(LeonardSavage)提出的主观期望效用理论等。而描述性决策认为人在进行决策时不完全遵循理性准则。自然决策专门研究人们如何在自然环境或仿真环境下实际进行决策。推荐系统目前依靠的主要是理性决策,使推荐系统学习人类的描述性决策与自然决策会使推荐系统更加自然,更加理解人类的意图,真正做到个性化推荐。

真正的智能是没有智能

你可能感兴趣的:(网络,大数据,python,机器学习,人工智能)