搜索系统一些思考——答案分层次

搜索系统是互联网应用的鼻祖,搜索、推荐、ctr、cvr都属于排序类算法范畴。解决的问题就是在有比较多答案都和用户要问的问题相关时候该怎么对这些信息排序,排序就一定会面临比较的基准是什么。要定义基准那就一定会问目标是什么,不同的目标下基准的标准肯定是不一样的。现在大部分的搜索和推荐的目的是商业目标——利益最大化,A.通过推荐给你更多付过费的商家信息,让付费的商家信息更多此的曝光从概率上讲曝光商家越多卖出去的商品就会更多;B.能越准确的提供给用户知识性问题,用户基数就会越多。

然而一个搜索系统对信息的排序应该是多基准,分层次的来衡量系统的。多目标是指除了商业目标、还应考虑到用户体验、用户信息收获、用户知识面是否有拓广、用户通过搜索系统对问题认识是否更深刻。先来聊聊现在推荐系统是如何实现,有哪些问题;在讲讲实际中高人是如何回答问题,有哪些是可以借鉴的。最后提出一个逻辑上可行的搜索系统改进方案。

现代搜索系统背后原理:

1、对用户搜索问题做解析、提取出问题里面的关键词、抽取出词之间图谱关系

2、问题的等价替换,转成问题库中已有的提问方式

3、对问题分析做用户的意图分析,通过用户历史提问画像、统计的问题归域对用户模糊问题转化成系统可以理解问题

4、通过等价问题、关键词做答案召回

5、答案排序

现代推荐系统问题:

1、召回来答案大部分是知识性回答

2、对于高频问题容易得到答案,低频问题效果不好

3、基于数据驱动方式推荐的答案,答案趋同性强

4、回答不成体系只是在知识点上回答

当你问一个世外高人问题,他会如何回答:

比如你问一个“为什么人有如此多烦恼,我要怎么跳脱出烦恼?”

高人回答:

1、你这么问,首先定位出你还在凡人境界(问题域确定)

2、问烦恼,到底是哪个方面烦恼(人情事故、爱情不顺、事业问题)

3、这人面相,身体状态(用户画像推断可能问题)

4、历史上我回答过哪些这类问题,他们反馈比较好的回答是什么

5、烦恼属于哪个范畴、和哪些概念相关(

高人回答问题思路:

A.通过问这个问题确定用户的境界、段位

B.通过问题归域确定问题归属定位可以从哪些方面回答

C.通过对用户的察言观色,获取更多用户信息,缩小回答问题搜索范围

D.解决问题因为我不是他,所以我掌握信息肯定不如他多,可以给他启发性回答发挥他自己主观思考辨析问题能力

E.通过历史经验反馈,给些建议性回答

F.给些可落实的知识性操作性回答

结合以上的要素,高人给出的回答:

1、人非草木孰能无情,人有贪嗔痴三欲,过度在意自己得失烦恼如丝缠身南街,施主放下就好(定位凡人域,启发往圣贤走)

2、事业总是有起有落这是自然规律,爱情总是分分合合有情人终成眷属,亲近远疏也是人之常情、看那草木长密了来年就疏来疏了来年就密了,这些都是天数自然之理,看来就好人总是要顺怎天运行才能省力(烦恼多方面)

3、施主印堂发黑气虚面焦黄,最近是事业不太顺否(用户画像、发问获取更多用户信息)

4、前些时日王五&&&&》〉》〉(经验总结给出答复)

5、烦恼是唯识中第六意识到第七意识,“渊深波浪境为先...."(问题归域,启发思考)

6、施主如若烦恼,可以放下手头工作找块清凉之地休息数日、今日天气烦闷饮食清淡些......如此这般 这般如此(知识性回答)

给我们现代搜索系统的启发:

1、答案排序应该是多元的:知识性回答、关联知识推荐、问题域上游定位、问题交叉领域推荐、哲学域启发

2、可以通过答案巧妙的设计和用户多轮交互,获取更多用户信息

3、通过对用户发问,确定出用户的水平境界,确定回答问题的专业程度(用户可听懂水平)

4、通过数据驱动,给出经验性反馈较好的保守回答

具体在技术层面实现:
1、答案召回应该是多元的

2、需要对关键词构建知识图谱(哲学分类域的图谱,比如地球可以属于地理、天文、神学)、确定问题的上届域

3、通过反问用户,获取更多信息

答案的多元化排序可以解决现在搜索系统,信息茧房效应

通过关联知识图谱方式可以让推荐的结果既有深度也有广度,可以扩展到关联交叉领域

关键词的哲学上下域图谱,可以较好的梳理出用户提问时候水平,知识是系统化的,可以提供一些上域问题让用户更好定位到自己问题在哪,更好去补强上域知识

通过和用户交互、以及大案排序交互设计可以得到更多用户的反馈信息,更明确知道用户的意图(加上这种有状态的问题反馈约束比单纯数据驱动强化学习更好的收敛,需要更少的用户试探成本)

通过这种多元答案列表设计可以一定程度解决现代搜索的难题:信息茧房、用户意图识别、用户心理学建模。可以给人有一种真正智慧的感觉,回答的问题很有弹性,有深度的哲学思考,也有马上可用的知识性回答。给人一种智者的感觉,让人各取所得、可深可浅。

 

你可能感兴趣的:(CTR)