前台产品内容结构化的思考

这篇是草稿,文章随时更新。以下几个角度还未写:

1)原创保护

2)问题重复度(标准化不够)

3)如何设计和筛选有结构化,有价值的,可反复利用的数据

微信公众号:weitalks



为什么天涯,猫扑渐渐没落了,网易和搜狐BBS关了?而知乎越来越好了?

人人与人之间的交流、活动都是从问题或者话题开始的,虽然知乎很好的利用了这点,但是其信息的组织和流动、seo等非常值得我们学习。ps,非常有意思的是,在我写这篇文章没多久之前,知乎已经限制用户在wap版只能看部分答案,如果需要看全部信息的话只能下载APP了。

本篇从知乎每个产品分析信息的组织流动,内容和用户的质量管理,SEO优化,参与者的利益和商业变现。


回答:有哪些类型的信息?信息如何组织?为什么这么组织?信息如何展示和流动的?( 优劣信息又是如何被展示和处理?展示渠道在哪里?展示排序算法是什么?SEO如何优化?)


有哪些类型的信息?信息如何组织?

信息包括6种:

1)以问题为元数据,问题提出者-问题-回答者-答案构成一个基本问题。
一个问题隶属于(或者叫做绑定)一个或多个话题,一个话题可以有父话题或者子话题。
这样的效果是通过话题能方便查找这个话题下有哪些问题大家最关注。

而话题与话题之间的关系是通过父子关系构成一个有根无循环的有向图,「根话题」即为所有话题的最上层的父话题。


这个结构方便搜索引擎的抓取,能被搜索引擎收录和排名和靠前。


整个话题结构图如下:

前台产品内容结构化的思考_第1张图片

根话题和一级子话题不可编辑,使其标准化,维护成本低。

问题的提问也开始标准化,包括问题的标题和描述。

另外,很重要的一点是,知乎的话题包括关键字和标签的功能

具体分析看后面。





2)文章

每篇文章绑定至多3个话题,话题是官方命名的,网友不可自由编辑,只可选择。文章聚集在专栏里。具体分析看后面。


3)知乎Live

知乎 Live 是实时互动问答,为1个小时,不是免费,一般是不能简单通过一个问题简单文字问答来解决,需要live。演讲者是用户在领域内回答的权重高的用户,对粉丝来讲熟悉。

某一种程度上,自己认为,虽然知识分享是件好事,但肚子里有真正干货的人都是亲身实践过的,这些人大部分都算是“成功人士”了,很少会分享给大众。原因很简单,一个是商业利益冲突,一个是商业协议,一个是时间,一个是精力,一个是人性。

另外,语音和视频类的知识付费APP,对于图书行业那些真正分享干货的人是很不利的

图书行业如果能对真正贡献知识的作者提供物质奖励或者精神上的奖励(比如类似于奥斯卡奖之类的),那图书行业也会振兴起来的。一本书一般是一个主题下系统化的整体知识点梳理,很适合深度阅读



4)知乎圆桌

打破地域的限制,以「知乎圆桌」这一形式,让传统的嘉宾在互联网上讨论。每场圆桌,邀请 1 位主持人和 4 位以上有多年行业经验的嘉宾共同发表见解。而观众和主持人可以向嘉宾讨论的主题提问,邀请参与活动的各位嘉宾回答。也欢迎对嘉宾的回答进行评论,或和嘉宾一同回答问题。具体分析看后面。



5)知乎书店

「一小时」是知乎推出的一系列深度短时阅读付费电子书。每本书 2.5 至 3.5 万字。具体分析看后面。


6)知乎日报和读读日报(值乎就不提了)

这里不研究日报的内容,人工、机器算法。日报的目的是为了让优质内容和优质用户得到更好的曝光,引流和粘性。


优劣信息如何被展示和处理?展示渠道在哪里?展示排序算法是什么?SEO如何优化?

1)问题:短文字互动

问题的流动有几个地方:邀请,知乎内部搜索,首页,话题,发现,问题详情的相关问题,个人主页,回答收藏夹,搜索引擎,问题分享或者答案分享。可以看出知乎的数据利用和内容闭环做的很好。

A、邀请

一个问题可以邀请人(列表里会有推荐)来回答,问题可以得到曝光。


B、知乎内部搜索

因为问题绑定话题即关键字,所以内部搜索可以快速搜到相关的问题,话题和用户。问题,话题和用户都得到了曝光。


C、首页

知乎首页动态展示哪些内容:来自用户关注话题下的且被多人关注或是有一定回答数的问题内容会进入首页动态,用户可以设置屏蔽的话题过滤掉自己不关心的。

展示排序:动态中的内容会根据用户间的关系、用户对话题的兴趣和内容的质量进行调整,不再严格依据时间排序,使得高质量的问题答案和用户得到很好的曝光。同时来自关注用户和关注话题下的内容会在更显著的位置显示,更容易发现自己感兴趣的问题和回答。


D、话题

知乎话题展示所有已关注的所有话题动态,每个话题动态是话题下的问题动态列表。也可以选择话题广场看更多话题。

一些子话题会显示该话题下的目录结构和问题列表这对于SEO非常有好处。如下图

前台产品内容结构化的思考_第2张图片

排序:热门或者时间。热门不是按关注人数和回答数来排序的,好像离当前时间越近排名就高些。


E、发现

发现可以展示编辑推荐的问题,今日热门/本月热门的问题,热门话题,热门收藏的问题。
排序:发现的热门算法和话题的热门算法应该类似。


F、问题详情的相关问题

类似问题会在问题详情页的相关问题展示,展示原则是同属于一个话题。这会引导搜索引擎的爬取,使得更多问题被搜索引擎收录,SEO优化很好


G、个人主页

个人的每一次对问题的操作,比如回答,关注,赞同,反对,收藏,都会在个人信息里展示。问题得到了很好的曝光。这也会引导搜索引擎的爬取,使得更多问题被搜索引擎收录,SEO优化很好。

排序:按时间


H、收藏夹

每个收藏的是答案以及对应的问题,收藏夹包括收藏列表。搜索引擎收录这些收藏夹

排序:不清楚。


I、搜索引擎

上面每个展示渠道都说到了SEO优化,这里再加上点搜索引擎爬取的流程和知乎SEO再优化。
a.为了能被搜索引擎爬取,知乎不需要登陆即可显示内容,且信息尽可能的使用文字,每个问题的标题自带关键词,问题绑定一个或多个话题,话题相当于关键字。

b.问题详情页右侧的相关问题,推荐的很靠谱,也是与本主题非常相关的问题,使得关键词密度进一步提升,便于搜索引擎分析到页面主题内容和继续爬取。

C.每一个回答者都可以定义自己在这个问题领域的专属签名档,内容又进一步加深了页面相关度,也让回答者得到了良好的曝光

d.投票机制让高质量答案排名提升,让高质量内容出现在代码更靠前的位置,方便搜索引擎快速抓取

e.不断有新回答、关注人数、浏览次数的更新,造成页面内容持续不断更新,而百度搜索引擎喜欢抓取经常更新的网站。

f.通过话题的组织形式--有根无循环有向图,搜素引擎知道网站地图,引导搜索引擎爬取。

g.搜索引擎喜欢抓取没有重复原创的内容。


J、问题分享或答案分享

分享渠道有微博和微信,增加信息的流通和曝光率。也对搜索引擎的排名有好处


优质问题和劣质问题如何被处理?优质用户和劣质用户如何激励和被处理?

优质答案排序算法:跟赞同数,反对数,赞同人的权级和擅长领域,回答者的权级和擅长领域,反对人的权级和擅长领域有关。具体可看威尔逊算法

用户的权重:跟领域下答案的被赞同数、被反对数、没有帮助数有关。竟然被感谢数、被折叠数、被举报数、公共编辑数这几个指标没有考虑。另外,使用匿名回答或者投票时,不会计算用户的权重,被关闭的问题下回答也不参与权重计算。

赞同保证高质量答案和用户的曝光,反对、没有帮助、折叠和举报保证了低质量答案和用户的降级和隐藏。

答案的赞同、感谢、禁止转载和收藏是对用户回答的反馈、保护、认可和激励。一个用户被赞同和收藏的答案越多,关注数越多,个人主页的浏览量越多。这里的禁止转载是否真具有保护原创功能没有去考究。

另外,从知乎的历史来看,知乎是首先进行知识的基本沉淀再逐步扩展到最后开放的,也就是先邀请优质大v产生优质内容,再半开放邀请新人,最后完全开放。

根据网友2014年12月爬取数据的知乎分析报告得知:

赞同数在0的答案,               占比57.73%,人数63.85万。

赞同数在1~9的答案,            占比34.5%,人数39.97万。

赞同数在10~99的答案,        占比6.46%,人数10.88万。

赞同数在100-999的答案,      占比1.20%,人数2.77万。

赞同数在1000-9999的答案,   占比0.13%,人数4500。

赞同数在10000以上的答案,   占比0.002%,人数128,答案数157。


另外点赞行为的数据如下:

点赞为0的,       人数239.73万 (???这个数据好玩了)

点赞为1的,        人数63.1万

点赞为1-10的,   人数82.62万

点赞为10-100的,人数44.75

点赞为100-1000的,人数56.75

点赞为1000以上的,人数6292


以上可以看出知乎的活跃程度和僵尸粉。


2)文章:长文字互动

文章展示的地方有:知乎内部搜索,首页的专栏,文章绑定话题,个人主页feed流,专栏,搜索引擎,文章分享、赞赏和收藏。曝光渠道不够多。

文章的点赞和收藏等影响不了用户的权重排名,这缺少用户激励。知乎可能考虑到文章和问题之间有竞争关系,所以没有激励?且文章的保护措施是举报,这个措施效果还未考究过。这里seo和信息流动就不介绍了。


3)知乎Live:语音互动

live展示的地方有:知乎内部搜索,首页,问题详情页的相关live,live绑定话题,live微信公众号,live详情页的更多live,个人主页feed流,搜索引擎,live分享和收藏。可以看出知乎的数据利用和内容闭环做的很好。看来知乎对live挺重视的,曝光渠道这么多。

live高效展示形式有3种,一个是课程(计划目录+每一计划下的问题列表),一个是专题,一个是热门精选(一周或本月热门)。


live质量管理:参与人数,用户评价(好中差)这两个指标衡量。内容保护是听众用户不得以任何载体或形式使用讲者的内容。

这种商业模式虽然很暴力,但是不利于信息各渠道之间的传播(因为文字传播速度最快),不利于搜索引擎收录SEO优化咯,也不利于图书、好答案等有公益行为和有价值内容的产品发展。其他的就不仔细分析了。

根据2016年网友爬去的数据分析报告可知,平均每个话题12场,每个话题4660人平均每场live300-400人左右,平均gmv8800元,平均价格27元

赚钱最多用户是工程师,互联网,心理学,VC咨询创业,金融。

场次内容最多的是艺术,生活方式,科学。

最高总参与人数:职业发展,艺术,生活方式,金融,科学。

平均每场最高总参与人数:市场营销职业发展金融心理,电影。

最高单价:创业,互联网

最高GMV:创业,职业发展,金融。


可以看出当下有付费能力的网友最关注什么了。


4)知乎圆桌

圆桌首页可以看到和知乎合作的机构有哪些,专业领域的人是谁。

圆桌展示的地方有:首页,发现,圆桌没有绑定话题圆桌没有绑定微信公众号,个人主页feed流(问题形式列表和个人成就收录),搜索引擎,圆桌分享,圆桌输出(问题形式)。

输出可以问题形式进行二次利用,挺不错。

这里不细研究了


5)知乎书店

书桌展示的地方有:首页,发现,书没有绑定话题知乎书店没有绑定微信公众号,个人主页feed流(出版作品),书店分享。

作者,是在各个领域拥有独到见解的专业人士;每一本,都会解释一个问题,每本书 2.5 至 3.5 万字,平均用时1小时。书店在亚马逊 Kindle、iBooks、多看阅读、豆瓣阅读等多家电子书平台发行。作者将从销售中获得收益分成,收益方式可以在合作协议中找条款保障。

书的写作方向:泛经济类、人文社科类、职场类、生活类。暂时不考虑的写作方向:职场心计、阴阳五行、通俗小说、情感鸡汤。


6)知乎日报和读读日报

有网页版和APP版

这里不研究日报的内容,人工、机器算法等。仅从日报的目的分析,是为了让优质内容和优质用户得到更好的曝光,引流和粘性,用户也多了一个选择。



以上都是从每个产品去分析信息的组织流动,内容和用户的质量管理,SEO优化。但是没有分析参与者的利益和商业变现,下面就简单分析下这两个。

参与者有:看客-》分享者-》专业领域优秀回答者。角色有营销者,机构等

而从回答者的动机和知乎为了保证内容质量的分析可看,回答者可以通过知乎回答曝光自己的知识和能力,而这种知识和能力可以用来个人的求职或公司的招聘,用来个人作品、培训课程或者公众号等的推广,用来个人的品牌和影响力提升,用来结交更多的朋友,用来公司品牌、产品、服务或者活动的推广和品牌诋毁等等。

而知乎自然而然地得到了内容的丰富和质量,这种商业模式是最健康的,消费者用户、生产者作者、第三方平台知乎都得到了自己要的东西。

你可能感兴趣的:(前台产品内容结构化的思考)