学生市场2.0迭代--标签维护(1)

截至2018.5.11,学生市场上现存的物品记录有1500条,其中标签使用多达2384次。
为什么标签使用的次数会超出发布次数这么多呢?做几个简单的猜想。
1.单次物品发布中包含了多个物品;
2.分类重复,差异化不够明显;
3.想增加物品的曝光率?

通过处理goods数据,筛选出tags(物品标签)在两个及其以上的物品。分析得出原因1是主要原因,且此类用户以毕业生为主,时间段集中在每一年的毕业季。针对此点,在2.0版本中可以在毕业季时段通过banner位的运营来满足用户“大甩卖”的需求。
原因2则是由于标签体系导致,现存的标签体系中分类存在冗余。

image.png

image.png

先来猜个迷。有一家餐厅叫“俏江南”,猜猜它是主打什么菜系?相信很容易理解成主打江南菜的餐厅。倘若再给你看logo
image.png

会不会觉得它其实主打京菜?事实上它主打川菜,而这是一个川剧脸谱,但辨识度显然不高。

这是一篇文章里提到的例子,并举出来一个概念:顺应用户的认知。这里就与标签体系相关联了。标签名应该容易理解,贴近大学生活,甚至可以口语化。
来看看图书分类下有这些词:人文社科、教育、文艺。最初自己花了一定思考去尝试理解这两个分类,人文社科这个词查了百度:在人文社科这个词中,主要包括人文科学和社会科学。主要是关于人的精神来进行描述,包括文学、历史、哲学、艺术等四方面。预备一次调研,看真实用户群是否存在对标签名有疑惑或带去了思考成本。
深究下去,这几个词的含义就显得有意思了。人文社科这个词可以作为图书分类,按照中国图书分类法简表得知,它囊括了教育、文学、艺术等。文艺一词没有找到合适的分类,第一印象是青春文学,当然这是个人经历的影响。但这个词无论是指文学和艺术还是指文学或表演艺术,都属于人文社科。

image.png

image.png

而教育这一词在图书分类中指的

image.png

这样的话,教育一词也就囊括了教材、考研、托福|GRE、证书、四六级。
而图书标签被使用次数为九个标签集中的第一位,原因除了基数大,还由于标签冗余导致发布物品时挑选过多标签。
举个例子:第一个学科资料的标签集实际上是由学院组成,此标签集极易与图书标签集冲突。1本课本,可以被标注学科资料-学院 + 图书-教材 + 图书-教育 ,甚至图书-人文社科,如果这是一门考研科目,还可以添加标签图书-考研...
可能需要对图书分类进行大改版。

扯远了,说回来。
第二点,根据现有的数据,可以进行一次小开刀,后期进行整理。其实是很想推翻重新做的;
第三点,可以做一个筛选,获取并整理被查看次数偏低的的物品,做一个banner位的运营。但需要考虑开发成本。

标签存在重复是客观事实,但有没有必要去改善呢?
苏杰说过对分类的理解:将全集分为子集后,不同子集的个体之间差异尽量大,每个子集内的个体差异尽量小。
我是不是误解了分类和标签的意义?
让我们回到最开始,为什么要设置标签?方便购买者方便查找所需物品。同时意味着为发布者提供一个能够尽量契合物品的标签库。

你可能感兴趣的:(学生市场2.0迭代--标签维护(1))