《标签:标记系统设计实践》阅读记录-第三章

标记的简单性和灵活性对一些复杂的设计决策有帮助。标记系统的框架(即用户、资源和标签之间的交互规则)会对系统的成功产生深远影响。

什么内容应该标记?资源如何进入系统?标记只能由贡献者提供,还是收听者也能进行标记?如果大家的标记与创建并分享资源的人不一致怎么办?

1、用户、资源和标签:探索我们的三部分标记模型

在设计界面或策划一个社会化导航功能之前,需要考虑标记系统中用户、资源和标签之间的关系与规则。这种情况下,“架构”简单的标记系统的框架系统创建中所包含的抽象的设计决定。

2、用户:一个标记系统中的本质的活跃成分

  • 身份:

  • 用户是谁。调查、访谈、现场研究,在理解用户上付出的努力越多,就越有可能设计出符合他们的系统。

  • 成员资格:

  • 如何进入系统?开放注册、邀请加入、外部条件,使他们成为系统的成员,从而添加资源、创建标签和查看其他人的标签和资源的权限。

  • 流通率:

  • 对他们而言发生了什么。保持已离去用户的账户可见,只要不活跃即可。旧有的内容对新员工非常有参考价值。

  • 活跃度:用户发布资源和标签的频率。

  • 用户活跃度是对资源和标签容量和动态性的一个很好的评估。很多界面设计决定(特别是与社会化导航有关的决定)会被用户活跃度驱动。

  • 确定用户的活跃度的方式:试用版或beta版,人们如何使用系统;用户对其他技术的接受程度;着眼于用户关于分享和寻找信息的痛点。

  • 社区:如何与其他用户交互

  • 关注者:简单的单向用户间联系;

  • 联系人:用户之间双向联系;

  • 群组:用户的集合,一起分享有关某一特定主题的资源。

  • 这些联系是社会化导航的基础——通过关注其他人的信息流来找到信息。

3、资源

  • 贡献的内容:它是如何进入系统的

  • 用户贡献的资源

  • 系统资源

  • 是原始资源还是指示器:究竟什么被标记了

  • 我们标记的资源可能是真实的文档、照片或视频等原始资源,也可能是资源所对应的一条权威数据库记录。

  • 在社会化书签标注系统中,人们标记一个书签或一个统一资源定位符,但他们的标签并没有附加在实际被标注的web页面上,而是附加在包含URL的数据库的一条记录上,我们称其为“指示器”——一条代表被标记资源的记录。

  • 原始资源和指示器之间的关键区别是:只有一个原始资源,但是可以有与标记它的人一样多的指示器。

  • 隐私:谁能看到它

  • 完全公开

  • 可配置,但默认公开

  • 可配置,默认私有

  • 完全私有

  • 限制:什么是不允许的

  • 文件类型: 例如flicker限制文件类型为图片文件,而Del.icio.us限制为链接。

  • 对象: 在librarything中,人们标记图书馆里的图书

  • 内容体裁:雅虎博客限制体裁为特定类型的音频

  • 出处:例如系统可能只支持内部网站标记文档

  • 动态性:系统的变化有多快 - - - 流的速度会影响更具体的设计决策(例如:导航)

  • 系统中的资源数量和变化率会影响人们使用系统的方式。如果资源是用户贡献的,则期待持续的新增数据流,而数据流流动多快则依赖于用户有多活跃;如果资源是系统的组成部分或者通过其他过程进入系统,那么数据集合的数据量和变化率可能与用户的活跃度无关。用户贡献资源的好处是资源可以同时被提交和标记,如果资源已经存在于系统中,那么用户可能就不会觉得有那么强的动机去标记了。

  • 预测资源采集的动态性有多大,有助于完成如下事情:

  • 设计导航和可视化工具

  • 设计对将要得到的标签类型和质量的期望

4、标签

标签是附加在资源上的关键词

  • 权限:谁可以标记什么

  • 谁可以创建、编辑和删除标签

  • 可以为哪些资源创建、编辑和删除标签

  • 实体存在:标签在哪里

  • 实体存在于文件中。标签存储在文件或资源本身中,它是便携式的:随着文件到处移动。

  • 实体存在于数据库中。标签存储于资源之外,通常是数据库中。虽然标签不那么便于移动,但如果资源移动,标签也可以随它移动。

  • 控制:应该审查标签吗

  • 监控系统,这对标签是一种形式的滥用,还是对资源的精确描述。

  • 要求用户标出不恰当的资源和标签。

  • 不要过多的使用控制权,如果用户觉得被压抑或不合理地审查,有可能会放弃系统。

  • 模式:理解幂率

  • 幂率:少数元素高频出现,而大多数低频出现

image.png
  • 标签的分布服从相同的模式——幂率模式

  • “优先联结”模型:一旦某个标签被使用,就有很大概率会被再次使用。社会认同、推荐界面,以及其他因素都对这种效果起了推动作用

  • 幂率的普遍性会影响标签系统的很多设计,例如,创建标签云需要对少数标签的超高出现频率做出补偿。

标记实践:现实世界的例子

5、4个标记系统及其架构选择

4个标记系统及其架构.png

4个标记系统及其架构.png
  • 协同标记:让用户标记指示器。这意味着每个用户对于资源都有其自己唯一的标签集,并且标签可以聚合成为对每个资源一种建议。

  • 简单标记:只允许对原始资源进行标记,没有对于资源的聚合观点。

6、5个常见的标记陷阱及其解决办法

问题通常包括如何使用户对系统感兴趣,如何让人们创建的数据有意义,以及如何减少反社会用户的影响

  • 冷启动问题:推进兴趣(boosting interest)和活跃度(activity)

  • 争取到最初的活跃用户。

  • 将你的产品推荐给内行和组织中的活跃分子。

  • 为标记建立系统内激励(鼓励参与,附带产生更多标签)。

  • 使用系统外激励(推广活动或竞赛)来鼓励参与。

  • 最后,可以考虑给标记的人利益,或者分配给在线工人。但是这些标签和质量会与真实用户所添加的不一样,并且,真实用户也会注意到这种差别。

  • 混乱的元数据:标签的纠结

  • 标签有其灵活性和可拓展性的有点,但是有代价的:混乱。混乱可能导致难以从标签中提取高质量的元数据,或者导致社会化导航系统难以设计。

  • 具体问题:

  • 有明显语法问题的标签(标准度不统一)。

  • 相同标签的多个不同版本(拼写、标点、同义词)。

  • 标签集合中没有明显的模式。

  • 解决方法:

  • 更改界面,使标签更规范。标签推荐是减少混乱的一个途径。

  • 鼓励用户遵循约定,使用某种特定的形式。

  • 为存在于系统中的标签建立关系(如同义词),通常需要人工介入。

  • 使用标签模式搜索算法,如Flickr的集簇(clustering)算法,Del.icio.us的同现(co-occurrence)算法。

  • 即少出现异常(前两个),隐藏混乱(后两个)

  • 混乱,是一种价值判断。标签与严谨的分类法、经过完善修饰的品牌信息,或者经过维护的有序的分类目录相比,是混乱的。但对于任何单独使用的用户,他们自己的标签则可能是完美有序的

  • 标签不会总是复合你的目标,但一定会为他们使用标签的方式感到惊讶。

  • 发声的少数:当某些用户篡夺了你的系统时

  • 活跃标记者的标签,有可能控制系统。那么就需要调整热门度算法,以使其对用户活跃度敏感。

  • 捣蛋鬼:抑制反社会的行为

  • 区别人类与机器人程序。

  • 给予用户忽视或阻止其他用户的选择权。

  • 号召用户帮助识别和标记出捣蛋鬼或不恰当的资源。

  • 时间就是金钱:管理有限的资源

  • 让获取用来管理系统的数据更容易。设计一个看板,显示用户、资源和标签的近期活跃度及相关趋势。[图片上传失败...(image-b2dc7f-1584693779143)]

    image.png
  • 让用户执行一些管理任务,例如,管理标签(合并、删除标签)和标出过时资源。减少独立标签个数,使整个标签集合更有用(并且完全由用户完成)。

7、小结

  • 标记系统的架构要求你设置有关用户(他们是谁,以及他们如何加入系统)、资源(他们如何被加入系统)和标签(谁可以标记什么资源)的规划。

  • 你需要考虑用户如何成为系统的组成部分,以及他们如何与其他用户交互。

  • 对于资源,你需要考虑他们如何进入系统、谁可以查看和标记它们,以及是否将其限定为特定的文件类型或格式。

  • 热门标记系统所构建的标记系统虽然相似,但实际是不同的。有协同标记、有简单标记。

  • 冷启动问题、混乱的元数据、发声的少数和捣蛋鬼是大多数标记系统的普遍问题。

你可能感兴趣的:(《标签:标记系统设计实践》阅读记录-第三章)