浅谈TikTok算法

一、用户数据收集与分析

  1. 注册与账号信息

    • 人口统计学信息细化
      • 年龄方面,不同年龄段的用户兴趣差异很大。例如,13 - 17岁的青少年可能对潮流文化、电子竞技等更感兴趣;25 - 34岁的年轻成年人可能会关注职业发展、家居装修等内容。TikTok会根据这些年龄段的普遍兴趣倾向来初步筛选推荐内容。
      • 性别差异也会影响推荐。男性和女性在消费内容上存在不同偏好,男性可能更多关注科技、体育类视频,女性可能对美妆、时尚类视频更感兴趣,但这也不是绝对的,算法会结合其他数据进行精准判断。
      • 地域因素非常关键。不同国家和地区有不同的文化、流行趋势和社会热点。比如在印度,宝莱坞相关的音乐和舞蹈视频可能更受欢迎;在日本,动漫、二次元相关的内容会有更多受众。TikTok会根据用户所在的地域,优先推荐符合当地文化和流行趋势的视频。
    • 账号关联与拓展
      • 除了关注列表和粉丝列表,TikTok还会分析用户与其他账号的互动关系,如是否参与过合拍、是否对某个账号的直播有互动等。如果用户经常与某个健身博主合拍视频,这表明用户与该博主有深度互动,算法会更倾向于推荐该博主以及其他健身类账号的视频给这个用户。
      • 账号的认证信息(如果有的话)也会被考虑。例如,一个经过认证的专业厨师账号发布的视频,可能会被推荐给对美食感兴趣的用户,而且可能会因为其专业认证身份而获得一定的推荐权重提升。
  2. 互动行为数据

    • 点赞的多维度分析
      • 点赞的时机也有影响。如果用户在视频发布后的短时间内点赞,这可能表示视频的开头部分就很吸引人,算法会认为这个视频具有较高的吸引力价值。例如,一个视频在前3秒就有独特的创意画面,用户在看到这个开头后就点赞,算法会重视这个信号。
      • 点赞的频率同样重要。如果一个用户频繁点赞某个博主的视频,这不仅表明对该博主内容的兴趣,还可能暗示对该博主创作风格的喜爱。算法可能会进一步探索该博主的其他风格视频或者类似风格的博主视频推荐给这个用户。
    • 评论的深度挖掘
      • 评论的情感分析是算法的一个研究方向。积极的评论(如表达喜爱、赞赏的评论)和消极的评论(如批评、抱怨的评论)都会被分析。如果一个视频有很多积极的评论,这会增加其被推荐的可能性;而如果有较多消极评论,算法可能会重新评估这个视频的质量或者调整推荐策略。
      • 评论中的话题延伸也会被关注。例如,在一个科技视频下,用户的评论讨论到了相关的新技术发展趋势,算法可能会认为这个视频具有引发深度讨论的价值,从而推荐给更多对科技话题感兴趣的用户。
    • 分享的传播价值
      • 分享的平台也会被考虑。如果用户将TikTok视频分享到其他社交平台(如Facebook、Twitter等),这表明该视频具有一定的跨平台传播价值,算法可能会给予更多的推荐权重。
      • 分享的群体特征也有影响。如果一个视频被分享到某个特定的专业群组或者兴趣社区,并且在该群组内引起了一定的反响,算法会根据这个群组的特征来进一步优化对这个视频的推荐,可能会推荐给该群组类似特征的其他用户。
    • 观看时长的细分研究
      • 观看时长的分布情况很重要。如果用户在视频的前半段观看时长较长,但在中间部分跳出,这可能意味着视频的中间部分存在问题,如节奏拖沓或者内容不吸引人。算法会根据这种观看时长分布来调整对该视频的推荐,可能会减少推荐量或者提示创作者优化视频内容。
      • 对于较长视频,用户的观看完成率是一个关键指标。如果一个较长的教程视频(如30分钟的手工制作教程)有较高的观看完成率,这说明视频内容质量高且具有吸引力,算法会更愿意推荐给其他有类似兴趣的用户。
  3. 设备与使用习惯数据

    • 设备性能与视频适配
      • 不同设备的网络连接能力不同。如果用户使用的是移动数据且网络信号不稳定,算法可能会推荐一些低码率、较小文件大小但内容仍然吸引人的视频,以确保流畅播放。而对于使用Wi - Fi且网络速度快的用户,则可以推荐高清、大文件大小的高质量视频。
      • 设备的存储容量也会影响推荐。对于存储容量小的设备,算法可能会减少推荐一些包含大量高清图片、视频素材或者大型文件的视频,以避免用户设备存储压力过大。
    • 使用时间与习惯模式
      • 工作日和周末的使用习惯可能不同。在工作日,用户可能更多利用碎片化时间浏览TikTok,如上下班途中,算法可能会推荐一些简短、轻松、能够快速吸引用户注意力的视频;而在周末,用户有更多休闲时间,可能会被推荐一些较长、更深入或者更具娱乐性的视频。
      • 每天的特定时间段也有影响。例如,晚上8点 - 10点可能是用户休闲娱乐的高峰期,算法在这个时间段可能会推荐更多热门、适合家庭观看或者放松身心的视频;而在早上通勤时间,可能更多推荐一些简短的新闻资讯类或者激励人心的短视频。

二、视频内容分析

  1. 标签生成
    • 视觉元素识别深化
      • 对于人物形象的识别更加细致。除了服装风格,还能识别人物的发型、妆容类型等。例如,识别出视频中的人物是复古发型和特定年代风格的妆容,就会打上相应的“复古造型”标签。
      • 场景中的物体关系也会被分析。如果视频是一个室内场景,其中有书架、台灯和正在阅读的人,算法可能会打上“室内阅读场景”的标签,而不仅仅是单独的“书架”“台灯”标签,这样能更精准地反映视频的主题。
    • 音频元素分析拓展
      • 除了识别歌曲名称,还能分析音乐的节奏类型(如快节奏、慢节奏、舒缓型等)、情感氛围(如欢快、悲伤、励志等)。如果一个视频的背景音乐是欢快的节奏,算法可能会将其推荐给喜欢欢快音乐风格视频的用户,即使这个视频的主题不是音乐本身。
      • 视频中的环境音效也会被考虑。例如,一个海边的视频如果有海浪声、海鸥叫声等环境音效,算法可能会将其与“海边度假”“海滨风光”等标签联系得更紧密,从而推荐给对海滨相关内容感兴趣的用户。
    • 视频主题与场景关联强化
      • 算法会分析视频主题和场景之间的逻辑关系。例如,在一个美食视频中,场景是在一个传统的家庭厨房,主题是制作传统美食,算法会将这种主题和场景的紧密联系作为一个重要因素,在推荐时可能会推荐给对家庭烹饪、传统美食感兴趣的用户。
      • 对于多场景的视频,算法会分析场景的转换逻辑。比如一个旅行视频从机场开始,到酒店、旅游景点再到当地美食街,算法会根据这种场景转换的连贯性和逻辑性来判断视频的质量和吸引力,进而影响推荐。
  2. 视频质量评估
    • 清晰度与视觉效果
      • 视频的色彩校正也会影响其质量评估。色彩鲜艳、对比度合适的视频往往比色彩暗淡或者对比度失调的视频更受青睐。例如,一个风景视频如果色彩还原度高,蓝天、绿树、红花等颜色鲜明,会更吸引用户观看,算法也会给予更高的推荐权重。
      • 视频的防抖效果是稳定性的一个方面。即使拍摄设备有一定晃动,但如果使用了有效的防抖技术,视频看起来仍然平稳流畅,这也会被视为高质量视频的一个特征。
    • 视频时长与内容适配
      • 对于不同类型的内容,算法有不同的理想时长范围。例如,一个搞笑短视频可能在15 - 30秒之间就能达到最佳效果,而一个深度的知识讲解视频可能需要3 - 5分钟甚至更长时间。算法会根据内容的性质来判断视频时长是否合适,如果一个知识讲解视频在较短时间内清晰地传达了核心内容,也会被视为高质量视频并得到推荐。

三、推荐机制

  1. 冷启动推荐
    • 初始用户选择的精准性
      • 与发布者有共同关注关系的初始用户选择是基于对用户兴趣的初步判断。例如,如果用户A和用户B都关注了多个健身博主,当用户A发布一个新的健身视频时,用户B就更有可能被选为初始推荐用户,因为他们的兴趣点有较大的重合度。
      • 相似兴趣标签的初始用户挖掘会更深入。除了表面的关注关系,算法还会分析用户的点赞、评论等行为所反映出的潜在兴趣标签。比如,一个用户虽然没有直接关注健身博主,但经常点赞健身相关的文章分享,也会被视为与健身视频发布者有相似兴趣的潜在初始推荐用户。
    • 冷启动阶段的互动权重
      • 在冷启动阶段,每一个互动行为的权重相对较高。因为此时算法对视频的质量和受欢迎程度还缺乏足够的数据,所以一个初始用户的点赞可能会比在视频已经有一定热度后的点赞对推荐的影响更大。例如,在冷启动时,一个初始用户的点赞可能会使视频的推荐范围扩大2 - 3倍,而在视频已经有大量点赞后的下一个点赞,可能只会使推荐范围扩大1.1 - 1.2倍。
  2. 基于内容的推荐
    • 标签匹配的动态调整
      • 标签的热度和时效性会被考虑。例如,某个流行话题(如某个热门电影的上映期间)相关的标签热度很高,算法会更关注带有这些热门标签的视频。随着时间推移,当这个话题热度下降,标签的权重也会相应降低。
      • 标签的组合匹配也很重要。如果一个视频同时带有“美食”“素食”“创意烹饪”三个标签,而用户对这三个方面都有一定兴趣,那么这个视频与用户兴趣的匹配度就会很高,推荐的可能性也会大大增加。
    • 视频内容相似性的多维度考量
      • 除了内容类型(如都是舞蹈视频),视频的风格元素也会被考量。例如,一个是现代舞视频,另一个是爵士舞视频,虽然都属于舞蹈类,但风格不同。如果用户对现代舞视频有互动,算法在推荐爵士舞视频时会考虑到这种风格差异,可能会根据用户对不同舞蹈风格的接受程度进行调整。
      • 视频的叙事结构相似性也会被分析。如果一个用户喜欢具有悬念式开头、逐步解谜式叙事的视频,算法会寻找具有类似叙事结构的视频进行推荐,即使内容主题不同。
  3. 协同过滤推荐
    • 用户 - 用户关系的深度挖掘
      • 社交网络中的间接关系也会被考虑。例如,用户A和用户C没有直接互动,但他们都与用户B有密切互动(点赞、评论等),算法可能会认为用户A和用户C也存在一定的潜在关联,从而根据用户B的互动行为来调整对用户A和用户C的视频推荐。
      • 用户群体的聚类分析是协同过滤的一个重要部分。TikTok会将具有相似兴趣、行为模式的用户聚类成不同的群体。例如,将所有热爱动漫的用户聚成一个群体,当群体中的一个用户发布了一个优质的动漫相关视频时,算法会更有效地将这个视频推荐给群体内的其他用户。
    • 物品 - 物品关系的复杂关联
      • 视频之间的关联不仅仅是基于内容的相似性。如果两个视频经常被同一批用户在不同时间观看(不是同时观看),也可能存在关联。例如,一个用户先看了一个旅游目的地的视频,过了一段时间又看了这个目的地当地特色美食的视频,算法会将这两个视频建立关联,当推荐其中一个视频时,也可能会考虑推荐另一个视频。
      • 视频与相关产品或服务的关联也会被探索。如果一个视频是关于某款电子产品的评测,算法可能会将其与该电子产品的官方网站、周边产品等相关链接建立关联,虽然TikTok目前主要以内容推荐为主,但这种关联为未来的商业拓展和精准营销提供了可能。
  4. 热门推荐
    • 热门视频的动态筛选
      • 热门视频的评选是动态的,不仅仅取决于当前的点赞数、评论数等。算法还会考虑视频的增长趋势,如果一个视频在短时间内点赞数、评论数呈指数级增长,即使其总量目前不是最高的,也可能会被纳入热门推荐范围。
      • 热门话题下的视频筛选也有特殊规则。在热门话题下,算法会更注重视频与话题的相关性和创新性。例如,在某个热门电影话题下,除了普通的影评视频,那些以独特视角(如电影中的隐藏彩蛋分析、演员的幕后趣事等)呈现的视频更有可能被推荐到热门推荐中。
    • 热门推荐的传播效应
      • 热门推荐会产生滚雪球效应。当一个视频被推荐到热门推荐中,会有更多的用户看到,从而可能引发更多的互动(点赞、评论、分享),这又会进一步提高视频的热度,使其在热门推荐中的曝光时间更长、范围更广。
      • 热门推荐也会影响用户的创作趋势。当某个类型的视频在热门推荐中频繁出现时,会吸引更多用户创作类似主题和风格的内容,从而形成一种流行趋势。
  5. 多样性推荐
    • 避免信息茧房的策略
      • 算法会定期分析用户的兴趣范围,如果发现用户过度集中在某一类视频上,会有意推荐一些不同类型但可能有一定关联的视频。例如,如果用户一直观看健身类视频,算法可能会推荐一些健康饮食类视频,因为健身和健康饮食是相关的领域,这样可以拓宽用户的兴趣视野,避免用户陷入只关注健身内容的茧房。
      • 多样性推荐也会考虑用户的探索历史。如果用户之前有过尝试新类型视频并给予积极反馈(如观看了一定时长或者点赞)的经历,算法会更积极地推荐不同类型的视频给这个用户。
    • 多样性推荐的平衡机制
      • 在进行多样性推荐时,算法会平衡新类型视频与用户已有兴趣视频的比例。不会一次性推荐过多完全不同类型的视频,而是逐步增加新类型视频的比例。例如,可能先在10个推荐视频中加入1 - 2个新类型的视频,观察用户的反应,如果用户接受度较好,再逐渐增加新类型视频的比例。
      • 多样性推荐还会考虑用户的年龄、地域等因素。对于年轻用户或者来自文化多元地区的用户,可能会相对增加多样性推荐的比例,因为他们可能更愿意接受新的内容和体验。

你可能感兴趣的:(算法)