6、片花关联长视频

1、风行内容仓的增效之路 - 前言

2、从“键鼠套装”到“全键盘游戏化”审核

3、从“人等机器”到“人机和谐”

4、绩效管理实践

5、质量保证实践

前面两篇都是管理方面的措施,插花介绍一下技术上采用的增效手段,先从长短视频关联这个功能讲起。

最近两年许多客户提出了短带长的需求,希望能够把用户对片花类短视频的观看引导到对相应长视频的消费,要实现这个功能的自动化,必须知道这个短视频片段对应的是哪个影视内容,最好是能够精确定位到影视内容的相关片段,这样便于用户可以继续观看后续内容。

最早尝试通过人工手段做关联,但这样做效率很低,即便不填偏移时间只做关联,每人每天只能完成一千条左右,内容仓里面的片花超过百万条,而且还持续有新内容产生,完全通过人工手段需要的成本太高,必须考虑通过技术手段来自动关联。

最先考虑的方案是通过标题关联,有些片花的标题里面是包含了片名的,但是这种情况是少数,大部分片花,特别是竖屏的片花,其标题经常不完整,有的虽然有片名信息,也是各种不规范的缩写,靠标题搜索可以提高人工关联的效率,但是依靠标题实现自动关联成功率太低,这个方案就被放弃了。

然后很自然考虑的方案是根据视频特征做关联,研发配合做了可行性测试,分别提取长视频和片花的视频特征进行比对,效果很不错,唯一的缺点就是计算量和数据量太大了,公司没有这么多的空闲服务器。

这个问题困扰了我们好一段时间,后来我想到一个可能的方法,视频的码率高,所以需要处理的数据量和运算量很大,但是音频的码率远远小于视频,通常要低一个数量级或者更多,如果我们能采集到音频特征进行比对,是不是有可能把片花和长视频对应起来呢?

许多经典的影视片段确实是可识别度很高,比如“I will be back", "bond, james bond",“你们师长姓什么叫什么”,可是,要在数十万小时的长视频里准确对应到片花所在的片段,能达到什么效果还是没把握的。

找研发讨论了一下,感觉值得尝试,于是找了几部电影和对应的片花,加上一些同类题材的干扰项,提供给研发做验证。研发的小伙伴非常给力,很快把测试样本的准确率提高到90%以上。进一步分析匹配出错的原因,发现典型的原因是影片中不同场景多次出现主题BGM,或者相关片段比较安静声音信息过少,研发进一步优化了算法,根据声音特征结合抽帧图进行比对,最终把完整片库的匹配准确率提高到了99%以上,确定时间偏移的问题一并解决,效果杠杠的。

你可能感兴趣的:(内容仓,绩效管理,降本增效,片花)