很快我们就要进入到软件工程最重要最核心的部分----团队项目的挑战时间了,老师会提出一些他感兴趣的备选方案供我们参考。但在此之前,我们小组通过几次的讨论、提proposal,也想出了几个idea,下面这个字幕对轴工具就是其中之一。很多人可能对字幕组的工作不是很了解,会觉得为什么要五个人花上两个月的时间做一个听上去离大家很远的软件呢?实际上并非如此,NABC分析会告诉我们,其实这样一个软件很有它的现实意义。
(1) Need(N)
Need就是需求,用户的需求是做产品的最终动力。在我看来,字幕对轴工具的用户需求是显而易见的。在中国,活跃着大量的字幕工作者,他们因为兴趣互相认识,结成团体,通常被称为“字幕组”(Fansub Group)。他们因为对于某部作品的喜爱或者出于锻炼外语能力的需求对电影作品进行翻译。近年来由于美剧和日本动漫在中国国内的流行,需要字幕组的已经不单单是国外的电影了,现在像是人人字幕组和澄空字幕组已经有了大量拥趸,并且广为人知了。
字幕组内部有很明确的分工。 有专门负责翻译工作的人员,但是很少被人知道的是做字幕对轴工作的组员们。因为翻译出来之后仅仅是文本的内容,并没有跟视频文件进行匹配,字幕组的成员们往往需要进行非常细致的比对调整,才能使得最终观众们欣赏到拥有高质量的翻译内容,并且与原视频内容配合得天衣无缝的字幕。遗憾的是对于字幕的对轴工作会占用字幕组成员非常多的时间,而且这件事情相比翻译实在是没有什么技术含量,对于字幕组这些无偿造福人类的同学们来说花费正常的学习生活时间做轴是非常不值当的。我觉得如果有这样一个自动给字幕对轴的软件会给字幕组带来很大的方便。大大提高字幕组的生产效率,让广大美剧、动漫迷们更早的看到期待的作品。
(2) Approach(A)
Approach即项目的做法。字幕对轴最核心的部分其实就是找到音频的断点,并且与字幕上的句子开头一一对应上,并且将字幕的显示时间设定为对应音频内容的持续时间。这其中涉及到一些语音信号处理的算法,如果在做完第一个milestone以后我们想要再加一个实时翻译并给视频添加字幕的功能的话,还需要添加对已有翻译器的调用。语音的识别算法现在已经比较成熟了,我们认为可以从研究院的speech组得到一些算法上面的知识来帮助我们将音频的节点与字幕内容的句子对应起来,甚至实现将音频内容中的多音源混杂段落处理的很好,帮助字幕组更加容易的实现一些绚丽的字幕特效。
(3) Benefit(B)
Benefit即好处。我觉得我们这个想法能带来的好处是显而易见的,而且不想很多娱乐性质的应用,大家可能一开始觉得有意思,可能晚了两天以后觉得玩儿腻了就丢在一边再也不去搭理;相反的,这个想法如果如果实现的好,可能会被广大字幕组长期采用,成为一件“神兵利器”,让字幕组成员用多的时间去进行翻译的字斟句酌,去创造出更加喜闻乐见的传神翻译。另外一点,如果我们的软件可以实现基本的实时翻译和字幕产生的话,那么普通的同学也可以给自己喜欢的影视作品制作符合自己口味的“自定义”字幕,这样给了字幕更多的活力。
(4) Competitors(C)
Competitor即为竞争。到目前为止,还没有一款软件可以进行自动字幕对轴的工作。字幕组大多数是利用一些字幕编辑软件去开展工作,比如说最广为人知的人人字幕组自己开发的一款软件叫做“时间机器”,就是一种他们常用的对轴工具。我们的软件要想要取代这种字幕编辑软件就必须做的比他们更方便、更人性化,应该尽量去实现让字幕组工作人员将做好的字幕直接输入,然后跟着视频走一遍稍微做一些微调就可以的得到字幕成品的程度。或者说直接进行字母的自动生成,让字幕组的成员直接在软件内进行修改。如果能做到上面两项,我认为没有字幕组会舍得不用我们的软件而去浪费大量的时间去做对轴了。