用户观看有效学习时长统计

随着在线教育成为我们获取知识的主流方式之一,那么伴随而来的诸多学习APP中,是如何统计有效学习时长的呢?
一个视频一共10秒,那么我学习这个视频的有效学习时长是多少呢?
比如,下面这个例子:


观看 (1).jpg

第一次观看:开始观看(0-5 s)
第二次观看:此时发现之前的内容太过精彩,想重新观看一次,于是拖动进度到2s重新观看(2-8s)
第三次观看:又看到第5s后去接了个电话,但此时播放进度到了第8s,于是拖动进度到第5s重新观看(5-10s)
此时,用户总共观看时长为(5 - 0)+ (8-2)+(10-5) = 16 s,但其实用户的有效时长即为学习时长的10s。

那么如何计算用户观看视频的有效时长呢,根据上面的图例,我们发现视频时长是个大线段,那么每次观看是一个小线段,那有效时长就是多个小线段的加和(过滤重复部分),即{0,5} 、{2,8}合并成为{0,8}。

所以此时我想到了线段树,那么线段树是否适合这个场景呢?我个人理解其实是不适合的,首先咱们要计算的总时长是固定的,不会存在计算动态的起止点{m,n}类似的需求,也就是每次我们获取有效时长只会取根节点,所以线段树的优势就变成了劣势。
根据上述的例子,我们可以发现{0,5} 、{2,8}合并成为{0,8}的操作,其实就是对线段进行合并,那我只需要将 学员A学习课程A作为一个key,把所有已观看的部分进行线段的合并保存起来就可以解决这个问题了(eg.[{0,8},{9,10}])。但是这个方案存在一些问题,比如如果所有子线段都无法合并,或者所有的子线段非常小的时候,此时合并线段可能会存在的效率问题(无法合并以及合并次数过高)。上述的情况,其实是合并线段的优点也是缺点,优点是当可以合并线段时,集合长度为1-N。
为了解决长度的不固定的问题,我做了一个假设。假设一个视频时长为M,则总线段为0~M,那么我固定子线段的个数为N,此时每个子线段长度为(M/N), 此时我只需要想办法计算每个子线段的长度就ok了。
如果不能用线段来表明子线段长度, 那么我们还可以通过哪些方式来表明用户是否观看过呢?我们发现用户是否观看过某一秒视频,只有两种可能。即看过和没看过,也就是0和1。
那么是否可以通过用二进制数的对应位来表示呢?
此时我可以将一个集合分成[a,b,c,d,e],集合中的元素a~e,用Long表示,其对应的二进制数的位数即代表该秒是否观看过。同时我们可以引入步长的概念来解决一个子线段对应的时长超长(因为一个Long最大只能表示 2的32次方-1,即最多31位,为了便于计算,我们一个节点位数为30),步长即为Long对应的二进制数中的一位代表的秒数。
有了这个思路,我们接下来的实现就简单了:

/**
      * @description: 计算有效时长
      * @param
      * @return
      * @throws
      * @author ezial
      * @date 2021/3/22 1:44 PM
      */
    public static void main(String[] args) {
        // 默认步长为1,防止视频过长的情况(即后续的1代表step对应的秒数)
        int step = 1;
        // 0 到 1 分钟之间的总学时
        Long totalDurationBetween0And30 = 0L;
        // 观看了第6s eg. [5,6]
        Integer second_6 = 6;
        totalDurationBetween0And30 = totalDurationBetween0And30 | getOffset(second_6);
        System.out.println("第N位表示是否观看了第N秒,此时观看了第" + second_6 + "秒,则对应的二进制数为:" + Long.toBinaryString(totalDurationBetween0And30) + ",位数:" +Long.toBinaryString(totalDurationBetween0And30).length());
        System.out.println("观看总时长:" + calcLearningTime(totalDurationBetween0And30) * step);

        // 观看了第1s eg. [0,1]
        Integer second_1 = 1;
        totalDurationBetween0And30 = totalDurationBetween0And30 | getOffset(second_1);
        System.out.println("第N位表示是否观看了第N秒,此时观看了第" + second_1 + "秒,则对应的二进制数为:" + Long.toBinaryString(totalDurationBetween0And30) + ",位数:" +Long.toBinaryString(totalDurationBetween0And30).length());
        System.out.println("观看总时长:" + calcLearningTime(totalDurationBetween0And30) * step);

        // 观看了第1s eg. [10,11]
        Integer second_11 = 11;
        totalDurationBetween0And30 = totalDurationBetween0And30 | getOffset(second_11);
        System.out.println("第N位表示是否观看了第N秒,此时观看了第" + second_1 + "秒,则对应的二进制数为:" + Long.toBinaryString(totalDurationBetween0And30) + ",位数:" +Long.toBinaryString(totalDurationBetween0And30).length());
        System.out.println("当前步长为" + step+",观看总时长:" + calcLearningTime(totalDurationBetween0And30) * step);
    }

    /**
      * @description: 计算second对应的2进制位数
      * @param second 对应观看视频的第N秒
      * @return
      * @throws
      * @author ezial
      * @date 2021/3/22 4:22 PM
      */
    public static Long getOffset(Integer second){
        Integer gowhere = second - 1 + (-1);
        return gowhere > 0 ? (2L << gowhere) : (2L >> (-gowhere));
    }

    /**
      * @description: 通过记录的2进制数反推公学习秒数
      * @param
      * @return
      * @throws
      * @author ezial
      * @date 2021/3/22 4:23 PM
      */
    public static int calcLearningTime(long n) {
        int ans = 0;
        while (n != 0) {
            ans += (n & 1);
            n >>>= 1;
        }
        return ans;
    }

此时我们已经实现了对有效时长的统计,但是此时发现步长超过1的时候,可能会需要一些容错机制比如{7,10}这种区间如何记录等等。
其实现实场景中,如果我们要来记录有效时长的视频长度,不会是无限长,我们可以通过对视频大小的限制以及视频时长限制等等来规避视频时长过长的问题。根据上述的思路,其实每个子线段的实现就是一个缩小版的Bitmap。那么我们其实可以通过redis的bitmap来实现记录。即对二进制数做|的操作,有效观看时长即为 所有1的个数,即 BITCOUNT
现在我们可以计算下Bitmap的内存开销,一个1亿长度的Bitmap大约占用12MB的内存(10^8/8/1024/1024),内存的压力不会太大,同时在实际应用中,我们可以对Bitmap设置过期时长。同时设置一个遇到超时的数据恢复策略就好了。

你可能感兴趣的:(用户观看有效学习时长统计)