恰逢1024的来临,作为一个程序员,将结合996.ICU这个项目200多天的历史数据,用程序员的方法还原996.ICU曾经的盛况。比如你想知道为什么上线仅仅4天,作者被迫关闭Issues吗,这里面都进行了哪些疯狂的讨论?你想知道996.ICU的贡献者在提交代码时候都说了些什么吗?你想知道该项目每一天的star数量是是多少吗?本文将这些免费分享给大家,致敬这曾经为程序员发声的项目。
这篇文章其实是我在上一篇文章的延续,在 《原来你是这样的 GitHub》一文中,我详细介绍了获取GitHub所有仓库数据的四种方法,在此基础上分析了Github的概况和一些有趣和的事情。关于这篇文章的链接,仔细看,下文中有给出,或者你也可以直接在文中搜索这篇文章的名字。由于当时篇幅太大,对于996.ICU这个2019年最火项目没能够做更多的分析,只是展示了一张图,本文将做更加详细的分析。
2019年Github上最火的项目肯定是非996.ICU莫属。996.ICU是什么,我想不用我多介绍了,能够点开这篇文章的人,都是明白的。下图便是996ICU截至2019/10/21的概览截图:
在该项目出来的时候,瞬间点爆了中国程序员的热情,加之各大媒体争相转载报道,人民日报相继发生,连很多国外的大佬级程序员都有参与进来,至今仍保持了GitHub最快的star记录。本文的名称叫做996icu编年史,并不是去整理以往的这些报道,那是媒体人干的事情。作为一名程序员,会用数据真正的还原当年究竟发生了什么,我列举了一部如下:
1,996.ICU是由谁在什么时候创建的,显然99icu只是大佬的小号,从2019年才创建就可以看出。
2,996.ICU 日均star增长曲线,fork增长曲线,push增长曲线,这些特征是一个项目大热的指标。
3,996.ICU issue title ,issue comment都讨论了哪些内容,其issue目前属于关闭状态,你一定很好奇作者为什么这样做。
4,996.ICU issue,push等人员的国籍,公司,城市分布。是否能够间接的表明这些地区和公司备受996的煎熬。
5,996.ICU哪个issue的评论最多, TOP issue 排名是哪些。
6,哪些大佬对于996.ICU 做出了贡献。
7,996.ICU 贡献者在提交commit的时候都使用了哪些黑话,当一个开发者对于一个项目充满极大热情的时候,会发出怎样的呐喊。
996.ICU是由谁在什么时候创建的
996.ICU项目最初是由一位中国程序员在北京时间2019/03/18 13:38分创建的,至于由谁创建的并不是特别的重要,因为这位大佬做的事情已经非常的有意义。这个大佬所在的公司一定是加班严重的,请各大公司对号入座。在北京时间2019/03/26 15:31的时候使用996icu这个账户重新创建996.ICU这个项目并正式上线。出于对创建者的尊重,那么在此也希望掌握了分析方法的小伙伴们不要创建者的问题上有过多的讨论。955.WLB就不一样,创建者使用自己常用的GitHub账号公开的创建,因为本身他这个事是有利于其宣传公司的,是上海微软的一位大佬,你可以随便撩拨他。
996.ICU各项指标:
通过上述的项目概览图可以看到watch,star,fork的数量分别为4K+,247K+,21+。watch通常表示用户想要持续的关注该项目,获取项目的推送变化信息;star可以理解微信的点赞功能;fork让自己拥有当前项目的一份拷贝,在此基础上可以进行修改。watch的数量比之star和fork数量太少,虽然这个项目点燃了大家的点,说实话很多的程序员可能还是一种自嘲以及围观的心态,点个star已经表明其精神上的支持,持续的watch一般不太可能。而fork数量竟然有如此之多,猜测很多人是出于保留现场才fork的吧,不然单独拉一个分支做好像没啥理由。因此本文绘制了该项目的star,fork,push曲线作为反映996.ICU热度的指标。
996icu 日均star增长,如下图:
996icu fork日均增长,如下图:
有上述几张图可得:
(1),项目发布前一周之内,是最疯狂的时候。单日7.5W star数量应该也是一个记录,还有单日4K+ fork以及120+的push。
(2),前一个月内各项指标都有明显的增长,一个月后基本增长趋于0。虽然各大媒体还在报道,但是Github上的活动已经不再疯狂,说明真正活跃于github上的中国程序员基本和这一段时间内star总量相当。
(3),虽然三张图的走势一致,但是纵轴是不在一个数量级的,累计的数量和目前该项目主页显示的基本一致。出入在于有的人可能点赞之后又取消了。
996icu issue
对于这么火的项目,最热闹的肯定是issues区,例如issue title ,issue comment都讨论了哪些内容。本来想绘制一下issue的增长曲线。但是 发现issue的数据只有四天,下图表示的是日均issue数量:
(1),可以看到issue的数量只在2019/03/26-2019/03/29这几天有创建的活动,共计创建了22791条。
(2),项目创建的首日并没有引起太多人的注意,但是3/28日这一天的issue创建量达到13683条,破记录了有木有。
如果你现在去查看996.ICU的项目,你会发现issue这一项是被disable掉的。由于当时中国程序员疯狂的提issue,导致这个版块的失控,项目创始人不得不关闭。那么这些issue中究竟出出现了哪些让作者不堪重负的讨论呢?经过后面的分析你会发现,也许关闭是最好的方法。下图是我提取的996.ICU 这个项目所有issue title的词云,也许可见一斑:
可以看到由于issue的讨论有很多的广告以及和项目不相关的内容都来蹭热度,例如像免流,广告,电信,qq,免费送,微信群,加群,交友等词出现频率很高。超出了创始人的掌控,被迫disable issue 的功能真的是唯一的办法。如下是我统计的所有issue title出现次数最高的前十名:
(1),不同的title的issue数量也高达17016个 。
(2),一个吆喝卖流量卡的竟然发了500次,毅力可贵啊,四天内无时无刻不在轰炸issue区。
(3),还有很多趁机加群的,我都把他们打上马赛克。
(4),也难怪作者抗不住着这样的压力,广告君太多,可见很多人是想趁机撸一波程序员的羊毛。
(5),我注意到还有很多的围观群众,只是路过打个卡。
我在看lol直播的时候,在一波非常亮眼的操作之后,弹幕上都是满屏的666,秀儿,老哥稳,nice,刘明,!,围观,吃瓜,皮等,出于好奇我也统计了这些词汇在issue title中出现的频率,用来说明大家通常在某个事情说道自己心坎里面的感受,如下:
下图展示的是所有的issue title 下面评论次数的排名:
其他的issue title 大家可以自行体会,但是我注意到关于996.license有很多人参与了讨论,但是我在统计github上所有license的时候并没有发现996的license,不知目前进展如何。下图是我统计的github上所有项目的license词云,在Gitchat 《原来你是这样的 GitHub》一文中有讲到具体方法,这里,如下:
如果问你996.ICU这个项目哪个国家的开发者参程度最高,你一定会毫不犹豫的说是中国,以下便是我通过数据分析得出的,每个国家参与评论的开发者数量以及每个国家的开发者一共参与了多少次issue的评论:
(1),中国无论是comments总量还是用户个数都稳居第一。但是数量上和我们想象的有出入,coment数量肯定没有这么少。主要原因在于这里面统计的是在github上面填写国籍的开发者,有很多的开发者并没有填写这方面的信息,你是不是就没有填写。但是你会发现经常活跃于Github的开发者信息都是比较全面的。
(2),au和us,jp有相当一部分用户参与进来,大概率是一些留学生,因为issue只维持了四天,能关注到这个项目的基本都是中国人。
同样的,统计了发表过issue comment的所有人员中,每个公司的用户数和comment总量,分别按照公司开发者数和提交comments总量排名,依据同样是用户的填写的公司信息:
(1),公司员工方面可以看到 百度,腾讯,美团,华为,阿里都有员工参与了评论,这也怪不得很多大厂以及浏览器屏蔽个这个地址。
(2),当然还有学生,压力不大,参与这个话题点还是挺有趣的。
(3),issue comment数量方面奥本大学有个哥们一个人竟然评论了86次,真的厉害,我查看了一下他在github活跃度挺高。
(4),这两个排名,百度都有上榜。同时发现,公司信息有填写Baidu的也有baidu,合并之后可能会更多些。
(5),Jieyang No.1 Middle School这个哥们对自己的高中念念不忘,Embarcadero 这个员工看来工作压力不大,感兴趣的可以去撩拨他。
996icu commit message
另外一个和会出现很多文字信息的就是commit中的message了,很多基于研发数据的挖掘也会关注这个方面,统计一下程序员提交代码时候的心情。如下是该项目commit中出现频率最高的message排名:
(1),前几名都是更新md文件,该项目最重要的就是README和黑名单这两个文件了,后续还发展到不同语言版本的翻译。
(2),Add files via upload 这个我在《原来你是这样的 GitHub》也提到程序员在提交代码中经常出现的一个message。
(3),一共出现了854条不同的message记录。
有了所有message记录,绘制commit message内容词云,你应该会猜测到会是一个什么样子,如下:
在项目Insights的Contributors,你会看到所有参与这个项目贡献的人员列表。我在此统计的是所有提交过commit记录的开发者的提交次数排名,如下:
(1),项目源作者提交的次数最多,为153次。
(2),这里面的名字是作者的porfile里面的name,而不是login name,需要注意区分一下。可能和Insights的Contributors显示的不太一致。
(3),共有684个不同的开发者有提交commit的记录。
绘制所有提交过commit的开发者词云如下,还有几个中文实名的大佬,看看有没有熟悉的朋友:
以上仅仅是我工作之余,针对996.ICU这个项目的一点分析总结。在大家掌握相关方法之后,可以进行更多有趣的分析,关注这一社会现象,关爱程序员。如果你觉得本文有趣,可以分享给更多的朋友。
本文为CSDN村中少年原创文章,转载记得加上原创出处,博主链接这里。