996ICU的這些往事,你一定不知道

恰逢1024的來臨,作爲一個程序員,將結合996.ICU這個項目200多天的歷史數據,用程序員的方法還原996.ICU曾經的盛況。比如你想知道爲什麼上線僅僅4天,作者被迫關閉Issues嗎,這裏面都進行了哪些瘋狂的討論?你想知道996.ICU的貢獻者在提交代碼時候都說了些什麼嗎?你想知道該項目每一天的star數量是是多少嗎?本文將這些免費分享給大家,致敬這曾經爲程序員發聲的項目。

這篇文章其實是我在上一篇文章的延續,在 《原來你是這樣的 GitHub》一文中,我詳細介紹了獲取GitHub所有倉庫數據的四種方法,在此基礎上分析了Github的概況和一些有趣和的事情。關於這篇文章的鏈接,仔細看,下文中有給出,或者你也可以直接在文中搜索這篇文章的名字。由於當時篇幅太大,對於996.ICU這個2019年最火項目沒能夠做更多的分析,只是展示了一張圖,本文將做更加詳細的分析。

2019年Github上最火的項目肯定是非996.ICU莫屬。996.ICU是什麼,我想不用我多介紹了,能夠點開這篇文章的人,都是明白的。下圖便是996ICU截至2019/10/21的概覽截圖:
在這裏插入圖片描述
在該項目出來的時候,瞬間點爆了中國程序員的熱情,加之各大媒體爭相轉載報道,人民日報相繼發生,連很多國外的大佬級程序員都有參與進來,至今仍保持了GitHub最快的star記錄。本文的名稱叫做996icu編年史,並不是去整理以往的這些報道,那是媒體人乾的事情。作爲一名程序員,會用數據真正的還原當年究竟發生了什麼,我列舉了一部如下:

1,996.ICU是由誰在什麼時候創建的,顯然99icu只是大佬的小號,從2019年才創建就可以看出。
2,996.ICU 日均star增長曲線,fork增長曲線,push增長曲線,這些特徵是一個項目大熱的指標。
3,996.ICU issue title ,issue comment都討論了哪些內容,其issue目前屬於關閉狀態,你一定很好奇作者爲什麼這樣做。
4,996.ICU issue,push等人員的國籍,公司,城市分佈。是否能夠間接的表明這些地區和公司備受996的煎熬。
5,996.ICU哪個issue的評論最多, TOP issue 排名是哪些。
6,哪些大佬對於996.ICU 做出了貢獻。
7,996.ICU 貢獻者在提交commit的時候都使用了哪些黑話,當一個開發者對於一個項目充滿極大熱情的時候,會發出怎樣的吶喊。

996.ICU是由誰在什麼時候創建的

996.ICU項目最初是由一位中國程序員在北京時間2019/03/18 13:38分創建的,至於由誰創建的並不是特別的重要,因爲這位大佬做的事情已經非常的有意義。這個大佬所在的公司一定是加班嚴重的,請各大公司對號入座。在北京時間2019/03/26 15:31的時候使用996icu這個賬戶重新創建996.ICU這個項目並正式上線。出於對創建者的尊重,那麼在此也希望掌握了分析方法的小夥伴們不要創建者的問題上有過多的討論。955.WLB就不一樣,創建者使用自己常用的GitHub賬號公開的創建,因爲本身他這個事是有利於其宣傳公司的,是上海微軟的一位大佬,你可以隨便撩撥他。

996.ICU各項指標:
通過上述的項目概覽圖可以看到watch,star,fork的數量分別爲4K+,247K+,21+。watch通常表示用戶想要持續的關注該項目,獲取項目的推送變化信息;star可以理解微信的點贊功能;fork讓自己擁有當前項目的一份拷貝,在此基礎上可以進行修改。watch的數量比之star和fork數量太少,雖然這個項目點燃了大家的點,說實話很多的程序員可能還是一種自嘲以及圍觀的心態,點個star已經表明其精神上的支持,持續的watch一般不太可能。而fork數量竟然有如此之多,猜測很多人是出於保留現場才fork的吧,不然單獨拉一個分支做好像沒啥理由。因此本文繪製了該項目的star,fork,push曲線作爲反映996.ICU熱度的指標。

996icu 日均star增長,如下圖:
在這裏插入圖片描述
996icu fork日均增長,如下圖:

在這裏插入圖片描述
996icu push日均增長,如下圖:

在這裏插入圖片描述
有上述幾張圖可得:
(1),項目發佈前一週之內,是最瘋狂的時候。單日7.5W star數量應該也是一個記錄,還有單日4K+ fork以及120+的push。
(2),前一個月內各項指標都有明顯的增長,一個月後基本增長趨於0。雖然各大媒體還在報道,但是Github上的活動已經不再瘋狂,說明真正活躍於github上的中國程序員基本和這一段時間內star總量相當。
(3),雖然三張圖的走勢一致,但是縱軸是不在一個數量級的,累計的數量和目前該項目主頁顯示的基本一致。出入在於有的人可能點贊之後又取消了。

996icu issue
對於這麼火的項目,最熱鬧的肯定是issues區,例如issue title ,issue comment都討論了哪些內容。本來想繪製一下issue的增長曲線。但是 發現issue的數據只有四天,下圖表示的是日均issue數量:
在這裏插入圖片描述
(1),可以看到issue的數量只在2019/03/26-2019/03/29這幾天有創建的活動,共計創建了22791條。
(2),項目創建的首日並沒有引起太多人的注意,但是3/28日這一天的issue創建量達到13683條,破記錄了有木有。

如果你現在去查看996.ICU的項目,你會發現issue這一項是被disable掉的。由於當時中國程序員瘋狂的提issue,導致這個版塊的失控,項目創始人不得不關閉。那麼這些issue中究竟出出現了哪些讓作者不堪重負的討論呢?經過後面的分析你會發現,也許關閉是最好的方法。下圖是我提取的996.ICU 這個項目所有issue title的詞雲,也許可見一斑:
在這裏插入圖片描述
可以看到由於issue的討論有很多的廣告以及和項目不相關的內容都來蹭熱度,例如像免流,廣告,電信,qq,免費送,微信羣,加羣,交友等詞出現頻率很高。超出了創始人的掌控,被迫disable issue 的功能真的是唯一的辦法。如下是我統計的所有issue title出現次數最高的前十名:
在這裏插入圖片描述
(1),不同的title的issue數量也高達17016個 。
(2),一個吆喝賣流量卡的竟然發了500次,毅力可貴啊,四天內無時無刻不在轟炸issue區。
(3),還有很多趁機加羣的,我都把他們打上馬賽克。
(4),也難怪作者抗不住着這樣的壓力,廣告君太多,可見很多人是想趁機擼一波程序員的羊毛。
(5),我注意到還有很多的圍觀羣衆,只是路過打個卡。

我在看lol直播的時候,在一波非常亮眼的操作之後,彈幕上都是滿屏的666,秀兒,老哥穩,nice,劉明,!,圍觀,喫瓜,皮等,出於好奇我也統計了這些詞彙在issue title中出現的頻率,用來說明大家通常在某個事情說道自己心坎裏面的感受,如下:
在這裏插入圖片描述
下圖展示的是所有的issue title 下面評論次數的排名:
在這裏插入圖片描述
其他的issue title 大家可以自行體會,但是我注意到關於996.license有很多人蔘與了討論,但是我在統計github上所有license的時候並沒有發現996的license,不知目前進展如何。下圖是我統計的github上所有項目的license詞雲,在Gitchat 《原來你是這樣的 GitHub》一文中有講到具體方法,這裏,如下:
在這裏插入圖片描述
如果問你996.ICU這個項目哪個國家的開發者參程度最高,你一定會毫不猶豫的說是中國,以下便是我通過數據分析得出的,每個國家參與評論的開發者數量以及每個國家的開發者一共參與了多少次issue的評論:
在這裏插入圖片描述
(1),中國無論是comments總量還是用戶個數都穩居第一。但是數量上和我們想象的有出入,coment數量肯定沒有這麼少。主要原因在於這裏面統計的是在github上面填寫國籍的開發者,有很多的開發者並沒有填寫這方面的信息,你是不是就沒有填寫。但是你會發現經常活躍於Github的開發者信息都是比較全面的。
(2),au和us,jp有相當一部分用戶參與進來,大概率是一些留學生,因爲issue只維持了四天,能關注到這個項目的基本都是中國人。

同樣的,統計了發表過issue comment的所有人員中,每個公司的用戶數和comment總量,分別按照公司開發者數和提交comments總量排名,依據同樣是用戶的填寫的公司信息:
在這裏插入圖片描述
在這裏插入圖片描述
(1),公司員工方面可以看到 百度,騰訊,美團,華爲,阿里都有員工參與了評論,這也怪不得很多大廠以及瀏覽器屏蔽個這個地址。
(2),當然還有學生,壓力不大,參與這個話題點還是挺有趣的。
(3),issue comment數量方面奧本大學有個哥們一個人竟然評論了86次,真的厲害,我查看了一下他在github活躍度挺高。
(4),這兩個排名,百度都有上榜。同時發現,公司信息有填寫Baidu的也有baidu,合併之後可能會更多些。
(5),Jieyang No.1 Middle School這個哥們對自己的高中念念不忘,Embarcadero 這個員工看來工作壓力不大,感興趣的可以去撩撥他。

996icu commit message
另外一個和會出現很多文字信息的就是commit中的message了,很多基於研發數據的挖掘也會關注這個方面,統計一下程序員提交代碼時候的心情。如下是該項目commit中出現頻率最高的message排名:
在這裏插入圖片描述
(1),前幾名都是更新md文件,該項目最重要的就是README和黑名單這兩個文件了,後續還發展到不同語言版本的翻譯。
(2),Add files via upload 這個我在《原來你是這樣的 GitHub》也提到程序員在提交代碼中經常出現的一個message。
(3),一共出現了854條不同的message記錄。

有了所有message記錄,繪製commit message內容詞雲,你應該會猜測到會是一個什麼樣子,如下:
在這裏插入圖片描述
在項目Insights的Contributors,你會看到所有參與這個項目貢獻的人員列表。我在此統計的是所有提交過commit記錄的開發者的提交次數排名,如下:
在這裏插入圖片描述
(1),項目源作者提交的次數最多,爲153次。
(2),這裏面的名字是作者的porfile裏面的name,而不是login name,需要注意區分一下。可能和Insights的Contributors顯示的不太一致。
(3),共有684個不同的開發者有提交commit的記錄。

繪製所有提交過commit的開發者詞雲如下,還有幾個中文實名的大佬,看看有沒有熟悉的朋友:
在這裏插入圖片描述

以上僅僅是我工作之餘,針對996.ICU這個項目的一點分析總結。在大家掌握相關方法之後,可以進行更多有趣的分析,關注這一社會現象,關愛程序員。如果你覺得本文有趣,可以分享給更多的朋友。

本文爲CSDN村中少年原創文章,轉載記得加上原創出處,博主鏈接這裏

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章