2020年數據標註公司情況分析

文章開始要做兩個感謝:

    1.感謝很多標註公司的小夥伴在數據標註公司及平臺排名一文中,通過填寫信息的方式,提供了非常真實的數據信息資料,以便爲本文提供部分數據基礎。

      2.要感謝在看過2020年第一季度數據標註行業需求分析一文之後,下單獲取數據的夥伴,希望可以幫助拿到數據的小夥伴。

      言歸正傳,本文想跟大家聊聊目前標註行業的主力軍標註公司或者團隊。可以讓大家對目前標註公司有一個概況的瞭解。目前的標註項目大部分都還是標註公司或者團隊來完成,不管是平臺類型的公司,還是AI公司自己發項目,但有一個特點,由於每次的項目需求不同,通用型的工具大部分沒有平臺化,或者工具平臺化但對人的管理缺乏監控,往往導致項目總是在“黑盒”的情況下完成,“黑盒”的結果就是風險的逐層轉嫁,最底層的那部分人終將會承擔由於這部分風險帶來的損失。本文無法從非常細節的層面剖析“黑盒”的原因和解決辦法,但想在現有數據的基礎上,呈現一個宏觀角度的面貌,供大家參考。

    本次想分析的主要呈現:

    1.數據公司的分佈情況。

    2.數據公司的人員情況。

注:

1.數據樣本總量400家,部分分析維度或低於400家,由於部分維度部分公司沒有相關信息。

2.數據來源採集和網絡。

一.數據公司的主要分佈

注:圈的越大表明當地的標註公司家數越多。

二.數據公司分佈佔比

三.成立年分佈

四.地區全職人數及兼職人數分佈

五.全職人數區間分佈

       

        通過上面數據可以初步得出以下結果:

        1.低成本且人口密度高的省份依舊是數據標註的主力軍。

        2.目前數據標註公司的人員情況基本都以中小型公司或者團隊爲主。

        3.“甲方爸爸”標註項目的不確定性和變化性依然非常高,依然無法持續保證標註團隊的長期規模化發展。

       4.不管是平臺方還是甲方來說,中大型項目很難有單一團隊完全解決。對於中大型項目衆包或許是必需方案。

        5.平臺的發展是必然需求。

       6.標註公司或者團隊抗風險能力比較弱,如果提高存活能力成爲了很關鍵的問題。

        數據本身可能存在的問題:

        1.樣本不夠且不全。

        2.數據提供的存在虛高成分。

 

      以上是數據公司情況的分析,作爲一個行業相關從業者真心希望可以良好發展,但項目“黑盒”實施是目前的普遍現象,其結果就是更多資源的消耗和浪費,至於最終誰承擔了這部分消耗呢?我們不得而知。希望可以通過對行業內的公司的剖析,可以給小夥伴提供一些更據參考性的思路。也歡迎小夥伴們留言交流。

    從事相關工作的小夥伴可以繼續報名,如果有相關合適的甲方留言需求可以推送給各位。數據標註公司調研

  

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章