作爲一個2020年3月份才正式正名的一個崗位,開始就受到了很多關注,但也引發了很多爭議。經過幾年的發展人工智能很多領域已經落地初見成效,數據標註也逐漸要進入一個“洗牌期”。但很少有人關注從業者的發展,不管是在百度還是知乎去查找都很難找到一個很好的職業前景的說明,得到的標籤基本都是“簡單”、“重複”等等。那麼在疫情之下可以吸收大量就業的崗位,作爲從業者或者即將從業到底該如何選擇?
到目前階段個人不太贊同再把數據標註員比作AI的老師,去教AI如何認識世界。對於老師來講“教”這個事情其實是不用對特定情況下結果負責的,而標註這件事發展到目前階段則不然,更像“調音”的過程,是一個技術活,所以想要真的做好,就要更準確的理解並可以通過標註的方式進行“調音”。
所以本文重點從實際公司需求出發來分析,目前對於求職者如何更好的選擇同時在這個行業發展的更好。下面我們從兩大方面進行一個詳細分析:1.職位和對應薪資,2.職位對應的要求。
本文原始數據主要採集自知乎、智聯、獵聘、Boss、拉鉤。
一.行業本身衍生出來的職位類型
首先我們先了解一下目前市場需求的數據標註的職位類型有哪些?個人認爲行業初期行業內職業類型的單一是很正常的,由於粗狂發展最直接的賺錢並且最小的投入纔是硬道理。但目前的階段這個行業有哪些職位可以供大家選擇?
1.可以看出來需求量最多依然是標註員的崗位,其次是審覈員、經理,很容易理解這是基礎的需求,其他崗位更多的也是從這個崗位衍生出來的。對於公司來講也是最直接盈利點。
2.從需求量上來看,目前審覈情況基本上是1:12,當然不排除審覈員很多會有內部標註員晉升到質檢員的情況,但是這個數字也基本在合理範圍內。
3.從需求量上也可以看出,目前經理管理人員情況是1:21,目前也是比較合理的。
這裏有兩點值得注意,a.銷售人員的需求量非常少,b.出現了明確針對數據標註行業的測試和產品的需求。這個也是值得各位小夥伴關注的。
二.對應崗位基礎薪資情況
對應崗位的工資相比也是大家非常關心的問題,那麼可以看到目前市場需求上的對應工資排名情況(此部分爲基礎工資)。
1.顯而易見上面提到的需求量相對少的銷售崗位是這個行業基礎薪資最高,這個就很容易理解作爲一個新興的行業,銷售不依賴於銷售員,而是渠道爲王,更多的是老闆就是主要的銷售手段。
2.在這裏很明顯的可以分出我們傳統意義上的管理崗位和技術崗位,管理崗如總監、經理、主管,技術崗:測試、產品。
3.作爲一個新興的行業相對已有的成熟行業來講,其行業衍生的崗位已經基本形成。
三.不同地域對於不同崗位的需求
很容易可以看到對於不同崗位需求度越豐富的地區,行業相對於其他行業的發展就會更快,那麼假設你是可以到外地工作的話,最好選擇哪些城市呢?我們可以分析一下。
1.可以看出從需求量上來說,北京、杭州、成都、深圳、上海、合肥的多樣性會更多一些,可以說明行業在這些地方的發展相對較快。適合初入職場的同學去學習。
2.對於主管、總監、經理需求量多的城市,如:成都、西安、蘇州、石家莊、長沙、貴陽等地,新成立的數據公司相對會比較多一些。更適合一些已經有一些行業經驗的人去。
3.另外可以看出這個數據尾巴很長,涉及到中小城市很多,很符合我最近看的一篇關於說數據標註的工作讓更多的年輕人又回到了家鄉。
上圖是數據標註員在各個地區的平均薪資情況,可以看出如果是剛畢業想從事數據標註員的同學,從平均薪資上來看選擇順序應該是:上海、深圳、蘇州、北京、成都、廈門。
四.地區公司量的角度
某一個地區需求公司的多少也很大程度的決定了發展空間,畢竟選擇行業是長遠的,還要考慮到可跳槽的空間。
可以看出北京是當之無愧的榜首,其次杭州、上海、成都、深圳也是可以選擇的。這樣分析下來是不是有了心怡的地方了呢?
五.職位要求有哪些?
上面我們分析了需求公司的情況以及薪資情況,那麼最重要的這份工作到底怎麼幹呢?接下來我們分析一下不同職位的崗位需要具備哪些能力呢?
1.標註員
以文本爲例:最低薪資和最高薪資的崗位要求有哪些不同呢?
-
最低薪資:
職責描述:
1、快速學習掌握語義業務功能,掌握掌握司法知識和標註平臺、工具功能;
2、進行日常語義需求的標註、問題反饋及需求總結;
任職要求:
1、語言學、法學相關專業,有較好理解能力;
2、熟練使用辦公軟件;
3、學習接收能力強,工作認真細心,責任心強有團隊意識,有一定抗壓能力;
-
最高薪資:
工作職責:
1.深入理解和分析金融、保險、物流、證券等行業數據,並負責完成數據生產、標註、維護;
2.數據標註及檢查:對不同項目所需的標註數據進行情感標註、關係判斷需要根據語句判斷兩個實體及他們之間的關係是否準確;
3.能依據產品需求,對標註數據進行總結、分析,定期總結標註經驗,提供標註工具的使用完善建議。
4.對接算法研發同事及數據標註人員,確保數據標註人員輸出滿足算法研發需求的數據。
任職資格:
1. 專科及以上學歷,語言學、信息管理、中文信息處理等方向優先;
2. 熟悉使用辦公軟件,擅長excel最佳,大數據和算法是加分項;
3. 語言表達流暢,能理解數據需求,善於發現問題並及時反饋,具有敏銳的數據分析能力,辦事踏實認真仔細;
4.具備敏捷的觀察、判斷能力,以及邏輯思維能力,具團隊合作精神,有強烈的責任心和敬業精神;
優先條件:
1.有保險電話客戶從業經驗優先;
2.相關項目經歷:詞庫、知識庫建設等;
3.對詞庫、知識庫建設;信息分類整理方向有濃厚興趣。
很容易就可以看出要求的不同,當然也很客觀的體現在薪資上了,所以如果想從事相關的小夥伴一定能要理解要面試公司的需求。在這裏我們可以分析出來幾個關鍵詞:
-
深入理解(對場景的深入理解)
-
標註和審覈(最基本的需求)
-
可以依據產品需求(可以根據場景來處理數據)
-
能與算法研發和標註員對接(能把場景需求和算法之間的關係進行轉化)
-
專科及以上學歷(這個也是很關鍵的點也是新畢業同學的機會所在)
2.測試
-
最低薪資
崗位職責
1、負責環視項目素材的採集和整理;
2、有效地執行測試用例,提交測試報告;
3、準確地定位並跟蹤問題,推動問題及時合理地解決;
4、歡迎2020屆畢業生投遞;此崗位有畢業後留任機會。
崗位要求
1、計算機及相關專業專科以上學歷;
2、熟練操作電腦和Excel,工作態度嚴謹。
3、邏輯思考能力強,有良好的學習能力;
4、對軟件測試領域發現、分析和解決問題有濃厚的興趣;
5、責任心強,工作積極、主動,注重總結;
6、有代碼基礎者優先,熟悉MongoDB數據庫搭建語言,熟悉Linux系統下C編程優先。
-
最高薪資
崗位職責:
1、負責人工智能深度學習算法的測試計劃、測試用例的編寫和測試執行;
2、負責人工智能深度學習算法的數據標註和審覈;
3、負責人工智能數據標註工具的編寫;
4、負責常規的數據測試和標註人員的管理、監督工作。
任職要求:
1、本科及以上學歷,電子、自動化、通信、計算機類相關專業畢業; 2、負責人工智能深度學習算法測試和SDK應用測試工作;
3、負責人工智能深度學習數據標註規劃以及審覈等工作;
4、熟悉Python語言,能自己編寫一些標註工具者優先。
5、具有快速學習能力和團隊合作精神, 善於交流。
3.管理崗
崗位職責:
1、對AI業務數據標註和採集項目的完整生命週期負責,建立完善的標註和採集的流程,推動業務向規範化和規模化方向前進,定期對服務的項目進行總結和經驗提升;
2、負責深入挖掘客戶的需求並確認,和客戶進行充分的溝通,保證項目的質量和進度,有效的控制項目風險,完成交付,提高客戶滿意度;
3、參與數據標註和採集業務的運營和決策,爲該業務線總監提供強有力的支持,包括流程化管理、標註人員素質提升、第三方渠道維護和開發等一系列業務方面的工作;
崗位要求:
1、對人工智能行業的算法情況有一定的瞭解,掌握主流的文本、音頻、圖像方面對標註類型、質量管控等方面的要求;
2、具有數據標註和採集行業的服務經驗2年以上;
3、有較強的統籌協調能力,做事細緻,認真負責,具有良好的抗壓能力和快速應變能力;
綜上不管是基礎崗位還是技術崗、管理崗位,對於能力的需求都是非常明顯,如果你想從事相關工作,一定要會的能力也非常顯而易見。同學們可以借鑑以上的需求對應學習。
今天文章有點長了,基本上從兩個方向梳理了一下目前階段數據標註行業如果想選擇的話的需求以及前景和公司的要求。這個是一個新興的行業有很多機遇也有很多挑戰。最近也跟一些大學的老師交流,一些大專和本科也開設相關的大數據、人工智能的課程,但是就連老師可能很難講清楚學生畢業了該如何選擇工作,而數據標註或許是一個很好的選擇。
最後我想說不管任何職業任何崗位都缺少不了用心、細心、專心。疫情影響很多傳統崗位都面臨着減員的情況,而數據標註行業的缺口依然巨大,所以希望本文可以幫助大家更清晰的梳理方向,也歡迎大家留言交流。