數據標註工廠裏的職業生涯!

隨着人工智能行業的發展,也帶動了數據標註行業的火熱發展,而剛畢業的大學生則懷揣着自己的創業夢想走入了充滿憧憬的人工智能標註行業,從此成爲了一名標註員。

數據標註是一項枯燥的工作,而在龍貓數據標註團隊裏則每天忙忙碌碌的標註員除了辛勤的工作之外也創造了一個又一個數據標註的奇蹟。

在北京海淀區的知春路,坐落着幾棟高樓,龍貓數據則就在這裏了。小標是龍貓數據的資深標註員了,他在這家公司已經兩年時間了,伴隨着一個又一個項目的完成小標已經記不起做過多少個項目了。小標是廣東某高校的畢業生畢業就來到這家公司從事標註工作,一恍兩年光景。從中學習了很多豐富的標註和採集經驗。雖然小標工作很繁忙但每次見到他時都是樂呵呵的開朗陽光。

小標正對着電腦用鼠標“貼標籤”:將一張普通道路交通圖中的機動車、行人、非機動車逐一框中……貼標籤的目的是教人工智能看圖識物,他們被叫作“數據標註員”。

當前,以互聯網、大數據、人工智能爲代表的新一代信息技術日新月異。人工智能在去年、今年兩度被寫入政府工作報告;而大數據,已經成爲世界認識貴州的新名片。在脫貧攻堅主戰場的貴州,大數據的經濟增速已連續7年位居全國前列。

產業勃興,數據標註員因此成爲新興職業。多名業內人士告訴記者,目前國內至少有大小近千家標註公司,共20餘萬名數據標註員。

“教機器認識這個世界”

這是一張微笑的普通女性的臉,她的鼻子、嘴巴、眼睛、眉毛和臉部輪廓佈滿了點,一共有149個,它們被叫做“人臉關鍵點”。

小標與同事們坐在電腦前,將圖片放大,用鼠標移動這些小點,使它們落在合適的位置。小標瀏覽了成千上萬張人臉圖片,在他的眼中,這些人臉沒有膚色、性別、老少之分,只有清晰與模糊的區別,一張像是從監控攝像裏截取的模糊圖片會讓他多花幾倍時間。

人工智能本身不會識別物體,而要依靠海量訓練。當人臉關鍵點被一一標註之後,計算機才能建立起對人臉的認知。而人臉關鍵點的數目並不固定,不同數目的背後連接的是不同的算法。“小標們”只需按照人工智能工程師們設定的數目規範來標註。換言之,這些數據標註員並不需要了解算法之複雜,他們所做的,更像在工廠流水線重複作業。

可不就是“畫框的”?幾十個人坐在電腦前按動鼠標畫框,機動車分成大型車、小型車,非機動車分成自行車、摩托車、三輪車,還有行人、交通信號燈,都要一一框起來。

“標註員都是‘滾雪球’帶教帶出來的,那時一個人一天要畫幾百個框,以至於後來走在路上看什麼東西都想畫個框把它框住。”

“後來,看到無人駕駛汽車在美國的硅谷跑,在烏鎮的世界互聯網大會跑,說實話還是蠻振奮的。”他們笑着說,不管科技有多先進,至少無人車裏出現的路況掃描圖像他是熟悉的,“也許那就是我之前標註過的。”

那種感覺,就像一不小心踩到了時代潮流的浪尖上。

數據標註行業有一套明確流程:上游的人工智能公司將項目交給中游的數據加工公司或衆包平臺,後者自行加工或分包給下游的小公司、小作坊,有的小作坊還會分發給“散兵遊勇”,比如學生或二三線城市的兼職人員。

而到了下游,項目經過層層轉包,利潤已經低得嚇人。“這與我們一線標註員的付出是不對等的。”曾芸說,早期夢動科技只能從中游的衆包平臺獲取項目,現在則儘量直接對接上游客戶。

對一般的數據標註員而言,職業生涯是一眼望得見頭的:從一線標註員做起,然後是質培專員(相當於質檢)、項目組長、項目主管、項目經理,最後是部門總監。

短短兩年間,從小小的鼠標一端,小標便感受到了另一端世界前沿科技進步的速度,“以前無人駕駛汽車框出基本輪廓就可以了,現在不只是從2D平面進化到3D立體,還要標註車頭的方向。”

實際上,數據標註本身也是一個要用人工智能來改造的行業,標註工具也正在迭代升級。比如,人臉識別最早均由人工標註關鍵點,但眼下吳潘威接到的項目裏,機器已經打好點,標註員要做的只是最後的校正。!


作者:龍貓數據
來源:CSDN
原文:https://blog.csdn.net/langlang008/article/details/89915926
版權聲明:本文爲博主原創文章,轉載請附上博文鏈接!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章