RELATEED CONSULTING
相關咨詢
選擇下列產品馬上在線溝通
服務時間:9:30-18:00
你可能遇到了下面的問題
關閉右側工具欄
美國記者飛到中國實地探訪河南AI村
  • 作者:吳匯眾
  • 發表時間:2019-01-15 04:13
  • 來源:國外網站


人工智能這個行業這幾年非?;鸨?,但數據標注只是人工智能的一小部分,不知道從什么時候被媒體紛紛關注,并不斷報道,人工智能行業確實非?;?,明年會更火。

2018年11月我公司負責人收到一封來自美國的郵件,


大致內容為,一位印度的華裔記者,跟美國媒體公司工作。通過網絡搜索:數據標注,看到我公司網站并聯系,
 
說現在在調查數據標注的行業,它的發展和未來潛力, 也對它的員工的背景好奇。如果方便的話我希望跟你們先電話上聊一下。然后如果你們愿意的話可以實地去采訪。
 
12月初,美國記者飛到北京,來到鄭州我們見面聊了很長時間,對中國和美國的人工智能和數據標注相互的了解,同時還探討了中國和美國文化的差異。
具體過程就不說了,以下是采訪內容,采訪結束,美國記者希望我給他介紹一個偏遠的數據標注團隊,好有一個鮮明的對比,為了讓美國記者不虛此行,給介紹了一個小兄弟的標注公司。以下包含采訪內容。



在中國小城市、鄉鎮,無數年輕人正成為“數據貼標人”,他們每天坐在電腦前8小時,點擊幾10張照片,概述背景、前景和特定物品。他們的工作為AI公司的算法提供和處理大量數據。隨著技術的進步,那些“低技能”的工作者將會失業,但也創造了很多“低技能”的工作。
 
周俊凱(Junkai Zhou,音譯)的辦公室座落在東沙河的邊沿,這是1條靜謐的河,它把將位于中國中部河南省的31.8萬人的小縣城民權縣新舊兩個部份辨別開來。在這里,19歲的周俊凱和他26歲的堂兄今年夏天1起創辦了他們的小型數據貼標工廠。
 
他們創辦的“俊鵬科技公司”辦公室在1個租用的傳統庭院住宅里面,是典型的河南農村。這棟房子很大,有兩三層高,不像中國大城市普遍存在的公寓樓。在房子后面,1名男子在1片土地上耙葉子,周俊凱說,這些土地是1片莊稼地。
??3è?1?????¨?????ˉ?????????? ????é??é???????¨??????????????¤???é?¨?¤????
 
周俊凱(右)和他的表哥
在房子里面,唯1溫暖的房間是辦公室,10幾個年輕人坐在寬大的發光屏幕前。在11月的某1天,屏幕和熒光燈幾近不能照亮房間,當地污染程度已阻擋了太陽,4周彌漫著濃霧。
 
 
“俊鵬科技公司”的員工
這些年輕人是“數據貼標人”,他們每天坐在電腦前8小時,點擊幾10張照片,概述背景、前景和特定物品,所有這些都是根據正在進行人工智能的客戶規格而定。有些人可能會標記醫療掃描圖片,有些人標注風景和樹木的照片,還有些人標注無人駕駛車輛的道路圖片。這些都是人工智能算法學習“看”的數據。
 
人工智能行業依賴于這類便宜的人工,由于算法和“機器學習”在很多情況下都是由真人訓練。
 
人工智能需要大量數據來學習和辨別模式,不管是圖片、音頻還是文本,由于它們不同于人類解釋媒體。要教授算法如何準確辨認蘋果是1個蘋果,它需要不計其數的蘋果圖片。另外,算法很容易上當受騙。在1項實驗中,安全研究人員發現,通過扭曲校車圖片,雖然人眼看不到這類變化,但人工智能系統再也沒法辨認它是1輛校車。
 
資金流入中國的人工智能產業,很少有地方比河南更好。在幾年前河南富士康工廠(生產蘋果產品)和電子工廠而聞名,現在,河南的城鎮現在具有辦公室工作人員,他們正在進行艱苦乏味的輸入工作,讓計算機變得聰明。
 
咨詢公司AIB的研究顯示,去年,風險資本家向中國的人工智能創業公司投入了50億美元,這使得該行業的資金首次超過美國。中國政府已將AI領域作為優先事項,并在去年夏天宣布1項雄心勃勃的政策:到2030年建設價值1500億美元的AI產業。
 
在推動中國經濟發展的制造工廠中,河南人民也發現自己具有不斷增長的勞動密集型數據標簽公司這類邊沿產業,這些公司為算法提供和處理大量數據。除中國最大城市有幾家大型企業外,這些數據標注公司主要散布在較小的城市、城鎮和農村地區。
 
周俊凱是在平頂山西部的鎮上看到1些類似數據工廠后,想到了自己開店。他的表兄弟們1起拿出家里多年的積蓄(45000美元),購買了幾10臺電腦并租用辦公室。據他們所知,他們是民權縣中唯1的做這個產業的人。
 
“你不能期望具有這么高工資的人來完成這項勞動密集型工作”
 
從貿易學院畢業后,周俊凱開始進入這1行,之前他1直在找工作,但卻處處受限。
19?2??????¨?????ˉ??¥è?a?°??????¥?¤?????????a????o???? ???èˉ′??????è′?????-|? ??ˉ?????????????????·¥???é??????1?????¤????
 
19歲的周俊凱來自河南民權縣的1個村落里。 他說,從貿易學院畢業后,他的工作選擇其實不多。
“如果你不知道將來做甚么,你可以去1個大城市,成為1名白領工作者,然后每天都要擠地鐵擠公交,”他說,“至于其他(領域),如果你想出人頭地,就需要大量的知識、經驗和教育。而這些是我們沒有的東西。“
 
他很難才找到了1份汽車修理工的工作。他說,在1家工廠干了很短時間就辭職了——那份工作太苦了,要1天工作14個小時。
 
“我以為我再也受不了(這些),”他說,但“現在從事的這個行業感覺它有潛力。”
 
韓金浩(Jinhao Han,音譯)說,許多人現在正涌向數據標注行業。1年多前,他在河南省省會鄭州開辦了他的數據標注公司Dianwokeji(點我科技),目前具有了100多名數據貼標機。
 
“雖然標注是相當低級別的工作,但進入門坎相對較低,而且仍屬于人工智能行業。”他說,“所以我們認為,如果我們可以從這里開始,然后漸漸地、1步1步地走向更高價值的東西。”
 
韓具有超過6000種數據標注設備,這些設備已在他建立的類似Craigslist的平臺上注冊,其中較小的設備可以找到外包或雇用新員工。
 
18歲的趙夢瑤(Zhao Mengyao,音譯)是個新手。她于今年10月開始在周所在的公司工作。當我訪問辦公室時,她正在追蹤停車場停車位的白線:畫面扭曲,線條曲折,好像相機的1個魚眼鏡頭,但她輕松地將鼠標放置在它們上面。20分鐘后,趙夢瑤繼續處理她下1張照片。這是停車場的另1個角度的照片。
 
 
年輕姑娘正在學習如何給汽車標注
在她旁邊,1個年輕人則在描出1位歌手穿著的橙色連衣裙的疏松邊沿。接下來,他開始描1個打高爾夫球的人的輪廓。
 
趙夢瑤曾是1個婚禮攝影工作室的化裝師,但由于工作疲憊而辭職。有幾天她必須在清晨4點起來準備客戶拍攝,而晚上7點才能回家。
 
而現在的工作節奏她很滿意:朝8晚6,中間休息1個半小時。在午休時間,她和她的同事還能聊聊天,聊聊共同玩的游戲。
 
她說:“我覺得這很不錯,這里很自由。”
 
趙說工資還可以:每處理1套照片(大概20張)就可以取得大概20元的報酬。她每天可以完成4到8套,即80到160張照片。當我問她認為照片會去哪里、有何用處時,她回答不知道。
 
我交談過的7位數據貼標者的月工資從2000元人民幣到4000元人民幣不等。這與中國工人的平都可安排收入或稅后收入相當——2017年為2164元人民幣。“鄭州有這么多可以取得這類水平工資的工作。”25歲的點我科技員工王玉雙(Yushuang Wang,音譯)說。
???????1′è???¥3?-?? ?????±?è?|? ??-???§??????èˉ′??????
 
點我科技大多數員工都只有20歲出頭。
AI照片辨認教學的標準是使用ImageNet的圖象,這是1個由斯坦福大學教授李飛飛和她的團隊創建的超過1400萬張圖象的數據庫。該數據庫依賴于亞馬遜的Mechanical Turk,后者將勞動密集型工作外包,例如照片標記的工作以幾美分/1張的報酬交給互聯網用戶去做。
 
但是,隨著世界各地的企業愈來愈多地轉向從無人駕駛汽車到醫療診斷等行業的人工智能利用,ImageNet和Mechanical Turk被證明是不夠用的。
 
你認為我們會讓沒有生命的東西控制人類嗎?
 
數據標注公司Awakening Vector的開創人Peter Yang說:“醫療業務需要非常細致的數據來讓人工智能學會如何做出區分,例如在CT掃描中區分腫瘤和眼球。”它需要在大量不同的照片中,通過數據來指出照片中的腫瘤是甚么模樣,這就需要人工的來點擊并標注圖片。
 
“但大多數人工智能初創企業只有少數全職員工,通常都是數據科學家。”
 
“這需要大量的體力勞動。你不能期望收入這么高的人做這類勞動密集型的工作,所以你必須把這項工作外包出去。”
 
另外,還有隱私和質量控制問題。
 
例如,醫學圖象需要保密。亞馬遜土耳其機器人(Amazon Mechanical Turk)的任務是由任何想賺外快的注冊用戶來完成的,而不是那些周1到周5都有固定工資的員工。
 
外包意味著這些業務現在在國內遍地開花。
 
Peter Yang的業務集中于新疆,客戶包括百度和跨國制藥公司諾華(Novartis)。韓金浩的公司為國內1些無人駕駛汽車初創公司服務,在河南和鄰近的山東省的1些小城市也設有分支機構。
 
傳統觀點認為,隨著技術的進步,那些“低技能”的工作者將會失業。學術研究大多也支持這1觀點。
 
但這其實不意味著科技必定會取代所有的工作崗位。
 
波士頓大學科技與政策研究項目的履行主任James Bessen說:“歷史研究表明,自動化帶來了就業熱潮。”
 
“以紡織業為例,在19世紀初期,由于布料太昂貴,大多數人只有1套衣服。但隨著科技的發展,1些任務變得自動化,降落了制作衣服的本錢,人們對布料的需求也在增長。服裝需求的增長帶來了更多的就業機會。雖然紡織業被認為是“低技能”的行業,但隨著范圍的急劇擴大,它也帶來了新1代的工人,他們不能不學習操作復雜的機械。只有當需求得到滿足時,就業人數才開始降落。”
 
就目前而言,我國的勞動力還算是便宜的。
 
這項工作也超出了圖片標注的范疇。許多公司還為語音辨認、視頻標簽乃至原始數據付費。
 
對1些工人來講,成為1個新行業的1分子有1種明顯的自豪感。
 
“我們正在做1些非?;A的工作,雖然只是幫助機器人學習和查看大量數據,但我們也是其中非常重要的1部份。”
 
那末如果有1天算法學會了自己辨認事物,那末數以萬計的“低技能”人工智能人材會失業嗎?
 
韓金浩仿佛對此漠不關心:“如果真的到了那個階段,那末人類可能就不會活著了。你認為人類會讓乃至沒有生命的東西控制人類嗎?我們只會教它如作甚人類服務。我們不會把他教得那末好以致于有1天我們要為機器服務。


愿您心想事成,感謝支持。
找數據標注供應商請認準,點我科技:www.raaja.cn

国产日韩欧美中文免费|国产精品初高中精品久久|亚洲成a人v欧美综合天堂麻豆|青青草二区无码av不卡播