廣西新聞網(wǎng) > 首頁(yè)欄目 > 首頁(yè)要聞 > 正文 |
电脑刷机重装系统 |
2025-10-04 16:57 來(lái)源:廣西云-廣西日?qǐng)?bào) 記者 羅莎 楊思悅 通訊員 劉鵬飛 編輯:馮芯然 |
河南商丘生產(chǎn)糧食,還有數(shù)據(jù) 河南商丘生產(chǎn)糧食,還有數(shù)據(jù)。糧食給人吃,管飽;人加工數(shù)據(jù)給機(jī)器吃,叫“機(jī)器學(xué)習(xí)”。薛再?gòu)?qiáng)就是在商丘給自動(dòng)駕駛做數(shù)據(jù)的,用他的話說(shuō),汽車(chē)?yán)镉袀€(gè)“傻電腦”,他的工作就是訓(xùn)練“傻電腦”學(xué)開(kāi)車(chē)。 就像小麥要打谷篩磨做成面粉才能吃,訓(xùn)練“傻電腦”學(xué)開(kāi)車(chē),就得把影像文字變成可以用代碼理解的語(yǔ)言,也就是“數(shù)據(jù)標(biāo)注”。讓“傻電腦”變成一個(gè)會(huì)自動(dòng)駕駛的AI需要把多少圖像變成數(shù)據(jù)?目前業(yè)內(nèi)最廣泛的共識(shí)是千億公里。也就是說(shuō),至少需要將一千億公里的路況數(shù)據(jù)化,才能“培養(yǎng)”出一個(gè)可以安全駕駛的AI。拿每公里標(biāo)注十輛車(chē)計(jì)算,如果讓一個(gè)人每秒鐘標(biāo)出一輛車(chē),那么他至少需要三萬(wàn)一千多年;商丘七百多萬(wàn)常住人口,所有人晝夜不休一起干,才能完成這項(xiàng)工作。 就像從零搭建一座結(jié)構(gòu)精密的建筑,每個(gè)AI的成長(zhǎng)都會(huì)經(jīng)歷人工訓(xùn)練的過(guò)程。導(dǎo)航語(yǔ)音的生成,智能音箱的應(yīng)答,人臉支付,動(dòng)作捕捉……現(xiàn)在,你去問(wèn)ChatGpt,它也會(huì)“親口”承認(rèn),“在我的訓(xùn)練過(guò)程中,開(kāi)發(fā)者們還使用了一些人工標(biāo)注的數(shù)據(jù)集,以幫助我識(shí)別語(yǔ)言中的關(guān)鍵概念和語(yǔ)法規(guī)則。這些數(shù)據(jù)集通常由人類(lèi)專(zhuān)家進(jìn)行標(biāo)注,包括注釋句子結(jié)構(gòu)、命名實(shí)體識(shí)別和情感分析等等。這些標(biāo)注數(shù)據(jù)可以幫助我更好地理解自然語(yǔ)言,并使我更準(zhǔn)確地執(zhí)行我的任務(wù)。” 據(jù)估計(jì),在中國(guó),有約千萬(wàn)名“人類(lèi)專(zhuān)家”正在給數(shù)據(jù)“打谷子”。商丘市城西的北航星數(shù)字產(chǎn)業(yè)園就是這樣一座谷場(chǎng),打開(kāi)招聘網(wǎng)站,你能找到二十多家公司在商丘招聘數(shù)據(jù)標(biāo)注員。AI就從這里開(kāi)始,睜開(kāi)眼認(rèn)識(shí)世界。 “人工智能的發(fā)展離不開(kāi)數(shù)據(jù)標(biāo)注,沒(méi)有數(shù)據(jù)標(biāo)注,就沒(méi)有人工智能。沒(méi)有數(shù)據(jù)標(biāo)注,就沒(méi)有無(wú)人駕駛、刷臉支付、阿爾法狗、智能音箱。”薛再?gòu)?qiáng)的公司招聘廣告上這樣寫(xiě)著。 但在公司里,坐到電腦前,人們不會(huì)把手頭的工作和人工智能的美好未來(lái)聯(lián)系到一起。大家說(shuō)得最多的是“產(chǎn)值”。產(chǎn)值從屏幕里來(lái),電腦前的男人叫李亞洲,屏幕里是他的工作面板,顯示出某片街道。但跟鏡頭和人眼中的景象不同,李亞洲屏幕里的城市被雷達(dá)掃描為一個(gè)個(gè)點(diǎn),點(diǎn)點(diǎn)密密疏疏堆成不同顏色的云,沉在黑色的布景上,凝結(jié)出一些車(chē)輛和行道樹(shù)的模糊形狀。 這是機(jī)器眼中街市的相貌。李亞洲要做的,是告訴機(jī)器,如何認(rèn)識(shí)它所“見(jiàn)”的物質(zhì)——用機(jī)器使用的語(yǔ)言。他給一片片云打上標(biāo)簽:自行車(chē)、小轎車(chē)、客車(chē)、貨車(chē)……至于這是哪里的街道,誰(shuí)在開(kāi)車(chē),那不是雷達(dá)的掃面范圍。 滑動(dòng)滾輪,拉扯界面,點(diǎn)拖鼠標(biāo),他幾秒鐘就能拉出一個(gè)立方體框架,貼住云邊。然后,圖像上的標(biāo)簽會(huì)變成一段坐標(biāo)數(shù)據(jù),傳輸?shù)椒?wù)器上。在下一個(gè)數(shù)字空間里,一行行代碼被輸入計(jì)算機(jī)處理器,AI將要變得和李亞洲一樣,認(rèn)識(shí)這一團(tuán)團(tuán)點(diǎn)云的含義。薛再?gòu)?qiáng)對(duì)接過(guò)一位科技企業(yè)自動(dòng)駕駛部門(mén)項(xiàng)目經(jīng)理,那人告訴他,就當(dāng)汽車(chē)上有個(gè)傻電腦,它啥也不懂,你要把圖上大車(chē)小車(chē)分個(gè)類(lèi),輸入電腦,它才能在汽車(chē)移動(dòng)的時(shí)候自動(dòng)規(guī)避它們。 這就是機(jī)器學(xué)習(xí)的過(guò)程,從零搭建一座結(jié)構(gòu)精密的建筑。其最基礎(chǔ)的工作,就是用鼠標(biāo)拉出一個(gè)個(gè)方框,砌出一塊塊方方正正的磚——李亞洲,就是塔下萬(wàn)千砌磚的工人之一。當(dāng)然,每塊磚都沒(méi)有它的署名。 李亞洲很少說(shuō)話,開(kāi)口是濃重的商丘本地口音。他每天上午點(diǎn)到辦公室,飯盒往桌上一擺,埋頭在電腦前一坐至少八小時(shí)。這時(shí)的他,處在整個(gè)人工智能生產(chǎn)系統(tǒng)的最末一環(huán),一輛輛行駛在道路上的數(shù)據(jù)采集車(chē)通過(guò)雷達(dá)與攝像頭將物質(zhì)世界壓成圖像,千萬(wàn)個(gè)屏幕前的李亞洲操縱鼠標(biāo),將圖像轉(zhuǎn)寫(xiě)為數(shù)據(jù)串,汩汩流入算法中樞。這就是從數(shù)據(jù)采集、數(shù)據(jù)標(biāo)注到數(shù)據(jù)分析的全過(guò)程。 一般情況下,要成為一個(gè)熟練工,最少要磨合三個(gè)月以上。薛再?gòu)?qiáng)說(shuō),在業(yè)內(nèi),大家都把工作稱(chēng)為“做題”,一位數(shù)據(jù)標(biāo)注員成熟的標(biāo)志就是題做得又快又好。 李亞洲是公司里走得最晚的人。來(lái)公司快一年,他已經(jīng)掌握車(chē)輛標(biāo)注的規(guī)律:高度高的,即便點(diǎn)少也是貨車(chē);輔路上長(zhǎng)條狀的,肯定是兩輪。他左手鍵盤(pán)右手鼠標(biāo),幾秒鐘就拉一個(gè)框。打標(biāo)簽叫“刷題”,他需要從一個(gè)在線標(biāo)注平臺(tái)上領(lǐng)取“題包”,再完成標(biāo)注,目前的項(xiàng)目拉一個(gè)框一毛多,他一天能拉千八百個(gè)。面前的電腦就是一只打谷機(jī),正在接入一片無(wú)邊際的數(shù)據(jù)麥場(chǎng),重復(fù)相同的動(dòng)作。 這個(gè)平臺(tái)有自動(dòng)識(shí)別功能。李亞洲點(diǎn)擊一團(tuán)點(diǎn)云,系統(tǒng)會(huì)自動(dòng)貼上一個(gè)框架。只不過(guò)這個(gè)框往往貼合得并不完美,有時(shí)是一架貨車(chē)只框住了個(gè)車(chē)頭,有時(shí)是框線陷進(jìn)地面。李亞洲總得往前伸伸腦袋瞇瞇眼,拉動(dòng)框線完美地裹住要標(biāo)注的物體。 踏實(shí)、能干、好管理。干這行一年多,從標(biāo)注員做到項(xiàng)目負(fù)責(zé)人,薛再?gòu)?qiáng)發(fā)現(xiàn),最適合干這行的,就是李亞洲這種人。薛再?gòu)?qiáng)管他們叫“悶子”——“能出產(chǎn)值的,都是悶子。” 薛再?gòu)?qiáng)今年32歲,在數(shù)據(jù)標(biāo)注員群體中算年齡大的。他是在2021年7月入行的,在此之前,他在流水線上加工過(guò)德克士腿炸雞,一只只肉雞吊鏈條上在眼前巡過(guò),他要眼手不停,一手握刀一手割腿。去過(guò)黑磚窯,也干過(guò)銷(xiāo)售。 后來(lái)銷(xiāo)售做得不順,剛好有個(gè)朋友說(shuō)標(biāo)注行業(yè)不錯(cuò),現(xiàn)在不少人在做。薛再?gòu)?qiáng)一聽(tīng),“數(shù)據(jù)標(biāo)注員”“后端”“IT”“技術(shù)人員”,感覺(jué)挺“高大上”,就去應(yīng)聘了。 主管在電腦上點(diǎn)開(kāi)“做題”的界面,也就是李亞洲屏幕里的那種3D點(diǎn)云圖。他讓薛再?gòu)?qiáng)按住鼠標(biāo),拖動(dòng)屏幕里的界面,街道旋轉(zhuǎn)起來(lái),路上的車(chē)一會(huì)兒顛過(guò)來(lái)一會(huì)兒倒過(guò)去,“暈不暈?”主管問(wèn)他。這是標(biāo)注最基本的考核——暈不暈3D。薛再?gòu)?qiáng)說(shuō),不少人在入職時(shí)都倒在了這一關(guān)上,一般來(lái)面試的,都會(huì)被問(wèn)一句玩不玩CS這種第一人稱(chēng)視角的動(dòng)作類(lèi)游戲,如果常玩,留下來(lái)的概率就高些。 看著周?chē)慌排烹娔X前的同事,薛再?gòu)?qiáng)明白了,這工作跟在工廠里打螺絲也差不多,只不過(guò)是在寫(xiě)字樓里,只要能堅(jiān)持下去,最起碼風(fēng)吹不倒,雨吹不著。“大家都喜歡這個(gè)辦公場(chǎng)地。”薛再?gòu)?qiáng)說(shuō)。辦公室四米挑高,落地窗,鋪著地毯,“說(shuō)出去,我是在寫(xiě)字樓里辦公,坐辦公室的!” 干這活兒的人就像他以前玩《地下城與勇士》時(shí)那種刷任務(wù)養(yǎng)號(hào)的:注冊(cè)一批新號(hào),不停地打怪撿裝備刷經(jīng)驗(yàn)升級(jí),再把升到一定等級(jí)的號(hào)賣(mài)出去。在電腦前坐一天,手粘在鼠標(biāo)鍵盤(pán)上,能養(yǎng)幾百個(gè)號(hào)。 但這只是第一關(guān)。入職第一周要考核,要求每人最低達(dá)到80塊產(chǎn)值,一個(gè)框兩毛多,一天得標(biāo)三四百個(gè)。薛再?gòu)?qiáng)速度跟不上,摳不出來(lái)。 “你這標(biāo)的都是錯(cuò)的啊”,旁邊工位上傳來(lái)一句。那小孩比薛再?gòu)?qiáng)年輕得多,是職校來(lái)實(shí)習(xí)的——現(xiàn)在,不少承接數(shù)據(jù)標(biāo)注業(yè)務(wù)的公司,都會(huì)和職業(yè)學(xué)校對(duì)接,招需要實(shí)習(xí)的學(xué)生,他們更年輕、便宜。小孩每天大部分時(shí)間都在打游戲,中午睡一覺(jué),下午才打開(kāi)界面,“啪啪”兩個(gè)小時(shí),800個(gè)框,當(dāng)天的產(chǎn)值完成了。 跑銷(xiāo)售的經(jīng)驗(yàn)用上了,薛再?gòu)?qiáng)沒(méi)事就給那小孩遞煙,讓人家教方法,煙冒得多了,“武功秘籍”就套出來(lái)了。“還是得心態(tài)好。”薛再?gòu)?qiáng)說(shuō),“你越是緊張兮兮的,一直緊盯著使勁,沒(méi)用。”活兒多的時(shí)候,薛再?gòu)?qiáng)跟同事也會(huì)在“題海”里找點(diǎn)樂(lè)趣。系統(tǒng)里除了點(diǎn)云圖,也會(huì)給出街景的實(shí)拍照片。他們會(huì)在路邊的行人里偶然發(fā)現(xiàn)個(gè)“身材不錯(cuò)的美女”,大伙“偷著樂(lè)一下”。 “大部分人是不適合做這個(gè),做不下來(lái)。”薛再?gòu)?qiáng)說(shuō)。尤其像他這種做過(guò)銷(xiāo)售的,習(xí)慣了和人聊天交朋友,“一下子讓你坐那坐一天悶著頭跟個(gè)機(jī)器一樣,受不了。” 強(qiáng)大的社交能力讓薛再?gòu)?qiáng)從標(biāo)注員做到小組長(zhǎng),又調(diào)到商丘這個(gè)新成立的分公司做負(fù)責(zé)人。在這座辦公樓里,幾乎所有的辦公室都屬于數(shù)據(jù)加工的公司。這里是賽博世界的后臺(tái),業(yè)務(wù)五花八門(mén),除了還沒(méi)能上路的自動(dòng)駕駛,抖音的自動(dòng)生成字幕、直播審核、電商平臺(tái)的商品上架…… 薛再?gòu)?qiáng)公司樓上還有一家數(shù)據(jù)處理公司,他們既做數(shù)據(jù)標(biāo)注業(yè)務(wù),也做審核業(yè)務(wù),如給自動(dòng)駕駛標(biāo)注圖片上的汽車(chē)輪子,以及給音樂(lè)流媒體做歌詞標(biāo)注——就是每天聽(tīng)歌,合著節(jié)奏把歌詞變成卡拉OK里那樣的滾動(dòng)效果。 最有意思的項(xiàng)目是無(wú)人售貨柜。它的整個(gè)銷(xiāo)售過(guò)程,就像是有人在ATM機(jī)里手動(dòng)數(shù)錢(qián)。“付款時(shí)如果有些延遲,那就是我們標(biāo)注的人有點(diǎn)慢。”這家數(shù)據(jù)處理公司的員工告訴記者,“因?yàn)橛械娜四脰|西時(shí)會(huì)刻意擋著商品,讓攝像頭拍不清楚他拿的是什么電腦刷機(jī)重裝系統(tǒng)。” 智能看起來(lái)也不那么智能了。這家數(shù)據(jù)處理公司的老板王偉才說(shuō)出了背后的秘密:AI自動(dòng)識(shí)別的成本是一單三毛,而人工的成本是一毛。經(jīng)濟(jì)理性選擇了人工。 人工的低廉,讓AI望向了中國(guó)的小城。人工智能和數(shù)據(jù)產(chǎn)業(yè)的興起,讓人的認(rèn)知也被標(biāo)價(jià)。這讓眾多像王偉才一樣的商人發(fā)現(xiàn)了機(jī)遇,他們糾集人力投入這項(xiàng)產(chǎn)業(yè),搭建起人工智能的感覺(jué)器官。 大多數(shù)像王偉才一樣做數(shù)據(jù)標(biāo)注的老板都稱(chēng)呼自己為“乙方”,這是人工智能產(chǎn)業(yè)鏈上的兩端:甲方是車(chē)企、互聯(lián)網(wǎng)公司等大集團(tuán),乙方則是覆蓋著一定數(shù)量基層勞動(dòng)者的數(shù)據(jù)標(biāo)注公司。技術(shù),是橫在二者中間的溝壑。 大廈里的人提起他時(shí),總會(huì)說(shuō),“那個(gè)名校的老板”。用時(shí)髦的話講,他是一位標(biāo)準(zhǔn)的“連續(xù)創(chuàng)業(yè)者”。剛上大學(xué)時(shí),因?yàn)槔蠋熣f(shuō)了句“大眾創(chuàng)業(yè)萬(wàn)眾創(chuàng)新”,他就受到召喚,躍入商業(yè)的海洋。 他2013年開(kāi)始創(chuàng)業(yè),做兼職平臺(tái)起家,給餐館酒店提供人力渠道。最意氣風(fēng)發(fā)的時(shí)候,他會(huì)和投資人講這樣的故事:中國(guó)是世界上人口最多的國(guó)家,所以在人力資源服務(wù)上,中國(guó)應(yīng)該會(huì)誕生世界上最牛的人力資源服務(wù)公司。彼時(shí),中國(guó)還沒(méi)有那樣一個(gè)巨頭企業(yè)。他覺(jué)得自己就是“被歷史選中的人”。 但2020年,隨著餐飲酒店業(yè)進(jìn)入寒冬,他的公司也遭遇了毀滅性的打擊。一個(gè)甲方?jīng)]有結(jié)款,現(xiàn)金流斷了。他賣(mài)了房子抵債,原先八個(gè)合伙人就剩他和發(fā)小兩個(gè)。王偉才不得不轉(zhuǎn)行,投入了數(shù)據(jù)產(chǎn)業(yè)。 那時(shí)候在線教育紅火,他接到了教育企業(yè)的拍照搜題系統(tǒng)開(kāi)發(fā)。他可以憑自己的能力走完一整套流程——試卷采集,然后找大學(xué)生做題。憑這項(xiàng)業(yè)務(wù),公司一個(gè)月能有一兩百萬(wàn)的凈利潤(rùn)。 那是他第一次接觸到數(shù)據(jù)產(chǎn)業(yè)。看似是大轉(zhuǎn)行,但無(wú)論在哪,都少不了對(duì)人力的需求——哪怕是人工智能這種以替代人工為目的的事業(yè)。而在中國(guó),永遠(yuǎn)不會(huì)缺乏如此數(shù)量龐大且善于服從的人工。 從2018年到現(xiàn)在,乙方們接受到的數(shù)據(jù)標(biāo)注需求就一直在變。語(yǔ)音識(shí)別、人臉識(shí)別、關(guān)節(jié)打點(diǎn),然后是自動(dòng)駕駛,從2D的圖片標(biāo)注,再到3D和4D的點(diǎn)云標(biāo)注。 薛再?gòu)?qiáng)覺(jué)得,他們?cè)谧龅氖羌?ldquo;子孫后代服務(wù)”的工作。目前,還沒(méi)有誕生出市場(chǎng)公認(rèn)的、成熟的、可被大范圍推廣的自動(dòng)駕駛系統(tǒng)。“你這會(huì)兒不好好做,到時(shí)候他們開(kāi)的車(chē)就是你做的電腦系統(tǒng)。你不能說(shuō)我做完這個(gè)(系統(tǒng))之后,開(kāi)個(gè)車(chē)剛出門(mén)啪鉆溝里了,那一下子出事了嘛。一旦出問(wèn)題,害的是你自己的后代。” 但王偉才總是在懷疑,“標(biāo)注這件事,真的那么有意義?機(jī)器不能干嗎?我覺(jué)得不是機(jī)器不能干,只是現(xiàn)在機(jī)器沒(méi)好到那種程度。”王偉才覺(jué)得,標(biāo)注企業(yè)更像是外包,“大廠會(huì)有一部分任務(wù),自己解決太浪費(fèi)成本,所以才會(huì)放到我們這兒。” 甲方的震動(dòng)隨時(shí)會(huì)傳遞到乙方的世界。王偉才告訴記者,2022年,一家互聯(lián)網(wǎng)巨頭的無(wú)人駕駛項(xiàng)目大幅收縮,大面積裁員,他的許多同行都因此而沒(méi)有活兒干,干脆撤出了基地。 在甲方與乙方的交流中,唯一會(huì)涉及的技術(shù)就是人工成本的核算。薛再?gòu)?qiáng)稱(chēng),接項(xiàng)目時(shí),乙方團(tuán)隊(duì)會(huì)首先對(duì)甲方的項(xiàng)目進(jìn)行試標(biāo)注,以此估計(jì)人工標(biāo)注的效率,也就是一天能拉多少框。然后根據(jù)用工成本除以拉框效率,得到每個(gè)框的成本,以此和甲方協(xié)商單個(gè)框的價(jià)格。 伴隨著AI成長(zhǎng)的,是甲方對(duì)成本的控制越來(lái)越精確。李洪昊2018年入行,現(xiàn)在在商丘北航星空數(shù)據(jù)加工產(chǎn)業(yè)園負(fù)責(zé)招商,同時(shí)也有自己的標(biāo)注團(tuán)隊(duì)。他感受到的是,數(shù)據(jù)標(biāo)注產(chǎn)業(yè)的附加值在變得越來(lái)越低。一項(xiàng)技術(shù)的成熟,也就意味著這項(xiàng)技術(shù)不再需要人工的輔助。現(xiàn)在,沒(méi)什么人再去接那種語(yǔ)音和文字識(shí)別的活兒了,單價(jià)太低,根本掙不到錢(qián)。“像2D的自動(dòng)駕駛標(biāo)注,還有普通話語(yǔ)音標(biāo)注這種,客戶算得很精確,你八個(gè)小時(shí)往死里趕,產(chǎn)出最多也就是每人每天一百五(元)。” 標(biāo)注行業(yè)和AI研發(fā)的核心科技存在著森嚴(yán)的壁壘,以前李洪昊還想,自己也能做點(diǎn)標(biāo)注以外更高端的業(yè)務(wù)。但跟甲方一聊才知道,標(biāo)注之后,圖像是以一串?dāng)?shù)碼的形式傳到程序員們那里。“咱缺的就是一個(gè)轉(zhuǎn)成數(shù)碼的技術(shù)。”去年,他去上海參加人工智能大會(huì),參展方都是科技企業(yè),交流環(huán)節(jié),他向那些老板們自我介紹,說(shuō)自己是做標(biāo)注的,對(duì)方則通常回應(yīng):“我們不做這一塊”,或者“哦,我們外包出去了”。 壁壘似乎堅(jiān)不可摧。對(duì)于真正“親手”訓(xùn)練AI的算法工程師們來(lái)說(shuō),數(shù)據(jù)標(biāo)注是個(gè)被藏在地下的世界。他們所接手到的,只是一個(gè)個(gè)被標(biāo)注后生成的Json文件,而每一串代碼,其實(shí)代表著地下世界里某位人類(lèi)教師的某句講解:“這是貨車(chē)”“這是汽車(chē)”“這是行人”……那是AI的啟蒙教育,它們統(tǒng)統(tǒng)被納入算法。 地下世界里,有標(biāo)注員重復(fù)的工作,有數(shù)據(jù)標(biāo)注訂單的轉(zhuǎn)包、爭(zhēng)奪……為了得到訂單,這些人力的供應(yīng)商們只能“內(nèi)卷”起來(lái),壓低報(bào)價(jià)。“我們就像坐在橋邊等活的民工,別人過(guò)來(lái)問(wèn)一百干不干,你說(shuō)干,旁邊立馬站起個(gè)人說(shuō)我八十能干,那個(gè)說(shuō)我六十就能干。”一名數(shù)據(jù)加工產(chǎn)業(yè)的經(jīng)營(yíng)者說(shuō)。 人力低廉的價(jià)格和龐大的數(shù)量,是數(shù)據(jù)標(biāo)注員和老板們立足的倚靠之一。面對(duì)被不斷壓低的單價(jià),標(biāo)注公司們需要不斷去尋找更加便宜的人工。目前,已經(jīng)有不少企業(yè)更多尋求與職業(yè)院校的合作,讓標(biāo)注公司成為職校生的實(shí)習(xí)場(chǎng)所,以壓低人工的成本。 據(jù)國(guó)際數(shù)據(jù)公司(IDC)預(yù)測(cè),到2025年,中國(guó)數(shù)據(jù)標(biāo)注服務(wù)的市場(chǎng)規(guī)模會(huì)由2022年的43億元增長(zhǎng)至123.4億元。不過(guò)在這一行業(yè)還沒(méi)有出現(xiàn)某個(gè)獨(dú)角獸體量的企業(yè),勞動(dòng)密集是絕大多數(shù)企業(yè)的類(lèi)型。在美國(guó),由于更高的人力成本,數(shù)據(jù)標(biāo)注企業(yè)會(huì)通過(guò)技術(shù)角度,思考解決數(shù)據(jù)加工過(guò)程中的成本問(wèn)題。例如ScaleAI,該企業(yè)主要訓(xùn)練用來(lái)實(shí)現(xiàn)機(jī)器自動(dòng)標(biāo)注的人工智能,2022年,這家公司的估值已經(jīng)達(dá)到73億美元。 趙子健也想做和ScaleAI一樣的事,他首先面對(duì)的是人力的競(jìng)爭(zhēng)。“假設(shè)我的客戶想要降低30%的成本,他要么去找便宜30%的人,要么通過(guò)算法自動(dòng)化來(lái)替代”,趙子健說(shuō),“短期來(lái)看,肯定是第一種方式更容易。” 趙子健在2018年發(fā)現(xiàn)了有關(guān)數(shù)據(jù)標(biāo)注的需求。當(dāng)時(shí)他在浙江大學(xué)讀本科,了解到有實(shí)驗(yàn)室在做橋梁顏色的自動(dòng)識(shí)別項(xiàng)目。那個(gè)課題組里,七八個(gè)人標(biāo)注十萬(wàn)張圖,用了三個(gè)月才完工。于是他和朋友合伙成立了公司,從處理實(shí)驗(yàn)室的數(shù)據(jù)需求開(kāi)始,踏入了這個(gè)世界。 趙子健還接到過(guò)“智慧課堂”的項(xiàng)目。就是在課堂前方設(shè)置一個(gè)攝像頭,讓系統(tǒng)通過(guò)學(xué)生上課時(shí)的表情狀態(tài),分析其上課時(shí)的專(zhuān)注度。在他看來(lái),這確實(shí)是一項(xiàng)存在倫理爭(zhēng)議的項(xiàng)目,但是他也認(rèn)為,“如果做一個(gè)調(diào)查,我覺(jué)得至少有80%以上的家長(zhǎng)會(huì)愿意犧牲孩子在課堂上的隱私,讓他們提高五分的成績(jī)。” 在數(shù)據(jù)的世界,效率是第一位的。趙子健在等待一個(gè)機(jī)會(huì),那就是人工的成本降低到人們“無(wú)法忍受”的程度。他覺(jué)得,到那時(shí),可以大量替代人工的自動(dòng)標(biāo)注工具一定會(huì)迎來(lái)更多的市場(chǎng)機(jī)會(huì),數(shù)據(jù)標(biāo)注就會(huì)走上智能化自動(dòng)化的路線。“甲方不會(huì)管乙方是人工還是智能,只看你能降低多少成本。” 趙子健介紹,即便是自動(dòng)標(biāo)注系統(tǒng),同樣需要少量人力來(lái)實(shí)現(xiàn)一部分的標(biāo)注工作,但在這個(gè)系統(tǒng)中,標(biāo)注員更多是在輔助算法,實(shí)現(xiàn)更精準(zhǔn)的自動(dòng)標(biāo)注。并且,隨著標(biāo)注的數(shù)據(jù)越來(lái)越多,自動(dòng)標(biāo)注的精準(zhǔn)度也會(huì)越來(lái)越強(qiáng)。 在趙子健所預(yù)見(jiàn)的未來(lái)中,人眼所見(jiàn)的一切都將被數(shù)據(jù)化、智能化。他也沒(méi)接觸過(guò)公司那些外包的數(shù)據(jù)標(biāo)注員,更不會(huì)想到,像李亞洲一樣的標(biāo)注員們?nèi)绻惶娲麄儗?huì)何去何從。 這個(gè)問(wèn)題在商丘的產(chǎn)業(yè)園中得不到回答——大部分人不會(huì)想這個(gè)問(wèn)題,少部分人則覺(jué)得,自己是隨著AI技術(shù)浪潮狂飆的一員。薛再?gòu)?qiáng)的辦公室里掛著一道橫幅:“為人工智能創(chuàng)造最高效的數(shù)據(jù)而努力奮斗”。這句話是上家公司留下的,薛再?gòu)?qiáng)覺(jué)得寫(xiě)挺好,就沒(méi)摘。
報(bào)紙版面截圖。 |
掃一掃在手機(jī)打開(kāi)當(dāng)前頁(yè)
|
>>更多精彩圖集推薦 |
|