這些人工智能成果"翩翩起舞"的背后,不得不提到“數(shù)據(jù)”為AI落地提供的底層支撐與價(jià)值。AI數(shù)據(jù)采集標(biāo)注是人工智能三大構(gòu)成要素之一——“數(shù)據(jù)”的處理環(huán)節(jié),它隨著AI產(chǎn)業(yè)需求發(fā)展進(jìn)行著快速發(fā)展,目前處于規(guī)范化成長(zhǎng)的階段。
近日,《互聯(lián)網(wǎng)周刊》&eNet研究院、德本咨詢聯(lián)合發(fā)布了《2021數(shù)據(jù)標(biāo)注公司排行》,又一次將AI數(shù)據(jù)服務(wù)產(chǎn)業(yè)推到了人們眼前。我們通過(guò)剖析本次排行榜TOP1服務(wù)商——云測(cè)數(shù)據(jù),來(lái)了解AI數(shù)據(jù)服務(wù)產(chǎn)業(yè)的發(fā)展脈絡(luò)及未來(lái)趨勢(shì)。
據(jù)《2020年中國(guó)AI數(shù)據(jù)服務(wù)行業(yè)研究報(bào)告》預(yù)測(cè),中國(guó)AI數(shù)據(jù)服務(wù)行業(yè)正在加強(qiáng)專(zhuān)業(yè)化發(fā)展,隨著人工智能產(chǎn)業(yè)落地需求升級(jí),理念更先進(jìn)、技術(shù)更硬核、效率度極高的專(zhuān)業(yè)AI數(shù)據(jù)服務(wù)企業(yè)將成為主流趨勢(shì)。
云測(cè)數(shù)據(jù)作為T(mén)estin云測(cè)旗下AI數(shù)據(jù)采集標(biāo)注的一個(gè)業(yè)務(wù)品牌,以高質(zhì)量、場(chǎng)景化的AI數(shù)據(jù)服務(wù)而出名,擁有行業(yè)首創(chuàng)的數(shù)據(jù)場(chǎng)景實(shí)驗(yàn)室和自建數(shù)據(jù)標(biāo)注基地,為智能駕駛、智慧城市、新零售等眾多領(lǐng)域提供高質(zhì)量的數(shù)據(jù)采集、數(shù)據(jù)標(biāo)注服務(wù)。
首先,在雄厚實(shí)力的加持下,云測(cè)數(shù)據(jù)在人工智能所需要的視覺(jué)、語(yǔ)音和文本三大數(shù)據(jù)類(lèi)型上實(shí)現(xiàn)了更高精確度的支持。在2020年的中國(guó)創(chuàng)新創(chuàng)業(yè)成果交易會(huì)上,云測(cè)數(shù)據(jù)正式向業(yè)界發(fā)布了他們?cè)贏I領(lǐng)域的最新成果——AI數(shù)據(jù)項(xiàng)目的最高交付精準(zhǔn)度已近提升至99.99%。這個(gè)數(shù)字標(biāo)志著,“數(shù)據(jù)”作為人工智能三大基石之一,已近邁入了高品質(zhì)時(shí)代。從此,云測(cè)數(shù)據(jù)在行業(yè)內(nèi)外也就成了高質(zhì)量AI數(shù)據(jù)的代名詞。
以視覺(jué)類(lèi)型的數(shù)據(jù)為例,云測(cè)數(shù)據(jù)的標(biāo)注精度可以完成多高呢? 據(jù)云測(cè)數(shù)據(jù)總經(jīng)理在某次采訪時(shí)透露,“一張人臉需要你準(zhǔn)確地在內(nèi)眼角上標(biāo)注人臉關(guān)鍵點(diǎn),在圖片上,內(nèi)眼角也就不到100像素,而任務(wù)還會(huì)到標(biāo)注到具體哪個(gè)像素上。”
其實(shí),高精度的數(shù)據(jù)標(biāo)注僅僅是AI需求復(fù)雜度上升的后半程的要求,人工智能對(duì)數(shù)據(jù)高質(zhì)量的需求同樣體現(xiàn)在數(shù)據(jù)場(chǎng)景化的采集上。,隨著人工智能技術(shù)的不斷成熟,更多的場(chǎng)景和行業(yè)開(kāi)始嵌入使用人工智能技術(shù),AI行業(yè)應(yīng)用場(chǎng)景逐漸趨于長(zhǎng)尾和碎片化,產(chǎn)生了大量新興垂直領(lǐng)域的數(shù)據(jù)需求,如疫情期間的口罩識(shí)別應(yīng)用等。
為了進(jìn)一步攻克場(chǎng)景化數(shù)據(jù)這一難題, 云測(cè)數(shù)據(jù)開(kāi)創(chuàng)“數(shù)據(jù)場(chǎng)景實(shí)驗(yàn)室”,成為行業(yè)內(nèi)第一個(gè)規(guī)范化進(jìn)行場(chǎng)景化數(shù)據(jù)生產(chǎn)的數(shù)據(jù)服務(wù)商。如為了進(jìn)行多角度多姿態(tài)的采集任務(wù),云測(cè)數(shù)據(jù)專(zhuān)門(mén)在橫店設(shè)置了“數(shù)據(jù)場(chǎng)景實(shí)驗(yàn)室”,進(jìn)行特定動(dòng)作和表情的捕捉。據(jù)了解,云測(cè)數(shù)據(jù)也是目前唯一聘請(qǐng)群眾演員進(jìn)行人工智能數(shù)據(jù)采集的公司。
如在音頻領(lǐng)域,為保證音頻數(shù)據(jù)采集的質(zhì)量,云測(cè)數(shù)據(jù)開(kāi)發(fā)了“音頻檢測(cè)”功能,通過(guò)對(duì)音頻的底噪和能量值進(jìn)行檢測(cè),來(lái)保證底噪和能量值在閾值范圍之內(nèi)。這種預(yù)處理方式可大幅提升數(shù)據(jù)的采集質(zhì)量并切實(shí)提升數(shù)據(jù)采集的效率。
人工智能越深入發(fā)展,數(shù)據(jù)資產(chǎn)的重要性就越高,尤其是AI數(shù)據(jù)更加立體和豐富、精準(zhǔn)度到達(dá)一個(gè)新的高度后,AI數(shù)據(jù)的價(jià)值變得更高,數(shù)據(jù)安全就更加成為客戶企業(yè)的剛需。對(duì)數(shù)據(jù)隱私安全的重視,導(dǎo)致不少數(shù)據(jù)標(biāo)注企業(yè)至少在數(shù)據(jù)安全維護(hù)方面擁有可圈可點(diǎn)的技術(shù)耕耘,甚至不輸于其他被打上技術(shù)公司標(biāo)簽的巨頭。
一個(gè)現(xiàn)實(shí)是,像云測(cè)數(shù)據(jù)這樣的頭部企業(yè),數(shù)據(jù)精準(zhǔn)度、場(chǎng)景化做得越好,就更看重?cái)?shù)據(jù)隱私安全的保護(hù)。這些對(duì)數(shù)據(jù)安全的重視,是其實(shí)現(xiàn)高效的作業(yè)效率,甚至不斷引導(dǎo)行業(yè)的規(guī)范化發(fā)展的前提原則。據(jù)了解,除了流程和工作方式的嚴(yán)格控制,云測(cè)數(shù)據(jù)內(nèi)部還開(kāi)發(fā)了數(shù)據(jù)隔離、質(zhì)量保障等一系列數(shù)據(jù)安全方面的技術(shù),這也使得數(shù)據(jù)標(biāo)注企業(yè)的“技術(shù)”標(biāo)簽更加濃厚。
Testin云測(cè)CMO張鵬飛也強(qiáng)調(diào),“從目前看來(lái),AI數(shù)據(jù)行業(yè)關(guān)于安全、隱私等方面并沒(méi)有統(tǒng)一的標(biāo)準(zhǔn)。但從我們長(zhǎng)遠(yuǎn)角度出發(fā),一直在隱私和安全防護(hù)角度下大力氣服務(wù)行業(yè)、樹(shù)立數(shù)據(jù)質(zhì)量標(biāo)桿,只有以這種負(fù)責(zé)的態(tài)度來(lái)服務(wù)客戶,我們的行業(yè)才能‘良幣驅(qū)除劣幣’,真正讓人工智能成為新一輪技術(shù)革命,改變整個(gè)社會(huì)和人類(lèi)進(jìn)程”。
當(dāng)前,行業(yè)頭部企業(yè)將數(shù)據(jù)質(zhì)量提升到一個(gè)“頂尖”時(shí),馬太效應(yīng)將愈發(fā)突出,企業(yè)間差異化趨勢(shì)愈發(fā)明顯。對(duì)于人工智能相關(guān)的企業(yè)來(lái)說(shuō),AI數(shù)據(jù)是否優(yōu)質(zhì)關(guān)乎著企業(yè)效率、用戶感受、價(jià)值回報(bào)等等,這也是以云測(cè)數(shù)據(jù)為代表的AI數(shù)據(jù)服務(wù)商們需要共同發(fā)展一起解決的問(wèn)題。