這是繼今年6月任小楓入職后,iDST迎來(lái)的又一位大牛級(jí)人物。
馮津偉曾就讀國(guó)內(nèi)聲學(xué)研究機(jī)構(gòu)南京大聲學(xué)研究所,師從音頻聲學(xué)泰斗沙家正先生,并與導(dǎo)師一起研制出了全球第一臺(tái)揚(yáng)聲器紙盆共振頻率的自動(dòng)測(cè)試系統(tǒng),極大地幫助了國(guó)內(nèi)的電聲行業(yè)提高生產(chǎn)效率。馮津偉博士畢業(yè)于在主動(dòng)降噪領(lǐng)域著名的弗吉尼亞理工大學(xué)VAL實(shí)驗(yàn)室。
Polycom是語(yǔ)音和視頻協(xié)作解決方案領(lǐng)域的全球領(lǐng)導(dǎo)者,占全球視頻會(huì)議市場(chǎng)份額第一。馮津偉曾在Polycom工作17年,擁有十余項(xiàng)美國(guó)專(zhuān)利,大部分已產(chǎn)品化,是名聲在外的世界級(jí)音頻專(zhuān)家。他曾主持開(kāi)發(fā)基于麥克風(fēng)陣列的視頻跟蹤系統(tǒng),即在多人視頻會(huì)議時(shí),攝像頭能基于方位和距離,精準(zhǔn)定位發(fā)言人,產(chǎn)品創(chuàng)新性引業(yè)內(nèi)效仿。
阿里巴巴iDST語(yǔ)音團(tuán)隊(duì)負(fù)責(zé)人鄢志杰表示:
馮博士的入職,是物理學(xué)和互聯(lián)網(wǎng)間的‘跨界’。阿里嚴(yán)肅看待智能語(yǔ)音交互技術(shù)全鏈路,逐步組建世界級(jí)專(zhuān)家團(tuán)隊(duì)。從源頭和信號(hào)采集開(kāi)始,在端上做突破性的智能語(yǔ)音交互體驗(yàn)。
此前,iDST語(yǔ)音團(tuán)隊(duì)的技術(shù)成果已通過(guò)阿里云人工智能ET等對(duì)外輸出,在法庭庭審識(shí)別、智能客服、視頻審核和實(shí)時(shí)字幕轉(zhuǎn)寫(xiě)、聲紋驗(yàn)證、物聯(lián)網(wǎng)等多個(gè)場(chǎng)景成功應(yīng)用。全國(guó)有近300家法院和超過(guò)6000家法庭在使用ET,每年有超過(guò)1.2億次客服電話由ET協(xié)助人類(lèi)接聽(tīng)。
在語(yǔ)音交互產(chǎn)品方面,阿里iDST研究的技術(shù)平臺(tái)能夠精準(zhǔn)轉(zhuǎn)換用戶的語(yǔ)音為對(duì)互聯(lián)網(wǎng)內(nèi)容和服務(wù)的意圖,觸達(dá)手機(jī)、IoT設(shè)備、互聯(lián)網(wǎng)汽車(chē)、電視、智能音箱等各類(lèi)終端,如與斑馬網(wǎng)絡(luò)、上汽合作的的榮威互聯(lián)網(wǎng)汽車(chē)、與海爾合作的人工智能電視等。
馮津偉入職后將依托其在聲學(xué)與信號(hào)處理領(lǐng)域的背景,主持領(lǐng)導(dǎo)語(yǔ)音交互設(shè)備端的研究工作。聲學(xué)是物理學(xué)分支學(xué)科之一,研究媒質(zhì)中機(jī)械波的產(chǎn)生、傳播、接收和效應(yīng)。以時(shí)下最熱門(mén)的智能音箱為例,如何選擇麥克風(fēng)的材質(zhì)、擺放位置、結(jié)構(gòu),就是聲學(xué)設(shè)計(jì)要解決的問(wèn)題。
關(guān)于加入阿里巴巴,馮津偉認(rèn)為是一次全新的機(jī)會(huì)。他表示,過(guò)去自己的專(zhuān)業(yè)知識(shí)基本用于會(huì)議模式,而未來(lái)阿里豐富的智能交互場(chǎng)景將為聲學(xué)設(shè)計(jì)與信號(hào)處理的發(fā)展提供寶貴的實(shí)戰(zhàn)經(jīng)驗(yàn)。
馮津偉的研究方向?yàn)?ldquo;下一代人機(jī)自然交互技術(shù)”,該領(lǐng)域已經(jīng)得到阿里巴巴重點(diǎn)投入,此前成立的“達(dá)摩院”就包含這一研究領(lǐng)域。
阿里巴巴iDST透露,馮津偉已參與一秘密項(xiàng)目開(kāi)發(fā),項(xiàng)目在全球沒(méi)有先例。
速記員
阿里云的人工智能ET在綜合了iDST的語(yǔ)音能力后已在全國(guó)近300家法院和超過(guò)6000家法庭承擔(dān)起“書(shū)記員”的角色,在現(xiàn)場(chǎng)做同步的庭審記錄,且在試點(diǎn)中準(zhǔn)確率高達(dá)96.%。而此前ET曾憑準(zhǔn)確率0.67%的微弱優(yōu)勢(shì)戰(zhàn)勝第50屆國(guó)際速聯(lián)速記大賽全球速記亞軍姜毅。
智能客服
阿里云還推出了智能語(yǔ)音客服機(jī)器人“云小蜜”,它支持中文英文會(huì)話,可以7*24小時(shí)在線工作。目前,已覆蓋阿里巴巴生態(tài)圈二十余個(gè)業(yè)務(wù)線,每天服務(wù)600萬(wàn)客戶,問(wèn)題解決率達(dá)到95%。每年有超過(guò)1.2億次客服電話由ET協(xié)助人類(lèi)接聽(tīng)。
智能音箱
今年雙11,阿里人工智能實(shí)驗(yàn)室的首個(gè)智能語(yǔ)音終端——天貓精靈,創(chuàng)造了破100萬(wàn)臺(tái)的驚人銷(xiāo)量,其強(qiáng)大的聲紋識(shí)別能力正來(lái)源于過(guò)往阿里在語(yǔ)音技術(shù)上的積累。
互聯(lián)網(wǎng)汽車(chē)
上汽與阿里耗資十億打造榮威i6互聯(lián)網(wǎng)汽車(chē)也在智能語(yǔ)音交互上有亮眼表現(xiàn),通過(guò)斑馬智行App,駕駛員可以通過(guò)語(yǔ)音指令實(shí)現(xiàn)車(chē)輛的語(yǔ)音控制、智能導(dǎo)航、娛樂(lè)影音的選擇保證了車(chē)輛的動(dòng)態(tài)安全。同時(shí)如果車(chē)內(nèi)溫度過(guò)高或者過(guò)低,通過(guò)喚醒語(yǔ)音交互界面之后,僅需說(shuō)出“太冷”、“太熱”系統(tǒng)就可以識(shí)別用戶的需求從而做出相應(yīng)的反饋。