語音識別技術(shù)——電子商務(wù)的 “推進(jìn)器”
張欣 2001/06/29
“Speech Technology is The Next Big Thing in Computing。ㄕZ音技術(shù)是計算機(jī)行業(yè)的下一個重點)”這句曾經(jīng)出現(xiàn)在美國《商務(wù)周刊》封面上的論點,給記者留下了十分深刻的印象。從目前的技術(shù)來看,要使高科技的IT產(chǎn)業(yè)真正走向大眾生活,充分利用語音技術(shù)、將語音技術(shù)與數(shù)據(jù)技術(shù)結(jié)合是必然趨勢。言豐科技的梁康忠博士說:“語音技術(shù)是當(dāng)今迅猛發(fā)展的電子商務(wù)經(jīng)濟(jì)最重要的‘推進(jìn)器’之一,該市場正在迅速成長,且發(fā)展勢頭良好!庇袊獾姆治黾翌A(yù)測,從2000年到2005年,語音技術(shù)市場將以每年31%的速度持續(xù)增長。語音技術(shù)市場的迅速擴(kuò)展,意味著我們正面臨著大量部署語音應(yīng)用的轉(zhuǎn)折期。
提到語音技術(shù),更應(yīng)該強(qiáng)調(diào)語音識別技術(shù)。因為只有系統(tǒng)能夠自動識別語音內(nèi)容,才能真正實現(xiàn)全程智能化、自動化。同時,只有當(dāng)大家真正認(rèn)識到語音識別技術(shù)在通信系統(tǒng)中所起到的核心作用時,才標(biāo)志著語音應(yīng)用進(jìn)入到了一個新的階段。
以往,我們都比較熟悉IBM的ViaVoice等個人識別軟件,但真正帶來最大利潤的還是企業(yè)級語音識別軟件。企業(yè)級語音識別軟件往往可被擴(kuò)展為一個平臺,集信息查詢、信息點播、交易處理、統(tǒng)一消息四大功能模塊于一體,很多人稱之為語音門戶。目前,常見的語音解決方案的供應(yīng)商主要是IBM、Nuance、SpeechWorks、Philips,以及香港言豐科技。
在很多人對實現(xiàn)語音功能頗為撓頭的時候,言豐科技高級系統(tǒng)開發(fā)經(jīng)理周魯生卻說:“語音識別技術(shù)的門檻其實不高!闭Z音識別技術(shù)需要對語言規(guī)律的高度理解,因此,對于漢語識別系統(tǒng),中國的公司在核心模塊二進(jìn)制級別對漢語的雙字節(jié)處理上要具有很多優(yōu)勢。并且,源語音采集庫的規(guī)模直接決定語音識別的范圍和精確性,中國公司在這方面要大大占先。
現(xiàn)在,很多語音技術(shù)大多如此:先跟著指導(dǎo)練習(xí)一段時間,相當(dāng)于與系統(tǒng)的“磨合”,然后再根據(jù)系統(tǒng)的提示,在“嘀”聲后開始說話,一問一答地完成此過程。語音識別的難度在于突破這種傳統(tǒng)的非人性化、非靈活性的語音環(huán)境,實現(xiàn)一些新功能,包括:說話者可以隨時開口,而相應(yīng)系統(tǒng)隨時都可覺察并錄制、識別;說話者可以多種方言甚至多種語種輸入,而系統(tǒng)能夠識別出來;說話者在噪音非常大(甚至與說話者音量相當(dāng))的環(huán)境中說話,系統(tǒng)能識別出來等。言豐科技的語音識別系統(tǒng)目前已經(jīng)能實現(xiàn)這些功能,人工智能會話斷插(barge-in)、多語音混合識別和回聲消除等,已使語音識別技術(shù)正在進(jìn)一步獲得突破。
梁博士認(rèn)為,語音識別只是一種技術(shù)手段,它的應(yīng)用不能脫離應(yīng)用主體去單獨實施,否則,語音技術(shù)開發(fā)者就不可能承接好各種應(yīng)用項目。因此,在推動企業(yè)應(yīng)用語音系統(tǒng)開展商務(wù)活動和進(jìn)行內(nèi)外部管理的時候,必須讓集成商介入這個領(lǐng)域。而且,由于舊有的語音應(yīng)用還處于一個比較低級的階段,技術(shù)上的突破將會給這個領(lǐng)域帶來重新洗牌的機(jī)會。
摘自《中國計算機(jī)報》
語音開拓應(yīng)用最重要 2001-06-25 |
語音應(yīng)用開財源 2001-06-25 |
語音技術(shù):走出實驗室的革命 2001-06-21 |
炎黃新星與新華世紀(jì)聯(lián)手推出《新華音霸KingVoice 1.0》 2001-06-08 |
統(tǒng)一消息平臺中的語音技術(shù) 2001-06-04 |