談?wù)Z音識(shí)別技術(shù)的產(chǎn)業(yè)化
王作英
2002/10/14
語(yǔ)音識(shí)別,是一項(xiàng)已經(jīng)被科學(xué)界關(guān)注了幾十年的技術(shù)。雖然現(xiàn)在已經(jīng)沒(méi)有人否認(rèn)語(yǔ)音識(shí)別技術(shù)廣闊的應(yīng)用前景和深遠(yuǎn)的社會(huì)意義,工業(yè)界也一再對(duì)其前景表示看好,但是語(yǔ)音識(shí)別能不能就此成功邁出產(chǎn)業(yè)化的步伐,能不能真正走入人們的日常生活得到普遍的應(yīng)用,這仍然是一個(gè)疑問(wèn)。
本人認(rèn)為,一項(xiàng)技術(shù)能不能得到普及,能不能被市場(chǎng)所接受,最關(guān)鍵的有三點(diǎn):一是這項(xiàng)技術(shù)能不能給人們帶來(lái)價(jià)值,即它是否能給人們帶來(lái)便利,解決困難,提高效率;或者是改善生活,增加樂(lè)趣。從這一點(diǎn)來(lái)說(shuō),語(yǔ)音識(shí)別技術(shù)的價(jià)值是驚人的。語(yǔ)音作為人們最自然的交流方式,是最理想的下一代人機(jī)界面。它的使用,將是人類的生活方式的一次革命。
第二是技術(shù)的實(shí)用性和成熟性。不必諱言,現(xiàn)在的語(yǔ)音識(shí)別技術(shù)確實(shí)并不完美,還有很多問(wèn)題亟待解決,例如對(duì)環(huán)境的適應(yīng)性和對(duì)語(yǔ)言的理解等。不過(guò),在很多實(shí)際應(yīng)用中,目前的語(yǔ)音識(shí)別技術(shù)已經(jīng)足以發(fā)揮作用。例如專用領(lǐng)域的語(yǔ)音輸入、無(wú)線互聯(lián)移動(dòng)終端的語(yǔ)音控制和語(yǔ)音查詢、各種軟件的語(yǔ)音控制、呼叫中心的自動(dòng)語(yǔ)音應(yīng)答等。我們必須認(rèn)識(shí)到,沒(méi)有一項(xiàng)技術(shù)在被投入市場(chǎng)時(shí)就已經(jīng)是完善的了,市場(chǎng)的培育、應(yīng)用的需求、用戶的反饋是技術(shù)廣泛普及的必經(jīng)之路。因此,尋找語(yǔ)音識(shí)別技術(shù)與實(shí)際需求最佳的結(jié)合點(diǎn),找到最合適的語(yǔ)音識(shí)別應(yīng)用,是語(yǔ)音識(shí)別技術(shù)產(chǎn)業(yè)化的關(guān)鍵。
第三是產(chǎn)品的性價(jià)比。那些價(jià)格很高但作用很小的產(chǎn)品是不會(huì)受到用戶青睞的。由于IT產(chǎn)業(yè)的高速發(fā)展,硬件設(shè)備的成本不斷降低,而提供的資源卻不斷提高。摩爾定律依然在發(fā)揮著作用,并且這種趨勢(shì)還會(huì)繼續(xù)保持下去,這就為語(yǔ)音識(shí)別技術(shù)的實(shí)現(xiàn)提供了很好的平臺(tái)和條件。這也使語(yǔ)音識(shí)別產(chǎn)品能夠擁有較好的產(chǎn)品性價(jià)比。
語(yǔ)音技術(shù)對(duì)于用戶,將會(huì)成為人機(jī)交互的界面;對(duì)于產(chǎn)業(yè),將會(huì)成為標(biāo)準(zhǔn)平臺(tái);對(duì)于運(yùn)營(yíng),將會(huì)成為增值服務(wù)。當(dāng)然,這種多贏局面的形成,有賴于技術(shù)提供商、設(shè)備制造商和服務(wù)運(yùn)營(yíng)商的共同努力。我們相信,語(yǔ)音時(shí)代的序幕已經(jīng)拉開(kāi),語(yǔ)音技術(shù)產(chǎn)業(yè)化將勢(shì)不可擋。
賽迪網(wǎng) 中國(guó)信息化(industry.ccidnet.com)