首頁>>廠商>>交換機/ACD系統(tǒng)平臺廠商>>IBM>>語音產(chǎn)品ViaVoice

ViaVoice:半個世紀的求索

2001/10/10

您也許曾經(jīng)為科幻電影中出現(xiàn)的下列場景所吸引:機器人能聽懂和服從主人的命令,為其所用。雖然到今天,這樣的機器人還沒能成為現(xiàn)實,但是作為機器人的“耳朵”,語音識別技術(shù)卻在近幾年有了許多突破性的進展,從實驗室走進了我們的生活。目前被廣泛使用的IBM ViaVoice軟件便是其中最典型的代表。

從50年代初期開始,IBM公司就在尋求一種更加有效的與計算機系統(tǒng)交互的方式。幾年后,以此為目標的語音識別研究在IBM華生(Watson)研究中心進行。研究之初,IBM的科學家們需要一套十分龐大的機器,研究中心所有的高級計算機資源到了晚上全部被語音識別的訓練和計算所占用。面對比最初想象得多的巨大挑戰(zhàn),科學家們不得不把目標降低:只要計算機能聽懂有限的詞匯,或者只能聽懂某個人說話即可,不需要聽懂每一個人的話。但他們從來都沒有放棄。經(jīng)過不懈的努力,終于實現(xiàn)了一個個突破。

這些重要的突破中,將“隱馬爾科夫模型”引入語音識別領(lǐng)域,為語音模型的建立提供了基礎(chǔ);“n元統(tǒng)計語音模型”讓計算機學會了“學習”和“記憶”人們怎樣用詞;“快速匹配方法”的發(fā)明則顯著提高了大詞匯系統(tǒng)識別的速度。它們和其他不勝枚舉的發(fā)明一起,使語音識別技術(shù)走進我們的生活。IBM公司的許多科學家在這個領(lǐng)域長期不懈的努力和獲得的100多項專利,確定了公司技術(shù)上的領(lǐng)先地位。世界上許多研究機構(gòu)和公司的其他科學家,也為這一領(lǐng)域的發(fā)展做出了卓越的貢獻。

1997年IBM ViaVoice 4.0的誕生對于語音識別史意義重大。漢語具有同音字多、有聲調(diào)、口音復雜等特點,因此中文的語音識別技術(shù)被認為是“王冠上的明珠”。在跨越了連續(xù)語音、大量詞匯,以及非特定識別人等難關(guān)之后,IBM公司成功地推出了世界上第一個中文連續(xù)語音識別產(chǎn)品——IBM ViaVoice 4.0,它被認為是中文識別領(lǐng)域重要的里程碑。

經(jīng)過半個世紀的求索,如今IBM不僅已經(jīng)使機器聽懂人話成為現(xiàn)實,而且ViaVoice還具有語音查詢、語音上網(wǎng)、網(wǎng)上聊天等許多功能,使用起來更方便、識別的更準確。它讓人類的夢想實現(xiàn)得如此完美!

IBM供稿 CTI論壇編輯



相關(guān)鏈接:
ViaVoice語音上網(wǎng)新概念 2001-11-14
IBM ViaVoice更方便更健康 2001-11-14
語音識別重在應用 2001-11-14
IBM ViaVoice Telephony——完善的中文電話語音技術(shù) 2001-11-14
CRM中的IBM語音技術(shù) 2001-10-10