2006/07/20
3 歲的小孩在語音識別方面就非常老練了。另一方面,在經(jīng)過30年的發(fā)展后,計算機在語音識別方面的表現(xiàn)仍然不盡如人意。由于相關廠商在語音識別軟件方面所取得的進展,以及它們?yōu)闋帄Z面向手機和汽車的語音命令市場而進行的競爭,這種情況可能會有所改變。
本周二,Nuance Communications 發(fā)布了其新版PC語音識別軟件━━Dragon NaturallySpeaking 9.0. 與8.0 版本相比,新版本的語音識別準確率提高了20% ,這意味著它的識別準確率能夠達到99% ,殘疾人可以用語音“指揮”他們的PC。
Nuance的工程師還為用戶使用他們的軟件提供了一條捷徑,使用戶無須經(jīng)過對軟件進行長時間的訓練就能夠使用它,軟件會在使用的過程中進行自我訓練。
Nuance負責產(chǎn)品管理的主管瑪特說,三、四年前曾經(jīng)試用過我們產(chǎn)品的用戶會發(fā)現(xiàn),新版軟件有了相當大的進步。它能夠“自學”。
微軟正在測試其語音識別技術,并計劃在Vista 中捆綁該技術。與Nuance一樣,微軟也一直在提高語音識別技術的準確率,使它能夠根據(jù)上下文環(huán)境區(qū)分“beach”和“peach”。
微軟還在改進其技術的用戶界面,使普通用戶能夠更方便地讓軟件修正出現(xiàn)的錯誤,或切換應用軟件。微軟的軟件架構師羅勃說,語音識別技術正在日益成熟,準確率正在以指數(shù)速度提高。
語音識別在計算機領域是個難題。例如,外部噪音會干擾語音識別軟件對用戶語音的接收,造成它不能正確地理解用戶的語音。
另一個障礙是各個用戶的語音有很大差別。語音識別軟件必須掌握各個用戶語音模式間的細微差別,才能夠達到最高的準確率。
語音識別技術的下一次飛躍將出現(xiàn)在手機市場上。黑莓等手掌式產(chǎn)品使用戶能夠口授一封電子郵件而無須使用“迷你”鍵盤輸入文字。
語音識別技術還使汽車駕駛人員在手握方向盤的同時更好地控制空調(diào)設備。瑪特表示,Nuance正在與各大手機運營商和手機廠商進行相關談判。
微軟也瞄上了這一市場。羅勃表示,他相信計算機的語音識別能力終有一天會超過人。計算機的數(shù)字運算能力已經(jīng)超過了人。
CNET科技資訊網(wǎng)