憑心而論,語(yǔ)音識(shí)別是一項(xiàng)復(fù)雜的技術(shù),特別對(duì)于漢語(yǔ)語(yǔ)音識(shí)別尤其如此。因此,盡管多年前就有眾多公司和研究機(jī)構(gòu)開始了語(yǔ)音技術(shù),包括語(yǔ)音識(shí)別和語(yǔ)音合成技術(shù)的研究,但直到最近一兩年,在國(guó)內(nèi)應(yīng)該說(shuō)是今年,才開始有規(guī)模的商用。
■用戶的獨(dú)立性
所謂用戶的獨(dú)立性,就是語(yǔ)音識(shí)別軟件能夠識(shí)別有不同嗓音和口音的用戶,而無(wú)需通過(guò)訓(xùn)練軟件來(lái)使其識(shí)別一個(gè)特殊用戶的聲音。目前的許多語(yǔ)音識(shí)別軟件,是基于標(biāo)準(zhǔn)的發(fā)音來(lái)進(jìn)行識(shí)別的。而實(shí)際上,人們說(shuō)話千差萬(wàn)別,發(fā)音也各不相同,特別對(duì)于有口音的語(yǔ)音來(lái)說(shuō),更是對(duì)語(yǔ)音識(shí)別軟件提出了嚴(yán)峻的挑戰(zhàn)。目前的語(yǔ)音識(shí)別軟件大部分是通過(guò)自學(xué)習(xí)功能,不斷的訓(xùn)練來(lái)達(dá)到軟件對(duì)于特定用戶語(yǔ)音的識(shí)別。
■自然的語(yǔ)言能力
許多語(yǔ)音識(shí)別系統(tǒng)還具有自然的語(yǔ)言能力,這就是軟件理解講話者的能力。這種能力不僅表現(xiàn)在特定的單詞上,甚至還表現(xiàn)在短語(yǔ)和完整的句子上。自然的語(yǔ)言意味著兩點(diǎn):第一,它可讓用戶用句子來(lái)表達(dá)意思。例如,為表達(dá)checking account,用戶可使用有更多單詞的自然句子,如I'd like my checking account balance。 第二指用戶可使用包含多義詞的句子。例如,我們可說(shuō)I want to transfer $500 dollars from my savings account to my checking account。這是自然語(yǔ)言的一個(gè)主要準(zhǔn)則,用戶可在一個(gè)單句中使用多個(gè)多義詞。
■處理插入的能力
新增的插入的能力是語(yǔ)音識(shí)別軟件的另一個(gè)主要進(jìn)步。插入的能力允許用戶在系統(tǒng)提示時(shí)中斷系統(tǒng),但系統(tǒng)依然能知道用戶的請(qǐng)求。
■軟件身份驗(yàn)證的能力
語(yǔ)音識(shí)別銷售商最近還介紹了軟件身份驗(yàn)證的能力,即根據(jù)用戶的嗓音和語(yǔ)言特點(diǎn),來(lái)達(dá)到識(shí)別用戶的能力。這在實(shí)際中是一個(gè)非常有價(jià)值的特點(diǎn),如可用于人事管理上。
《賽迪市場(chǎng)專家》 2000/12/07