IBM“超人類語(yǔ)音識(shí)別”電腦2010年面世
2002/01/25
21世紀(jì)頭十年結(jié)束之前,生產(chǎn)出能夠自動(dòng)理解多達(dá)20門語(yǔ)言,并能識(shí)別這些語(yǔ)言的各種語(yǔ)調(diào)變化、口音及上下文環(huán)境的機(jī)器。該機(jī)器還能絲毫不差地轉(zhuǎn)錄法律、醫(yī)療和法庭證詞。這正是IBM把這項(xiàng)新計(jì)劃稱為“超人類語(yǔ)音識(shí)別”的原因所在。
該項(xiàng)目已于本年度啟動(dòng),計(jì)劃于2010年完成。IBM稱,已經(jīng)制定出了整個(gè)研制過程的階段性任務(wù),而總體目標(biāo)更加明確——使機(jī)器語(yǔ)音識(shí)別能力趕上并超越人類。很多年來(lái),PC機(jī)及其更加小巧的后續(xù)產(chǎn)品(PDA和手機(jī))就具備了聽說功能,但是用戶很少能夠充分利用這些功能,這是因?yàn)檫存在以下制約因素:
機(jī)器在理解口音、語(yǔ)調(diào)變化特別是談話的上下文環(huán)境方面還有困難,英語(yǔ)對(duì)于機(jī)器來(lái)說尤其困難。另外,機(jī)器尚無(wú)法有效處理背景噪音。除此之外,技術(shù)越復(fù)雜越需要大量的實(shí)驗(yàn)和調(diào)整,比如:通過反復(fù)聽同一段聲音,機(jī)器的識(shí)別能力將大為改善。
在過去的一段時(shí)間里,基于語(yǔ)音識(shí)別技術(shù)的產(chǎn)品在市場(chǎng)上取得了一定的進(jìn)展,被用于開展查號(hào)服務(wù),以及安裝在一些電子設(shè)備中,例如:移動(dòng)電話、PDA、汽車儀表盤以及交互式電視等。
IDC預(yù)計(jì),到2005年全球市場(chǎng)對(duì)電話語(yǔ)音處理設(shè)備的需求將達(dá)到35億美元,為此,IBM、AT&T、朗訊和飛利浦等許多大公司都在爭(zhēng)先恐后地進(jìn)行語(yǔ)音識(shí)別技術(shù)研究。IBM公司的100位全職語(yǔ)音識(shí)別研究人員中有20名正在專門投入此項(xiàng)研究課題之中。 他們正在著手進(jìn)行音頻-視頻識(shí)別研究,這涉及計(jì)算機(jī)視覺技術(shù)的開發(fā),以便改善語(yǔ)音識(shí)別的精確度。另一個(gè)研究重點(diǎn)是MALACH項(xiàng)目。在國(guó)家科學(xué)基金會(huì)的資助下,IBM正在和其他行業(yè)的研究人員并肩工作,試圖破解長(zhǎng)達(dá)10萬(wàn)小時(shí)的二戰(zhàn)納粹大屠殺幸存者的談話錄音,這些錄音內(nèi)容紛繁多變,充滿各種方言,感情起伏,語(yǔ)調(diào)跌宕,還夾雜著各種不同語(yǔ)言。
賽迪網(wǎng) 2002/01/25
IBM:CRM一體化推進(jìn)電信運(yùn)營(yíng)新格局 2009-06-30 |
IBM榮獲“2009中國(guó)最佳呼叫中心”大獎(jiǎng) 2009-05-22 |
3G時(shí)代來(lái)臨 IBM Lotus新服務(wù)幫客戶實(shí)現(xiàn)更智慧的運(yùn)作 2009-05-14 |
IBM推出BlackBerry平臺(tái)上的Lotus應(yīng)用軟件 2009-05-08 |
IBM“刀片”助印度電信削減IT成本 2009-02-26 |