Acapela:人人能企及 玩轉(zhuǎn)TTS
2012/02/21
信息的世界,聲音接收更有效
信息化的時代拼的是接收信息的效率。為了接收更多的信息,我們開始嘗試各種信息處理的方式,我們開始嘗試創(chuàng)造信息、接受信息和傳遞信息同步。耳朵的功能越來越強(qiáng)大,要?dú)w功于IT技術(shù)為我們提供了新的接收信息的方式。而當(dāng)人們習(xí)慣了聽聲音而不是看文字的時候,卻可能意識不到,在我們生活的很多方面都靠的是一個技術(shù)——語音合成技術(shù)(Text To Speech)
TTS技術(shù)應(yīng)用之廣泛你或許沒有意識到。但是,當(dāng)你開啟汽車上的導(dǎo)航,導(dǎo)航中溫柔的女聲為你指路,這就是TTS;當(dāng)你打開電子詞典按下讀音,詞典用標(biāo)準(zhǔn)的聲音告訴你單詞的發(fā)音,這是TTS;當(dāng)你在故宮旅游考慮用電子導(dǎo)游為你介紹各個景點(diǎn),這是TTS;當(dāng)你要從ATM機(jī)里取現(xiàn)金,機(jī)器告訴你操作的每一步,這是TTS;還有你大學(xué)課堂中的交互式英語,你的寶寶的語音讀物……這么一說,TTS無所不在,生活不自覺地被改變。
談起TTS對生活的改變, 世界領(lǐng)先的語音專家Acapela的CEO Antoine Kauffeisen頗有感想:“TTS技術(shù)在全球范圍內(nèi)改變著人們的生活,便利生活的方方面面。語音解決方案的廣泛應(yīng)用也在改變著人們?nèi)粘I钪蝎@取信息的方式。語音為我們帶來了更好的溝通,更有效的學(xué)習(xí),更大程度上的分享,更便利的駕駛以及對熱點(diǎn)新聞更及時的追蹤!盇capela是一家20多年來專注于TTS技術(shù)的IT公司,致力于創(chuàng)造高質(zhì)量的語音效果。通常,對于語音的品質(zhì)好壞的鑒定標(biāo)準(zhǔn)是在于由機(jī)器發(fā)出的聲音能不能很好地清楚連貫準(zhǔn)確地表達(dá)文字所要表達(dá)的內(nèi)容,更有是能不能精確傳達(dá)出文字所表現(xiàn)的情緒與情感,通俗來說是指接近人聲的程度。這也是語音技術(shù)需要創(chuàng)新突破的關(guān)卡。Acapela雖擁有30多種不同語言以及60種不同語音,但仍然不斷在提高語音的質(zhì)量方面努力創(chuàng)新,通過廣泛多樣的的解決方案,使得語音能夠表達(dá)出真情實感,從而產(chǎn)生更加愉悅的語音效果。Acapela 對于每一個字符、每一種口音和發(fā)音的習(xí)慣進(jìn)行研究,創(chuàng)造出的語音能夠從每一點(diǎn)來說都是可識別的。
認(rèn)識TTS
TTS所用的關(guān)鍵技術(shù)就是語音合成(SpeechSynthesis)。早期的TTS一般采用專用的芯片實現(xiàn)。而現(xiàn)在的TTS一般都用軟件實現(xiàn),主要包括文本分析、語音合成和韻律處理幾部分。文本分析指的是對輸入文本進(jìn)行語言學(xué)分析,包括文本的斷句、字詞切分、多音字的處理、數(shù)字的處理、縮略語的處理等。語音合成是把處理好的文本所對應(yīng)的單字或短語從語音合成庫中提取,把語言學(xué)描述轉(zhuǎn)化成言語波形。韻律處理旨在提高合成語音的質(zhì)量,一般從清晰度、自然度和連貫性這幾個維度評估。
要合成出高質(zhì)量的語音,采用的計算一定是極其復(fù)雜的。 Acapela擁有來自各國的專家和研究人員的研發(fā)團(tuán)隊,他們與世界各地的大學(xué)緊密合作。為了復(fù)制出每種語言最自然的聲音,開發(fā)者對每個可能出現(xiàn)的聲音文本(詩歌,政治新聞,體育運(yùn)動,證券交易所更新等等)做了記錄。這些記錄然后被記錄下來并且被儲存到一個音響數(shù)據(jù)庫。在數(shù)據(jù)庫創(chuàng)建期間,對所有錄制的語音會作以下的劃分:雙連音,音節(jié),語素,詞,短語和句子。為了復(fù)制文本的文字,語音合成系統(tǒng)開始開展一個復(fù)雜的語言分析,將文本文字轉(zhuǎn)換成語音文字。根據(jù)語法和句法分析,我們使系統(tǒng)定義如何發(fā)音每個單詞,以重建意義,這是韻律處理,由此給出一個句子的節(jié)奏和語調(diào)。最后,系統(tǒng)會產(chǎn)生與信息關(guān)聯(lián)的語調(diào)和發(fā)音。這就是連鎖分析,總之聲音會在數(shù)據(jù)庫中選擇最佳的發(fā)聲單位來產(chǎn)生的。
Acapela的研發(fā)人員積極推陳出新,不斷創(chuàng)造出更多帶有感情色彩的聲音,力求能準(zhǔn)確表達(dá)出自然的聲音和真實的情感。精英團(tuán)隊出精品,Acapela是唯一一家通過ISO9001:2000認(rèn)證的語音公司。
人人能企及,玩轉(zhuǎn)TTS
最初開發(fā)語音方案是為了使有視覺障礙人能夠閱讀書面信息,而現(xiàn)在的應(yīng)用范圍已經(jīng)瘋狂擴(kuò)大,不僅成為在應(yīng)用里的一個標(biāo)準(zhǔn)元件,服務(wù)于用戶的語音界面,而且廣泛地運(yùn)用于日常生活的各個方面,改變著我們原本無聲的生活。
這是科技改變生活的力量,科技雖高,但是也不是不能企及。TTS的技術(shù)在娛樂和社交領(lǐng)域也能發(fā)揮作用,讓普通人也能玩轉(zhuǎn)TTS。Acapela.tv的talking Card就是對TTS技術(shù)最簡單最直白的呈現(xiàn)。選定一張賀卡,輸入文本,自動生成的Flash賀卡就是講文字讀出來,發(fā)送給朋友和親人問候,不僅別致,還是我們參與其中的科技成果。Acapela Box 更是人性化的小應(yīng)用。在對話框里輸入文字,立刻能轉(zhuǎn)化為音頻輸出,選擇合適的音頻格式導(dǎo)入播放器,就能夠隨時隨地聽。這樣的小應(yīng)用,改變的是閱讀方式:地鐵上捧著Ipad閱讀電子書的人們已經(jīng)out,播放器里讀出的能讓眼睛得到休息;考試復(fù)習(xí)來不及,政治資料英語單詞都放入播放器,搶回縫隙里的時間……
TTS從無到有幾十年的時間,從對企業(yè)的技術(shù)支持,到針對個體消費(fèi)者的娛樂開發(fā),幾乎實現(xiàn)了行業(yè)的全覆蓋,也深入到尋常百姓家?萍挤⻊(wù)于生活,生活又給科技靈感。從TTS的小技術(shù),我們看到了生活因科技變遷的軌跡,也欣慰所謂的“高”科技其實并不高,它就在生活的細(xì)節(jié)里,無處不在。
關(guān)于Acapela
Acapela集團(tuán)是世界領(lǐng)先的語音專家,創(chuàng)造了文字—語音的解決方案。Acapela為客戶提供多達(dá)30種語言的語音,并幫助其客戶建立自身的“語音戰(zhàn)略”,通過添加語音發(fā)聲傳達(dá)他們的服務(wù)和品牌價值。Acapela Acapela擁有60種高品質(zhì)標(biāo)準(zhǔn)的聲音,同時也對目標(biāo)客戶進(jìn)行個性化聲音合成,推出的語音解決方案能使任何書面文字轉(zhuǎn)換成自然的語音文件。多年來,Acapela受到全球市場的廣泛認(rèn)可,創(chuàng)造出強(qiáng)大的品牌知名度。超過1000家來自世界各地的不同領(lǐng)域的公司采用了Acapela高品質(zhì)的聲音,使用著語音授權(quán)的產(chǎn)品和服務(wù)。
Open2China
相關(guān)閱讀: