訊飛語(yǔ)音技術(shù)在交通自動(dòng)語(yǔ)音播報(bào)系統(tǒng)中的應(yīng)用
2006/07/14
隨著信息社會(huì)的快速發(fā)展,人們對(duì)于信息獲取及時(shí)性、方便性的要求也越來(lái)越高。公共交通的信息服務(wù)系統(tǒng)適應(yīng)這一發(fā)展趨勢(shì),不斷應(yīng)用新技術(shù)拓展服務(wù)范圍、提升服務(wù)質(zhì)量、提高工作效率。實(shí)時(shí)更新數(shù)據(jù)、效果清晰流暢、應(yīng)用方便高效也成為機(jī)場(chǎng)、車(chē)站、碼頭等公共交通場(chǎng)所對(duì)建設(shè)新一代自動(dòng)語(yǔ)音播報(bào)系統(tǒng)的最重要要求。
科大訊飛作為語(yǔ)音技術(shù)的領(lǐng)導(dǎo)者,一直積極推動(dòng)智能語(yǔ)音技術(shù)在交通自動(dòng)語(yǔ)音播報(bào)領(lǐng)域的應(yīng)用;陬I(lǐng)先技術(shù)、成熟的產(chǎn)品和對(duì)應(yīng)用的不斷深入探索,從2001年開(kāi)始,科大訊飛的語(yǔ)音技術(shù)在機(jī)場(chǎng),車(chē)站、碼頭等交通自動(dòng)語(yǔ)音播報(bào)系統(tǒng)中應(yīng)用,至今,已經(jīng)樹(shù)立了包括武漢天河機(jī)場(chǎng)、合肥駱崗機(jī)場(chǎng)、鄭州火車(chē)站、福建晉江、泉州等的幾十個(gè)成功應(yīng)用案例,為來(lái)自五湖四海的乘客提供了高質(zhì)量、高效率的自動(dòng)語(yǔ)音服務(wù)。
機(jī)場(chǎng)、車(chē)站、碼頭等公共交通場(chǎng)所每天進(jìn)出的班次多,信息更新頻繁,單純依靠人工廣播為旅客提供信息服務(wù)的方式面臨的壓力越來(lái)越大,若由于人工報(bào)讀出現(xiàn)誤差、引起錯(cuò)誤容易產(chǎn)生秩序混亂,不利于交通管理。應(yīng)用科大訊飛語(yǔ)音合成技術(shù)的自動(dòng)語(yǔ)音播報(bào)系統(tǒng)就能夠自動(dòng)將預(yù)先編排的文字內(nèi)容自動(dòng)轉(zhuǎn)換成語(yǔ)音在站廳內(nèi)播放出來(lái),很好地解決了當(dāng)前服務(wù)方式的局限性。
科大訊飛的語(yǔ)音合成(Text To Speech)技術(shù)能夠自動(dòng)將任意文字轉(zhuǎn)換為清晰、流暢、自然的語(yǔ)音,是一種能夠在任何時(shí)間、任何地點(diǎn)向任何人提供語(yǔ)音信息服務(wù)的高效便捷手段,非常符合信息時(shí)代海量數(shù)據(jù)、動(dòng)態(tài)更新和個(gè)性化查詢(xún)的需求。訊飛語(yǔ)音技術(shù)始終引領(lǐng)業(yè)界的發(fā)展,2006年7月,新一代語(yǔ)音合成技術(shù)產(chǎn)品-InterPhonic
5.0正式發(fā)布,語(yǔ)音技術(shù)的發(fā)展再次邁上了一個(gè)新臺(tái)階。InterPhonic 5.0的合成效果已超過(guò)普通人的說(shuō)話水平,與專(zhuān)業(yè)播音員的效果更趨接近,在普通話,英語(yǔ),廣東話等多語(yǔ)種進(jìn)一步突破,數(shù)字、數(shù)值判斷準(zhǔn)確、發(fā)音清晰飽滿,地名、站名等詞組短句合成流暢、自然。靈活開(kāi)放的系統(tǒng)架構(gòu),穩(wěn)定性和可用性經(jīng)受了眾多大規(guī)模實(shí)際應(yīng)用的檢驗(yàn),能夠確保7×24小時(shí)不間斷的高質(zhì)量自動(dòng)化語(yǔ)音服務(wù)。
InterPhonic 5.0首創(chuàng)的兩項(xiàng)專(zhuān)利技術(shù)“提示音智能匹配”與“合成模版”幾乎是為交通自動(dòng)語(yǔ)音播報(bào)系統(tǒng)度身定做,能夠顯著提升語(yǔ)音效果。在站廳廣播中,很多內(nèi)容的播報(bào)句式是固定的,只是當(dāng)中一部分內(nèi)容發(fā)生變化, 例如:
- 乘坐 3u8601 次航班前往 澳門(mén) 的旅客請(qǐng)注意。
- 乘坐 3u8602 次航班前往 包頭 的旅客請(qǐng)注意。
在這兩個(gè)例句中,整個(gè)句式是一樣的,只是航班號(hào)和目的地不同。在InterPhonic 5.0中,允許用戶提取句式的固定部分,組成合成模板,模板的固定內(nèi)容由人工錄音保障效果,而對(duì)于動(dòng)態(tài)變化部分,如字符、數(shù)字、數(shù)值、短語(yǔ)、姓名等,則采用語(yǔ)音合成,系統(tǒng)能夠自動(dòng)實(shí)現(xiàn)預(yù)錄語(yǔ)音與合成語(yǔ)音的無(wú)縫銜接,最終達(dá)到整體效果與人工播報(bào)相當(dāng)?shù)哪繕?biāo)。
在交通自動(dòng)語(yǔ)音播報(bào)系統(tǒng)中應(yīng)用語(yǔ)音技術(shù),我們?nèi)匀唤ㄗh用戶對(duì)于常用的相對(duì)固定的內(nèi)容采用人工錄音的方式來(lái)生成語(yǔ)音,如由專(zhuān)業(yè)播音員錄音,效果自然,并且能體現(xiàn)更多的情感風(fēng)格,給用戶以親切感受。語(yǔ)音合成的效果雖然清晰、準(zhǔn)確,但是在語(yǔ)情感和語(yǔ)氣表現(xiàn)等方面與專(zhuān)業(yè)錄音員畢竟還有一定差距。運(yùn)用“提示音智能匹配”功能,在進(jìn)行語(yǔ)音合成過(guò)程中,將首先自動(dòng)匹配由人工錄制的語(yǔ)音,既保持了固定不變內(nèi)容的播報(bào)效果,又能實(shí)現(xiàn)實(shí)時(shí)更新的動(dòng)態(tài)合成,并且自動(dòng)進(jìn)行預(yù)錄語(yǔ)音與合成語(yǔ)音的融合,使得銜接過(guò)渡自然流暢,提供最佳效果體驗(yàn)。
科大訊飛每一代新產(chǎn)品的推出均代表了語(yǔ)音技術(shù)發(fā)展新的里程碑,而技術(shù)產(chǎn)品的發(fā)展又源自于在應(yīng)用實(shí)踐中的不斷積累和完善。科大訊飛始終關(guān)注技術(shù)發(fā)展與市場(chǎng)應(yīng)用的最佳結(jié)合,以領(lǐng)先的語(yǔ)音技術(shù)為提升自動(dòng)語(yǔ)音服務(wù)提供源源不斷的動(dòng)力。同時(shí),科大訊飛一直致力于推動(dòng)行業(yè)標(biāo)準(zhǔn)的制定與完善,是中文語(yǔ)音交互技術(shù)標(biāo)準(zhǔn)工作組的組長(zhǎng)單位。2005年底,科大訊飛牽頭制定的中文語(yǔ)音合成系統(tǒng)通用技術(shù)規(guī)范通過(guò)審定成為國(guó)家標(biāo)準(zhǔn),將對(duì)中文語(yǔ)音技術(shù)產(chǎn)業(yè)的健康、快速發(fā)展起到積極的作用。
成功案例一:鄭州火車(chē)站自動(dòng)電話問(wèn)訊系統(tǒng)的語(yǔ)音合成應(yīng)用
鄭州火車(chē)站的自動(dòng)電話問(wèn)訊熱線系統(tǒng)建設(shè)“8356666”是一項(xiàng)為廣大旅客提供實(shí)實(shí)在在便利的舉措。在該電話問(wèn)訊系統(tǒng)中,應(yīng)用科大訊飛語(yǔ)音合成技術(shù),將實(shí)時(shí)查詢(xún)的列車(chē)、票務(wù)、行包等信息轉(zhuǎn)換成語(yǔ)音,通過(guò)電話提供用戶,實(shí)現(xiàn)了人工受理咨詢(xún)服務(wù)與24小時(shí)自動(dòng)服務(wù)相結(jié)合的新型服務(wù)方式。該電話問(wèn)訊系統(tǒng)投入使用以來(lái),受到旅客們的廣泛好評(píng)。
應(yīng)用訊飛語(yǔ)音技術(shù)的鄭州火車(chē)站電話問(wèn)訊系統(tǒng),不僅規(guī)模比原有系統(tǒng)擴(kuò)大一倍,而且服務(wù)內(nèi)容更加豐富,提供實(shí)時(shí)更新的信息,真正實(shí)現(xiàn)了對(duì)旅客的個(gè)性化服務(wù)。下圖所列即該自動(dòng)電話問(wèn)訊熱線主要功能:
進(jìn)入系統(tǒng)后可以進(jìn)行定購(gòu)火車(chē)票、查詢(xún)列車(chē)信息、查詢(xún)列車(chē)正晚點(diǎn)、行包到達(dá)查詢(xún)等操作。所有供查詢(xún)信息都由系統(tǒng)實(shí)時(shí)從數(shù)據(jù)庫(kù)中調(diào)用,由訊飛語(yǔ)音合成系統(tǒng)轉(zhuǎn)換成語(yǔ)音播放,不僅保證了信息的實(shí)時(shí)性,同時(shí)業(yè)務(wù)更加靈活,語(yǔ)音效果更好,系統(tǒng)的管理和維護(hù)也比以前便捷多了。
成功案例2:武漢天河機(jī)場(chǎng)自動(dòng)語(yǔ)音廣播系統(tǒng)
武漢天河國(guó)際機(jī)場(chǎng)為4E級(jí)機(jī)場(chǎng),是華中地區(qū)的航空運(yùn)輸?shù)臉屑~。良好的發(fā)展機(jī)遇、特有的區(qū)位優(yōu)勢(shì)、齊全的機(jī)場(chǎng)功能使天河機(jī)場(chǎng)成為航空客貨集散中心。給乘客帶來(lái)更加優(yōu)質(zhì)高效的的服務(wù)是天河國(guó)際機(jī)場(chǎng)的目標(biāo)。
每天的起降的航班很多,如果單靠人工廣播工作量很大,而且不容易管理,往往會(huì)由于廣播的時(shí)間出現(xiàn)誤差、人員播音的錯(cuò)誤引起機(jī)場(chǎng)秩序的混亂。而采用了語(yǔ)音合成技術(shù)的廣播系統(tǒng)能夠自動(dòng)把需要廣播的文本內(nèi)容自動(dòng)轉(zhuǎn)換成自然流暢的語(yǔ)音,很好地解決了上述的問(wèn)題。
天河機(jī)場(chǎng)自動(dòng)語(yǔ)音廣播系統(tǒng)的功能是在機(jī)場(chǎng)實(shí)現(xiàn)廣播的自動(dòng)化和控制的集中統(tǒng)一化。系統(tǒng)實(shí)現(xiàn)了對(duì)航班信息廣播的自動(dòng)化,它將天河國(guó)際機(jī)場(chǎng)根據(jù)需要?jiǎng)澐殖?個(gè)廣播分區(qū),這些廣播分區(qū)廣播不同的通知信息。
廣播內(nèi)容一般有固定的格式,因此自動(dòng)語(yǔ)音播報(bào)系統(tǒng)的工作人員用戶界面輸入采用填充和選擇的形式。操作人員選擇句型格式以后,只需把其中的變動(dòng)內(nèi)容(如乘客姓名等)輸入系統(tǒng),或者直接從航班信息系統(tǒng)中選擇相應(yīng)的信息,設(shè)定時(shí)間以后,系統(tǒng)到時(shí)即會(huì)自動(dòng)廣播。并且可以根據(jù)現(xiàn)場(chǎng)的時(shí)機(jī)情況設(shè)置播放次數(shù)和每次重復(fù)廣播的時(shí)間間隔。也可以實(shí)現(xiàn)輸入提交以后馬上播放。
由于實(shí)際操作本系統(tǒng)的操作人員使用4臺(tái)分布在不同位置的電腦,每臺(tái)電腦上看到的是一個(gè)客戶端的用戶界面。操作人員在自己的用戶界面上進(jìn)行播報(bào)內(nèi)容的文字輸入、設(shè)置、編排等工作,操作人員可以編輯、修改、刪除已設(shè)定但還沒(méi)有播放的廣播內(nèi)容。
無(wú)需了解和操作語(yǔ)音合成系統(tǒng)。用戶界面友好、使用簡(jiǎn)單,操作人員只要有初步的電腦操作能力就可以勝任。
考慮到機(jī)場(chǎng)有時(shí)需要廣播一些臨時(shí)內(nèi)容,需要人工播音。在這種情況下,可以預(yù)先錄制廣播內(nèi)容,存放在電腦中,并且在系統(tǒng)中預(yù)先設(shè)定播放時(shí)間。如果需要進(jìn)行現(xiàn)場(chǎng)人工廣播,可以隨時(shí)停止自動(dòng)播放功能,插入人工廣播。
自動(dòng)語(yǔ)音廣播系統(tǒng)對(duì)每條通知都采用用中英文雙語(yǔ)廣播,運(yùn)用了訊飛的語(yǔ)音合成技術(shù),針對(duì)用戶的具體情況,可以進(jìn)一步對(duì)一些新加入的特定語(yǔ)料內(nèi)容進(jìn)行優(yōu)化,通用語(yǔ)音合成產(chǎn)品緊密結(jié)合定制化的資源,始終保證高質(zhì)量的語(yǔ)音合成效果,且簡(jiǎn)單易用,穩(wěn)定可靠,得到機(jī)場(chǎng)工作人員的好評(píng)和信賴(lài)。
科大訊飛公司供稿 CTI論壇編輯
相關(guān)鏈接: