首頁>>廠商>>語音識別與合成>>科大訊飛

訊飛語音技術在交通自動語音播報系統(tǒng)中的應用

2006/07/14

  隨著信息社會的快速發(fā)展,人們對于信息獲取及時性、方便性的要求也越來越高。公共交通的信息服務系統(tǒng)適應這一發(fā)展趨勢,不斷應用新技術拓展服務范圍、提升服務質量、提高工作效率。實時更新數(shù)據(jù)、效果清晰流暢、應用方便高效也成為機場、車站、碼頭等公共交通場所對建設新一代自動語音播報系統(tǒng)的最重要要求。

  科大訊飛作為語音技術的領導者,一直積極推動智能語音技術在交通自動語音播報領域的應用;陬I先技術、成熟的產(chǎn)品和對應用的不斷深入探索,從2001年開始,科大訊飛的語音技術在機場,車站、碼頭等交通自動語音播報系統(tǒng)中應用,至今,已經(jīng)樹立了包括武漢天河機場、合肥駱崗機場、鄭州火車站、福建晉江、泉州等的幾十個成功應用案例,為來自五湖四海的乘客提供了高質量、高效率的自動語音服務。

  機場、車站、碼頭等公共交通場所每天進出的班次多,信息更新頻繁,單純依靠人工廣播為旅客提供信息服務的方式面臨的壓力越來越大,若由于人工報讀出現(xiàn)誤差、引起錯誤容易產(chǎn)生秩序混亂,不利于交通管理。應用科大訊飛語音合成技術的自動語音播報系統(tǒng)就能夠自動將預先編排的文字內容自動轉換成語音在站廳內播放出來,很好地解決了當前服務方式的局限性。

  科大訊飛的語音合成(Text To Speech)技術能夠自動將任意文字轉換為清晰、流暢、自然的語音,是一種能夠在任何時間、任何地點向任何人提供語音信息服務的高效便捷手段,非常符合信息時代海量數(shù)據(jù)、動態(tài)更新和個性化查詢的需求。訊飛語音技術始終引領業(yè)界的發(fā)展,2006年7月,新一代語音合成技術產(chǎn)品-InterPhonic 5.0正式發(fā)布,語音技術的發(fā)展再次邁上了一個新臺階。InterPhonic 5.0的合成效果已超過普通人的說話水平,與專業(yè)播音員的效果更趨接近,在普通話,英語,廣東話等多語種進一步突破,數(shù)字、數(shù)值判斷準確、發(fā)音清晰飽滿,地名、站名等詞組短句合成流暢、自然。靈活開放的系統(tǒng)架構,穩(wěn)定性和可用性經(jīng)受了眾多大規(guī)模實際應用的檢驗,能夠確保7×24小時不間斷的高質量自動化語音服務。

  InterPhonic 5.0首創(chuàng)的兩項專利技術“提示音智能匹配”與“合成模版”幾乎是為交通自動語音播報系統(tǒng)度身定做,能夠顯著提升語音效果。在站廳廣播中,很多內容的播報句式是固定的,只是當中一部分內容發(fā)生變化,  例如:
  1. 乘坐 3u8601 次航班前往 澳門 的旅客請注意。

  2. 乘坐 3u8602 次航班前往 包頭 的旅客請注意。
  在這兩個例句中,整個句式是一樣的,只是航班號和目的地不同。在InterPhonic 5.0中,允許用戶提取句式的固定部分,組成合成模板,模板的固定內容由人工錄音保障效果,而對于動態(tài)變化部分,如字符、數(shù)字、數(shù)值、短語、姓名等,則采用語音合成,系統(tǒng)能夠自動實現(xiàn)預錄語音與合成語音的無縫銜接,最終達到整體效果與人工播報相當?shù)哪繕恕?br />
  在交通自動語音播報系統(tǒng)中應用語音技術,我們仍然建議用戶對于常用的相對固定的內容采用人工錄音的方式來生成語音,如由專業(yè)播音員錄音,效果自然,并且能體現(xiàn)更多的情感風格,給用戶以親切感受。語音合成的效果雖然清晰、準確,但是在語情感和語氣表現(xiàn)等方面與專業(yè)錄音員畢竟還有一定差距。運用“提示音智能匹配”功能,在進行語音合成過程中,將首先自動匹配由人工錄制的語音,既保持了固定不變內容的播報效果,又能實現(xiàn)實時更新的動態(tài)合成,并且自動進行預錄語音與合成語音的融合,使得銜接過渡自然流暢,提供最佳效果體驗。

  科大訊飛每一代新產(chǎn)品的推出均代表了語音技術發(fā)展新的里程碑,而技術產(chǎn)品的發(fā)展又源自于在應用實踐中的不斷積累和完善?拼笥嶏w始終關注技術發(fā)展與市場應用的最佳結合,以領先的語音技術為提升自動語音服務提供源源不斷的動力。同時,科大訊飛一直致力于推動行業(yè)標準的制定與完善,是中文語音交互技術標準工作組的組長單位。2005年底,科大訊飛牽頭制定的中文語音合成系統(tǒng)通用技術規(guī)范通過審定成為國家標準,將對中文語音技術產(chǎn)業(yè)的健康、快速發(fā)展起到積極的作用。

  成功案例一:鄭州火車站自動電話問訊系統(tǒng)的語音合成應用

  鄭州火車站的自動電話問訊熱線系統(tǒng)建設“8356666”是一項為廣大旅客提供實實在在便利的舉措。在該電話問訊系統(tǒng)中,應用科大訊飛語音合成技術,將實時查詢的列車、票務、行包等信息轉換成語音,通過電話提供用戶,實現(xiàn)了人工受理咨詢服務與24小時自動服務相結合的新型服務方式。該電話問訊系統(tǒng)投入使用以來,受到旅客們的廣泛好評。

  應用訊飛語音技術的鄭州火車站電話問訊系統(tǒng),不僅規(guī)模比原有系統(tǒng)擴大一倍,而且服務內容更加豐富,提供實時更新的信息,真正實現(xiàn)了對旅客的個性化服務。下圖所列即該自動電話問訊熱線主要功能:

  進入系統(tǒng)后可以進行定購火車票、查詢列車信息、查詢列車正晚點、行包到達查詢等操作。所有供查詢信息都由系統(tǒng)實時從數(shù)據(jù)庫中調用,由訊飛語音合成系統(tǒng)轉換成語音播放,不僅保證了信息的實時性,同時業(yè)務更加靈活,語音效果更好,系統(tǒng)的管理和維護也比以前便捷多了。

  成功案例2:武漢天河機場自動語音廣播系統(tǒng)

  武漢天河國際機場為4E級機場,是華中地區(qū)的航空運輸?shù)臉屑~。良好的發(fā)展機遇、特有的區(qū)位優(yōu)勢、齊全的機場功能使天河機場成為航空客貨集散中心。給乘客帶來更加優(yōu)質高效的的服務是天河國際機場的目標。

  每天的起降的航班很多,如果單靠人工廣播工作量很大,而且不容易管理,往往會由于廣播的時間出現(xiàn)誤差、人員播音的錯誤引起機場秩序的混亂。而采用了語音合成技術的廣播系統(tǒng)能夠自動把需要廣播的文本內容自動轉換成自然流暢的語音,很好地解決了上述的問題。

  天河機場自動語音廣播系統(tǒng)的功能是在機場實現(xiàn)廣播的自動化和控制的集中統(tǒng)一化。系統(tǒng)實現(xiàn)了對航班信息廣播的自動化,它將天河國際機場根據(jù)需要劃分出4個廣播分區(qū),這些廣播分區(qū)廣播不同的通知信息。

  廣播內容一般有固定的格式,因此自動語音播報系統(tǒng)的工作人員用戶界面輸入采用填充和選擇的形式。操作人員選擇句型格式以后,只需把其中的變動內容(如乘客姓名等)輸入系統(tǒng),或者直接從航班信息系統(tǒng)中選擇相應的信息,設定時間以后,系統(tǒng)到時即會自動廣播。并且可以根據(jù)現(xiàn)場的時機情況設置播放次數(shù)和每次重復廣播的時間間隔。也可以實現(xiàn)輸入提交以后馬上播放。

  由于實際操作本系統(tǒng)的操作人員使用4臺分布在不同位置的電腦,每臺電腦上看到的是一個客戶端的用戶界面。操作人員在自己的用戶界面上進行播報內容的文字輸入、設置、編排等工作,操作人員可以編輯、修改、刪除已設定但還沒有播放的廣播內容。

  無需了解和操作語音合成系統(tǒng)。用戶界面友好、使用簡單,操作人員只要有初步的電腦操作能力就可以勝任。

  考慮到機場有時需要廣播一些臨時內容,需要人工播音。在這種情況下,可以預先錄制廣播內容,存放在電腦中,并且在系統(tǒng)中預先設定播放時間。如果需要進行現(xiàn)場人工廣播,可以隨時停止自動播放功能,插入人工廣播。

  自動語音廣播系統(tǒng)對每條通知都采用用中英文雙語廣播,運用了訊飛的語音合成技術,針對用戶的具體情況,可以進一步對一些新加入的特定語料內容進行優(yōu)化,通用語音合成產(chǎn)品緊密結合定制化的資源,始終保證高質量的語音合成效果,且簡單易用,穩(wěn)定可靠,得到機場工作人員的好評和信賴。

科大訊飛公司供稿 CTI論壇編輯



相關鏈接:
訊飛暢言語音教具系統(tǒng)榮獲“創(chuàng)新軟件產(chǎn)品” 2009-09-08
科大訊飛嵌入式語音新產(chǎn)品發(fā)布會在深圳舉行 2009-09-07
“會說話”的顯示屏提升居民小區(qū)信息服務水平 2009-09-07
訊飛語音助力太平人壽客服中心 2009-08-28
訊飛語音助力CDMA手機競爭終端市場 2009-08-14

相關頻道:  交通_與_語音合成TTS  交通_與_語音識別ASR  語音合成TTS_與_語音識別ASR