首頁>>>技術(shù)>>>語音應(yīng)用>>>語音合成(TTS)  語音合成產(chǎn)品

中科院服務(wù)器端語音推送系統(tǒng) 盲人也能“上網(wǎng)”

2011/01/25

  中科院計算所研發(fā)的系統(tǒng)叫服務(wù)器端語音推送系統(tǒng)。互聯(lián)網(wǎng)無障礙閱讀系統(tǒng)只屬于其中的一部分。其它還包括客戶端語音推送系統(tǒng),即客戶可以以軟件的形式一次性將其裝入電腦系統(tǒng),在無需其他幫助的情況下,對需要瀏覽的任何網(wǎng)頁進行無障礙閱讀。另外,開發(fā)成功的還包括電話訪問系統(tǒng),盲人無需上網(wǎng),直接撥打電話,通過自動語音應(yīng)答,即可瀏覽網(wǎng)站內(nèi)容。

  互聯(lián)網(wǎng)無障礙閱讀系統(tǒng)在服務(wù)器端安裝后,可自動將指定網(wǎng)站內(nèi)容轉(zhuǎn)化為語音版,并在用戶瀏覽時將語音推送至普通客戶端瀏覽器。這一系統(tǒng)無需用戶安裝任何附加軟件,用IE等普通瀏覽器即可瀏覽。

  從目前情況看,盲人朋友普遍認為操作很方便。但目前系統(tǒng)主要針對內(nèi)容型的網(wǎng)站,對像社區(qū)、論壇、搜索、軟件下載等交互性網(wǎng)站的使用,還未添加專門的支持。王博士進一步解釋說:“網(wǎng)站上有什么我們已經(jīng)呈現(xiàn)了,但是讀者需要什么就呈現(xiàn)什么將是我們下一步需要做的,真正實現(xiàn)人機交互的統(tǒng)一已經(jīng)不遠!

  盲人也能上網(wǎng)!

  以視覺呈現(xiàn)為主的傳統(tǒng)互聯(lián)網(wǎng)網(wǎng)絡(luò),生硬地拉開了盲人和互聯(lián)網(wǎng)的距離,而現(xiàn)今,互聯(lián)網(wǎng)無障礙閱讀系統(tǒng)讓我們看到距離不再是問題。

  2010年12月23日,由中國科學(xué)院計算技術(shù)研究所開發(fā)的面向盲人的互聯(lián)網(wǎng)無障礙閱讀系統(tǒng),在北京市殘疾人福利基金會網(wǎng)站(http://www.bfdp.org.cn)正式上線運行,這方便了視力障礙者獲取互聯(lián)網(wǎng)信息。

  人機交互復(fù)雜而困難

  以視覺化呈現(xiàn)內(nèi)容為主的互聯(lián)網(wǎng)讓視力障礙者只能望而卻步

  互聯(lián)網(wǎng)的產(chǎn)生建起了全球溝通的橋梁,縮短了人與人之間的距離,但一直以來,以視覺化呈現(xiàn)內(nèi)容為主的互聯(lián)網(wǎng)讓視力障礙者只能望而卻步。當前,盲人瀏覽網(wǎng)頁一般采用讀屏軟件(如陽光讀屏軟件、永德讀屏軟件),需要單獨購買和安裝。安裝后通過語音合成技術(shù)將屏幕上顯示的網(wǎng)頁文本內(nèi)容讀出,使盲人通過收聽獲取網(wǎng)頁內(nèi)容。但是軟件只能根據(jù)網(wǎng)頁固有順序朗讀網(wǎng)頁全部內(nèi)容,耗時長、瀏覽速度較慢。

  另外,當前也有一些語音網(wǎng)站系統(tǒng),可以將網(wǎng)站內(nèi)容轉(zhuǎn)化為語音。但這些系統(tǒng)要求人工設(shè)置需要轉(zhuǎn)換的欄目、內(nèi)容,并且需要根據(jù)網(wǎng)頁內(nèi)容的變化進行人工更新處理,操作繁瑣復(fù)雜。由于操作復(fù)雜,且對轉(zhuǎn)換的網(wǎng)頁內(nèi)容有一定條件限制,對于較大的網(wǎng)站,事實上只能轉(zhuǎn)換其中的較少部分。

  不管怎樣,經(jīng)過以前的研究,至少互聯(lián)網(wǎng)向受眾輸出內(nèi)容時可以將網(wǎng)頁讀出。

  另一方面,視力障礙者在瀏覽時,為操作瀏覽器和控制瀏覽過程,需要記憶包括Windows系統(tǒng)快捷鍵在內(nèi)的許多快捷鍵組合,人機交互復(fù)雜而困難。

  那么,有沒有更快、更便捷的方式讓視力障礙者使用互聯(lián)網(wǎng)呢?

  網(wǎng)頁內(nèi)容智能化分析技術(shù)

  在對網(wǎng)頁內(nèi)容進行智能化分析時,首先可將網(wǎng)頁分類為主題型網(wǎng)頁和目錄型網(wǎng)頁

  “互聯(lián)網(wǎng)無障礙閱讀系統(tǒng)在服務(wù)器端安裝后,可以對網(wǎng)頁內(nèi)容進行智能分析,過濾冗余的視覺信息、抽取頁面的主要文本,將HTML頁面轉(zhuǎn)化為層次樹狀結(jié)構(gòu),從而幫助用戶快速定位和選擇感興趣的內(nèi)容! 中科院計算所普適計算中心王向東博士介紹說。

  在對網(wǎng)頁內(nèi)容進行智能化分析時,首先可將網(wǎng)頁分類為主題型網(wǎng)頁和目錄型網(wǎng)頁。主題型網(wǎng)頁(如某一篇新聞或文章所在的網(wǎng)頁)在經(jīng)過該系統(tǒng)分析后,抽取主要文本(新聞或文章主體),忽略次要內(nèi)容及圖像等視覺內(nèi)容,成為便于視力障礙者使用的簡單文本。而對于像各大網(wǎng)站首頁這樣的目錄型網(wǎng)頁,系統(tǒng)將網(wǎng)頁內(nèi)容進行自動分塊抽取標題,組織為層次樹狀結(jié)構(gòu),一步步引導(dǎo)使用者進行所需內(nèi)容選取。

  網(wǎng)頁內(nèi)容智能化分析技術(shù),實現(xiàn)了無需專人負責,根據(jù)網(wǎng)頁內(nèi)容,自動對網(wǎng)頁進行內(nèi)容重組,并且可實時跟蹤網(wǎng)頁的更新。這樣,更好地節(jié)省視力礙障者在互聯(lián)網(wǎng)網(wǎng)頁停留時間,改變以往順序朗讀耗時的嚴重缺點,進一步實現(xiàn)高效的“閱讀”。

  語音推送技術(shù)

  用IE等普通瀏覽器,視力障礙者即可收聽網(wǎng)站內(nèi)容
可收聽網(wǎng)站內(nèi)容

  網(wǎng)頁內(nèi)容被分塊重組后,語音推送技術(shù)即實現(xiàn)了網(wǎng)頁自動閱讀的可能。它將智能化分析后的網(wǎng)站內(nèi)容,自動轉(zhuǎn)化為語音版,在用戶瀏覽時推送至普通客戶端瀏覽器。這樣無需用戶安裝任何附加軟件,用IE等普通瀏覽器,視力障礙者即可收聽網(wǎng)站內(nèi)容。在重新組織為層次樹狀結(jié)構(gòu)的網(wǎng)頁中,視力障礙者無需記憶復(fù)雜的快捷鍵,只需簡單根據(jù)提示輸入數(shù)字,即可進入感興趣的鏈接。通過這種方式,即可降低按鍵負擔,提高網(wǎng)頁瀏覽效率。

  人類的進步來自于技術(shù)的不斷發(fā)明和創(chuàng)新。互聯(lián)網(wǎng)無障礙閱讀系統(tǒng)利用網(wǎng)頁內(nèi)容智能解析技術(shù),剔除網(wǎng)頁中次要內(nèi)容和無用視覺信息,將HTML頁面轉(zhuǎn)化為層次樹狀結(jié)構(gòu)或抽取其主內(nèi)容文本,幫助用戶快速定位和選擇感興趣的內(nèi)容,從而結(jié)束了視力障礙者對互聯(lián)網(wǎng)使用的慢跑歷程。

  技術(shù)推廣成關(guān)鍵

  比較棘手的是,要實現(xiàn)這些系統(tǒng)的使用價值,需要得到其他網(wǎng)站或機構(gòu)的支持。

  “相對于歐美的同類系統(tǒng),我們的技術(shù)也是先進的?傮w來說,我們?nèi)钡牟皇羌夹g(shù),是支持!蓖跸驏|博士介紹說。

  據(jù)了解,中科院計算所研發(fā)的系統(tǒng)叫服務(wù)器端語音推送系統(tǒng),互聯(lián)網(wǎng)無障礙閱讀系統(tǒng)只屬于其中的一部分。其它還包括客戶端語音推送系統(tǒng),即客戶可以以軟件的形式一次性將其裝入電腦系統(tǒng),在無需其他幫助的情況下,對需要瀏覽的任何網(wǎng)頁進行無障礙閱讀。另外,開發(fā)成功的還包括電話訪問系統(tǒng),盲人無需上網(wǎng),直接撥打電話,通過自動語音應(yīng)答,即可瀏覽網(wǎng)站內(nèi)容。

  同時,比較棘手的是,要實現(xiàn)這些系統(tǒng)的使用價值,需要得到其他網(wǎng)站或機構(gòu)的支持。比如互聯(lián)網(wǎng)無障礙閱讀系統(tǒng),需要有專用的服務(wù)器和網(wǎng)址支持。針對客戶端的無障礙閱讀軟件、電話訪問系統(tǒng)這些也都需要合適的合作方,才能實現(xiàn)開發(fā)和推廣。技術(shù)的推廣,成為了視力障礙者無障礙人機交互的關(guān)鍵。

  互聯(lián)網(wǎng)技術(shù)的發(fā)展,縮短了人與世界的距離,亦縮短了人與人之間的距離。盲人無障礙閱讀系統(tǒng)促使互聯(lián)網(wǎng)文明逐步得以實現(xiàn)。

人民網(wǎng)



相關(guān)閱讀:
“互動英語學(xué)生版”體驗活動掀起學(xué)習(xí)英語熱潮 2011-01-21
捷通華聲語音合成技術(shù)應(yīng)用于天行娛樂社區(qū) 2011-01-06
語音合成芯片應(yīng)用于“農(nóng)村信息機系統(tǒng)” 2010-12-28
中科院開發(fā)面向盲人的互聯(lián)網(wǎng)無障礙閱讀系統(tǒng) 2010-12-27
訊飛為煤礦應(yīng)急廣播系統(tǒng)裝上安全“芯” 2010-12-27

熱點專題:  語音合成TTS 語音識別ASR