首頁>>>技術(shù)>>>語音應(yīng)用>>>語音合成(TTS)  語音合成產(chǎn)品

嵌入式產(chǎn)品的讀、聽、說能力將獲得重大突破
--解讀捷通"靈感"語言嵌入式全面解決方案

奧運之聲專欄作家:古源 2005/02/21

嵌入式系統(tǒng) -- 最后的英雄

  嵌入式計算機系統(tǒng)在哪里?答案是:Any Where,嵌入式系統(tǒng)早已滲入到人們?nèi)粘I畹拿恳粋角落,與我們的生活息息相關(guān)!嵌入式系統(tǒng)就在你的手機里,在你的汽車里!

  美國汽車大王福特公司的高級經(jīng)理曾宣稱,"福特出售的'計算能力'已超過了IBM"。顯然,這并不是一個嘩眾取寵或者夸張的說法。

  比如Mercedes-Benz C級轎車安裝了153個微處理器并可選擇配置衛(wèi)星通信系統(tǒng),司機可利用這種系統(tǒng)與汽車公司聯(lián)系獲得地圖和其他駕駛信息、股票報價和應(yīng)急幫助。知道技術(shù)細節(jié)的人會說:"這不再是一部汽車,而是一臺計算機。"

  說的完全對。在不經(jīng)意中,計算機技術(shù)就是這樣悄悄地深入到傳統(tǒng)工業(yè)之中去了。

  舉例之后,我們再回到嵌入式系統(tǒng)(Embedded Systems)的定義:嵌入式系統(tǒng)是以具體的產(chǎn)品為形態(tài)、以計算機技術(shù)為基礎(chǔ)、軟件硬件的規(guī)格隨產(chǎn)品而定并且向?qū)嵱谜叻忾]、適應(yīng)應(yīng)用系統(tǒng)對功能、可靠性、成本、體積、功耗嚴格要求的專用計算機系統(tǒng)。一說到"計算機"人們不自覺地就去找表面粘貼著"Intel Inside"標簽的米色盒子、顯示屏和鍵盤鼠標,其實這是在"騎驢找驢",因為他自己身上就有好幾個"計算機"-- 手機、手表或者智能卡都嵌有它們,而且他們在與汽車、電梯、廚房設(shè)備、電視、錄像機以及娛樂系統(tǒng)的嵌入式系統(tǒng)交互時也往往對此毫無覺察。嵌入式系統(tǒng)在工業(yè)機器人、醫(yī)藥設(shè)備、電話系統(tǒng)、衛(wèi)星、飛行系統(tǒng)等領(lǐng)域扮演了一個更為重要的角色。"看不見"的這一個特性正好詮釋了嵌入式計算機系統(tǒng)及其產(chǎn)品的本質(zhì)。

  在2000年的時候嵌入式系統(tǒng)帶來的工業(yè)年產(chǎn)值就已經(jīng)超過了1萬億美元。2004年世界廣告的總投入是3.7萬億美元,那么制造業(yè)對于產(chǎn)品計算能力的投入總不會低于廣告投入吧?所以筆者預(yù)計全世界商品的嵌入式技術(shù)增加值是5萬億美元,從醫(yī)療設(shè)備到手機計算無所不在。

中國需要嵌入式嗎?回答更是100個肯定。

  中國從政府到產(chǎn)業(yè)界都有一個共同的呼聲,那就是盡快提高中國產(chǎn)品的技術(shù)含量。出路在哪里?如果說嵌入式技術(shù)不是答案的全部,也是答案的一大半。集成電路技術(shù)和計算技術(shù)的成熟,傳統(tǒng)工業(yè)已經(jīng)成了吸納新技術(shù)的大海綿。

  嵌入式系統(tǒng)是計算機技術(shù)、通信技術(shù)、半導(dǎo)體技術(shù)、微電子技術(shù)、語音和圖象技術(shù)、數(shù)據(jù)傳輸技術(shù)、甚至傳感器等先進技術(shù)和具體應(yīng)用對象相結(jié)合后的更新?lián)Q代產(chǎn)品,可以說它是當代最新技術(shù)的濃縮。

  以"Intel Inside"為標簽的所謂通用計算機,原來就是在8088、8086單片機上發(fā)展起來的,今天計算技術(shù)要帶著近二三十年的技術(shù)積累,對傳統(tǒng)工業(yè)說"我回來了"。

  這一回來非同小可,從電話到照相機等所有工業(yè)都會今非昔比,半導(dǎo)體時代曾經(jīng)締造了日本人70、80兩個年代的繁榮,今天嵌入式技術(shù)又送來了一個難得的歷史機遇。中科院院士倪光南幾年來一直呼吁嵌入式技術(shù)是中國工業(yè)的機會,沒有計算的機床按重量買,而數(shù)控機床身價要翻幾十倍。臺灣工業(yè)人士則干脆稱"嵌入式系統(tǒng)的發(fā)展是挽救臺灣(工業(yè))的最后英雄。"誰愿意放過"最后的英雄"?

機會是為誰準備的?

  中國人有句俗話叫做"財不過三代",這種話似乎多少出于小農(nóng)式的平衡心理,一種財富輪回的安慰,到了現(xiàn)代卻不靈驗了。

  日本人給人的印象似乎是軟件上的軟國,不像印度、愛爾蘭那樣咄咄逼人,佐證是日本每年的軟件進口有100億美元,出口只有10億美元,實在入不敷出。但是實際上日本是世界上出口軟件封裝產(chǎn)品最多的國家!有多少?10000億美元。日本每年出口的數(shù)碼相機、筆記本、手機總值是全球最多的,其中所含的軟件模塊,絕大部分都是日本軟件公司負責制造的,2004年日本在美國的汽車銷售量又超過了500萬輛,從復(fù)印機到電梯無不嵌入著大量的軟件,所以我們說日本每年的軟件出口額至少有10000億美元!

  中國工程院院士許居衍不無感慨地說,嵌入式技術(shù)是中國廠商從"中國制造"向"中國創(chuàng)造"轉(zhuǎn)變的最佳契機,嵌入式技術(shù)領(lǐng)域不像通用計算機那樣由 WinTel 一統(tǒng)天下,該核心技術(shù)還遠沒有被壟斷,其世界非常之寬闊,它對包括小編譯器、語音技術(shù)、傳感技術(shù)等各種技術(shù)需求是很多的,在其中任何一個領(lǐng)域只要你踏踏實實搞下去都會有所收獲。國內(nèi)搞嵌入式開發(fā)的企業(yè)不少,但是有系統(tǒng)、有深度的不多,淺嘗輒止者眾,鍥而不舍者寡。

  嵌入式技術(shù)人才缺乏,中國微計算機單片機學(xué)會理事長、復(fù)旦大學(xué)教授陳章龍感到擔心,目前大學(xué)里還沒有相關(guān)的人才培養(yǎng)工作,包括從教育模式、教材編制等方面都還在摸索的過程中。每當他看到充滿活力而聰明的青年人追逐技術(shù)新潮,大學(xué)Delphi、ASP、.Net的時候(當然這些東西也很有用),他都建議他們學(xué)一點匯編C,準備技術(shù)到制造業(yè)去用。

  可以坦率地說,嵌入式技術(shù),從芯片到人才培養(yǎng),中國的準備遠沒有到位,這是日本人在對"中國制造"感到恐怖時而得到的最大安慰。

機會是為有準備的人準備的

  捷通軟件技術(shù)公司看好嵌入式技術(shù)由來已久。早在2001年,捷通的嵌入式語音合成軟件一舉獲得當年的科技部重點新產(chǎn)品、中關(guān)村十大IT創(chuàng)新產(chǎn)品、國際軟件博覽會等三項大獎。從此捷通公司的嵌入式技術(shù)產(chǎn)品一發(fā)而不可收,不斷為手機、PDA、街頭信息亭等廠家所捆綁。

  捷通公司提供集手寫識別、語音識別和語音合成于一體的技術(shù),使電腦可以同時實現(xiàn)讀(手寫識別)、聽(語音識別)、說(語音合成)功能,即把人所具有的語言能力統(tǒng)統(tǒng)教給電腦。

  從2001年起捷通給自己立了一條不成文的規(guī)定,凡是公司所開發(fā)的通用軟件,都同時開發(fā)成為嵌入式產(chǎn)品;嵌入式的開發(fā)又要同時按照Linux、 WinCE、 Palm以及手機方面的Brew等幾個環(huán)境進行,即使每種開發(fā)不一定都完成終測,但是都必須完成階段的試驗。

  以向嵌入式產(chǎn)品提供語言智能為目標,幾年走下來,捷通公司已經(jīng)做好了充分的準備,每當嵌入式產(chǎn)品廠商提出嵌入需求時,捷通都能從容地拿出樣品,并進行嵌入試驗。

選擇正確的先進性同樣很重要

  捷通公司選擇正確的先進性的能力同樣讓筆者感到欽服。筆者考察了捷通的嵌入式語言技術(shù),覺得它的智能化還沒有達到完全令人滿意的程度。捷通的解釋是"我們要選擇正確的先進性",人類不能等到完全清潔的核聚變試驗好了再去燒開水。

  正確的先進性,顯示了IT人的哲學(xué)智慧,捷通人的商場機敏。

  我們的結(jié)論是機會是給有備者準備的,同時機會是給"正確的先進性"準備的。

智能從讀、聽、寫開始

  嵌入式產(chǎn)品通過傳感技術(shù)接收數(shù)據(jù),如溫度、壓力、光、電等理化參數(shù),通過時鐘計算時間,通過小鍵盤或觸摸屏接收指令數(shù)據(jù),通過GPS來定位,還可以通過互聯(lián)網(wǎng)實現(xiàn)異地的人機交互。與人、與環(huán)境多方位的信息交互,低能耗小尺寸的就地計算,正是嵌入式技術(shù)的無限魅力。

  這不是很豐富了嗎?但是美中不足,嵌入式唯一欠缺的就是跟人沒有語言形式的交流,或者說交流是比較困難的。

  選擇方向?qū)τ谝粋公司來說是至關(guān)重要的。選擇大撥哄的賺錢生意,看似平庸倒也安全;選擇陽春白雪,開始名噪一時后來恐高處不勝寒。捷通的決策是選擇"正確的先進性"。理想的情況是走一大步,一舉實現(xiàn)具體環(huán)境的人機智能對話,使機器能聽懂人語,自我調(diào)整然后合成人語與人交流,但是目下時機不成熟;把革命分為兩步走,第一步先把在PC上實現(xiàn)的模式識別成果通過優(yōu)化壓縮嫁接給嵌入式產(chǎn)品,待時機成熟時,一舉實現(xiàn)完全的人機對話。

  這是一種被嵌入式技術(shù)的急促發(fā)展節(jié)奏所激發(fā)的睿智,是一種符合技術(shù)與市場規(guī)律的抉擇,捷通公司稱之為"靈感"嵌入式漢語技術(shù)。但愿嵌入式產(chǎn)品從此獲得語言的"靈感"。

  至此,實際上筆者已經(jīng)把捷通的"靈感"語言嵌入式解決方案介紹完了,其實這個方案就這么簡單 -- 讓機器讀懂人所寫,聽懂人所說并且把輸出的東西說給人聽。不知我們可否繼續(xù)中科院倪光南院士的邏輯,會計算的機床(數(shù)控機床)懸貴于普通機床;那么懂人言會說話的機器比啞者當貴幾何?它算不算人類的技術(shù)產(chǎn)品又向前邁了一步呢?

  這的確是一種"靈感"的驅(qū)動,恐怕連捷通人自己也說不清楚,為什么從創(chuàng)辦公司伊始就把圍繞漢語的文字和語音技術(shù)通通抓在手里?語言的聽、讀、說、寫原本是一個整體,現(xiàn)在受技術(shù)所限它們是分隔的,但是總有一天它們會統(tǒng)一起來!

  人認識世界從感覺開始,機器認識世界從語言開始,機器的人工智能之路也許就從機器的讀、聽、說開始,在這里咬定青山不放松,也許捷通是對的。

作者供稿 CTI論壇編輯



相關(guān)鏈接:
2005年語音技術(shù)產(chǎn)業(yè)發(fā)展展望 2004-11-19
嵌入式語音合成技術(shù)在車載終端中的應(yīng)用 2004-10-13
語音界面設(shè)計感想一二 2004-08-31
用電話聽的網(wǎng)絡(luò) 2004-07-21
淺談TTS與CTI技術(shù) 2004-07-12

分類信息:     文摘   技術(shù)_語音合成_文摘