"多功能電話機普通話語音識別模塊"項目書

趙大有 2002/12/05

  據(jù)信息產(chǎn)業(yè)部(www.mii.gov.cn)統(tǒng)計公報的數(shù)據(jù)表明:我國固定電話機近年來一直是增長態(tài)勢,繼2000年歷史發(fā)展最高記錄以來,2001年已達1.804億萬戶,一年新增用戶3000多萬戶,其中城市用戶11228萬戶,新增2000萬戶,農(nóng)村用戶6811萬戶,新增1630萬戶,2002年截止到6月末,全國固定電話用戶總數(shù)為1.98億,半年新增1991萬戶。

  我國電話機產(chǎn)量約占世界總數(shù)的一半以上,并向世界81個國家和地區(qū)出口,其中向美國出口最多,約占美國電話機市場的2/3,其次是香港,日本,德國,新加坡,韓國,英國等國家。據(jù)行業(yè)估計,2001年全國電話機總產(chǎn)量為6000萬臺左右。

  1994年國家全面開發(fā)電信市場之前屬于電話機行業(yè)的"壟斷時代"(幾大品牌借力于郵電部門,壟斷了90%以上的市場),之后進入"自由競爭時代"(各生產(chǎn)廠家在商業(yè)市場自由角逐);自99年以來,國內(nèi)電話機行業(yè)進入"品牌時代"。電話機行業(yè)從未像今天這樣引人關(guān)注,以前的VCD/DVD企業(yè),以及家電行業(yè)的巨頭,甚至一些著名的外國名牌(西門子、索尼)也向電話機市場邁進一只腳。經(jīng)過"價格戰(zhàn)" "廣告戰(zhàn)" "服務戰(zhàn)",目前電話機制造行業(yè)已趨于冷靜和成熟,具有高科技含量的,含有較高附加值功能且價格合適的多功能智能話機成為"美味享受"。

  據(jù)此,開發(fā)多功能電話機普通話語音識別模塊,就具有很大的市場價值。

一、 項目功能

1、 普通電話機功能(含來電顯示)
2、 語音提示
3、 語音拔號
4、 四種音樂(MIDI)振鈴選擇
5、 定時錄音(25秒左右)
6、 來電、去電信息保護 (掉電不丟失)
7、 語音電話號碼薄
8、 遠程遙控查詢
9、 語音密碼
10、 來電報號碼及報人名

注:以上除第1項外,2-10項可由客戶靈活選擇選用。

二、 電路框圖


三、 行業(yè)中同類各方案比較

  具有語音識別功能的電話機,近年在國內(nèi)、外皆有開發(fā),但市場上未能成氣候。

  1、 一種是其于DSP(數(shù)字信號外理器)的電話機,其功能足夠強大,性能不可謂不好,但價格太昂貴成了其致命弱點,此類電話機少則¥500-600,多則上千元。(如中科模式方案,清華大學方案)。近期此類產(chǎn)品不可能有太大市場,國內(nèi)生產(chǎn)制造商大多不會感興趣。

  2、 另一種是其于語音識別芯片的電話機,這種系統(tǒng)成本相對較低,國內(nèi)曾有兩個電話機廠家(高科、天時達)試產(chǎn)過幾千臺(1999-2000年),之后亦再無生產(chǎn)。主要原因是,當時的識別效果不夠理想,功能單一,市場賣點不多。試想,僅僅為了加入一項語音撥號功能,就必須增加近人民幣100元之成本,有哪個電話機廠會真正有興趣呢?TCL也只是在高交會上展出了樣機,之后亦未有動作。

  因此,語音識別技術(shù)在電話機行業(yè)之推廣,遭遇了一個艱難的過程,似乎大多生產(chǎn)廠家皆"談虎色變",避而遠之。

  但是,我公司之語音識別電話機模塊,克服了以上兩種不利情況。我公司認真進行了大量周密的市場調(diào)查,以"在適當增加成本的前提下,增加具有附加值的實用流行功能"為指導思想,利用當今世界最先進語音識別芯片,并相應選擇最合適的電話控制芯片,形成了一套目前最優(yōu)化的多功能電話語音識別模塊方案,具有豐富的市場切入點和較高市場價值,并且在未來亦有強大的競爭能力。

四、 重要特性分析

  1、 語音撥號及語音提示

幾年前即開始流行的語音電話機市場,現(xiàn)仍十分巨大,隨著產(chǎn)量逐漸加大,語音IC價格已從每套人民幣17-18降至人民幣5元。但語音提示電話機不多,這塊市場基本空白。此模塊所使用的語音識別芯片,本身具有語音合成功能,因此無需另外增加任何硬件成本,即可實現(xiàn)語音提示功能。而對于語音撥號功能,其實用性已無須多說,用戶最關(guān)心的是其識別的準確度,此模塊之一次識別準確率可達95%,工作準確率為100%。(聯(lián)想,喬興,步步高已對我公司語音識別通用模塊識別精度給予認證。)

  2、 四種音樂選擇振鈴

  電話機市場在每一階段都有一兩個之流行功能。三年前開始出現(xiàn)來電顯示(現(xiàn)在成為電話機的基本功能),2001年是流行來電報號,今年以來,短信息電話和MIDI電話機開始流行。(成電新公司50K芯片已被一次性預定完。)現(xiàn)市場出現(xiàn)之MIDI電話機需另增加一0.3美元之芯片,而此系統(tǒng)中之語音識別芯片亦已含4個MIDI音樂,無需另增加硬件成本。

  3、 通話實時錄音功能

  我們常常遇到以下情況:電話中對方告訴你一個電話號碼,或一次約會的時間地點,而你必須記錄下但手邊沒有紙和筆,這時,20-30秒之實時錄音即會十分方便。錄音電話機的種類有三種:留言電話機,電話錄音機和自動應答機,后一種是前兩種之結(jié)合,目前最為流行。目前答錄機的錄音時間都在15分鐘以上,無論是用磁帶或數(shù)碼錄音,成本都較高,近期有電話機廠家生產(chǎn)了一種短時間錄音電話(20秒),不過用了一顆1.5美金的芯片,市場反饋意見是成本太高。此模塊系統(tǒng)中已經(jīng)包含有2M(或4M)的FLASH存儲芯片,即可實現(xiàn)20-30S的錄音,也無需另加硬件成本。

  4、 來電/去電信息保護

  現(xiàn)在市場上電話機,許多都帶有來電/去電查詢,但一斷電即丟失信息。此模塊利用了系統(tǒng)中之非揮發(fā)性存儲器(ROM),可使此信息在斷電時不丟失。

  5、 語音電話號碼薄/遙控遠程查詢/來電報姓名

  現(xiàn)有電話機之電話號碼薄,輸入姓名不方便,此模塊實現(xiàn)了用語音輸入姓名 ;若是出差在外,想查詢一個好朋友的電話號碼,只需打個電話、報出姓名即可;現(xiàn)在來電報號正十分流行,若來電屬于語音號碼薄之一,則連姓名也可以報出。試想,若是老板來電,你總不能睡意朦朧去接電話吧!

  6、 語音密碼防盜打功能

  利用語音識別技術(shù)之身份識別技術(shù),給你的電話加上一個語音密碼,〈例:芝麻開門〉,真是方便實用又有趣。

五、 技術(shù)水平分析

  本模塊由我公司與深圳成電新公司(見附頁:成電新公司簡介)合作開發(fā)。

  1、 技術(shù)之先進性:本模塊采用了當今世界性價比最優(yōu)的語音識別芯片。(美國SENSORY公司的RSC300芯片,WWW.SENSORYINC.COM)

  2、 技術(shù)之適用性

  本模塊采用的語音識別及其相關(guān)技術(shù)適合我國目前電話機市場的發(fā)展階段,是一項適用技術(shù)。

  3、 技術(shù)之可行性

  經(jīng)過國外市場5-6年之試驗認證,本模塊采用之所有技術(shù)已經(jīng)成熟和穩(wěn)定,亦無任何專利限制問題。

  4、 技術(shù)之經(jīng)濟性和合理性

  本模塊投入--產(chǎn)出關(guān)系合理,能夠獲得好的經(jīng)濟利益,而且適合公司規(guī)模。

  5、 技術(shù)之領(lǐng)先獨占性

  結(jié)合了多種實用新穎功能之本模塊,目前在市場上尚無類似產(chǎn)品。 本公司正在向?qū)@痔岢鰧@暾垺?br>
六、 經(jīng)濟分析

  1、 模塊成本估算(以批量100K計):人民幣20左右。

 。–PU$1.0+FLASH$0.5+EPROM$0.4+其它$0.5=$2.4)

  2、 利潤估算:

  預計模塊銷售價格在人民幣25-30元之間,利潤率可達25%-50%。

  3、預計生產(chǎn)計劃及銷售量估計:

  2002年8-9月:出樣品及樣機(預計生產(chǎn)樣機50-100臺)
  2002年10-11月:小批量生產(chǎn),10-20K/月。
  2002年12月始:大批量生產(chǎn),100K/月。

  4、 投資概算:

  前期小批量生產(chǎn)階段投入:人民幣30-40萬元。
  進入大規(guī)模量產(chǎn)階段:人民幣100萬元。

七、 項目后續(xù)計劃:

  本模塊為國內(nèi)版,僅適用于中文市場(提示音為中文),計劃2002年底開始國外版之模塊開發(fā),預計每個語種之模塊開發(fā)周期為一個月。針對現(xiàn)有電話機國外銷售市場,暫定語種有:英語/阿拉伯語/西班牙語/俄語/韓語//葡萄牙語/越南語。

深圳捷通公司供稿 CTI論壇編輯



相關(guān)鏈接:
捷通82語音識別模塊產(chǎn)品說明書 2003-06-09
語音合成芯片情況介紹和產(chǎn)品設(shè)想 2003-05-06
數(shù)字可視復讀機方案 2003-04-09
語音識別控制電話機方案 2003-04-04
智能早教機方案 2003-04-03

分類信息:  電信_與_語音識別ASR     行業(yè)_電信_解決方案   技術(shù)_語音識別_文摘