首頁>>>技術>>>語音應用>>>語音合成(TTS)  語音合成產品

優(yōu)視科技陳石:移動互聯(lián)網的深度未來

2010/11/03

優(yōu)視科技副總裁陳石

優(yōu)視科技副總裁陳石

  10月28日消息,“科大訊飛‘語音云’發(fā)布會暨移動互聯(lián)網語音創(chuàng)新論壇”在北京香格里拉飯店召開,圖為優(yōu)視科技副總裁陳石現場講演。

  科大訊飛在本次發(fā)布會上推出全球首個同時提供語音合成、語音搜索、語音聽寫等智能語音交互能力的移動互聯(lián)網智能交互平臺——“訊飛語音云”。

  以下為優(yōu)視科技副總裁陳石發(fā)言實錄:

  大家下午好。很高興有機會參加訊飛的發(fā)布會,我剛才看了一下訊飛發(fā)的視頻,特別有感觸,其實我跟訊飛,包括劉總,其實很早就認識了,當時在語音識別和語音合成這塊,競爭非常激烈,主要還都是一些跨國公司,剛才劉總也提到,當時訊飛我記得應該主要是合成TDS,識別方面還是一些國外的技術。但是經過這么多年的競爭下來,我看到發(fā)生了巨大的變化,訊飛一步一步在壯大,而一些跨國公司在退出,訊飛現在上市了,現在又推出了訊飛云,我從心里頭特別的為訊飛感到驕傲,祝訊飛越走越好。

  我今天演講的題目是:領先技術,開放平臺,移動互聯(lián)網的深度未來。

  我們首先看一下小手機的大未來,關注一個數字,30億,也就是說到了2014年,全球會有30億的人通過寬帶移動上網,是PC的四倍,也就是說PC的產業(yè)增長在放緩,手機在快速增長,我們確實看到了移動互聯(lián)網的發(fā)展,今后的十年是移動互聯(lián)網的十年。

  那么移動互聯(lián)網與PC互聯(lián)網有什么不同?我想最大的不同可能體現在終端上面,作為手機最大的特點,它有三個屬性:首先它有眼睛,那就是它的攝象頭,它有嘴巴,就是它的麥克風,還有它有位置。也就是說移動互聯(lián)網首先它是互聯(lián)網的一個很重要的組成部分,同時移動互聯(lián)網又有自己的特點,我們總結它是能看,能定位,能聽,能說的互聯(lián)網。

  我們認為手機瀏覽器面臨四個大的技術門檻:

  第一個技術門檻,所謂的訪問互聯(lián)網的門檻。就是說我們要用手機能夠非?焖俚臒o縫的訪問到PC互聯(lián)網上原滋原味的內容和應用。那么在這個基礎上,幾個因素:一個是速度,一個是穩(wěn)定性。

  第二個技術門檻,我們認為是瀏覽多媒體的一個門檻。我們希望在手機上不僅僅是看到干巴巴的文字,圖,我們希望看到視頻,看到游戲,聽到聲音。這些技術它核心的幾個因素,首先是流暢,清晰。

  第三個技術門檻是位置服務的門檻。在位置服務這個技術上,主要的核心點,一個是精準,穩(wěn)定和資源。

  第四個技術門檻,是語音輸入的門檻。我這有兩個方向,一個是語音的識別和輸入,一個是語音的輸出,這個我后面會詳細再講。

  2004年,UC首先攻克了訪問互聯(lián)網的門檻,當別人還在用手機看WOP,當時還都是文字的時候,我們已經率先實現了WWW的無縫訪問,這有賴于我們在全球率先采用了客戶端服務器混合運算架構的方式,充分利用了服務器端的技術能力和功能,把大部分運算集中在服務器端,在手機端進行展現,這個是我們在04年做的一個重大的技術突破。09年,UC率先攻克了Flash這個門檻,現在我們已經支持了PC上的Flash10,已經率先打破了Flash禁區(qū)。別人在規(guī)劃的時候,我們已經實現了,尤其已經在所有主流的平臺上實現了Flash功能,可以支持一些游戲、視頻等互動項目。

  2010年,UC攻克了位置門檻,剛才我也講到很多基于本地服務的一些應用,比如說我們生活服務,假設我在口碑網,我查一下有沒有飯館,包括本地搜索,包括今后可能會有些跟地域相關的應用,這些應用都需要有一個平臺去支持它能夠獲取用戶的位置,那么我們現在已經具備了這么一個平臺,我想等到這個平臺運行穩(wěn)定之后,我們會跟業(yè)界的合作伙伴開展深度的合作。

  那么未來我想有一個可預見的未來,我們希望跟科大訊飛這樣的語音服務的領先的提供商一起攜手突破語音的門檻。剛才講到分成兩類,一類是輸入,一類是輸出。輸入主要是通過連續(xù)的語音識別到解析成文字,然后根據語意解釋了解用戶的意圖,然后再進行一些網絡的訪問和交互。還有一個,我這路里沒畫出來,就是輸出,輸出利用把互聯(lián)網上一些文字信息,利用語音合成技術能夠播放出來,讓用戶能夠很方便的獲得語音的信息。

  UC一貫的原則是合作與開放,我們是為產業(yè)鏈創(chuàng)造價值,而不是掠奪產業(yè)鏈的價值。在用戶這一端,我們幫助手機用戶實現了快捷上網,既省錢,又省時間,現在用戶規(guī)模已經超過了一個億。在運營商方面,我們增加了手機上網用戶的數量,增加了用戶的移動數據,產生了收入,F在UC上流量每個月的流量費可以高達上億,跟手機廠商,我們幫助手機廠商更好的定制軟件,能夠快速的訪問互聯(lián)網,也就是說,手機加上UC瀏覽器,就可以成為互聯(lián)網手機。

  目前我們已經跟上百個品牌,三千多款手機開展了合作,對新浪、搜狐、開心這樣的內容網站,我們的價值在于,我們通過技術創(chuàng)新,幫助用戶能夠快速無縫的訪問他們的業(yè)務和內容,而且我們通過開放平臺,幫助他能夠實現業(yè)務的展現的增值。

  那么UC一直堅持開放的原則,會與各種云端的服務進行無縫的結合。我們一定會堅持以開放式合作的心態(tài),跟合作伙伴一起分享用戶,分享應用。后續(xù)我們也會跟訊飛在語音識別方面進行一些其他的合作。剛才講到了語音輸入的技術門檻,這里頭提到一個移動互聯(lián)網時代一個不可調和的矛盾,就說一邊是蓬勃發(fā)展的一些應用內容的需求,另外一邊就手機的交互能力的限制。隨著移動互聯(lián)網發(fā)展,我們希望手機上能夠更多的展現文字、聲音、圖象、視頻,以及能夠進行各方面的互動。但是手機本身它是移動的,它的尺寸,它的屏幕,它的鍵盤,都是不能夠支持良好的交互,這個時候我認為語音技術就有非常大的一個機會。

  語音技術與手機瀏覽器的結合,我認為能夠形成人機語音交互的一個巨大進步,必將在移動互聯(lián)網上發(fā)揮巨大作用。舉個例子來說,我們可以語音識別來操控瀏覽器,暢游移動互聯(lián)網,剛才劉總已經做了精彩的演示,我覺得非常好。

  第二個,在語音合成方面,我們能夠幫助內容進行展現,能夠通過直接語音的輸出,讓用戶很方便的得到信息。那么通過UC跟訊飛的合作,我們希望UC和手機加在一起,能變成一個生動的移動互聯(lián)網。我們堅信通過兩個公司的合作,能看能聽能說的移動互聯(lián)網必將到來,謝謝大家!

騰訊科技



相關閱讀:
聯(lián)想韋衛(wèi)演講:攜手開創(chuàng)移動互聯(lián)網的新時代 2010-11-03
手機閱讀:閱讀方式新變局 2010-11-02
應用商店成3G內容差異化競爭關鍵 2010-11-01
科大訊飛董事長劉慶峰介紹語音云概念 2010-10-29
專訪科大訊飛吳曉如:語音與移動互聯(lián)網共舞 2010-10-29

熱點專題:  語音合成TTS 語音識別ASR    移動增值   移動互聯(lián)網
分類信息:  移動增值_與_移動互聯(lián)網  移動互聯(lián)網_與_移動
相關頻道:  增值電信文摘