語音分析系統(tǒng)相比傳統(tǒng)的人工分析的優(yōu)勢
語音分析系統(tǒng)的優(yōu)勢主要有以下幾個方面:
1. 數(shù)據(jù)覆蓋更全:很顯然,智能語音分析人工分析工具所難以比擬的數(shù)據(jù)覆蓋性,語音分析可以做到100%覆蓋,但人工分析一般抽樣比例低于5%.
2. 數(shù)據(jù)處理能力更強:相比于人工分析,智能語音分析數(shù)據(jù)處理能力更高,每一個CPU線程每一小時可以處理分析2.6小時的錄音,而人工分析每人每一小時只能處理分析0.4小時的錄音。一般標配服務(wù)器為16核CPU,一般等同于104人。(Elwin,這里需要說得更簡單直白一些,“一般標配服務(wù)器16和CPU,一般等同于104人”,具體是什么意思?)
3. 具有精確的分析功能:語音分析可以通過聚類算法知道熱點業(yè)務(wù)、高頻詞匯;同時也可以通過篩選算法,在幾秒鐘內(nèi)就可找到目標數(shù)據(jù),而人工分析無法處理大數(shù)據(jù)量計算統(tǒng)計工作。
4. 更具智能性:語音分析可以進行大數(shù)據(jù)量的統(tǒng)計計算,從而找出中間的具有某個特定特性的集合,并且分析集合間的相關(guān)性,而人工分析無法進行大數(shù)量的計算。
5.自動性:語音分析可以事先預(yù)設(shè)統(tǒng)計規(guī)則,并設(shè)置回溯期的數(shù)據(jù)重新統(tǒng)計計算,人工無法將歷史數(shù)據(jù)采用新算法計算。
6.統(tǒng)計計算工具:語音分析具備大量的數(shù)據(jù)挖掘和分析工具,人工分析只能做簡單的計算統(tǒng)計。
語音識別領(lǐng)域落后歐美發(fā)達國家 但發(fā)展空間廣闊
在中文語音識別領(lǐng)域,國內(nèi)的科研院所及公司的數(shù)據(jù)積累要遠遠多于國外的同行,因此在中文的識別準確度上要好于國外。國內(nèi)技術(shù)型創(chuàng)業(yè)公司(包括普強)在研發(fā)和利用新技術(shù)方面有很大的靈活性,站在技術(shù)的前沿,這同時也提高了國內(nèi)語音技術(shù)在國內(nèi)的產(chǎn)業(yè)化水平。在企業(yè)應(yīng)用市場方面仍然落后于歐美的發(fā)達國家,但是目前處于迅速跟進和快速發(fā)展的階段,這給語音產(chǎn)業(yè)的創(chuàng)業(yè)公司尤其是面向企業(yè)市場的公司提供了廣闊的市場空間。
加強研發(fā) 投資多個領(lǐng)域
在技術(shù)方面,從簡單的聲音模板匹配,到GMM/HMM,再到DNN/HMM每個新技術(shù)的發(fā)展都能給ASR的準確率帶來一個飛躍,但仍然有很多問題需要解決,比如適應(yīng)各種環(huán)境的噪音,尤其是含有人聲的背景噪聲、口音及方言的識別、以及在嵌入式設(shè)備中降低功耗等。普強會繼續(xù)投入大量的資源去解決這些問題。以保證普強在技術(shù)上的領(lǐng)先地位。
ASR可應(yīng)用在很多不同領(lǐng)域。包括:企業(yè)呼叫中心,車載導(dǎo)航領(lǐng)域、教育領(lǐng)域、玩具領(lǐng)域、聲紋識別領(lǐng)域和醫(yī)療保健領(lǐng)域等。普強的自主專利核心技術(shù)都可以支持這些領(lǐng)域。目前,我們集中資源在企業(yè)呼叫中心和移動互聯(lián)網(wǎng)領(lǐng)域。我們的產(chǎn)品在這一領(lǐng)域有明顯的優(yōu)勢,會繼續(xù)投資現(xiàn)有的領(lǐng)域,同時也會在此領(lǐng)域繼續(xù)加大投入以保持我們的優(yōu)勢,當(dāng)然,也會投入在車載、教育等領(lǐng)域來建立技術(shù)屏障。