首頁>>>技術>>>語音應用>>>語音合成(TTS)  語音合成產(chǎn)品

基于MSTTS的網(wǎng)絡通信應用開發(fā)

武漢大學電信學院(430072) 楊宗長 2003/08/04

  VOIP(Voice over IP,俗稱IP電話)是建立在IP技術上的分組化、數(shù)字化傳輸技術,其基本原理是:通過語音壓縮算法對話音進行壓縮編碼處理,然后把這些語音數(shù)據(jù)按IP等相關協(xié)議進行打包,經(jīng)過IP網(wǎng)絡把數(shù)據(jù)包傳輸?shù)侥康牡,再把這些語音數(shù)據(jù)包串起來,經(jīng)過解碼解壓處理后,恢復成原來的語音信號,從而達到由IP網(wǎng)絡傳送話音的目的。雖然經(jīng)過幾年的快速發(fā)展.然而由于種種原因,VOIP離成熟的應用還有一段不小的距離;實際上,人們在網(wǎng)絡通信的內(nèi)容還是文本為主,正如:IOCQ等.

一、MSTTS(Microsoft Text TO Speech,文本朗讀)網(wǎng)絡通信設計

  MSTTS 是基于COM(Component Object Model,組件對象模型) 規(guī)范的文本朗讀技術;簡單地說,它能將文本直接朗讀出來.因此應用MSTTS技術 ,我們可以開發(fā)出具有語音功能的網(wǎng)絡通信,

  本文的基本設計思路: 通信方,將通話文本信息通過網(wǎng)絡傳輸?shù)綄Ψ?對方接收到信息后,顯示信息并同時通過MSTTS 播放出來。


二、MSTTS 應用程序開發(fā).

  MSTTS基于COM 規(guī)范的文本朗讀技術;COM是基于二進制標準一種軟件組件通信技術,它主要的目標是為了管理日益復雜的應用程序和實現(xiàn)代碼重用.在使用COM組件對象時,一般地使用兩種方式:

  A.通過CoCreateInstance() 或CoCreateInstanceEx()實例化對象;然后調(diào)用Addref()引用 計數(shù),使用完后,再調(diào)用Release()釋放對象

  B..另外一種更簡便的方法就是使用智能指針(smart pointer)。

  所有的智能指針都是基于_com_ptr_t 的模塊類,_ com_ptr_t 它封裝IUnknow QureyInterface ,Addref() 和 Release() 方法;它具有自動計數(shù)的機制:即在構造對象時,自動計數(shù);在析構對象時,自動調(diào)用Release().通過 #import 指令可以入服務組件到應用程序中,并生成智能指針定義.

1.MTTS 組件的應用編程

導入MSTTS 組件

#import "C:\Winnt\Speech\VText.DLL" no_namespace // MSTTS 的安裝目錄

CoInitialize(NULL); //COM 初始化

ITextToSpeechPtr pSkPtr(_uuidof(TextToSpeech)); /MSTTS智能指針

ITextToSpeech *pTxtSph=pSkPtr.GetInterfacePtr();;

pTxtSph->AddRef();

1>.朗讀

char buf[]=”Hello, the word!”; //文本信息

pTxtSph->Speak(buf); //朗讀

2>.暫停

pTextSph->Pause();

3>.繼續(xù)

pTxtSph->Resume();

4>.停止

pTxtSph->Stop();


2.網(wǎng)絡通信應用編程

<1> 套接字

  它是網(wǎng)絡的基本構件,是網(wǎng)絡應用程序接口。它具有可以被命名和尋址的通信端點,使用中的每一個套接字都有其類型和一個與之相連聽進程。WINDOWS SOCKET 版本支持兩種套接字:流套接字(SOCK_STREAM)和數(shù)據(jù)報套接字(SOCK_DGRAM) .

<2>、WINDOWS SOCKETS 實現(xiàn)

  WINDOWS SOCKETS 實現(xiàn)是指實現(xiàn)了WINDOWS SOCKETS規(guī)范所描述的全部功能的一套軟件。在VC++6.0 開發(fā)平臺中它提供了專門的阻塞形式的CSocket 類() 和異步形式的CAsyncSocket 類,封裝實現(xiàn)了Windows Sockets 功能..

<3>網(wǎng)絡數(shù)據(jù)報通信的編程實現(xiàn)

A. 創(chuàng)建建套接字

CasyncSocket m_Sock;

M_Sock.Create(6000,SOCK_DGRAM);// 數(shù)據(jù)報套接字,端口6000

B. 發(fā)送文本信息

char textbuf[]=”Hello,good day!”

m_Sock.SendTo(textbuf,//發(fā)送的數(shù)據(jù)

sizeof(buf),//數(shù)據(jù)的大小

,6000,//對方的端口

“127.0.0.1”,//對方的主機名或IP 地址

0);

C. 接收文本信息

char revbuf[50];//接收緩存區(qū)

CString strHost;//保存發(fā)送方IP地址的字符串

unsigned int port;//發(fā)送方端口

int len=m_Sock.ReceiveFrom(revbuf,50,strHost,port); //接收信息

pTxtSph->Speak(revbuf); //朗讀接收到的文本信息

3.程序示例

<1>用戶界面(如下圖)


<2>通信演示(單機的自發(fā)自收)


計算機世界網(wǎng)(www.ccw.com.cn)


相關鏈接:
捷通華聲“颶風行動”降低語音應用門檻 2003-08-04
語音應用客戶滿意度調(diào)研 2003-07-29
Nuance Voice Platform - NVP 2.0語音平臺 2003-07-22
語音合成發(fā)揮作用 2003-07-21
淺析國元證券呼叫中心自動語音信息制作方式 2003-07-21

分類信息:     文摘   技術_語音合成_文摘