呼叫中心TTS的定義與作用
作者:admin 來源:本站 發(fā)布時間:2020-07-09 11:03:30是一種將輸入的文本轉(zhuǎn)換成語音的技術(shù)。TTS輸入的文本包括兩部分:純文本和標(biāo)記。純文本指的是語音的內(nèi)容,而標(biāo)記可以用來改變語音的聲調(diào)、速度、重讀等。TTS引擎的處理過程如圖:
其中,文本處理是通過語音模型進(jìn)行分詞,單詞的多義(如確定多音字的發(fā)音),并處理標(biāo)記。而合成是把單詞轉(zhuǎn)換成語音。
合成主要有兩種,一種是基于規(guī)則的合成,主要是計算參數(shù)的軌跡,形成規(guī)則,完成語音的合成,采用的參數(shù)包括發(fā)音器官參數(shù)和聲道模型參數(shù);另一種是基于拼接的合成,合成器按照語音規(guī)則把預(yù)先錄制的語音單元進(jìn)行拼接,預(yù)先錄制的語音單元的集合叫作音庫,合成語音的音質(zhì)與錄音員的音質(zhì)是一樣的。語音合成技術(shù)主要有以下發(fā)展方向。
(1)提高合成語音的自然度
提高合成語音的自然度仍然是高性能文語轉(zhuǎn)換的當(dāng)務(wù)之急。就漢語語音合成來說,目前在單字和詞組一級上,合成語音的可懂度和自然度已基本,但是到句子乃篇章一級時其自然度問題就比較大。
(2)豐富合成語音的表現(xiàn)力
目前國內(nèi)外大多數(shù)語音合成研究是針對文語轉(zhuǎn)換系統(tǒng),且只能以某種朗讀風(fēng)格將書面語言轉(zhuǎn)換成口語輸出,缺乏不同年齡、性別特征及語氣、語速的表現(xiàn),更不用說賦予個人的感情色彩。
(3)多語種文語合成
語言是人們交流的工具,不同民族有自己不同的語言,不同語言之間的交流在今天開放的信息社會和網(wǎng)絡(luò)時代顯得十分重要,多語種的文語合成有著獨(dú)特的應(yīng)用價值。
TTS是語音合成應(yīng)用的一種,它將儲存于電腦中的文件,如幫助文件或者網(wǎng)頁,轉(zhuǎn)換成自然語音輸出。TTS不僅能幫助有視覺障礙的人閱讀計算機(jī)上的信息,更能增加文本文檔的可讀性?,F(xiàn)在的TTS應(yīng)用包括語音驅(qū)動的郵件以及聲音敏感系統(tǒng),并常與聲音識別程序一起使用。
現(xiàn)在有很多TTS的產(chǎn)品,包括語音合成助手,PDF Markup Cloud,PDF 大師 ,Read Please 2000, Proverbe Speech Unit,以及Next Up Technology的TextAloud。朗訊、 Elan、以及 AT&T都有自己的語音合成產(chǎn)品。 特別是在智能呼叫中心IVR導(dǎo)航起作重要的作用!