呼叫中心TTS的定義與作用

作者：admin 來源：本站發(fā)布時(shí)間：2020-07-09 11:03:30

TS是Text To Speech的縮寫，即“從文本到語音”，是人機(jī)對(duì)話的一部分，讓機(jī)器能夠說話。濟(jì)南電話營銷系統(tǒng)

是一種將輸入的文本轉(zhuǎn)換成語音的技術(shù)。TTS輸入的文本包括兩部分：純文本和標(biāo)記。純文本指的是語音的內(nèi)容，而標(biāo)記可以用來改變語音的聲調(diào)、速度、重讀等。TTS引擎的處理過程如圖:

　　其中，文本處理是通過語音模型進(jìn)行分詞，單詞的多義(如確定多音字的發(fā)音)，并處理標(biāo)記。而合成是把單詞轉(zhuǎn)換成語音。

合成主要有兩種，一種是基于規(guī)則的合成，主要是計(jì)算參數(shù)的軌跡，形成規(guī)則，完成語音的合成，采用的參數(shù)包括發(fā)音器官參數(shù)和聲道模型參數(shù);另一種是基于拼接的合成，合成器按照語音規(guī)則把預(yù)先錄制的語音單元進(jìn)行拼接，預(yù)先錄制的語音單元的集合叫作音庫，合成語音的音質(zhì)與錄音員的音質(zhì)是一樣的。語音合成技術(shù)主要有以下發(fā)展方向。

　　(1)提高合成語音的自然度

　　提高合成語音的自然度仍然是高性能文語轉(zhuǎn)換的當(dāng)務(wù)之急。就漢語語音合成來說，目前在單字和詞組一級(jí)上，合成語音的可懂度和自然度已基本，但是到句子乃篇章一級(jí)時(shí)其自然度問題就比較大。

　　(2)豐富合成語音的表現(xiàn)力

　　目前國內(nèi)外大多數(shù)語音合成研究是針對(duì)文語轉(zhuǎn)換系統(tǒng)，且只能以某種朗讀風(fēng)格將書面語言轉(zhuǎn)換成口語輸出，缺乏不同年齡、性別特征及語氣、語速的表現(xiàn)，更不用說賦予個(gè)人的感情色彩。

　　(3)多語種文語合成

　　語言是人們交流的工具，不同民族有自己不同的語言，不同語言之間的交流在今天開放的信息社會(huì)和網(wǎng)絡(luò)時(shí)代顯得十分重要，多語種的文語合成有著獨(dú)特的應(yīng)用價(jià)值。

　　TTS是語音合成應(yīng)用的一種，它將儲(chǔ)存于電腦中的文件，如幫助文件或者網(wǎng)頁，轉(zhuǎn)換成自然語音輸出。TTS不僅能幫助有視覺障礙的人閱讀計(jì)算機(jī)上的信息，更能增加文本文檔的可讀性?，F(xiàn)在的TTS應(yīng)用包括語音驅(qū)動(dòng)的郵件以及聲音敏感系統(tǒng)，并常與聲音識(shí)別程序一起使用。

　　現(xiàn)在有很多TTS的產(chǎn)品，包括語音合成助手，PDF Markup Cloud，PDF 大師，Read Please 2000， Proverbe Speech Unit，以及Next Up Technology的TextAloud。朗訊、 Elan、以及 AT&T都有自己的語音合成產(chǎn)品。特別是在智能呼叫中心IVR導(dǎo)航起作重要的作用!