語(yǔ)音合成技術(shù)(精選5篇)
語(yǔ)音合成技術(shù)范文第1篇
【關(guān)鍵詞】計(jì)算機(jī);語(yǔ)音合成技術(shù);發(fā)展方向
1、引言
語(yǔ)音合成技術(shù)使人們只要通過(guò)“聽(tīng)”就可以聽(tīng)懂、了解信息的內(nèi)容,該技術(shù)的應(yīng)用可以描述為將計(jì)算機(jī)產(chǎn)生的或者外部其他設(shè)備輸入的文字信息,按語(yǔ)音處理設(shè)定好的的規(guī)則轉(zhuǎn)換成語(yǔ)音信號(hào)輸出,這就會(huì)使文本文件內(nèi)容、手機(jī)短信內(nèi)容、WORD文件內(nèi)容等文字信息,能通過(guò)計(jì)算機(jī)流暢順利地讀出文字信息。這種將文字轉(zhuǎn)換成語(yǔ)音的高新技術(shù)稱之為文字語(yǔ)音轉(zhuǎn)換技術(shù),簡(jiǎn)稱TTS (Text to Speech) 技術(shù)。
2、語(yǔ)音合成技術(shù)方法研究
錄音編輯法、波形合成法、參數(shù)合成法和規(guī)則合成法,這四種研究方法是研究語(yǔ)音合成技術(shù)的主要方法,當(dāng)然還有其他方法,我們這里不做介紹。
1)錄音編輯法。此方法是將人的語(yǔ)音通過(guò)某種媒介錄制下來(lái),再適當(dāng)?shù)匕堰@些錄制下來(lái)的語(yǔ)音連接起來(lái),編輯成所需文字,缺點(diǎn)是在計(jì)算機(jī)內(nèi)對(duì)此卻不作任何壓縮及其他技術(shù)處理,而是直接將其輸出,此法需要大容量存儲(chǔ)器。
2)波形合成法我們這里介紹兩種方法。一種方法是波形編輯合成,目前很多專用的語(yǔ)音合成器基本上是采用這種方法,其原理是選取語(yǔ)音庫(kù)采取的自然語(yǔ)言的合成單元波形后,對(duì)這些波形進(jìn)行編輯拼接,最后輸出,簡(jiǎn)單的講是把波形編輯技術(shù)用于語(yǔ)音合成。這種方法比較常見(jiàn),比如我們生活中常見(jiàn)的有自動(dòng)報(bào)時(shí)裝置、公交車(chē)語(yǔ)音報(bào)站等。
另一種是波形編碼合成,此方法是直接將要合成的語(yǔ)音發(fā)音波形進(jìn)行存儲(chǔ)或進(jìn)行波形編碼壓縮技術(shù)處理,然后進(jìn)行存儲(chǔ),當(dāng)合成重放時(shí)再譯碼組合輸出語(yǔ)音,這種方法類似于語(yǔ)音編碼中的波形編解碼方法,。但是此方法在技術(shù)上還需進(jìn)一步升級(jí),這種語(yǔ)音合成器只是語(yǔ)音存儲(chǔ)和重放的器件。
3)專家早期的研究主要是采用參數(shù)合成法,這種運(yùn)行方式比較復(fù)雜,下面我們主要介紹發(fā)音器官參數(shù)合成、共振峰合成、LPC合成等幾種方法。
發(fā)音器官參數(shù)合成應(yīng)計(jì)算出語(yǔ)音的聲波,如何得到語(yǔ)音的聲波,應(yīng)首先通過(guò)定義唇、舌、聲帶的相關(guān)參數(shù),再由這些參數(shù)估計(jì)聲道截面積函數(shù),進(jìn)而獲取語(yǔ)音聲波。這種合成方法具有我們希望得到的優(yōu)點(diǎn),即它直接模擬人的發(fā)音過(guò)程,可以產(chǎn)生接近人發(fā)聲的語(yǔ)音,但是,目前要準(zhǔn)確測(cè)定出這些參數(shù)還缺少行之有效的手段,因?yàn)槊總(gè)人的發(fā)音生理過(guò)程比較復(fù)雜,因此,大家普遍認(rèn)為發(fā)音器官參數(shù)合成技術(shù)研究還不夠成熟,走出實(shí)驗(yàn)室研究還需一段時(shí)間。共振峰合成把人的聲道看作成諧振腔,腔體的諧振特性決定所發(fā)出語(yǔ)音信號(hào)的頻譜特性,它是對(duì)聲源—聲道模型的模擬,我們稱之為共振峰特性。我們可以通過(guò)修改振峰合成參數(shù)獲得不同特性的語(yǔ)音。也能以較低的代價(jià)產(chǎn)生具有高可懂度的合成語(yǔ)音,但是前提是振峰合成的參數(shù)設(shè)置合理。后來(lái)又產(chǎn)生了基于LPC、lSP等聲學(xué)參數(shù)的合成系統(tǒng)。在眾多合成系統(tǒng)中LPC是一線性預(yù)測(cè)編碼法。它采用10~25ms為一幀對(duì)語(yǔ)音波形進(jìn)行采樣,各幀的參數(shù)是時(shí)變的,在一幀內(nèi)則為一線性時(shí)不變系統(tǒng)。在存儲(chǔ)器中存入各幀的參數(shù),參數(shù)獲取方法為在幀中抽取原始語(yǔ)音的音調(diào)周期、清音、濁音若干個(gè)基于最小二乘的預(yù)測(cè)系數(shù),在合成時(shí)以這些參數(shù)綜合語(yǔ)音。LPC法系用3~7 位對(duì)所獲取參數(shù)進(jìn)行編碼處理,在數(shù)值間可以自動(dòng)插補(bǔ)運(yùn)算,因此次方法合成的語(yǔ)音音質(zhì)柔、動(dòng)聽(tīng)[1]。
4)規(guī)則合成法。20世紀(jì)80年代末至今,基音同步疊加(PSOLA)方法問(wèn)世,大大提高了基于時(shí)域波形拼接方法合成的語(yǔ)音的音色和自然度,該基于PSOLA方法的合成器具有結(jié)構(gòu)簡(jiǎn)單、易于實(shí)時(shí)實(shí)現(xiàn)等優(yōu)點(diǎn),此方法的提出標(biāo)志著語(yǔ)言合成技術(shù)研究取得了實(shí)質(zhì)性的進(jìn)展,引起了科學(xué)界的轟動(dòng),具有寬廣的商用價(jià)值。
PSOLA技術(shù)的原理特點(diǎn)是,要想使拼接單元的韻律特征符合上下文的要求,同時(shí)又能使合成波形保持了原發(fā)音的主要音段特征,需要根據(jù)上下文的要求,用PSOLA算法調(diào)整拼接單元的韻律特征,如基頻、音長(zhǎng)、音強(qiáng)等,最后再對(duì)語(yǔ)音波形片斷進(jìn)行拼接,從而獲得具有很高清晰度和自然度的語(yǔ)音。隨著人們對(duì)語(yǔ)音合成的自然度和音質(zhì)的要求越來(lái)越高,研究一種具有音質(zhì)好,對(duì)時(shí)長(zhǎng)和聲調(diào)適應(yīng)性強(qiáng),可以靈活調(diào)節(jié)韻律參數(shù)的語(yǔ)音合成方法被人們又一次的提上來(lái)研究日程,于是一種基于LMA (對(duì)數(shù)振幅近似)聲道模型的語(yǔ)音合成方法被提出來(lái)了,從技術(shù)上講這種新方法克服了PSOLA算法難以處理協(xié)同發(fā)音的缺陷和韻律參數(shù)調(diào)整能力較弱的缺點(diǎn),而且這種新的語(yǔ)音合成方式具有比PSOLA技術(shù)更高的合成音質(zhì)[2]。解決了PSOLA算法難以解決的問(wèn)題,綜上所述,計(jì)算機(jī)語(yǔ)音合成方式有很多種,科學(xué)家們從軟件和硬件的各方面對(duì)比進(jìn)行了研究, 發(fā)現(xiàn)人們可以按不同的使用情況、不同的使用目的選擇適合各自需求的的語(yǔ)音合成方法。
3、語(yǔ)音合成未來(lái)研究方向
目前語(yǔ)音合成的發(fā)展方向及研究熱點(diǎn)主要涉及以下幾方向,它們是:
1)不同語(yǔ)音風(fēng)格的語(yǔ)音技術(shù)合成。一種發(fā)展方向是合成具有獨(dú)特特征的語(yǔ)音,比如某個(gè)名人的語(yǔ)音。另一個(gè)發(fā)展方向是使語(yǔ)音合成系統(tǒng)不但能夠合成標(biāo)準(zhǔn)的朗讀風(fēng)格,而且能完成特定的風(fēng)格,這個(gè)發(fā)展方向?qū)⑹谷藱C(jī)對(duì)話更加智能,比如能產(chǎn)生評(píng)書(shū)、RAP、新聞、幽默、警告、以及普通非正式的說(shuō)話等語(yǔ)音效果,區(qū)分度將更大。所以加強(qiáng)不同說(shuō)話風(fēng)格的合成技術(shù)的研究顯得非常必要和關(guān)鍵。這是未來(lái)的研究發(fā)展方向之一。
2)情感語(yǔ)音技術(shù)合成。對(duì)于漢語(yǔ)語(yǔ)音,目前研究出了驚、怒、悲喜四種情感不同的變調(diào)規(guī)律,變調(diào)規(guī)律由科學(xué)家通過(guò)分析情感語(yǔ)句的語(yǔ)調(diào)得出。并對(duì)不同的情感類型確定與之相應(yīng)的元音的變異規(guī)律、基音頻率變化規(guī)律、能量變化規(guī)律、和無(wú)聲時(shí)延比例變化規(guī)則[3]。對(duì)于待合成的語(yǔ)音, 要獲得較好的語(yǔ)音效果,應(yīng)先進(jìn)行文本掃描輸入,再通過(guò)對(duì)相應(yīng)情感的語(yǔ)調(diào)變化規(guī)則的迭加,利用PSOLA技術(shù)進(jìn)行情感語(yǔ)音合成,但是實(shí)現(xiàn)對(duì)人的認(rèn)知的完全理解, 還需要深入研究。
3)發(fā)音器官合成與可視語(yǔ)音。在語(yǔ)音合成系統(tǒng)中,說(shuō)話者的臉可以顯著提高合成語(yǔ)音的可懂度、真實(shí)性、和終端用戶的可接受性。在聲學(xué)語(yǔ)音受到周邊噪聲影響時(shí)或者遇到具有聽(tīng)力障礙的人時(shí),可視語(yǔ)音可以提高語(yǔ)音的可懂度。目前在語(yǔ)音合成技術(shù)研究領(lǐng)域中,人們普遍認(rèn)為如何解決語(yǔ)音合成中自然度的問(wèn)題,無(wú)疑是可視語(yǔ)音合成技術(shù)的亟需解決的關(guān)鍵問(wèn)題,研究人員對(duì)此充滿了信心。
4)文本語(yǔ)音閱讀。當(dāng)我們需要將在屏幕上顯示的文字、已打出的文字稿件或者打出的文字需要用語(yǔ)音讀出來(lái)的時(shí)候,此時(shí)就要對(duì)文本進(jìn)行閱讀,,以釋放用眼疲勞,緩解壓力。當(dāng)前,文本語(yǔ)音閱讀技術(shù)主要應(yīng)用在文稿校對(duì)、計(jì)算機(jī)輔助教學(xué)等工作領(lǐng)域。
綜上所述,我們應(yīng)該加強(qiáng)對(duì)語(yǔ)音合成技術(shù)的深入研究,并把這種高新技術(shù)轉(zhuǎn)化為更加強(qiáng)大的、切實(shí)可用的生產(chǎn)力,創(chuàng)造出更大的社會(huì)經(jīng)濟(jì)效益,推動(dòng)人機(jī)交互方式的革命的到來(lái)。如今,盡快開(kāi)發(fā)出一個(gè)自然度高、可視化高、可懂度高漢語(yǔ)語(yǔ)音合成系統(tǒng),已經(jīng)成為當(dāng)務(wù)之急。
參考文獻(xiàn)
[1]王仁華.中文語(yǔ)音交互技術(shù)標(biāo)準(zhǔn)化工作進(jìn)展[J].信息技術(shù)標(biāo)準(zhǔn)化,2004(3):4-5.
語(yǔ)音合成技術(shù)范文第2篇
從幾年前蘋(píng)果Siri將語(yǔ)音迅速升溫推至消費(fèi)者面前,到現(xiàn)在語(yǔ)音助手幾乎已成為智能手機(jī)、汽車(chē)電子、智能家居的標(biāo)配,從人們過(guò)去在路邊招手打車(chē)到現(xiàn)在先用微信與出租車(chē)師傅說(shuō)好再出門(mén)……似乎,智能語(yǔ)音產(chǎn)業(yè)已經(jīng)迎來(lái)生機(jī)盎然的春天。語(yǔ)音一時(shí)間成為輿論的焦點(diǎn):“語(yǔ)音將徹底替代鼠標(biāo)、鍵盤(pán)”,“語(yǔ)音將成為移動(dòng)互聯(lián)網(wǎng)主流信息入口”,“誰(shuí)掌控語(yǔ)音誰(shuí)就將掌控一切”……看好、贊揚(yáng)語(yǔ)音之聲不絕于耳。
但一個(gè)技術(shù)從萌芽期開(kāi)始不斷發(fā)展,要醞釀多久才會(huì)到爆發(fā)期?智能語(yǔ)音產(chǎn)業(yè)是真的到爆發(fā)期了,還是被提前過(guò)度炒作了?智能語(yǔ)音產(chǎn)業(yè)現(xiàn)狀和未來(lái)發(fā)展方向如何?中國(guó)智能語(yǔ)音企業(yè)又該如何選擇適合自己的成長(zhǎng)路徑?帶著這些疑問(wèn),本報(bào)記者先后采訪多位智能語(yǔ)音專家,力求探知一二。
莫錯(cuò)失趕超良機(jī)
智能語(yǔ)音是新一代的人機(jī)交互技術(shù)手段之一。就像人與人之間對(duì)話交流一樣,智能語(yǔ)音是要通過(guò)語(yǔ)音實(shí)現(xiàn)人與機(jī)器之間的交互,即機(jī)器能聽(tīng)懂,并能回答提問(wèn),實(shí)現(xiàn)對(duì)話互動(dòng)。“智能語(yǔ)音技術(shù)主要包括語(yǔ)音識(shí)別、自然語(yǔ)言理解和語(yǔ)音合成三個(gè)環(huán)節(jié),完成讓機(jī)器聽(tīng)懂人說(shuō)話,再讓機(jī)器說(shuō)人話的過(guò)程。這種交互需要基于海量的語(yǔ)料庫(kù),通過(guò)模型實(shí)現(xiàn)語(yǔ)音識(shí)別和語(yǔ)義理解,包括對(duì)語(yǔ)法、分詞、情景,甚至是情緒等的理解,再通過(guò)知識(shí)庫(kù)系統(tǒng)找到答案,然后通過(guò)語(yǔ)音合成技術(shù)說(shuō)出答案,來(lái)回交互。”在接受記者采訪時(shí),中國(guó)語(yǔ)音產(chǎn)業(yè)聯(lián)盟副秘書(shū)長(zhǎng)李德升這樣給出他對(duì)智能語(yǔ)音的理解。
百度語(yǔ)音首席研究員賈磊在第十八屆中國(guó)國(guó)際軟件博覽會(huì)的演講中介紹,百度語(yǔ)音就是通過(guò)語(yǔ)音識(shí)別、語(yǔ)義理解和后臺(tái)資源來(lái)實(shí)現(xiàn)“你說(shuō)我聽(tīng)”、“你說(shuō)我想”和“你說(shuō)我做”的過(guò)程,打造人機(jī)交互的閉環(huán)過(guò)程。
人機(jī)智能語(yǔ)音交互,說(shuō)起來(lái)容易做起來(lái)難。20世紀(jì)50年代,AT&T開(kāi)發(fā)出第一個(gè)語(yǔ)音識(shí)別系統(tǒng)Audry;20世紀(jì)80年代,智能語(yǔ)音技術(shù)研究由傳統(tǒng)的基于標(biāo)準(zhǔn)模型匹配的技術(shù)思路開(kāi)始轉(zhuǎn)向基于統(tǒng)計(jì)模型的技術(shù)思路;21世紀(jì)初,智能語(yǔ)音從技術(shù)研究走向?qū)嵱貌⑦M(jìn)入產(chǎn)業(yè)化,進(jìn)入呼叫中心、家電、汽車(chē)等領(lǐng)域;而近期,以蘋(píng)果Siri為重要引爆點(diǎn),智能語(yǔ)音應(yīng)用才開(kāi)始向移動(dòng)互聯(lián)網(wǎng)等新興領(lǐng)域延伸,產(chǎn)業(yè)進(jìn)而不斷積累、發(fā)展。
智能語(yǔ)音技術(shù)是人工智能的研究領(lǐng)域之一,其原理涉及聲學(xué)、語(yǔ)言學(xué)、數(shù)字信號(hào)處理和計(jì)算機(jī)科學(xué)等多個(gè)學(xué)科,研究周期長(zhǎng),投入成本大,技術(shù)壁壘高。全球和中國(guó)智能語(yǔ)音市場(chǎng)基本形成寡頭壟斷的格局。隨著智能語(yǔ)音產(chǎn)業(yè)的快速發(fā)展,產(chǎn)業(yè)競(jìng)爭(zhēng)進(jìn)一步加劇,也吸引了IT巨頭和中小創(chuàng)業(yè)團(tuán)隊(duì)爭(zhēng)相進(jìn)入,與傳統(tǒng)語(yǔ)音技術(shù)提供商共同角逐智能語(yǔ)音市場(chǎng)。
在國(guó)際市場(chǎng),既有像Nuance這樣的占據(jù)全球62%語(yǔ)音市場(chǎng)的傳統(tǒng)語(yǔ)音技術(shù)巨頭,也有谷歌、蘋(píng)果、微軟、IBM等IT巨頭的競(jìng)爭(zhēng)參與。在國(guó)內(nèi)市場(chǎng),李德升告訴記者,目前我國(guó)語(yǔ)音技術(shù)廠商基本分為三類:一類是傳統(tǒng)語(yǔ)音技術(shù)廠商,一般從科研院所基礎(chǔ)研究脫胎,包括像科大訊飛(中國(guó)科技大學(xué))、捷通華聲(清華大學(xué)、中科院聲學(xué)所、北京大學(xué))、中科模識(shí)(中科院自動(dòng)化所)、中科信利(中科院聲學(xué)所)等;第二類是互聯(lián)網(wǎng)廠商,包括百度、騰訊、搜狗等,它們?yōu)榻o其廣大的互聯(lián)網(wǎng)用戶提供更好的增值服務(wù),普遍采用戰(zhàn)略合作或者收購(gòu)等方式,掌握智能語(yǔ)音技術(shù),推廣語(yǔ)音服務(wù);第三類是創(chuàng)業(yè)企業(yè),像云知聲、思必馳等,它們專注于某些行業(yè)領(lǐng)域,比如汽車(chē)、家電、教育、社交網(wǎng)絡(luò)來(lái)推廣自己的語(yǔ)音技術(shù)和產(chǎn)品。
近幾年來(lái),移動(dòng)互聯(lián)網(wǎng)蓬勃發(fā)展,基于互聯(lián)網(wǎng)海量數(shù)據(jù)的深度神經(jīng)網(wǎng)絡(luò)技術(shù)有力推進(jìn),智能家電、汽車(chē)電子、可穿戴設(shè)備等領(lǐng)域加速應(yīng)用,汽車(chē)、醫(yī)療、智能家居、教育等行業(yè)應(yīng)用不斷拓展,智能語(yǔ)音作為新的信息入口,開(kāi)始引領(lǐng)產(chǎn)業(yè)重大變革。
這一兩年來(lái),我國(guó)智能語(yǔ)音市場(chǎng)也是風(fēng)起云涌:2023年8月中國(guó)移動(dòng)以13.6億元戰(zhàn)略投資科大訊飛,科大訊飛受二級(jí)市場(chǎng)機(jī)構(gòu)投資者追捧市值超過(guò)200億元;云知聲創(chuàng)立僅一年就先后獲得兩輪投資,其中一次融資金額高達(dá)1億元;2023年5月,捷通華聲宣布來(lái)自百度、清華大學(xué)戰(zhàn)略投資;2023年8月,百度正式宣布向開(kāi)發(fā)者開(kāi)放語(yǔ)音生態(tài)系統(tǒng),包括底層的語(yǔ)音識(shí)別技術(shù)應(yīng)用程序開(kāi)發(fā)接口(API)、百度語(yǔ)音助手軟件開(kāi)發(fā)工具包(SDK);同樣在這個(gè)月騰訊在微信5.0中增加語(yǔ)音輸入功能,一出來(lái)便風(fēng)靡大眾,微信APP已經(jīng)成為消費(fèi)者每天必刷的強(qiáng)大APP之一;直到最近,2023年4月12日,云知聲組織創(chuàng)業(yè)公司牽頭成立“全智能交互聯(lián)盟”;2023年4月29日,科大訊飛的訊飛輸入法繼支持粵語(yǔ)、四川話、河南話等方言之后宣布支持東北話語(yǔ)音輸入;5月20日晚,錘子科技首款智能手機(jī)Smartisan T1,借科大訊飛智能語(yǔ)音技術(shù)實(shí)現(xiàn)語(yǔ)音搜索、語(yǔ)音輸入等特色功能……整個(gè)產(chǎn)業(yè)一片欣欣向榮。
“智能語(yǔ)音是人機(jī)智能交互的手段之一,而人機(jī)智能交互是目前中國(guó)技術(shù)企業(yè)有可能趕超國(guó)際的為數(shù)不多的產(chǎn)業(yè)機(jī)遇之一。產(chǎn)業(yè)變革是以技術(shù)為先導(dǎo)的。在PC/互聯(lián)網(wǎng)時(shí)代,我國(guó)技術(shù)企業(yè)在計(jì)算機(jī)技術(shù)尤其是操作系統(tǒng)等方面,因?yàn)槠鸩酵,趕超微軟、谷歌等國(guó)際技術(shù)公司比較難,但在智能交互這個(gè)技術(shù)領(lǐng)域,相對(duì)而言,目前中西方起步差不多,如果我們能把握好現(xiàn)在的機(jī)會(huì),好好練內(nèi)功,發(fā)展我們自己的包括智能語(yǔ)音在內(nèi)的交互技術(shù),也許在這方面我們可以真正和國(guó)際公司一較高下,真正從中國(guó)制造走向中國(guó)創(chuàng)造。”北京捷通華聲語(yǔ)音技術(shù)有點(diǎn)公司(簡(jiǎn)稱捷通華聲)董事長(zhǎng)張連毅這樣告訴記者。
與張連毅持相同觀點(diǎn)的還有科大訊飛信息科技股份有限公司(簡(jiǎn)稱科大訊飛)副總裁江濤和北京云知聲信息技術(shù)有限公司(簡(jiǎn)稱云知聲)CEO黃偉。在他們看來(lái),智能語(yǔ)音是難得的一次產(chǎn)業(yè)良機(jī),錯(cuò)過(guò)語(yǔ)音,中國(guó)技術(shù)企業(yè)很難再有機(jī)會(huì)趕超國(guó)際了。
磨一根針 破一片天
“做語(yǔ)音是需要慢慢熬的。”這句話記者不止聽(tīng)一個(gè)被采訪人說(shuō)過(guò)。
1989年從清華大學(xué)畢業(yè)任職紫光推進(jìn)OCR(圖像掃描識(shí)別),中間赴美,2000年與中國(guó)科學(xué)院聲學(xué)所研究員呂士楠共同創(chuàng)辦捷通華聲的張連毅稱自己是語(yǔ)音乃至整個(gè)智能交互行業(yè)的老兵。在他看來(lái),從“入口說(shuō)”、“門(mén)檻說(shuō)”到“血統(tǒng)說(shuō)”再到“技術(shù)說(shuō)”,這兩年來(lái)的語(yǔ)音熱其實(shí)更多是一種炒作,而這種炒作對(duì)行業(yè)本身未必有多大好處。“我只認(rèn)可‘技術(shù)說(shuō)’。因?yàn)檎Z(yǔ)音只是交互的方式之一,智能語(yǔ)音就是一門(mén)技術(shù),它與應(yīng)用結(jié)合,這項(xiàng)技術(shù)就能創(chuàng)造出巨大價(jià)值。而這門(mén)技術(shù)的特點(diǎn)是厚積薄發(fā),需要慢慢積累,所以這就決定智能語(yǔ)音產(chǎn)業(yè)是要用一根針刺破天的專業(yè)領(lǐng)域,而不是用一個(gè)鐵錘砸出一片聲勢(shì)的產(chǎn)業(yè),必須專注、專業(yè),精耕細(xì)作,深耕久釀!
而所謂的積累,在云知聲CEO黃偉看來(lái),就是算法、數(shù)據(jù)和團(tuán)隊(duì)經(jīng)驗(yàn)的積累。他告訴記者,作為創(chuàng)業(yè)型公司,“云知聲的優(yōu)勢(shì)不在于數(shù)據(jù)積累,而在于算法。從云知聲成立第一天起,我們就用了比對(duì)手少一個(gè)數(shù)量級(jí)的數(shù)據(jù)來(lái)訓(xùn)練算法模型,最終達(dá)到甚至超越對(duì)手產(chǎn)品性能,這個(gè)過(guò)程我們也積累了豐富而寶貴的團(tuán)隊(duì)經(jīng)驗(yàn)。而現(xiàn)在開(kāi)放的語(yǔ)音云平臺(tái)已經(jīng)讓我們有了很多用戶數(shù)據(jù),我們的數(shù)據(jù)短板已經(jīng)得到了彌補(bǔ)!
黃偉畢業(yè)于中國(guó)科學(xué)技術(shù)大學(xué),后加入摩托羅拉并帶隊(duì)研發(fā)出世界上首個(gè)手機(jī)聲紋認(rèn)證系統(tǒng)。國(guó)際金融危機(jī)期間,摩托羅拉將整個(gè)語(yǔ)音識(shí)別團(tuán)隊(duì)出售給Nuance。黃偉拒絕被Nuance收編,于2009年7月加入盛大網(wǎng)絡(luò)旗下的創(chuàng)新院,2023年10月創(chuàng)建了語(yǔ)音分院,2023年年底正式出任公司CEO。黃偉告訴記者,在技術(shù)方面云知聲先后四次升級(jí)語(yǔ)音識(shí)別內(nèi)核,目前識(shí)別準(zhǔn)確率達(dá)96.26%,技術(shù)領(lǐng)先,并且可提供中、英、粵多語(yǔ)言識(shí)別;在商業(yè)化方面,云知聲單月簽約額突破千萬(wàn)元,合作伙伴超過(guò)3200家,云知聲智能語(yǔ)音已廣泛應(yīng)用在移動(dòng)互聯(lián)網(wǎng)、智能家電、車(chē)載、可穿戴設(shè)備、呼叫中心、教育、醫(yī)療等領(lǐng)域。
無(wú)獨(dú)有偶,科大訊飛副總裁江濤也同樣是語(yǔ)音界的老人。畢業(yè)于中國(guó)科技大學(xué)自動(dòng)化與計(jì)算機(jī)專業(yè)的他是科大訊飛的元老,作為科大訊飛創(chuàng)業(yè)團(tuán)隊(duì)成員,一直在從事語(yǔ)音技術(shù)在通信和互聯(lián)網(wǎng)方向的應(yīng)用推廣。在江濤看來(lái),語(yǔ)音技術(shù)和其他技術(shù)一樣,都在沿技術(shù)成熟曲線不斷發(fā)展。幾年前蘋(píng)果Siri帶動(dòng)語(yǔ)音走進(jìn)向上發(fā)展階段,那時(shí)整個(gè)產(chǎn)業(yè)被看好,很多資本投入進(jìn)來(lái)至一個(gè)高潮,而現(xiàn)在是高潮過(guò)后走入技術(shù)成熟曲線下行階段,很多人開(kāi)始悲觀,資本撤離,只有堅(jiān)持下來(lái)的公司能做成。他判斷,帶語(yǔ)音走入下一波上行曲線的動(dòng)力很可能是可穿戴設(shè)備、智能家居、智能汽車(chē)等。
江濤向記者回憶,在上世紀(jì)90年代,當(dāng)時(shí)公認(rèn)語(yǔ)音做得最好是南北二“王”,南“王”就是中國(guó)科技大學(xué)的王仁華老師,他也是科大訊飛第一任董事長(zhǎng),也是他支持科大訊飛現(xiàn)任董事長(zhǎng)劉慶峰創(chuàng)業(yè)的;北“王”指的就是清華大學(xué)的王作英老師,語(yǔ)音識(shí)別和語(yǔ)音合成做得都很不錯(cuò)。在江濤看來(lái),語(yǔ)音成為人機(jī)交互的主要信息入口這是大勢(shì)所趨,毋庸置疑,只是語(yǔ)音真正價(jià)值的實(shí)現(xiàn)還有賴于技術(shù)的成熟和應(yīng)用的普及。應(yīng)用的普及需要慢慢來(lái),引導(dǎo)、教育市場(chǎng),培養(yǎng)人們的使用習(xí)慣要一點(diǎn)點(diǎn)推進(jìn),但要全面推廣、普及還是需要過(guò)程的!皫啄昵耙怯腥嗽陔娞堇飳(duì)著自己手機(jī)喃喃自語(yǔ)大家都會(huì)覺(jué)得奇怪,不知道這人干嘛呢,但現(xiàn)在因?yàn)槲⑿诺钠占,這種行為習(xí)慣已經(jīng)被接受認(rèn)可。”
而對(duì)于技術(shù)的成熟,江濤同樣認(rèn)為是需要專注投入、不斷積累的。江濤向記者介紹目前的語(yǔ)音識(shí)別技術(shù)現(xiàn)狀,他以環(huán)境從嘈雜到安靜的程度為橫軸,以人說(shuō)話的清晰程度為縱軸,劃分四個(gè)象限。在第一象限,也就是環(huán)境也安靜、人說(shuō)話也清楚的情況下,目前各家語(yǔ)音廠商技術(shù)實(shí)力差距不大,語(yǔ)音識(shí)別率都很高。在第二象限,也就是環(huán)境嘈雜、網(wǎng)絡(luò)不好的情況下,目前科大訊飛做得很不錯(cuò)。噪音大、網(wǎng)絡(luò)信號(hào)時(shí)斷時(shí)續(xù)非常影響語(yǔ)音識(shí)別效果。“車(chē)載語(yǔ)音識(shí)別最大的對(duì)手就是噪音。2023年8月,奔馳在全球?qū)υ萍夹g(shù)提供商進(jìn)行選型的報(bào)告中分別按不同時(shí)速(每小時(shí)60、100、140公里)測(cè)噪,科大訊飛是唯一在100公里時(shí)速上識(shí)別率超過(guò)90%的廠商!苯瓭院赖亟榻B。在第三象限,也就是環(huán)境不錯(cuò)、人發(fā)音不太配合(最典型的各種口音)的情況下,看的就是對(duì)語(yǔ)言種類,尤其是方言的支持程度。云知聲實(shí)現(xiàn)對(duì)粵語(yǔ)、英語(yǔ)的識(shí)別支持?拼笥嶏w除了實(shí)現(xiàn)對(duì)粵語(yǔ)、英語(yǔ)的識(shí)別支持,2023年以來(lái)陸續(xù)支持對(duì)河南話、四川話、東北話等方言的識(shí)別。江濤透露今年還會(huì)陸續(xù)支持湖南話、山東話、武漢話、合肥話、閩南話的方言識(shí)別。除了口音之外,語(yǔ)速、講話模式等也會(huì)對(duì)語(yǔ)音識(shí)別帶來(lái)不同挑戰(zhàn),比如演講與開(kāi)會(huì)的語(yǔ)音識(shí)別的識(shí)別算法和模型都不一樣!敖衲昴甑卓拼笥嶏w將推出一個(gè)產(chǎn)品實(shí)現(xiàn)普通話開(kāi)會(huì)過(guò)程中,將語(yǔ)音轉(zhuǎn)變?yōu)槲淖郑R(shí)別率很高。”江濤透露。而在第四象限,即環(huán)境又不好、發(fā)音又不好的情況是世界性的難題,很難有誰(shuí)能攻克。
各展所長(zhǎng) 開(kāi)放競(jìng)合
隨著谷歌、微軟、IBM等IT巨頭加快對(duì)智能語(yǔ)音領(lǐng)域的布局,以及Nuance在中國(guó)的本土化不斷加強(qiáng),國(guó)內(nèi)語(yǔ)音企業(yè)將面臨越來(lái)越大的競(jìng)爭(zhēng)壓力。相較于Nuance等國(guó)際巨頭,國(guó)內(nèi)語(yǔ)音企業(yè)在研發(fā)力量、創(chuàng)新能力、集成應(yīng)用、行業(yè)應(yīng)用拓展等方面還有不小差距。國(guó)內(nèi)語(yǔ)音企業(yè)間的合作、并購(gòu)、整合步伐也相對(duì)要緩慢一些。
對(duì)于國(guó)內(nèi)語(yǔ)音企業(yè)的發(fā)展,作為行業(yè)專家的李德升給出了他的見(jiàn)解和建議。他認(rèn)為,在傳統(tǒng)語(yǔ)音技術(shù)廠商中,科大訊飛的實(shí)力有目共睹,而捷通華聲的語(yǔ)音合成在鐵路交通、金融電信等領(lǐng)域也有較高的市場(chǎng)占有率,很多高鐵、公交站等的報(bào)站語(yǔ)音是捷通華聲做的。對(duì)于這類廠商,李德升給出的建議是得專注于語(yǔ)音,引入互聯(lián)網(wǎng)思維,真正做大做強(qiáng)。對(duì)于百度、騰訊、搜狗等互聯(lián)網(wǎng)廠商做語(yǔ)音,李德升認(rèn)為他們具有最豐富的互聯(lián)網(wǎng)語(yǔ)音資源,更重要的是他們有技術(shù)實(shí)力、有用戶、有互聯(lián)網(wǎng)思維,這些廠商最有可能可以和國(guó)外競(jìng)爭(zhēng)者一較高下。而對(duì)于第三類語(yǔ)音創(chuàng)業(yè)企業(yè),李德升的建議是盡量采取合作方式,與互聯(lián)網(wǎng)廠商合作,專注于特定行業(yè)領(lǐng)域積累實(shí)力,既不能小富即安,也不能貪高大上,只要積極進(jìn)取,踏實(shí)經(jīng)營(yíng),還是有非常大的成長(zhǎng)空間的。
“其實(shí),以蘋(píng)果為代表的軟硬件一體化廠商做語(yǔ)音是為了賣(mài)硬件產(chǎn)品,互聯(lián)網(wǎng)廠商大多是從幫助用戶搜索的角度做語(yǔ)音,相對(duì)于創(chuàng)業(yè)型的語(yǔ)音企業(yè),科大訊飛的優(yōu)勢(shì)就在于語(yǔ)音的寬度和厚度積累,優(yōu)勢(shì)就在于多年來(lái)對(duì)語(yǔ)音識(shí)別、語(yǔ)音合成、語(yǔ)音評(píng)測(cè)與語(yǔ)義理解各方面立體的投入和研究,目前擁有全方位立體的語(yǔ)音技術(shù)產(chǎn)品。”江濤說(shuō),在語(yǔ)音推廣方面,科大訊飛堅(jiān)持兩條腿走路:一是堅(jiān)持移動(dòng)互聯(lián)網(wǎng)能力開(kāi)發(fā),一是通信、教育和安全等重點(diǎn)行業(yè)推進(jìn)。逐步拓展移動(dòng)互聯(lián)網(wǎng)能力的三駕馬車(chē)是手機(jī)、汽車(chē)和智能電視。目前科大訊飛手機(jī)語(yǔ)音已經(jīng)有四億的用戶,每天活躍用戶達(dá)四千多萬(wàn)。在教育領(lǐng)域,科大訊飛的語(yǔ)音合成、語(yǔ)音評(píng)測(cè)在廣東高考英語(yǔ)口語(yǔ)考試,西部中小學(xué)的英語(yǔ)教具和日常教學(xué)中已經(jīng)發(fā)揮很大作用;而在安全領(lǐng)域,公安部第一個(gè)跟企業(yè)合辦的部級(jí)重點(diǎn)實(shí)驗(yàn)室――公安部聲紋實(shí)驗(yàn)室就設(shè)在科大訊飛。
江濤也坦言,相較于百度等互聯(lián)網(wǎng)巨頭做語(yǔ)音,傳統(tǒng)語(yǔ)音技術(shù)廠商確實(shí)存在一些劣勢(shì),“在整個(gè)大的開(kāi)發(fā)平臺(tái)、云存儲(chǔ)、位置服務(wù)和構(gòu)建整個(gè)生態(tài)系統(tǒng)方面,互聯(lián)網(wǎng)公司確實(shí)值得我們學(xué)習(xí)。我們還是要專心做好自己所長(zhǎng),聚焦在語(yǔ)音和語(yǔ)義方面,真正做好開(kāi)發(fā)者服務(wù),基于語(yǔ)音和語(yǔ)義構(gòu)建生態(tài)系統(tǒng),嘗試推廣人機(jī)交互廣告等!
“互聯(lián)網(wǎng)巨頭要擁有語(yǔ)音這個(gè)技術(shù),不被別人卡住喉嚨,但他們有自己的主業(yè),不會(huì)放太多精力在語(yǔ)音上。”張連毅如此判斷,“語(yǔ)音技術(shù)廠商只要做好自己的技術(shù)和產(chǎn)品,保持開(kāi)放合作就能獲得良好的發(fā)展!背撕粚(shí)智能語(yǔ)音市場(chǎng),捷通華聲更要做的是實(shí)現(xiàn)包括智能語(yǔ)音、圖像識(shí)別(OCR)、生物特征識(shí)別在內(nèi)的全方位的人機(jī)智能交互。
語(yǔ)音合成技術(shù)范文第3篇
從幾年前蘋(píng)果Siri將語(yǔ)音迅速升溫推至消費(fèi)者面前,到現(xiàn)在語(yǔ)音助手幾乎已成為智能手機(jī)、汽車(chē)電子、智能家居的標(biāo)配,從人們過(guò)去在路邊招手打車(chē)到現(xiàn)在先用微信與出租車(chē)師傅說(shuō)好再出門(mén)……似乎,智能語(yǔ)音產(chǎn)業(yè)似乎已經(jīng)迎來(lái)生機(jī)盎然的春天。語(yǔ)音一時(shí)間成為輿論的焦點(diǎn):“語(yǔ)音將徹底替代鼠標(biāo)、鍵盤(pán)”,“語(yǔ)音將成為移動(dòng)互聯(lián)網(wǎng)主流信息入口”,“誰(shuí)掌控語(yǔ)音誰(shuí)就將掌控一切”……看好、贊揚(yáng)語(yǔ)音之聲不絕于耳。
但一個(gè)技術(shù)從萌芽期開(kāi)始不斷發(fā)展,要醞釀多久會(huì)到爆發(fā)期?智能語(yǔ)音產(chǎn)業(yè)是真的到爆發(fā)期了還是被提前過(guò)度炒作了?智能語(yǔ)音產(chǎn)業(yè)現(xiàn)狀和未來(lái)發(fā)展方向如何?中國(guó)智能語(yǔ)音企業(yè)又該如何選擇適合自己的成長(zhǎng)路徑?帶著這些疑問(wèn),本報(bào)記者先后采訪多位智能語(yǔ)音專家,力求探知一二。
莫錯(cuò)失趕超良機(jī)
智能語(yǔ)音是新一代的人機(jī)交互技術(shù)手段之一。就像人與人之間對(duì)話交流一樣,智能語(yǔ)音是要通過(guò)語(yǔ)音實(shí)現(xiàn)人與機(jī)器之間的交互,即機(jī)器能聽(tīng)懂,并能回答提問(wèn),實(shí)現(xiàn)對(duì)話互動(dòng)!爸悄苷Z(yǔ)音技術(shù)主要包括語(yǔ)音識(shí)別、自然語(yǔ)言理解和語(yǔ)音合成三個(gè)環(huán)節(jié),完成讓機(jī)器聽(tīng)懂人說(shuō)話,再讓機(jī)器說(shuō)人話的過(guò)程。這種交互需要基于海量的語(yǔ)料庫(kù),通過(guò)模型實(shí)現(xiàn)語(yǔ)音識(shí)別和語(yǔ)義理解,包括對(duì)語(yǔ)法、分詞、情景、甚至是情緒等的理解,再通過(guò)知識(shí)庫(kù)系統(tǒng)找到答案,然后通過(guò)語(yǔ)音合成技術(shù)說(shuō)出答案,來(lái)回交互!痹诮邮苡浾卟稍L時(shí),中國(guó)語(yǔ)音產(chǎn)業(yè)聯(lián)盟副秘書(shū)長(zhǎng)李德升這樣給出他對(duì)智能語(yǔ)音的理解。
人機(jī)智能語(yǔ)音交互,說(shuō)著容易做起來(lái)難。從20世紀(jì)50年代,AT&T開(kāi)發(fā)出第一個(gè)語(yǔ)音識(shí)別系統(tǒng)Audry;到20世紀(jì)80年代,智能語(yǔ)音技術(shù)研究由傳統(tǒng)的基于標(biāo)準(zhǔn)模型匹配的技術(shù)思路開(kāi)始轉(zhuǎn)向基于統(tǒng)計(jì)模型的技術(shù)思路;再到21世紀(jì)初,智能語(yǔ)音從技術(shù)研究走向?qū)嵱貌⑦M(jìn)入產(chǎn)業(yè)化,進(jìn)入呼叫中心、家電、汽車(chē)等領(lǐng)域;一直到近期以蘋(píng)果SiRi為重要引爆點(diǎn),智能語(yǔ)音應(yīng)用才開(kāi)始向移動(dòng)互聯(lián)網(wǎng)等新興領(lǐng)域延伸,智能語(yǔ)音產(chǎn)業(yè)進(jìn)而不斷積累、發(fā)展。
智能語(yǔ)音技術(shù)是人工智能的研究領(lǐng)域之一,其原理涉及聲學(xué)、語(yǔ)言學(xué)、數(shù)字信號(hào)處理和計(jì)算機(jī)科學(xué)等多個(gè)學(xué)科,研究周期長(zhǎng)。投入成本大,技術(shù)壁壘高。全球和中國(guó)智能語(yǔ)音市場(chǎng)基本形成寡頭壟斷的格局。隨著智能語(yǔ)音產(chǎn)業(yè)的快速發(fā)展,產(chǎn)業(yè)競(jìng)爭(zhēng)進(jìn)一步加劇,也吸引了IT巨頭和中小創(chuàng)業(yè)團(tuán)隊(duì)爭(zhēng)相進(jìn)入,與傳統(tǒng)語(yǔ)音技術(shù)提供商共同角逐智能語(yǔ)音市場(chǎng)。
在國(guó)際市場(chǎng),既有像Nuance這樣的占據(jù)全球62%語(yǔ)音市場(chǎng)的傳統(tǒng)語(yǔ)音技術(shù)巨頭,也有谷歌、蘋(píng)果、微軟、IBM等IT巨頭的競(jìng)爭(zhēng)參與。在國(guó)內(nèi)市場(chǎng),李德升告訴記者,目前我國(guó)語(yǔ)音技術(shù)廠商基本分為三類:一類是傳統(tǒng)語(yǔ)音技術(shù)廠商,一般從科研院所基礎(chǔ)研究脫胎,包括像科大訊飛(中國(guó)科技大學(xué))、捷通華聲(清華大學(xué)、中科院聲學(xué)所、北京大學(xué))、中科模識(shí)(中科院自動(dòng)化所)、中科信利(中科院聲學(xué)所)等;第二類是互聯(lián)網(wǎng)廠商,包括百度、騰訊、搜狗等,他們?yōu)榻o其廣大的互聯(lián)網(wǎng)用戶提供更好的增值服務(wù),普遍采用戰(zhàn)略合作或者收購(gòu)等方式,掌握智能語(yǔ)音技術(shù),推廣語(yǔ)音服務(wù);第三類是創(chuàng)業(yè)企業(yè),像云知聲、思必馳等,他們專注于某些行業(yè)領(lǐng)域,比如汽車(chē)、家電、教育、社交網(wǎng)絡(luò)來(lái)推廣自己的語(yǔ)音技術(shù)和產(chǎn)品。
近幾年來(lái),移動(dòng)互聯(lián)網(wǎng)蓬勃發(fā)展,基于互聯(lián)網(wǎng)海量數(shù)據(jù)的深度神經(jīng)網(wǎng)絡(luò)技術(shù)的有力推進(jìn),智能家電、汽車(chē)電子、可穿戴設(shè)備等領(lǐng)域加速應(yīng)用,汽車(chē)、醫(yī)療、智能家居、教育等行業(yè)應(yīng)用不斷拓展,智能語(yǔ)音作為新的信息入口,開(kāi)始引領(lǐng)產(chǎn)業(yè)重大變革。
這一兩年來(lái),我國(guó)智能語(yǔ)音市場(chǎng)也是風(fēng)起云涌:2023年8月中國(guó)移動(dòng)以13.6億元戰(zhàn)略投資科大訊飛,科大訊飛受二級(jí)市場(chǎng)機(jī)構(gòu)投資者追捧市值超過(guò)200億元;云知聲創(chuàng)立僅一年就先后獲得兩輪投資,其中一次融資金額高達(dá)1億元;2023年5月,捷通華聲宣布來(lái)自百度、清華大學(xué)戰(zhàn)略投資;2023年8月,百度正式宣布向開(kāi)發(fā)者開(kāi)放語(yǔ)音生態(tài)系統(tǒng),包括底層的語(yǔ)音識(shí)別技術(shù)應(yīng)用程序開(kāi)發(fā)接口(API)、百度語(yǔ)音助手軟件開(kāi)發(fā)工具包(SDK);同樣在這個(gè)月騰訊在微信5.0中增加語(yǔ)音輸入功能,一出來(lái)便風(fēng)靡大眾,微信APP已經(jīng)成為消費(fèi)者每天必刷的強(qiáng)大APP之一;直到最近,2023年4月12日,云知聲組織創(chuàng)業(yè)公司牽頭成立“全智能交互聯(lián)盟”;2023年4月29日,科大訊飛的訊飛輸入法繼支持粵語(yǔ)、四川話、河南話等方言之后宣布支持東北話語(yǔ)音輸入;5月20日晚,錘子科技首款智能手機(jī)Smartisan T1,借科大訊飛智能語(yǔ)音技術(shù)實(shí)現(xiàn)語(yǔ)音搜索、語(yǔ)音輸入等特色功能……整個(gè)產(chǎn)業(yè)一片欣欣向榮。
“智能語(yǔ)音是人機(jī)智能交互的手段之一,而人機(jī)智能交互是目前中國(guó)技術(shù)企業(yè)有可能趕超國(guó)際的為數(shù)不多的產(chǎn)業(yè)機(jī)遇之一。產(chǎn)業(yè)變革是以技術(shù)為先導(dǎo)的。在PC/互聯(lián)網(wǎng)時(shí)代,我國(guó)技術(shù)企業(yè)在計(jì)算機(jī)技術(shù)尤其是操作系統(tǒng)等方面,因?yàn)槠鸩酵,所以趕超微軟、谷歌等國(guó)際技術(shù)公司可能比較難,但在智能交互這個(gè)技術(shù)領(lǐng)域,相對(duì)而言,目前中西方起步差不多,如果我們能把握好現(xiàn)在的機(jī)會(huì),好好練內(nèi)功,發(fā)展我們自己的包括智能語(yǔ)音在內(nèi)的交互技術(shù),也許在這方面我們可以真正和國(guó)際公司一較高下,真正從中國(guó)制造走向中國(guó)創(chuàng)造。”北京捷通華聲語(yǔ)音技術(shù)有點(diǎn)公司(簡(jiǎn)稱捷通華聲)董事長(zhǎng)張連毅這樣告訴記者。
與張連毅持相同觀點(diǎn)的還有科大訊飛信息科技股份有限公司(簡(jiǎn)稱科大訊飛)副總裁江濤和北京云知聲信息技術(shù)有限公司(簡(jiǎn)稱云知聲)CEO黃偉。在他們看來(lái),智能語(yǔ)音是難得的一次產(chǎn)業(yè)良機(jī),錯(cuò)過(guò)語(yǔ)音,中國(guó)技術(shù)企業(yè)很難再有機(jī)會(huì)趕超國(guó)際了。
磨一根針破一片天
“做語(yǔ)音是需要慢慢熬的!边@話記者不止在一個(gè)被采訪人口中聽(tīng)到。
1989年從清華大學(xué)畢業(yè)任職紫光推進(jìn)OCR(圖像掃描識(shí)別),中間赴美,2000年與中國(guó)科學(xué)院聲學(xué)所研究員呂士楠共同創(chuàng)辦捷通華聲的張連毅稱自己是語(yǔ)音乃至整個(gè)智能交互行業(yè)的老兵。在他看來(lái),從“入口說(shuō)”、“門(mén)檻說(shuō)”到“血統(tǒng)說(shuō)”再到“技術(shù)說(shuō)”,這兩年來(lái)的語(yǔ)音熱其實(shí)更多是一種炒作,而這種炒作對(duì)行業(yè)本身未必有多大好處!拔抑徽J(rèn)可‘技術(shù)說(shuō)’。因?yàn)檎Z(yǔ)音只是交互的方式之一,智能語(yǔ)音就是一門(mén)技術(shù),它與應(yīng)用結(jié)合,這項(xiàng)技術(shù)就能發(fā)揮出巨大價(jià)值。而這門(mén)技術(shù)的特點(diǎn)是厚積薄發(fā),需要慢慢積累,所以這就決定智能語(yǔ)音產(chǎn)業(yè)是要用一根針頂破天的專業(yè)領(lǐng)域,而不是用一個(gè)鐵錘砸出一片聲勢(shì)的產(chǎn)業(yè),必須專注、專業(yè),精耕細(xì)作,深耕久釀!
而所謂的積累,在云知聲CEO黃偉看來(lái),就是算法、數(shù)據(jù)和團(tuán)隊(duì)經(jīng)驗(yàn)的積累。他告訴記者,作為創(chuàng)業(yè)型公司,“在數(shù)據(jù)的積累方面,云知聲不占優(yōu)勢(shì),我們的優(yōu)勢(shì)在于算法。從云知聲成立第一天起,我們就用了比對(duì)手少一個(gè)數(shù)量級(jí)的數(shù)據(jù)來(lái)訓(xùn)練算法模型,最終達(dá)到甚至超越對(duì)手產(chǎn)品性能,這個(gè)過(guò)程我們也積累了豐富而寶貴的團(tuán)隊(duì)經(jīng)驗(yàn)。而現(xiàn)在開(kāi)放的語(yǔ)音云平臺(tái)已經(jīng)讓我們有了很多用戶數(shù)據(jù),我們的數(shù)據(jù)短板已經(jīng)得到了彌補(bǔ)!
黃偉畢業(yè)于中國(guó)科學(xué)技術(shù)大學(xué),后加入摩托羅拉并帶隊(duì)研發(fā)出世界上首個(gè)手機(jī)聲紋認(rèn)證系統(tǒng)。金融危機(jī)期間,摩托將整個(gè)語(yǔ)音識(shí)別團(tuán)隊(duì)出售給Nuance。黃偉拒絕被Nuance收編,于2009年7月加入盛大網(wǎng)絡(luò)旗下的創(chuàng)新院,2023年10月創(chuàng)建了語(yǔ)音分院,2023年年底正式出任公司CEO。黃偉告訴記者,在技術(shù)方面云知聲先后四次升級(jí)語(yǔ)音識(shí)別內(nèi)核,目前識(shí)別準(zhǔn)確率達(dá)96.26%,技術(shù)領(lǐng)先,并且可提供中、英、粵多語(yǔ)言識(shí)別;在商業(yè)化方面,云知聲單月簽約額突破千萬(wàn)元,合作伙伴超過(guò)3200家,云知聲智能語(yǔ)音已廣泛應(yīng)用在移動(dòng)互聯(lián)網(wǎng)、智能家電、車(chē)載、可穿戴設(shè)備、呼叫中心、教育、醫(yī)療等領(lǐng)域。
無(wú)獨(dú)有偶,科大訊飛副總裁江濤也同樣是語(yǔ)音界的老人。畢業(yè)于中國(guó)科技大學(xué)自動(dòng)化與計(jì)算機(jī)專業(yè)的他是科大訊飛的元老,作為科大訊飛創(chuàng)業(yè)團(tuán)隊(duì)成員,一直在從事語(yǔ)音技術(shù)在通信和互聯(lián)網(wǎng)方向的應(yīng)用推廣。在江濤看來(lái),語(yǔ)音技術(shù)和其他技術(shù)一樣,都在沿技術(shù)成熟曲線不斷發(fā)展。幾年前蘋(píng)果Siri帶動(dòng)語(yǔ)音走進(jìn)向上發(fā)展階段,那時(shí)整個(gè)產(chǎn)業(yè)被看好,很多資本投入進(jìn)來(lái)至一個(gè)小高潮,而現(xiàn)在是小高潮過(guò)后走入技術(shù)成熟曲線下行階段,很多人開(kāi)始悲觀,資本撤離,只有堅(jiān)持下來(lái)的公司能做成。而他判斷,帶語(yǔ)音走入下一波上行曲線的動(dòng)力很可能是穿戴設(shè)備、智能家居、智能汽車(chē)等。
江濤向記者回憶,在上世紀(jì)90年代,當(dāng)時(shí)公認(rèn)語(yǔ)音做得最好是南北二“王”,南“王”就是中國(guó)科技大學(xué)的王仁華老師,他也是科大訊飛第一任董事長(zhǎng),也是他支持科大訊飛現(xiàn)任董事長(zhǎng)劉慶峰創(chuàng)業(yè)的;北“王”指的就是清華大學(xué)的王作英老師,語(yǔ)音識(shí)別和語(yǔ)音合成做得都很不錯(cuò)。
在江濤看來(lái),語(yǔ)音成為人機(jī)交互的主要信息入口這是大勢(shì)所趨,毋庸置疑,只是語(yǔ)音真正價(jià)值的實(shí)現(xiàn)還有賴于技術(shù)的成熟和應(yīng)用的普及。應(yīng)用的普及需要慢慢來(lái),引導(dǎo)、教育市場(chǎng),培養(yǎng)人們的使用習(xí)慣在一點(diǎn)點(diǎn)形成,但要推廣、普及還是需要過(guò)程的!皫啄昵耙怯腥嗽陔娞堇飳(duì)著自己手機(jī)喃喃自語(yǔ)大家都會(huì)覺(jué)得奇怪,不知道這人干嘛呢,但現(xiàn)在因?yàn)槲⑿诺钠占,這種行為習(xí)慣已經(jīng)被接受認(rèn)可!
而對(duì)于技術(shù)的成熟,江濤同樣認(rèn)為是需要專注投入、不斷積累的。江濤向記者介紹目前的語(yǔ)音識(shí)別技術(shù)現(xiàn)狀,他以環(huán)境從嘈雜到安靜的程度為橫軸,以人說(shuō)話的配合清晰程度為縱軸,劃分四個(gè)象限。在第一象限,也就是環(huán)境也安靜、人說(shuō)話也清楚的情況下,目前各家語(yǔ)音廠商技術(shù)實(shí)力差距不大,語(yǔ)音識(shí)別率都很高。在第二象限,也就是環(huán)境嘈雜、網(wǎng)絡(luò)不好的情況下,目前科大訊飛做得很不錯(cuò)。噪音大、網(wǎng)絡(luò)信號(hào)時(shí)斷時(shí)續(xù)非常影響語(yǔ)音識(shí)別效果。“車(chē)載語(yǔ)音識(shí)別最大的對(duì)手就是噪音。2023年8月,奔馳在全球?qū)υ萍夹g(shù)提供商進(jìn)行選型的報(bào)告中分別按不同時(shí)速按照幾種情況(包括60、100、140公里/小時(shí))測(cè)噪,科大訊飛是唯一在100公里/小時(shí)時(shí)速上識(shí)別率超過(guò)90%的廠商!苯瓭院赖亟榻B。
在第三象限,也就是環(huán)境不錯(cuò)、人發(fā)音不太配合(最典型的各種口音)的情況下,看的就是對(duì)語(yǔ)言種類,尤其是方言的支持程度。云知聲實(shí)現(xiàn)對(duì)粵語(yǔ)、英語(yǔ)的識(shí)別支持。科大訊飛除了實(shí)現(xiàn)對(duì)粵語(yǔ)、英語(yǔ)的識(shí)別支持,2023年以來(lái)陸續(xù)了對(duì)河南話、四川話、東北話等方言的識(shí)別。江濤透漏今年還會(huì)陸續(xù)湖南話、山東話、武漢話、合肥話、閩南話的方言識(shí)別。除了口音之外,語(yǔ)速、講話模式等也會(huì)對(duì)語(yǔ)音識(shí)別帶來(lái)不同挑戰(zhàn),比如演講與開(kāi)會(huì)的語(yǔ)音識(shí)別的識(shí)別算法和模型都不一樣!敖衲昴甑卓拼笥嶏w將推出一個(gè)產(chǎn)品實(shí)現(xiàn)普通話開(kāi)會(huì)過(guò)程中,將語(yǔ)音轉(zhuǎn)變?yōu)槲淖,識(shí)別率很高!苯瓭嘎丁6诘谒南笙,即環(huán)境又不好、發(fā)音又不好的情況是世界性的難題,很難有誰(shuí)能攻克。
各展所長(zhǎng)開(kāi)放競(jìng)合
隨著谷歌、微軟、IBM等IT巨頭加快對(duì)智能語(yǔ)音領(lǐng)域的布局,以及Nuance在中國(guó)的本土化不斷加強(qiáng),國(guó)內(nèi)語(yǔ)音企業(yè)將面臨越來(lái)越大的競(jìng)爭(zhēng)壓力。相較于Nuance等國(guó)際巨頭,國(guó)內(nèi)語(yǔ)音企業(yè)在研發(fā)力量、創(chuàng)新能力、集成應(yīng)用、行業(yè)應(yīng)用拓展等方面還有不小差距。國(guó)內(nèi)語(yǔ)音企業(yè)間的合作、并購(gòu)、整合步伐也相對(duì)要緩慢一些。
對(duì)于國(guó)內(nèi)語(yǔ)音企業(yè)的發(fā)展,作為行業(yè)專家李德升在接受記者采訪時(shí)給出了他的見(jiàn)解和建議。他認(rèn)為,在傳統(tǒng)語(yǔ)音技術(shù)廠商中,科大訊飛的實(shí)力有目共睹,而捷通華聲的語(yǔ)音合成在鐵路交通、金融電信等領(lǐng)域也有較高的市場(chǎng)占有率,很多高鐵、公交站等的報(bào)站語(yǔ)音是捷通華聲做的。對(duì)于這類廠商,李德升給出的建議是得專注于語(yǔ)音,引入互聯(lián)網(wǎng)思維,真正做大做強(qiáng)。對(duì)于百度、騰訊、搜狗等互聯(lián)網(wǎng)廠商做語(yǔ)音,李德升認(rèn)為他們具有最豐富的互聯(lián)網(wǎng)語(yǔ)音資源,更重要的是他們有技術(shù)實(shí)力、有用戶、有互聯(lián)網(wǎng)思維,這些廠商最有可能可以和國(guó)外競(jìng)爭(zhēng)者一較高下。而對(duì)于第三類語(yǔ)音創(chuàng)業(yè)企業(yè),李德升的建議是讓他們盡量采取合作方式,與互聯(lián)網(wǎng)廠商合作,專注于特定行業(yè)領(lǐng)域積累實(shí)力,既不能小富即安,更不能貪高大上,只要積極進(jìn)取,踏實(shí)經(jīng)營(yíng),還是有非常大的成長(zhǎng)空間的。
已于2023年向開(kāi)發(fā)者開(kāi)放語(yǔ)音生態(tài)系統(tǒng)的百度語(yǔ)音在語(yǔ)音領(lǐng)域也備受關(guān)注,但百度以采訪審批比較難為由拒絕了記者的面訪邀約,只文字回復(fù):在深度學(xué)習(xí)技術(shù)的驅(qū)動(dòng)下,百度在各方面都取得了長(zhǎng)足的進(jìn)步,可謂影響深遠(yuǎn)。語(yǔ)音技術(shù)方面,相對(duì)錯(cuò)誤率降低了25%以上,移動(dòng)搜索中文語(yǔ)音識(shí)別率突破了90%;圖像技術(shù)方面,人臉識(shí)別技術(shù)世界領(lǐng)先,同時(shí)快速推出了世界上首個(gè)全網(wǎng)人臉?biāo)阉饕妫辉谙嗨茍D像搜索方面,效果遠(yuǎn)遠(yuǎn)超過(guò)了國(guó)際上搜索引擎同類產(chǎn)品。
“其實(shí),以蘋(píng)果為代表的軟硬件一體化廠商做語(yǔ)音是為了賣(mài)硬件產(chǎn)品,互聯(lián)網(wǎng)廠商大多是從幫助用戶搜索的角度做語(yǔ)音,相對(duì)于創(chuàng)業(yè)型的語(yǔ)音企業(yè),科大訊飛的優(yōu)勢(shì)就在于語(yǔ)音的寬度和厚度積累,優(yōu)勢(shì)就在于多年來(lái)對(duì)語(yǔ)音識(shí)別、語(yǔ)音合成、語(yǔ)音評(píng)測(cè)與語(yǔ)義理解各方面立體的投入和研究,目前擁有全方位立體的語(yǔ)音技術(shù)產(chǎn)品!苯瓭f(shuō),在語(yǔ)音推廣方面,科大訊飛堅(jiān)持兩條腿走路:一是堅(jiān)持移動(dòng)互聯(lián)網(wǎng)能力開(kāi)發(fā),一是通信、教育和安全等重點(diǎn)行業(yè)推進(jìn)。移動(dòng)互聯(lián)網(wǎng)能力未來(lái)會(huì)逐步拓展的三駕馬車(chē):手機(jī)、汽車(chē)和智能電視。目前科大訊飛手機(jī)語(yǔ)音已經(jīng)有四億的用戶,每天活躍用戶達(dá)四千多萬(wàn)。在教育領(lǐng)域,科大訊飛的語(yǔ)音合成、語(yǔ)音評(píng)測(cè)在廣東高考英語(yǔ)口語(yǔ)考試,西部中小學(xué)的英語(yǔ)教具和日常教學(xué)中已經(jīng)發(fā)揮很大價(jià)值;而在安全領(lǐng)域,公安部第一個(gè)跟企業(yè)合辦的部級(jí)重點(diǎn)實(shí)驗(yàn)室――公安部聲紋實(shí)驗(yàn)室就設(shè)在科大訊飛。
但江濤也坦言,相較于百度等互聯(lián)網(wǎng)巨頭做語(yǔ)音,傳統(tǒng)語(yǔ)音技術(shù)廠商確實(shí)存在一些劣勢(shì),“在整個(gè)大的開(kāi)發(fā)平臺(tái)、云存儲(chǔ)、位置服務(wù)和構(gòu)建整個(gè)生態(tài)系統(tǒng)方面,互聯(lián)網(wǎng)公司確實(shí)值得我們多學(xué)習(xí)。對(duì)于訊飛來(lái)說(shuō),還是要專心做好自己專長(zhǎng),聚焦在語(yǔ)音和語(yǔ)義方面,真正把對(duì)開(kāi)發(fā)者的服務(wù)做好,基于語(yǔ)音和語(yǔ)義構(gòu)建生態(tài)系統(tǒng),嘗試推廣人機(jī)交互廣告等!
“互聯(lián)網(wǎng)巨頭要擁有語(yǔ)音這個(gè)技術(shù),不被別人卡住喉嚨,但他們有自己的主業(yè),不會(huì)放太多精力在語(yǔ)音!睆堖B毅如此判斷,“語(yǔ)音技術(shù)廠商只要做好自己的技術(shù)和產(chǎn)品,以開(kāi)放合作的心態(tài)就能獲得良好的發(fā)展。”除了夯實(shí)智能語(yǔ)音市場(chǎng),捷通華聲更要做的實(shí)現(xiàn)是包括智能語(yǔ)音、圖像識(shí)別(OCR)、生物特征識(shí)別在內(nèi)的全方位的人機(jī)智能交互。
語(yǔ)音合成技術(shù)范文第4篇
一、民族民間的咬字吐字技術(shù)
我國(guó)民族民間唱法的咬字吐字技術(shù)很有民族個(gè)性。這個(gè)民族個(gè)性的確立與我國(guó)民族語(yǔ)言(主要指漢語(yǔ))的特殊構(gòu)成方式有很大關(guān)系。我們漢語(yǔ)的單音節(jié)字,最大的特點(diǎn)是一字一音一意,各個(gè)相對(duì)獨(dú)立的單音節(jié)字可以相互組合,構(gòu)成語(yǔ)義差別很大的不同語(yǔ)組。漢語(yǔ)的單音節(jié)字在咬字、吐字技術(shù)方面,可分為各個(gè)相對(duì)獨(dú)立的最小語(yǔ)言單位即因素。不同漢字所包括的因素差別使?jié)h字讀音可以分為字頭、字符、字尾的不同結(jié)構(gòu),再加上聲調(diào)的復(fù)雜變化,使得漢語(yǔ)成為有別于西方語(yǔ)言的特殊語(yǔ)言。
根據(jù)漢語(yǔ)的語(yǔ)言結(jié)構(gòu)特點(diǎn),把咬字吐字技術(shù)分為五音、四呼、十三轍和四聲。根據(jù)咬字吐字技術(shù)分類的研究整理出一整套的咬字吐字和收聲歸韻技術(shù),使咬字真切,吐字清晰,歸韻收聲嚴(yán)謹(jǐn)準(zhǔn)確,進(jìn)而使歌唱語(yǔ)言生動(dòng)、親切,富于生命力,具有鮮明的民族風(fēng)格特征。
民族聲樂(lè)的咬字吐字技術(shù)非常強(qiáng)調(diào)字與腔的關(guān)系,理論中的大量術(shù)語(yǔ)講的都是字腔,如:“腔由字生,字正腔圓,依字行腔”等。魏良輔在《南詞引正》中說(shuō):“五音以四聲為主,但四聲不得其宜,五音廢矣。平、上、去、入務(wù)要端正,有上聲字把入平聲,去聲唱做入聲,皆做腔之故,宜速改之”。在字與情的關(guān)系上,不同的咬字技術(shù)會(huì)使歌唱的情感和韻味產(chǎn)生很大的變化。
二、美聲唱法的咬字吐字技術(shù)
美聲唱法的咬字吐字技術(shù)相對(duì)而言,不及民族民間唱法那么復(fù)雜,這在很大程度上應(yīng)歸結(jié)為意大利的語(yǔ)言結(jié)構(gòu)特點(diǎn)和意大利人對(duì)聲音美的觀念的認(rèn)識(shí)。有人說(shuō)“意大利語(yǔ)是世界上最適合歌唱的語(yǔ)言”這句話不無(wú)道理。盡管意大利語(yǔ)與其他歐洲國(guó)家語(yǔ)言一樣屬于拼音文字,多音節(jié)詞在其語(yǔ)言中所占比例很大,但意大利語(yǔ)元音和輔音的拼合非常簡(jiǎn)單方便,語(yǔ)言清晰,音序均勻,節(jié)奏明顯,元音都很平正而圓潤(rùn),渾厚而流暢。在意大利語(yǔ)發(fā)聲中,即使以輔音結(jié)尾,喉嚨、口、咽、鼻腔還是以最后的元音狀態(tài)為基本狀態(tài),鼻腔、口腔同時(shí)出氣,擴(kuò)張的適當(dāng)緊張度比較容易形成歌唱需要的空間,有利于發(fā)聲歌唱,它的語(yǔ)言重音一般都落在倒數(shù)第二個(gè)音節(jié)上,也有部分落在倒數(shù)第三個(gè)音節(jié)上,形成語(yǔ)言比較響亮,韻律比較鮮明,抑揚(yáng)頓挫的特點(diǎn),容易產(chǎn)生各種音的光彩,意大利人更為看中嗓音的柔和,圓潤(rùn)、豐滿、松弛和帶有掩蓋色彩的明亮純正的音質(zhì),這在另一方面也促進(jìn)了美聲唱法的歌唱咬字吐字技術(shù)。美聲唱法的輔音咬字吐字技術(shù)與我國(guó)民族唱法有很多的相同之處,都很注重輔音的咬字力度和噴口速度,只是在咬字力度的緊張度和噴口速度的快慢上稍有差異。美聲唱法的吐字技術(shù)與共鳴和氣息結(jié)合的更緊密。民族民間唱法的吐字技術(shù)與“行腔”的結(jié)合更緊密。
三、聲與情的完美結(jié)合是歌唱藝術(shù)表現(xiàn)的最高境界
在掌握正確的咬字吐字技術(shù)的同時(shí)還應(yīng)從幾個(gè)方面注意字與音、聲與情的關(guān)系:(1)重聲輕情。在歌唱的藝術(shù)表現(xiàn)上往往存在只重視聲音技術(shù),忽略情感表現(xiàn)的問(wèn)題。聲音是表現(xiàn)的手段,情感才是目的。應(yīng)避免因?yàn)榇罅坑?xùn)練聲音的技能技巧而形成單一追求聲音、炫耀聲音技巧現(xiàn)象,在歌唱的意識(shí)中努力把聲音的圓潤(rùn)、氣息的支持與聲區(qū)的統(tǒng)一,共鳴位置運(yùn)用到歌曲情感的表達(dá)上,才能做到歌唱的藝術(shù)表現(xiàn)。(2)重聲輕字。語(yǔ)言是美好的聲音的基礎(chǔ),是情感表達(dá)的靈魂。通過(guò)字的內(nèi)容和意義,表達(dá)我們的思想目的,聲音則是音樂(lè)的輔助者。在歌唱中應(yīng)重視吐字咬字技術(shù)和聲音表現(xiàn)的合理結(jié)合。不能一味地追求聲音的色彩、音量、位置等而唱不清楚歌詞,失去歌唱本身的意義。這一現(xiàn)象在所謂一些“美聲唱法”的人唱中國(guó)歌曲時(shí)尤顯得突出。(3)重情輕聲。在歌唱中也有盲目追求“情感”表現(xiàn)的,激動(dòng)時(shí)會(huì)聲嘶力竭地“真實(shí)”表現(xiàn),低聲區(qū)時(shí)像談話一樣“情感”表達(dá),這樣表現(xiàn)是因?yàn)楦璩呷狈φ_的技術(shù)支持及完美的藝術(shù)思想準(zhǔn)則,是假情感。這種情感失去了歌唱藝術(shù)的審美標(biāo)準(zhǔn),缺乏自如的聲音運(yùn)動(dòng)的技術(shù)能力,隨意性很強(qiáng),是不可忽視的。(4)聲情并重!澳榕c音,以音言情”,情融于音就像鹽融于水。聲含情,情滿聲,從而達(dá)到聲情并茂的歌唱目的。有技術(shù)支持及藝術(shù)規(guī)格的聲音才是歌唱藝術(shù)表現(xiàn)的手段,唱出具有豐富情感的歌聲應(yīng)依存于正確的發(fā)聲技巧,才是真正的歌唱藝術(shù)的情感表現(xiàn)。
歌唱的藝術(shù)表現(xiàn)應(yīng)注重聲情并進(jìn),要求聲音與情感的完美結(jié)合,只有這樣歌唱藝術(shù)的表現(xiàn)力才越強(qiáng)。聲與情的高度完美結(jié)合,以聲傳情、以情帶聲,互相依靠,互相促進(jìn),才能使歌唱賦有更強(qiáng)的生命力,實(shí)現(xiàn)聲情并茂,達(dá)到歌唱藝術(shù)表現(xiàn)的最高境界。
參考文獻(xiàn):
[1].宋篤剛:《聲樂(lè)語(yǔ)言藝術(shù)》,高等教育出版社,1997。
[2].薛 良:《歌唱的藝術(shù)》,:中國(guó)文聯(lián)出版社,1986。
語(yǔ)音合成技術(shù)范文第5篇
【關(guān)鍵詞】LTE IMS VoLTE
中圖分類號(hào):TN929.53 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-1010(2023)-03-0052-05
1 概述
IP技術(shù)是互聯(lián)網(wǎng)主導(dǎo)技術(shù),可方便靈活地提供各種信息服務(wù),還能根據(jù)客戶需求快捷創(chuàng)建新的服務(wù)。但在電信級(jí)語(yǔ)音方面只支持固定接入,安全性和計(jì)費(fèi)控制等不盡如意。傳統(tǒng)的基于電路交換的移動(dòng)網(wǎng)絡(luò),如GSM,雖具有接入的靈活性,可隨時(shí)隨地語(yǔ)音交換,卻不支持IP技術(shù),只能形成一種垂直的業(yè)務(wù)展開(kāi)方式;橫向的不同業(yè)務(wù)應(yīng)用只能分別進(jìn)行業(yè)務(wù)接入、網(wǎng)絡(luò)搭建、業(yè)務(wù)控制和應(yīng)用開(kāi)發(fā),像業(yè)務(wù)計(jì)費(fèi)等主要網(wǎng)絡(luò)單元也須建立獨(dú)立的運(yùn)營(yíng)系統(tǒng)。利用GPRS雖能使GSM用戶接入IP,卻是一種電路域與分組域完全分離、彼此獨(dú)立的補(bǔ)充性應(yīng)用,網(wǎng)速低、性能差,還存在語(yǔ)音和數(shù)據(jù)對(duì)無(wú)線資源的爭(zhēng)用問(wèn)題。
將IP技術(shù)引入到移動(dòng)電信級(jí)語(yǔ)音通信領(lǐng)域,不僅要考慮電路域與分組域的靈活接入性,還要考慮運(yùn)營(yíng)商現(xiàn)有網(wǎng)絡(luò)資源的續(xù)用。根據(jù)GSMA IR.92的定義,VoLTE(Voice over LTE,語(yǔ)音LTE)是一種基于IMS(IP Multimedia Subsystem,IP多媒體子系統(tǒng))的語(yǔ)音技術(shù),可保障較高的QoS(Quality of Serivce,服務(wù)質(zhì)量)和用戶體驗(yàn),解決數(shù)據(jù)互通和漫游問(wèn)題,還能在給用戶帶來(lái)電信級(jí)語(yǔ)音質(zhì)量的同時(shí),實(shí)現(xiàn)在IMS框架下的語(yǔ)音、視頻、數(shù)據(jù)、緊急呼叫等業(yè)務(wù)的融合,因而成為T(mén)D-LTE系統(tǒng)的終極語(yǔ)音解決方案。
2 IMS體系架構(gòu)
IMS是一組全I(xiàn)P核心網(wǎng)絡(luò)技術(shù)規(guī)范,是一種基于IP電話和多媒體服務(wù)業(yè)務(wù)融合的下一代網(wǎng)絡(luò)開(kāi)放式體系架構(gòu)。IMS實(shí)現(xiàn)了在IP基礎(chǔ)上對(duì)語(yǔ)音、數(shù)據(jù)、視頻和移動(dòng)網(wǎng)絡(luò)等技術(shù)的相融,支持多種接入方式,具有豐富的多媒體業(yè)務(wù),并可完成移動(dòng)電話、固定電話和互聯(lián)網(wǎng)等通信模式的整合,配合LTE核心網(wǎng)絡(luò)實(shí)現(xiàn)VoLTE端到端的基于分組域的語(yǔ)音和視頻的電信通信業(yè)務(wù)。由于VoLTE采用了高清語(yǔ)音和視頻編碼,可顯著提高語(yǔ)音通信質(zhì)量,又因采用了SIP(Session Initiation Protocol,會(huì)話發(fā)起協(xié)議)進(jìn)行端到端呼叫控制,使呼叫接續(xù)時(shí)長(zhǎng)僅為CS(Circuit Seitch,電路交換)域的一半,其QoS技術(shù)的應(yīng)用也使語(yǔ)音體驗(yàn)明顯優(yōu)于CS。
IMS體系可分為三層,其中應(yīng)用層由各種服務(wù)器和Web業(yè)務(wù)組成,用戶可通過(guò)IP或傳統(tǒng)電話方式訪問(wèn)這些語(yǔ)音和非語(yǔ)音業(yè)務(wù),所以IMS應(yīng)用層的作用是負(fù)責(zé)為用戶提供IMS多媒體業(yè)務(wù);控制層也叫信令控制層,負(fù)責(zé)管理呼叫或會(huì)話設(shè)置、修改和釋放,所有IP多媒體業(yè)務(wù)的信令控制都在這一層完成,是IMS的核心網(wǎng);傳送接入層也叫承載層,是一個(gè)IP分組交換網(wǎng),可通過(guò)SIP信令建立會(huì)話,并提供承載服務(wù),專門(mén)負(fù)責(zé)IMS SIP會(huì)話接入和傳輸。IMS體系架構(gòu)如圖1所示:
圖1 IMS體系架構(gòu)
3 基于IMS的VoLTE技術(shù)分析
VoLTE語(yǔ)音業(yè)務(wù)由LTE網(wǎng)絡(luò)數(shù)據(jù)域提供支持,而借助IMS系統(tǒng),不僅可實(shí)現(xiàn)語(yǔ)音呼叫控制等功能,還能夠合理、靈活地對(duì)多媒體會(huì)話進(jìn)行計(jì)費(fèi)。IMS定義了為業(yè)務(wù)開(kāi)發(fā)商使用的標(biāo)準(zhǔn)接口,通過(guò)這些接口運(yùn)營(yíng)商能夠在多廠商環(huán)境下提供業(yè)務(wù),避免綁定在單一廠商獲取新業(yè)務(wù)。由于LTE系統(tǒng)只有PS域,所以在LTE上承載語(yǔ)音只能用VoIP(Voice over IP,語(yǔ)音IP)技術(shù),要想在LTE網(wǎng)絡(luò)中應(yīng)用VoLTE語(yǔ)音業(yè)務(wù),還需要用IMS作為會(huì)話類業(yè)務(wù)的控制網(wǎng)絡(luò),需要在LTE/EPC網(wǎng)絡(luò)基礎(chǔ)上疊加IMS網(wǎng)絡(luò)來(lái)提供呼叫控制和業(yè)務(wù)功能。所以,VoLTE語(yǔ)音業(yè)務(wù)是以IMS網(wǎng)絡(luò)作為業(yè)務(wù)控制層,以LTE網(wǎng)絡(luò)作為業(yè)務(wù)承載層的VoIP語(yǔ)音業(yè)務(wù)。
2023年11月中興通訊宣布成功地完成了業(yè)界首個(gè)VoLTE語(yǔ)音互通測(cè)試,在中德兩地遠(yuǎn)距離測(cè)試站點(diǎn)中,驗(yàn)證了在廠商測(cè)試環(huán)境下,基于LTE/EPC/IMS技術(shù)的VoLTE接口的互聯(lián)互通、全球漫游和全I(xiàn)P技術(shù)下的VoLTE語(yǔ)音通信。在測(cè)試場(chǎng)景提供的端到端的網(wǎng)絡(luò)方案中,IMS核心網(wǎng)中包括了CSCF、HSS和IMS應(yīng)用服務(wù)器MMTel AS等,LTE網(wǎng)絡(luò)中包括了eNodeB、MME、S-GW、P-GW、PCRF等,DRA(Diameter Routing Agents,Diameter路由)模塊起到了將兩個(gè)核心網(wǎng)絡(luò)連接的作用,如圖2所示:
圖2 基于IMS系統(tǒng)的VoLTE網(wǎng)絡(luò)架構(gòu)
由圖1、圖2可以看出,將LTE接入IMS體系,DRA模塊起到了決定性的作用。作為Diameter路由,DRA可實(shí)現(xiàn)歸屬網(wǎng)絡(luò)和被訪網(wǎng)絡(luò)間的互聯(lián)與控制,完成各主機(jī)間的LTE漫游。引入Diameter信令,則可實(shí)現(xiàn)LTE用戶的鑒權(quán)、位置更新和計(jì)費(fèi)管理。所以,DRA節(jié)點(diǎn)的引入,可負(fù)責(zé)LTE Diameter信令目的地地址翻譯和轉(zhuǎn)接,為L(zhǎng)TE提供漫游服務(wù),保證全網(wǎng)MME-HSS之間、PCRF-PCRF之間的全I(xiàn)P連接關(guān)系。當(dāng)然,歸屬地HSS、PCRF等網(wǎng)元也需要通過(guò)IMS索引和路由。
VoLTE技術(shù)透過(guò)LTE網(wǎng)絡(luò)的空中接口來(lái)傳輸語(yǔ)音流量,使用傳統(tǒng)互聯(lián)網(wǎng)語(yǔ)音技術(shù)VoIP和以IMS體系為基礎(chǔ)的核心網(wǎng)絡(luò),提供包括視頻電話在內(nèi)的語(yǔ)音服務(wù),語(yǔ)音業(yè)務(wù)流程如圖3所示,可簡(jiǎn)單地分解為開(kāi)機(jī)、呼叫建立和呼叫釋放等三個(gè)過(guò)程。開(kāi)機(jī)過(guò)程是LTE終端UE附著過(guò)程,即所謂永久在線建立過(guò)程,與所有LTE終端附著不同的是,因加入IMS系統(tǒng),終端需要申請(qǐng)VoLTE語(yǔ)音會(huì)話建立和IMS鑒權(quán)與注冊(cè);呼叫建立過(guò)程是VoLTE語(yǔ)音呼叫過(guò)程中的主被叫鏈路的建立,該鏈路一旦建立,主被叫之間就可進(jìn)行VoLTE語(yǔ)音通話;釋放過(guò)程是使主叫回到開(kāi)機(jī)過(guò)程中的附著狀態(tài),一旦發(fā)起呼叫,則可快速連接被叫,大大縮短了起呼時(shí)間。
圖3 VoLTE語(yǔ)音業(yè)務(wù)流程
LTE終端在執(zhí)行VoLTE語(yǔ)音業(yè)務(wù)時(shí),在LTE網(wǎng)絡(luò)和IMS網(wǎng)絡(luò)中,主要經(jīng)歷的網(wǎng)元有eNodeB、MME、S-GW、P-GW、HSS、PCRF、CSCF和AS。從圖2中可以看出,LTE網(wǎng)絡(luò)不僅要完成語(yǔ)音業(yè)務(wù)的空中傳輸,還要負(fù)責(zé)通話終端間的EPS注冊(cè)、IMS注冊(cè)、用戶鑒權(quán)和EPS專用信道的建立,雖然IMS網(wǎng)絡(luò)也需要輔助響應(yīng),但在整個(gè)VoLTE語(yǔ)音業(yè)務(wù)應(yīng)用過(guò)程中,LTE網(wǎng)絡(luò)是其業(yè)務(wù)承載的傳輸主體。當(dāng)這種業(yè)務(wù)承載的傳輸網(wǎng)絡(luò)建立后,獲取多媒體業(yè)務(wù)、VoLTE視頻語(yǔ)音業(yè)務(wù)就需要IMS網(wǎng)絡(luò)支持了。
VoLTE語(yǔ)音業(yè)務(wù)遵循IMS語(yǔ)音業(yè)務(wù)流程,包括漫游和非漫游場(chǎng)景下的起呼和被叫。VoLTE使用PS域業(yè)務(wù)的VoIP語(yǔ)音技術(shù),與PS域所有數(shù)據(jù)業(yè)務(wù)一樣,VoLTE語(yǔ)音也只是一種互聯(lián)網(wǎng)業(yè)務(wù),一種多媒體語(yǔ)音數(shù)據(jù)業(yè)務(wù)。所以,VoLTE語(yǔ)音業(yè)務(wù)實(shí)現(xiàn)視頻語(yǔ)音是一件很簡(jiǎn)單的事。另外,在VoLTE解決方案中,實(shí)現(xiàn)VoIP語(yǔ)音業(yè)務(wù)時(shí),LTE系統(tǒng)將VoIP語(yǔ)音視為一種移動(dòng)寬帶業(yè)務(wù)提供一種承載,業(yè)務(wù)控制則由IMS系統(tǒng)提供,這樣用戶業(yè)務(wù)的QoS和計(jì)費(fèi)策略控制可由PCC(Policy Control and Charging,策略控制與計(jì)費(fèi))系統(tǒng)與之保證。
PCC是3GPP R7中提出的一種基于分組域?qū)崿F(xiàn)流的業(yè)務(wù)策略和控制的邏輯架構(gòu),在R8中增加了包括LTE在內(nèi)的多種接入方式、漫游和PCRF尋址功能。PCC架構(gòu)主要由PCRF、PCEF(Policy and Charging Enforcement Function,策略和計(jì)費(fèi)執(zhí)行功能)、AF(Application Function,應(yīng)用功能)、SPR(Subscription Profile Repository,簽約型存儲(chǔ))等功能實(shí)體組成。PCRF主要實(shí)現(xiàn)策略控制決策和基于流計(jì)費(fèi)控制功能;PCEF主要實(shí)現(xiàn)數(shù)據(jù)流檢測(cè)、策略執(zhí)行和基于流的計(jì)費(fèi)功能;AF在IMS架構(gòu)中由P-CSCF網(wǎng)元替代,主要實(shí)現(xiàn)與PCRF通信交互以傳輸動(dòng)態(tài)會(huì)話信息以便PCRF決策;SPR包含與所有簽約用戶或簽約相關(guān)的信息,而PCRF使用這些信息可決定基于簽約的策略。
在LTE網(wǎng)絡(luò)中引入PCC后的網(wǎng)絡(luò)架構(gòu)如圖4所示,其中PCRF為L(zhǎng)TE核心網(wǎng)中重要模塊,P-CSCF是IMS核心網(wǎng)中CSCF的一個(gè)子模塊,功能相當(dāng)于存儲(chǔ)器的SPR是新增網(wǎng)元,同為新增網(wǎng)元的PCEF,卻非常重要,負(fù)責(zé)執(zhí)行已選策略和計(jì)費(fèi)功能。在PCC策略實(shí)現(xiàn)中,PCRF首先需要查詢包括用戶簽約信息、運(yùn)營(yíng)商用戶數(shù)據(jù)、從承載層和應(yīng)用層獲得接入網(wǎng)絡(luò)信息、了解用戶位置、協(xié)商QoS、用戶設(shè)備信息和用戶計(jì)費(fèi)方式等信息來(lái)確定用戶QoS策略。而后PCRF根據(jù)這些查詢信息,為用戶配置相應(yīng)QoS策略,與其他核心網(wǎng)元交互,分配相關(guān)資源以保證業(yè)務(wù)服務(wù)質(zhì)量。顯然,在PCC策略實(shí)施中,包括了VoLTE語(yǔ)音業(yè)務(wù)在內(nèi)的所有PS域業(yè)務(wù),而上面所述的亦是VoLTE語(yǔ)音業(yè)務(wù)的QoS策略實(shí)施過(guò)程。
圖4 引入PCC架構(gòu)后的LTE網(wǎng)絡(luò)
4 VoLTE技術(shù)應(yīng)用思考
將VoLTE語(yǔ)音建立在IMS體系架構(gòu)和LTE網(wǎng)絡(luò)基礎(chǔ)上,是保證VoLTE語(yǔ)音質(zhì)量的重要前提。LTE的扁平化結(jié)構(gòu)使得接入網(wǎng)E-UTRAN僅由基站eNodeB組成,簡(jiǎn)化了網(wǎng)絡(luò)信令,能將更多會(huì)話(In-Session)資料管理責(zé)任交給eNodeB節(jié)點(diǎn),大大縮短了等待時(shí)間,從而能讓分組語(yǔ)音服務(wù)包和高速數(shù)據(jù)服務(wù)包如同串行流媒體(Streaming Media)一樣可行。LTE可使VoLTE在語(yǔ)音業(yè)務(wù)上擁有更高的頻譜效率,單位頻譜上也可承載更多的語(yǔ)音用戶,特別是通過(guò)引入電信級(jí)QoS和高清編解碼技術(shù),理論上VoLTE完全可以擁有比2G/3G語(yǔ)音、OTT語(yǔ)音更好的用戶體驗(yàn)。
2023年韓國(guó)電信運(yùn)營(yíng)商SKT和LGU及美國(guó)MetroPCS同時(shí)宣布推出可在LTE網(wǎng)絡(luò)中應(yīng)用的基于IP語(yǔ)音技術(shù)的VoLTE,數(shù)月后,韓國(guó)三星又宣布推出了具備VoLTE能力的Galaxy Note 10.1移動(dòng)設(shè)備,加上2023年中興通訊宣布的已成功地完成業(yè)界首個(gè)VoLTE語(yǔ)音跨國(guó)互通測(cè)試報(bào)道,說(shuō)明基于IP數(shù)據(jù)傳輸技術(shù)和LTE語(yǔ)音傳輸技術(shù)的VoLTE語(yǔ)音技術(shù),在PS域已經(jīng)具備了商業(yè)應(yīng)用能力。然而現(xiàn)實(shí)中,全球正在加速部署的LTE網(wǎng)絡(luò)大部分仍然只支持?jǐn)?shù)據(jù)傳輸,不能處理語(yǔ)音通信,用戶電話只能被轉(zhuǎn)移至傳統(tǒng)的2G/3G網(wǎng)上。這并非完全是技術(shù)因素,還與運(yùn)營(yíng)商2G/3G成熟網(wǎng)絡(luò)的投資保護(hù)有關(guān)。VoLTE的廣泛應(yīng)用還有一段路要走。
目前通過(guò)互聯(lián)網(wǎng)協(xié)議提供語(yǔ)音服務(wù)的技術(shù)主要是OTT服務(wù)商提供的、資費(fèi)很低的、技術(shù)簡(jiǎn)單的、使用VoIP技術(shù)的網(wǎng)絡(luò)電話,該網(wǎng)絡(luò)電話因其只需SIP軟件就可以通過(guò)IP地址和帳號(hào)注冊(cè)通話,所以如同互聯(lián)網(wǎng)上所有數(shù)據(jù)業(yè)務(wù)一樣,沒(méi)有區(qū)域和漫游的概念(只需IP地址),更不能提供語(yǔ)音質(zhì)量的QoS保證(非實(shí)時(shí)和隨機(jī)的語(yǔ)音包串聯(lián)沒(méi)有QoS支持)。這說(shuō)明VoLTE語(yǔ)音技術(shù)所面對(duì)的競(jìng)爭(zhēng)對(duì)手,不僅價(jià)廉易用,而且已廣泛普及。VoLTE語(yǔ)音技術(shù)要想塑造移動(dòng)互聯(lián)網(wǎng)語(yǔ)音神話,一方面要保證語(yǔ)音品質(zhì)遠(yuǎn)遠(yuǎn)超越普通網(wǎng)絡(luò)電話,甚至超過(guò)固定電話;另一方面要使可視電話音視頻品質(zhì)有質(zhì)的飛躍,使用戶有完美的體驗(yàn)。
因此,要在LTE網(wǎng)絡(luò)中應(yīng)用VoLTE業(yè)務(wù),分階段發(fā)展和重點(diǎn)區(qū)域應(yīng)用是較好的選擇,即將VoLTE語(yǔ)音應(yīng)用分三個(gè)階段:
第一階段為初始應(yīng)用階段,主要考慮LTE初期應(yīng)用是以熱點(diǎn)覆蓋為主,LTE網(wǎng)絡(luò)覆蓋區(qū)域有限,而2G/3G網(wǎng)絡(luò)不僅覆蓋全面,用戶群體還占有絕對(duì)優(yōu)勢(shì),尤其是存在高成熟度的CS語(yǔ)音技術(shù)與有待完善的VoLTE語(yǔ)音技術(shù)的矛盾。所以,在這一階段的LTE網(wǎng)絡(luò)中,有的地方可采用VoLTE語(yǔ)音技術(shù),有的地方則采用切換到CS域語(yǔ)音技術(shù)。這就要求運(yùn)營(yíng)商先有一個(gè)市場(chǎng)應(yīng)用調(diào)研和用戶應(yīng)用引導(dǎo)。如考慮在大專院校布局支持VoLTE語(yǔ)音技術(shù)的熱點(diǎn)LTE網(wǎng)絡(luò)覆蓋,在校園開(kāi)展各類有意義的支持VoLTE語(yǔ)音技術(shù)終端設(shè)備的市場(chǎng)優(yōu)惠銷(xiāo)售活動(dòng),開(kāi)展有針對(duì)應(yīng)用目標(biāo)的、性價(jià)比較高的具有VoLTE語(yǔ)音技術(shù)應(yīng)用模式指導(dǎo)的互動(dòng)活動(dòng)等。
第二階段為支持VoLTE技術(shù)的LTE網(wǎng)絡(luò)的發(fā)展期,特點(diǎn)是LTE網(wǎng)絡(luò)覆蓋規(guī)模不斷擴(kuò)大,用戶認(rèn)知也達(dá)到一定程度,LTE網(wǎng)絡(luò)技術(shù)、VoLTE語(yǔ)音技術(shù)和LTE終端技術(shù)開(kāi)始走向成熟,LTE網(wǎng)絡(luò)覆蓋水平達(dá)到了可以在城市和人口密集地區(qū)運(yùn)營(yíng)VoLTE語(yǔ)音業(yè)務(wù)的條件。尤其是LTE智能手機(jī)的大量應(yīng)用,IMS架構(gòu)的不斷完善,CS語(yǔ)音系統(tǒng)開(kāi)始逐漸退出,基于IMS架構(gòu)的多媒體業(yè)務(wù)類型的大量涌現(xiàn),VoLTE語(yǔ)音品質(zhì)得到較大提升……總之,本階段是基于IMS架構(gòu)VoLTE語(yǔ)音技術(shù)應(yīng)用的普及時(shí)期,運(yùn)營(yíng)商需要做的工作主要是在優(yōu)化VoLTE多媒體語(yǔ)音品質(zhì)的基礎(chǔ)上,提供內(nèi)容豐富的IMS多媒體應(yīng)用業(yè)務(wù)和種類繁多的智能手機(jī)。
第三階段為L(zhǎng)TE網(wǎng)絡(luò)全覆蓋和VoLTE成為主流語(yǔ)音應(yīng)用時(shí)期,相當(dāng)完善的LTE覆蓋和相當(dāng)成熟的VoLTE多媒體語(yǔ)音應(yīng)用,已促使傳統(tǒng)的CS開(kāi)始退出移動(dòng)通信舞臺(tái)。
第一階段是一個(gè)非常重要的應(yīng)用推廣階段,是IMS架構(gòu)初建與集成和VoLTE語(yǔ)音技術(shù)完善過(guò)程中必要的測(cè)試和試驗(yàn)階段,也是LTE網(wǎng)絡(luò)、IMS多媒體業(yè)務(wù)與VoLTE終端應(yīng)用的磨合階段,因而也是決定LTE網(wǎng)絡(luò)應(yīng)用在短期內(nèi)能否占領(lǐng)一定市場(chǎng)份額的重要階段。所以,運(yùn)營(yíng)商應(yīng)在第一階段的營(yíng)銷(xiāo)策略中做足文章。第二階段和第三階段是移動(dòng)多媒體業(yè)務(wù)發(fā)展和創(chuàng)新階段。
5 總結(jié)
基于IMS體系架構(gòu)的VoLTE語(yǔ)音技術(shù)是LTE運(yùn)營(yíng)商開(kāi)啟通往移動(dòng)寬帶語(yǔ)音的一扇大門(mén),也是移動(dòng)通信、固定通信和互聯(lián)網(wǎng)通信,語(yǔ)音業(yè)務(wù)、數(shù)據(jù)業(yè)務(wù)和視頻業(yè)務(wù)大融合的基礎(chǔ)。LTE語(yǔ)音通信技術(shù)最終是以VoLTE分組業(yè)務(wù)形式取代,但卻取決于VoLTE技術(shù)的臻如至善,取決于LTE網(wǎng)絡(luò)的無(wú)縫覆蓋程序,取決于IMS多媒體業(yè)務(wù)類型的豐富多彩,取決于智能終端的智能情況,最終還是取決于用戶的應(yīng)用普及程度。
從語(yǔ)音業(yè)務(wù)方面看,IMS體系架構(gòu)支持的基于IP的電話和多媒體服務(wù)業(yè)務(wù)的融合,不僅可為VoLTE語(yǔ)音貫通包括2G/3G和固定電話的所有語(yǔ)音,還能使視頻電話與互聯(lián)網(wǎng)視頻的相互通信變得十分方便,更重要的是為完全VoLTE語(yǔ)音技術(shù)應(yīng)用創(chuàng)造了安全的過(guò)渡環(huán)境。對(duì)于運(yùn)營(yíng)商來(lái)講,IMS體系架構(gòu)力助VoLTE實(shí)現(xiàn)了數(shù)據(jù)與語(yǔ)音業(yè)務(wù)在同一網(wǎng)絡(luò)下的統(tǒng)一,可幫助運(yùn)營(yíng)商降低運(yùn)營(yíng)計(jì)費(fèi)復(fù)雜度,提升運(yùn)營(yíng)效率,減少運(yùn)營(yíng)成本。
從技術(shù)角度看,VoLTE是一種在LTE協(xié)議層上封裝語(yǔ)音數(shù)據(jù)的新型語(yǔ)音標(biāo)準(zhǔn),與Voive over ATM、Voice over Frame Relay類似。借助成熟的技術(shù)和工藝,VoLTE技術(shù)完全可以簡(jiǎn)化終端芯片設(shè)計(jì),降低語(yǔ)音設(shè)備成本。所以筆者認(rèn)為運(yùn)營(yíng)商應(yīng)加快LTE網(wǎng)絡(luò)覆蓋速度,增加LTE網(wǎng)絡(luò)覆蓋率,尤其是完善IMS體系架構(gòu)的建立,為VoLTE語(yǔ)音技術(shù)的普及打下良好的網(wǎng)絡(luò)基礎(chǔ)。
另外,許多運(yùn)營(yíng)商采用電路回退等相關(guān)技術(shù)兼容2G/3G語(yǔ)音。對(duì)于運(yùn)營(yíng)商來(lái)講,這似乎可以在LTE時(shí)代繼續(xù)發(fā)揮2G/3G設(shè)備的效益,降低建網(wǎng)投資,但卻加重了用戶終端設(shè)備的成本,這無(wú)疑要影響LTE網(wǎng)絡(luò)應(yīng)用的推廣和普及,影響LTE網(wǎng)絡(luò)的成本效益。所以,在使用VoLTE語(yǔ)音技術(shù)的LTE網(wǎng)絡(luò)覆蓋建設(shè)中,采用重點(diǎn)區(qū)應(yīng)用模式有一定的現(xiàn)實(shí)意義。
參考文獻(xiàn):
[1] 付航. IMS體系研究與網(wǎng)絡(luò)架構(gòu)演進(jìn)[J]. 移動(dòng)通信, 2007(3): 73-76.
[2] 周峰,許正鋒,羅俊. VoLTE業(yè)務(wù)與技術(shù)實(shí)現(xiàn)方案的研究與分析[J]. 電信科學(xué), 2023(2): 31-35.
[3] 張長(zhǎng)青. TD-LTE演進(jìn)型分組核心網(wǎng)技術(shù)分析[J]. 移動(dòng)通信, 2023(8): 51-57.
[4] 馮傳奮,王少波,李愛(ài)嬌,等. IMS域引入QoS架構(gòu)探討[J]. 移動(dòng)通信, 2023(24): 71-74.
版權(quán)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn),該文觀點(diǎn)僅代表作者本人。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權(quán)/違法違規(guī)的內(nèi)容, 請(qǐng)發(fā)送郵件至 yyfangchan@163.com (舉報(bào)時(shí)請(qǐng)帶上具體的網(wǎng)址) 舉報(bào),一經(jīng)查實(shí),本站將立刻刪除