語音IC常用的音頻格式
PCM格式: Pulse Code Modulation 脈沖編碼調(diào)制,它將聲音模擬信號采樣后得到量化后的語音數(shù)據(jù),是最基本最原始的一種語音格式。同它極為類似的還有RAW格式和SND格式。它們都是純語音格式。
WAV格式:Wave Audio Files 是微軟公司開發(fā)的一種聲音文件格式,也叫波形聲音文件,被Windows平臺及其應用程序廣泛支持。WAV格式支持許多壓縮算法,支持多種音頻位數(shù)、采樣頻率和聲道,但WAV格式對存儲空間需求太大不便于交流和傳播。WAV文件里面存放的每一塊數(shù)據(jù)都有自己獨立的標識,通過這些標識可以告訴用戶究竟這是什么數(shù)據(jù),這些數(shù)據(jù)包括采樣頻率和位數(shù),單聲道(mono)還是立體聲(stero)等。
語音芯片IC
ADPCM格式:是利用對過去的幾個抽樣值來預測當前輸入的樣值,并使其具有自適應的預測功能與實際檢測值進行比較,隨時對測得的差值自動進行量化級差的處理,使之始終保持與信號同步變化。它適用于語音變化率適中的情況,而且聲音回放過程簡短。它的優(yōu)點是對于人聲的處理比較逼真,一般達到90%以上,已廣泛地應用于電話通信領域。
MP3格式: Moving Picture Experts Group Audio Layer III,簡稱為MP3。它是利用 MPEG Audio Layer 3 的技術,采取了名為“感官編碼技術”的編碼算法:編碼時先對音頻文件進行頻譜分析,然后用過濾器濾掉噪音電平,接著通過量化的方式將剩下的每一位打散排列,最后形成具有較高壓縮比的mp3文件,并使壓縮后的文件在回放時能夠達到較接近原音源的聲音效果。它的實質(zhì)是vbr(Variant Bitrate 可變波特率)可以根據(jù)編碼的內(nèi)容動態(tài)地選擇合適的波特率,因此編碼的結果是在保證了音質(zhì)的同時又照顧了文件的大小,mp3壓縮率10倍甚至12倍。是最初出現(xiàn)的一種高壓縮率的語音格式。
Linear Scale格式:根據(jù)聲音的變化率大小,把聲音分成若干段,對每段用線性比例進行壓縮,但是它的比例是可變的。SUNLINK公司和ALPHA公司的Linear Scale格式為5bit。
Logpcm格式:基本上對整個聲音進行線性壓縮,將最后若干位去掉。這種壓縮方式在硬件上很容易實現(xiàn),但音質(zhì)比Linear Scale差一些,特別是音量較小聲音比較細膩的情況下效果較差。主要用于pure speech方面。
Copyright (?) 2020 深圳唯創(chuàng)知音電子有限公司 版權所有 地址:深圳市寶安區(qū)福永街道大洋路90號中糧福安機器人智造產(chǎn)業(yè)園6棟2/3層 備案號:粵ICP備15026214號