㈠ 一道計算聲音的數據量的問題
這個問題太專業了,算比較麻煩你自己看看吧
文件壓縮技術的日新月異使得MP3成為時下最燙手的音樂格式,優質的音樂隨著0與1 的排列迅速散布到世界各地,撼動人心。何謂MP3?MP3的全稱是MPEG Audio Layer 3,它是一種高效的計算機音頻編碼方案,它以較大的壓縮比將音頻文件轉換成較小的擴展名為.MP3的文件,基本保持原文件的音質。MP3是 ISO/MPEG標準的一部分,ISO/MPEG標准描述了使用高性能感知編碼方案的音頻壓縮,此標准一直在不斷更新以滿足「質高量小」的追求,現已形成 MPEG Layer 1、Layer 2、Layer 3三個音頻編碼解碼方案。MPEG Layer 3壓縮率可達1:10至1:12,1M的MP3文件可播放1分鍾,而1分鍾CD音質的WAV文件(44100Hz,16bit,雙聲道,60秒)要佔用 10M空間,這樣算來,一張650M的MP3光碟播放時間應在10小時以上,而同樣容量的一張CD盤播放時間在70分鍾左右。MP3的優勢是CD難以比擬的。
2 MP3原理淺析
2.1 MPEG Audio標准
MPEG(Moving Picture Experts Group)是ISO下的一個動態圖象專家組,它制定的MPEG標准廣泛應用於各種多媒體中。MPEG標准包括視頻和音頻標准,其中音頻標准已制定出 MPEG-1、MPEG-2、MPEG-2 AAC和MPEG-4。
MPEG-1和MPEG-2標准使用同一個音頻編碼解碼族—Layer1、 2、3。MPEG-2一個新特點是採用低采樣率擴展降低數據流量,另一特點是多通道擴展,將主聲道增加為5個。MPEG-2 AAC(MPEG-2 Advanced Audio Coding)標準是Fraunhofer IIS同AT&T公司於1997年推出的,旨在顯著減少數據流量,MPEG-2 AAC採用的MDCT(Modified Discrete Cosine Transform)演算法,采樣率可在8KHz到96KHz之間,聲道數可在1-48之間。
MPEG Audio Layer 1、2、3三個層使用相同的濾波器組、位流結構和頭信息,采樣頻率為32KHz、44.1KHz或48KHz。Layer 1是為數字壓縮磁帶DCC(Digital Compact Cassette)設計的,數據流量為384kbps,Layer 2在復雜性和性能間作了權衡,數據流量下降到256kbps-192kbps。Layer 3一開始就為低數據流量而設計,數據流量在128kbps-112kbps,Layer 3增加了MDCT變換,使其頻率分辨能力是Layer 2的18倍,Layer 3還使用了與MPEG Video類似的平均信息量編碼(Entropy Coding),減少了冗餘信息。MP3絕大部分使用的是MPEG-1標准。
2.2 音頻壓縮的目的
MP3格式始於80年代中期,德國 Erlangen的Fraunhofer研究所致力於高質量、低數據率的聲音編碼。讓我們來看一個例子:你想對你喜歡的一首長約4分鍾的歌曲采樣,將其存儲在磁碟上,以CD音質的WAV格式抽樣,抽樣率為44.1kHz,即每秒鍾接收44100個值,立體聲,每次抽樣數據為16位(2位元組),則這首歌占的空間為:
44100x2聲道x2位元組x60秒x4分鍾=40.4MB
如果從Internet上下載這首歌,假設傳輸率為56kbps,則下載時間為:
40.4x106x8/56x103x60=96分鍾
即使是1M的寬頻網也需5分鍾以上,由此可見,音頻壓縮對減少音頻數據的存儲空間顯得尤為重要。
2.3 MP3編碼與解碼
MP3音頻壓縮包含編碼和解碼兩個部分。編碼是將WAV文件中的數據轉換成高壓縮率的位流形式,解碼是接受位流並將其重建到WAV文件中。
MP3 採用了感知音頻編碼(Perceptual Audio Coding)這一失真演算法。人耳感受聲音的頻率范圍是20Hz-20kHz,MP3截掉了大量的冗餘信號和無關的信號,編碼器通過混合濾波器組將原始聲音變換到頻率域,利用心理聲學模型,估算剛好能被察覺到的雜訊水平,再經過量化,轉換成Huffman編碼,形成MP3位流。解碼器要簡單得多,它的任務是從編碼後的譜線成分中,經過反量化和逆變換,提取出聲音信號。MP3編碼和解碼流程如圖1所示。
2.4 修正的離散餘弦變換
修正的離散餘弦變換(MDCT)是指將一組時域數據轉換成頻域數據,以得知時域變化情況。MDCT是對DCT演算法的改進,。早期的快速演算法是快速付立葉變換(FFT),但FFT有復數運算,MDCT都是實數運算,便於編程。
在壓縮音頻數據時,先將原始聲音數據分成固定的分塊,然後做順向MDCT(Forward MDCT)將每塊的值轉換為512個MDCT系數,解壓時,經反向MDCT(Inverse MDCT)將512個系數還原成原始聲音數據,前後的原始聲音數據是不一致的,因為在壓縮過程中,去掉了冗餘和不相關數據。FMDCT變換公式為:
k=0,1,…,N/2-1
式中N是轉換視窗長度,即每塊樣本點數,N=8,16,…,1024,2048。
n0=(N/2+1)/2,X(n)為時域值,X(k)為頻域值。若N取1024點,則轉換成512個頻域值。
IMDCT變換公式為:
n=0,1,…,N-1
MDCT本身並不進行數據壓縮,它只是把信號映射到另一個域,量化才使數據得到壓縮。在對量化後的變換樣值進行比特分配時要考慮使整個量化塊最小,這就成為有損壓縮了。
3 MP3文件格式分析
MP3文件數據由多個幀組成,幀是MP3文件最小組成單位。每個幀又由幀頭、附加信息和聲音數據組成。每個幀播放時間是0.026秒,其長度隨位率的不同而不等。有些MP3文件末尾有些額外位元組存放非聲音數據的說明信息。MP3文件結構如圖2所。
3.1 幀頭格式
幀頭長4位元組,對於固定位率的MP3文件,所有幀的幀頭格式一樣其數據結構如下:
typedef FrameHeader{
unsigned int sync:11;//同步信息
unsigned int version:2;//版本
unsigned int layer:2;//層
unsigned int protection:1;// CRC校驗
unsigned int bitrate:4;//位率
unsigned int frequency:2;//頻率
unsigned int padding:1;//幀長調節
unsigned int private:1;//保留字
unsigned int mode:2;//聲道模式
unsigned int mode extension:2;//擴充模式
unsigned int right:1;// 版權
unsigned int original:1;//原版標志
unsigned int emphasis:2;//強調模式
}HEADER, *LPHEADER;
幀頭4位元組使用說明見表1。
表1 MP3幀頭位元組使用說明
名稱 長度(位) 說 明
同步
信息 11 第1、2位元組 所有位均為1,第1位元組恆為FF。
版本 2 00-MPEG 2.5 01-未定義
10-MPEG 2 11-MPEG 1
層 2 00-未定義 01-Layer 3
10-Layer 2 11-Layer 1
CRC
校驗 1 0-校驗 1-不校驗
位率 4 第3位元組 取樣率,單位是kbps,例如採用MPEG-1 Layer 3,64kbps是,值為0101。
頻率 2 采樣頻率,對於MPEG-1:
00-44.1kHz 01-48kHz
10-32kHz 11-未定義
幀長
調節 1 用來調整文件頭長度,0-無需調整,1-調整,具體調整計算方法見下文。
保留字 1 沒有使用。
聲道
模式 2 第4位元組 表示聲道,
00-立體聲 01-Joint Stereo
10-雙聲道 11-單聲道
擴充
模式 2 當聲道模式為01是才使用。
版權 1 文件是否合法,0-不合法 1-合法
原版
標志 1 是否原版, 0-非原版 1-原版
強調
方式 2 用於聲音經降噪壓縮後再補償的分類,很少用到,今後也可能不會用。
00-未定義 01-50/15ms
10-保留 11-CCITT J.17
MP3幀長取決於位率和頻率,計算公式為:
幀長= 144×bitrate∕frequency+padding
例如:位率為64kbps,頻率為44.1kHz,padding為1時,幀長為210位元組。幀頭後面是可變長度的附加信息,對於標準的MP3文件來說,其長度是32位元組,緊接其後的是壓縮的聲音數據,當解碼器讀到此處時就進行解碼了。
對於固定位率(CBR,Constant Bitrate)的MP3文件,並不是所有的幀都是等長的,有的幀可能多一個或幾個位元組。還有一種可變位率(VBR, Variable Bitrate)的MP3文件,是為了使MP3文件長度最小同時又保證聲音質量,與CBR文件相比,除了第一幀不同外,其餘的都一樣。VBR的第一幀不包含聲音數據,其長度是156個位元組,用來存放標準的聲音幀頭(4位元組)、VBR文件標識、幀數、文件位元組數等信息,具體結構說明見表2。
表2 VBR文件第一幀結構
字 節 說 明
1-4 與CBR相同的標准聲音幀頭
5-40 存放VBR文件標識「Xing」(58 69 6E 67),此標識具體位置視採用的MPEG標准和聲道模式而定。標識的前後位元組沒有使用。
36-39 MPEG-1和非單聲道(常見)
21-24 MPEG-1和單聲道
21-24 MPEG-2和非單聲道
13-16 MPEG-2和單聲道
41-44 標志,說明是否存儲了幀數、文件長度、目錄表和VBR規模信息,如果存儲了,則01 02 04 08。
45-48 幀數(包括第一幀)
49-52 文件長度
53-152 目錄表,用來按時間進行位元組定位。
153-156 VBR規模,用於位率變動
3.2 ID3標准
MP3 幀頭中除了存儲一些象private、right、original的簡單音樂說明信息以外,沒有考慮存放歌名、作者、專輯名、年份等復雜信息,而這些信息在MP3應用中非常必要。1996年,FricKemp在「Studio 3」項目中提出了在MP3文件尾增加一塊用於存放歌曲的說明信息,形成了ID3標准,至今已制定出ID3 V1.0,V1.1,V2.0,V2.3和V2.4標准。版本越高,記錄的相關信息就越豐富詳盡。
ID3 V1.0標准並不周全,存放的信息少,無法存放歌詞,無法錄入專輯封面、圖片等。V2.0是一個相當完備的標准,但給編寫軟體帶來困難,雖然贊成此格式的人很多,在軟體中真正實現的卻極少。絕大多數MP3仍使用ID3 V1.0標准。此標準是將MP3文件尾的最後128個位元組用來存放ID3信息,這128個位元組使用說明見表3。
表3 ID3 V1.0文件尾說明
位元組 長度
(位元組) 說 明
1-3 3 存放「TAG」字元,表示ID3 V1.0標准,緊接其後的是歌曲信息。
4-33 30 歌名
34-63 30 作者
64-93 30 專輯名
94-97 4 年份
98-127 30 附註
128 1 MP3音樂類別,共147種。
3.3 文件實例
在VC++中打開一個名為test.mp3文件,其內容如下:
000000 FF FB 52 8C 00 00 01 49 09 C5 05 24 60 00 2A C1
000010 19 40 A6 00 00 05 96 41 34 18 20 80 08 26 48 29
000020 83 04 00 01 61 41 40 50 10 04 00 C1 21 41 50 64
……
0000D0 FE FF FB 52 8C 11 80 01 EE 90 65 6E 08 20 02 30
0000E0 32 0C CD C0 04 00 46 16 41 89 B8 01 00 08 36 48
0000F0 33 B7 00 00 01 02 FF FF FF F4 E1 2F FF FF FF FF
……
0001A0 DF FF FF FB 52 8C 12 00 01 FE 90 58 6E 09 A0 02
0001B0 33 B0 CA 85 E1 50 01 45 F6 19 61 BC 26 80 28 7C
0001C0 05 AC B4 20 28 94 FF FF FF FF FF FF FF FF FF FF
……
001390 7F FF FF FF FD 4E 00 54 41 47 54 45 53 54 00 00
0013A0 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
……
0013F0 00 00 00 00 04 19 14 03 00 00 00 00 00 00 00 00
001400 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
001410 00 00 00 00 00 00 4E
該文件長度1416H(5.142K),幀頭為:FF FB 52 8C,轉換成二進制為:
11111111 11111011
01010010 10001100
對照表1可知,test.mp3幀頭信息見表4。
表4 test.mp3文件幀頭信息
名稱 位值 說 明
同步信息 11111111111 第1位元組恆為FF,11位均為1。
版本 11 MPEG 1
層 01 Layer 3
CRC校驗 1 不校驗
位率 0101 64kbps
頻率 00 44.1kHz
幀長調節 1 調整,幀長是210位元組。
保留字 0 沒有使用。
聲道模式 10 雙聲道
擴充模式 00 未使用。
版權 1 合法
原版標志 1 原版
強調方式 00 未定義
第1397H開始的三個位元組是54 41 47,存放的是字元「TAG」,表示此文件有ID3 V1.0信息。
139AH開始的30個位元組存放歌名,前4個非00位元組是54 45 53 54,表示「TEST」;
13F4H開始的4個位元組是04 19 14 03,存放年份「04/25/2003」;
最後1個位元組是4E,表示音樂類別,代號為78,即「Rock&Roll」;
其它位元組均為00,未存儲信息。
4 結束語
聲音作為一類重要的多媒體數據,人們總是在不斷尋求更高效率的壓縮方法和新的聲音文件格式。MP3文件中使用了MDCT變換,它是一種結構簡單、易於編程的准最佳變換,,避免了最佳變換(K-L)難以求解協方差矩陣特徵值及特徵向量的困擾。通過對MP3文件格式的分析,不難發現它的欠缺。MP3文件每個幀都有4位元組的相同幀頭,對於一個含有大量幀的MP3文件來說,需要一定的空間開銷。ID3存放音樂說明信息,幀頭中的private、right等信息也是說明信息,音樂的說明信息有些零亂的感覺。
無論如何,MP3的發展勢不可擋,MP3已成為公認的聲音數據格式,MP3正與JPEG圖像、PDF文檔成為多媒體信息處理領域的熱點。
㈡ 采樣頻率為22.05khz,量化精度為16位,持續時間為兩分鍾和雙聲道,未壓縮時,數據量是多少MB
總數據量為:22.05*16*120*2=84672Kbit=84.672Mbit。由bit換算成byte就是除以8,即42.336/8=10.548MB。
整個文件可以看成是一個RIFF塊, 該RIFF 塊的形式類型棗慶液為「WAVE」 , 共包含了兩個子塊即「 fmt 」 和「data」子塊。文件的開始4 個位元組為字元串「 RIFF」 ,接著的4 個位元組為RIFF 塊的大小, 即「 fmt 」 子塊和「 data」子塊所差好佔位元組之和,,然後的4 個位元組是字元串「WAVE」 。
(2)音頻數據在無聲時為多少擴展閱讀:
在音頻壓縮領域,有兩種壓縮方式,分別是有損壓縮和無損壓縮。
常見到的MP3、WMA、OGG被稱為有損壓縮,有損壓縮顧名思義就是降低音頻采樣頻率與比特率,輸出的音頻文件會比原文件小。
無損壓縮能夠在100%保存原文件的所有數據的前提下,凳物將音頻文件的體積壓縮的更小,而將壓縮後的音頻文件還原後,能夠實現與源文件相同的大小、相同的碼率。無損壓縮格式有APE、FLAC、WavPack、LPAC、WMALossless、AppleLossless、La、OptimFROG、Shorten,而常見的、主流的無損壓縮格式只有APE、FLAC。
㈢ 數字音頻的主要技術參數有哪些
其技術指標主要有六項:頻率響應、信噪比、動態范圍、失真度、瞬態響應、立體聲分離度、立體聲平衡度。
一、頻率響應:頻率響應理論上要求為20~20000hz。在實際使用中由於電路結構、元件的質量等原因,往往不能夠達到該要求,但一般至少要達到32~18000hz。
二、信噪比:所謂信噪比是指音響系統對音源軟體的重放聲與整個系統產生的新的雜訊的比值,其雜訊主要有熱雜訊、交流雜訊、機械雜訊等等。一般檢測此項指標以重放信號的額定輸出功率與無信號輸入時系統雜訊輸出功率的對數比值分貝(db)來表示。一般音響系統的信噪比需在85db以上。
三、動態范圍:動態范圍是指音響系統重放時最大不失真輸出功率與靜態時系統雜訊輸出功率之比的對數值,單位為分貝(db)。一般性能較好的音響系統的動態范圍在100(db)以上。
四、失真:失真是指音響系統對音源信號進行重放後,使原音源信號的某些部分(波形、頻率等等)發生了變化。音響系統的失真主要有以下幾種:
1.諧波失真:所謂諧波失真是指音響系統重放後的聲音比原有信號源多出許多額外的諧波成分。此額外的諧波成分信號是信號源頻率的倍頻或分頻,它是由負反饋網路或放大器的非線性特性引起的。高保真音響系統的諧波失真應小於1%。
2.互調失真:互調失真也是一種非線性失真,它是兩個以上的頻率分量按一定比例混合,各個頻率信號之間互相調制,通過放音設備後產生新增加的非線性信號,該信號包括各個信號之間的和及差的信號。
3.瞬態失真:瞬態失真又稱瞬態響應,它的產生主要是當較大的瞬態信號突然加到放大器時由於放大器的反映較慢,從而使信號產生失真。一般以輸入方波信號通過放音設備後,觀察放大器輸出信號的包絡波形是否輸入的方波波形相似來表達放大器對瞬態信號的跟隨能力。
五、立體聲分離度:立體聲分離度表示立體聲音響系統中左、右兩個聲道之間的隔離度,它實際上反映了左、右兩個聲道相互串擾的程度。如果兩個聲道之間串擾較大,那麼斗旅重放空燃凳聲音的立體感將減弱。
六、立體聲平衡度:立體聲平衡度表示立體放音系統中左、右聲道增益的差別,如果不平衡度過大,重放的立體聲的聲像定位將產生偏移。一般高品質音響系統的立體聲平衡度應小於1db。
音響系統重放聲音的音域及音頻范圍是如何劃分的?各個頻段對音樂的表現如何? 音響系統的重放聲音的音域范圍一般可以分為超低音、低音、中低音、中音、中高音、次高音、高音、特高音八個音域。音頻頻率范圍一般可以分為四個頻段,即低頻段(30~150hz);中你頻段(150~500hz);中高頻段(500~5000hz);高頻段(5000~20000hz)。 其中,30~150hz頻段:能夠表現音樂的低頻成分,使欣賞者感受到強勁有力的動感。 150~500hz頻段:能夠表現單個打擊樂器在音樂中的表現力,是低頻中表達力度的部分。 500~5000hz頻段:主要表達演唱者語言的清晰度及弦樂的表現力。 5000~20000hz頻段:主要表達音樂的明亮度,但過多會使聲音發破。
另外,以下也是功放的重點數據指標:
1、功率大小:功放的額定功率應是音箱喇叭功率的3-10倍,這樣播放效果才有保障;
2、阻值大小:功放的額定阻值應該與音箱喇叭的阻值相匹配,如果喇叭的阻值大於功放的阻值,播放效率就會下降許多;段跡但如果喇叭的阻值小於功放,播放功效將增強。但如果阻值相差太大,就會導致功放發熱嚴重,甚至燒毀。
㈣ 手機沒有聲音怎麼恢復
若是使用的vivo手機,指的手機聽筒突然沒有聲音,可以參考以下處理方法:
1、如果有貼第三方保護膜,請確認貼膜膠水是否流入聽筒微縫,建議到vivo客戶服務中心貼官方保護膜;
2、使用聽筒接聽電話時,可按音量上鍵,將通話音量調大。
3、如果手機連接了藍牙設備,聲音會從藍牙設備播出,例如:藍牙耳機、車載藍牙等,可以進入設置--(其他網路與連接)--藍牙,關閉藍牙功能後查看。
4、請注意觀察保護殼、保護膜是否有遮擋聽筒的出聲孔,如果出聲孔有堵塞的情況,可以嘗試清理或者前往客戶服務中心清理。
5、如果所在的位置信號不好,會影響通話質量,建改嘩議前往信號良好的區域通話測試。
6、和不同聯系人通話對比測試,如果是某個號碼存在異常,可能是對方手機原因或核顫行網路原因。
若以上方法未能解決該問題,請提前備份好手機數據,攜帶手機和購機洞碰憑證前往vivo客戶服務中心檢測。vivo客戶服務中心地址:進入vivo官網/vivo商城APP--我的--網點查詢,選擇當前所在的城市即可獲取服務中心的地址與聯系方式。建議去之前先提前電話聯系,避免空跑,合理規劃行程,安全出行。
若指的是聲器沒有聲音了,可進入vivo官網--我的--在線客服--下滑底部--在線客服--輸入人工客服進入咨詢了解。
㈤ 無聲視頻存儲容量計算公式
[視頻碼率(kbps)+音頻碼率(kbps)]/8 * 時間(秒)=文件體積(mb)
MPEG4格式視頻可以壓縮到1.5M/分以下,如果用好軟體和我的一樣可以壓縮到0.8M/分。一天一夜24小時×60分鍾×1M基本上就是實際容量。
不經過壓縮,聲音數據量的計算公式為:數據量(位元組/秒)=(采樣頻率(Hz)×采樣位數(bit)×聲道數)/8。
㈥ 音頻基本知識
外界傳來的聲音引起人耳鼓膜振動經聽小骨及其他組織傳給聽覺神經,聽覺神經傳給大腦,這樣就聽到了聲音。
音調 :聲音的高低,由頻率決定,頻率越高音調越高。
響度 :又稱音量、音強,由振幅和距離聲源的距離決定。
音色 :又稱音品,由發聲物體本身材料、結構決定。
單聲道 :單聲道是指把來自不同方位的音頻信號混合後統一由錄音器材把它記錄下來,再由一隻音箱進行重放。在單聲道的音響器材中,你只能感受到聲音、音樂的前後位置及音色、音量的大小,而不能感受到聲音從左到右等橫向的移動。
雙聲道 :雙聲道就是有兩個聲音通道,其原理是人們聽到聲音時可以根據左耳和右耳對聲音相位差來判斷聲源的具體位置,在電路上它們往往各自傳遞的電信號是不一樣的,電聲學家在追求立體聲的過程中,由於技術的限制,在最早的時候只有採用雙聲道來實現。
立體聲 :就是指具有立體感的聲音。是一個幾何概念,是指在三維空間中佔有位置的事物。因為聲源有確定的空間位置,聲音有確定的方向來源,人們的聽覺有辨別聲源方位的能力,尤其是有多個聲源同時發聲時,人們可以憑聽覺感知各個聲源在空間的位置分布狀況。
模擬信號 :音頻信號是典型的連續信號,在時間和幅度上都是連續的。在任何一個特定的時間點都有一個對應是幅值。我們把時間和幅度上都是連續的信號稱為模擬信號。
數字信號 :在某些特定的時刻對這種模擬信號進行測量叫做采樣。在有限個特點時間的采樣得到的信號叫做離散時間信號。採到的幅值是一個實數,因此幅度還是一個連續的值,當我們將幅值限定為有限個數值,就稱為離散數值信號。我們把時間和幅值都用離散的值表示的時候,此時表示的信號就是數字信號。
人們日常生活聽到的各種聲音信息是典型的連續信號,它不僅在時間上連續,而且在幅度上也連續,我們稱之為模擬音頻。在數字音頻技術產生之前,我們只能用磁帶或膠木唱片來存儲模擬音頻,隨著技術的發展,聲音信號逐漸過渡到了數字化存儲階段,可以用計算機等設備將它們存儲起來。
模擬音頻數字化 :對於計算機來說,處理和存儲的只可以是二進制數,所以在使用計算機處理和存儲聲音信號之前,我們必須使用模數轉換(A/D)技術將模擬音頻轉化為二進制數,這樣模擬音頻就轉化為數缺正字音頻了。所謂模數轉換就是將模擬信號轉化為數字信號,模數轉換的過程包括采樣、量化和編碼三個步驟。模擬音頻向數字音頻的轉換是在計算機的音效卡中完成的。
采樣 : 采樣是指將時間軸上連續的信號每隔一定的時間間隔抽取出一個信號的幅度樣本,把連續的模擬量用一個個離散的點表示出來,使其成為時間上離散的脈沖序列。
著名的采樣定理(Nyquist 定理)中給出有明確的答案:要想不產生低頻失真,采樣頻率至少應為所要錄制的音頻的最高頻率的2 倍。例如,電話話音的信號頻率約為3.4 kHz ,采樣頻率就應該≥6.8 kHz ,考慮到信號的衰減等因素,一般取為8kHz 。
量化 :將采樣後離散信號的幅度用二進制數表示出來的過程稱為量化。每個采樣點所能表示的二進制位數稱為量化精度,或量化位數。量化精度反映了度量聲音波形幅度的精度。
編碼 :采樣和量化後的信號還不是數字信號,需要將它轉化為數字編碼脈沖,這一過程稱為編碼。模擬音頻進采樣、量化和編碼後納返形成的二進制洞扮飢序列就是數字音頻信號。
PCM編碼 : PCM(Pulse Code Molation),即脈沖編碼調制,指模擬音頻信號只經過采樣、模數轉換直接形成的二進制序列,未經過任何編碼和壓縮處理。PCM編碼的最大的優點就是音質好,最大的缺點就是體積大。
非平衡音頻 : 使用兩根線(一根信號線,一根地線)傳送一路(單聲道)音頻信號。非平衡音頻傳輸過程中信號不穩定,舉例說明:比如我們需要將音頻信號A從一段傳送到另一端,這個過程會有其他型號進入到這一根線,比如電腦的wifi信號B,手機產生的信號C等。等到音頻接收端收到的信號就變為了信號A+B+C。
平衡音頻信號 :使用三跟線(分別是熱端、冷端、地線)來傳送一路音頻信號。傳輸原理:熱端和冷端傳送的信號是同一個信號,信號的發送端把一個聲音信號分成兩路,一路正相進入熱端,一個反相後進入冷端。在信號的接收端把冷端進行反相和熱端合並,得到最終的信號。
抗干擾原理:我們將音頻信號A從一端發送另一端。在發送前,先兵分兩路,讓原始的A進入熱端,把A做一個反相之後進入冷端,變成-A,然後出發! 路上遇到了變壓器來的干擾B進入線路,。熱線上的信號變成了A+B,冷線上的信號變成了-A+B。還有手機干擾C,熱線上變成了A+B+C,冷線上變成了-A+B+C。 現在到接收端了,先把冷端做一個反相-(-A+B+C)=A-B-C 。然後,把這個反相過的冷端和熱端的信號混合,也就是(熱端)+(冷端):(A+B+C)+(A-B-C)。
結果呢,不用我說了吧,B和C這兩個干擾源在這里正好被完全抵消了!消得乾乾凈凈!剩下的只有我們要傳送的信號A!
AES/EBU 是一種無壓縮的數據音頻格式,以單向串列碼來傳送兩個聲道的高質量數字音頻數據(最高24bit量化),及傳送相關的控制信息 ( 包括數字信道的源和目的地址、 日期時間碼、 采樣點數、 位元組長度和其它業 務 信息) 並有檢測誤碼的能力。
AES/EBU信號數字格式
同步符 :也稱引導符,占據每個子幀開頭的4bit,用以標識每一個子幀的開始。子幀的開始:分三種情況,分別是一般子幀A,一般子幀B,既是塊的開始也是子幀A的開始;用於區分上述三種情況,AES/EBU規定了X、Y、Z三種同步符,用以分別標識。
音頻數據 :AES/EBU 支持 16- 24 bit 的音頻樣本數據。 在音頻樣本大於 20 bit 時, 數據同時占據輔助和音頻數據域; 在等於、小於 20
bit 時, 僅存放在音頻數據域中, 4 bit 輔助域可用於存放其它數據。
V(合法標記)位 :合法標記位表示此音頻采樣是否正確、有無包錯誤、是否適合作為數模轉換。
U(用戶)位 :沒有定義,可以用戶定義使用。
C(通道狀態)位 :每一個子幀的音頻樣本都對應一個C(通道狀態)位,所以一個塊中的A、B子幀各送了192個bit C(通道狀態)位;在節目端,各自的192bit被分別記憶組合,形成了兩個24位元組的數據集合,稱為通道狀態塊。子幀 A、B 的通道狀態塊是獨立的, 與 A、B 聲道的音頻樣品對應。 通道狀態塊每192 幀更新一次。
P(奇偶校驗)位 :為偶校驗位, 可檢出子幀中奇數個錯。
通道狀態塊數據結構 :
同步符 :也稱引導符,占據每個子幀開頭的4bit,用以標識每一個子幀的開始。子幀的開始:分三種情況,分別是一般子幀A,一般子幀B,既是塊的開始也是子幀A的開始;用於區分上述三種情況,AES/EBU規定了X、Y、Z三種同步符,用以分別標識。
音頻數據 :AES/EBU 支持 16- 24 bit 的音頻樣本數據。 在音頻樣本大於 20 bit 時, 數據同時占據輔助和音頻數據域; 在等於、小於 20 bit 時, 僅存放在音頻數據域中, 4 bit 輔助域可用於存放其它數據。
V(合法標記)位 :合法標記位表示此音頻采樣是否正確、有無包錯誤、是否適合作為數模轉換。
U(用戶)位 :沒有定義,可以用戶定義使用。
C(通道狀態)位 :每一個子幀的音頻樣本都對應一個C(通道狀態)位,所以一個塊中的A、B子幀各送了192個bit C(通道狀態)位;在節目端,各自的192bit被分別記憶組合,形成了兩個24位元組的數據集合,稱為通道狀態塊。子幀 A、B 的通道狀態塊是獨立的, 與 A、B 聲道的音頻樣品對應。 通道狀態塊每192 幀更新一次。
P(奇偶校驗)位 :為偶校驗位, 可檢出子幀中奇數個錯。
通道狀態塊 :
Data Burst Format :
㈦ oppoenco耳機沒有聲音
手機連接藍牙耳機播放音頻無聲、卡頓在使用藍牙耳機的過程中,有時會遇到通話或者音樂聲音卡頓、無聲的現象,可能包括以下幾種原因:1.藍牙斷線若發現在聽歌或者打電話時,藍牙耳機突然不出聲,且聲音外放,此時藍牙可能已經斷可進入藍牙界面查看已配對的耳機是否顯示「使用中,用於通話和媒體」,若不顯示,則說明已經斷連,需要重新連接耳機。2.環境干擾這種情況經常出現在人流密集或者wifi使用量大的區域/路邊攝像頭較多的地方,因藍牙與WIFI等信道同在2.4GHZ頻段附近,當我們處於這種環境下時,手機和耳機建立的藍牙連接較容易受到無線環境的干擾。如果在這些場景下遇到藍牙聲音卡頓/無聲的情況,請遠離人流密集的區域再使用。3.藍牙耳機距離手機太遠使用藍牙耳機時,手機通過天線給耳機發送音頻數據包,這個發送功率是有一定限制,如果手機和耳機的距離比較遠,耳機收到的手機信號就會比較弱,信號差會導致耳機聽到的聲音卡頓斷續。所以使用藍牙耳機的時候,不要離自己的手機太遠噢!4.耳機狀態異常有的清返拍時候,耳機突然無聲或者雜訊突然特別大,但是在手機藍牙界面看,藍牙還是正常連接的,就可能是耳機進入異常狀態了。這個時候,可嘗試在藍牙界面將耳機取消配對,然後再重新連接,如果在取消配對之後,耳機問題仍然存答羨在,可以前往OPPO官方客服中心由專業的工程師幫您檢測處理。有一些TWS耳機(True Wireless stereo真無線立體聲耳機)是左右耳分體式設計,這種耳機會有左右耳同步的機制,以此來確保左右耳的聲音同步正常。同步出現問題的時候,可能會導致雙耳的某一隻耳機聲音異常或者無聲,遇到這種情況,可以按照耳機的說明,重置一下耳機,或者將兩只耳機重新放回到耳機盒中,再拿出來與手機連接,就可以解決這種雙耳聲音不同步或者單耳異常的問題啦。5.音量設置太小,耳機聽不見手機聲音明明已經調到最大了,為什麼聲音還是小到幾乎聽不見?實世念際上,藍牙播放音樂的過程中,手機和耳機都是能夠控制音量大小的,如果在手機端調大音量不管用,若耳機有音量調節按鈕,可嘗試在耳機端調大音量看能否正常聽歌。如果藍牙耳機比較小巧(例如很多TWS入耳式耳機)沒有調音量的按鍵,可嘗試進入手機設置 > 藍牙,在藍牙界面右上角的高級設置中,將「媒體音量同步」(ColorOS 7.2及以後支持)開關打開,再來聽音樂 就能將聲音調大了。6.應用異常調用導致藍牙輸出不了聲音有些應用在打開之後會異常佔用手機的音頻通道,可能會使其他應用(如音樂等)無法通過藍牙播放聲音。如果是在某一個特定的應用打開/使用之後,出現播放音樂等聲音異常,可以嘗試清理其他後台應用,再嘗試播放音樂。溫馨提示若以上均無法解決,可以試試用耳機連接其他手機播放,看是否也有異常。如果只有特定的手機出現異常,可能是這款耳機和手機不兼容導致。由於不同廠家對於藍牙協議理解的不同,可能會出現某些耳機存在兼容性問題,您可以前往OPPO客服中心處理,我們的工程師會竭力為您解決。
㈧ 聲音的數據量是多少
不經孫沒過壓縮,聲音數據量的計算公式為:
數據量(位元組/秒)=(采樣頻率(Hz)×采樣位數(bit)×聲道數)/8
1丶音效卡對聲音的處理質量可以用三個基本參數來衡量,即采樣頻率、采樣位數和聲道數。
2丶采樣頻率是指單位時間內的采樣次數。采樣頻率越大則祥納,采樣點之間的間隔就越小,數字化後得到的聲音就越逼真,但相應的數據量就越大。音效卡一般提供11.025kHz、22.05kHz和44.1kHz等不同的采樣頻率。
3丶采樣位數是記錄每次采樣值數值大小的位數。采樣位數通常有8bits或16bits兩種,采樣位數越大,所宴亂能記錄聲音的變化度就越細膩,相應的數據量就越大。
4丶聲道數是指處理的聲音是單聲道還是立體聲。單聲道在聲音處理過程中只有單數據流,而立體聲則需要左、右聲道的兩個數據流。顯然,立體聲的效果要好,但相應的數據量要比單聲道的數據量加倍。
舉例:
1、請計算對於5分鍾雙聲道、16位采樣位數、44.1kHz采樣頻率聲音的不壓縮數據量是多少?
根據公式:數據量=(采樣頻率×采樣位數×聲道數×時間)/8
得,數據量(MB)=[44.1×1000×16×2×(5×60)] /(8×1024×1024)=50.47MB
計算時要注意幾個單位的換算細節:
時間單位換算:1分=60秒
采樣頻率單位換算:1kHz=1000Hz
數據量單位換算:1MB=1024×1024=1048576B