被灌满各种玩具c到失禁视频,成全电影大全在线播放视频免费观看下载,欧美一区二区视频高清专区,最近手机中文字幕高清大全

DAV首頁
數字音視工程網

微信公眾號

數字音視工程網

手機DAV

null
null
null
卓華,
招商,
null
null
null
快捷,
null

我的位置:

share

基于龍芯3B的H.264解碼器的向量化

來源:中國數字音視網     作者:tony    編輯:數字音視工程    2010-12-17 00:00:00     加入收藏    咨詢

咨詢
所在單位:*
姓名:*
手機:*
職位:
郵箱:*
其他聯系方式:
咨詢內容:
驗證碼:
不能為空 驗證碼錯誤
確定

基于龍芯3B的H.264解碼器的向量化

  本文實現了ffmpeg解碼器到龍芯3B平臺的移植,并針對龍芯3B所支持的向量擴展指令,對ffmpeg解碼器進行了向量化。實驗結果表明:實現向量化的ffmpeg解碼器,其性能比使用GCC向量化編譯得到的ffmpeg解碼器具有更好的性能,而且性能提升的比率比在一些商業平臺上更大。

  0 引言

  當今社會已經步入信息時代,傳統的信息載體和通信方式已經無法滿足人們對信息的需求。而實驗表明:相比較語音和抽象數據,人類接受的信息更多是以圖片和視頻方式為載體的。其中視頻信息具有直觀、具體和高效的特點,這也就決定了視頻通信技術將成為信息時代的重要技術之一。

  由于視頻的數據量巨大,而存儲視頻的資源通常是非常有限的,因而對視頻進行壓縮編碼,以減少存儲資源的消耗,非常必要。然而,通常情況下,使用的壓縮算法的復雜度越高,壓縮比率越高,視頻播放時的解碼速度就會越低。因而在提高編碼壓縮率的同時,也需要對解碼器進行相應的優化,以提高視頻解碼器在目標平臺上的性能。本文就實現了ffmpeg解碼器在龍芯3B上的移植與向量化,提高了該解碼器在龍芯3B上的性能。

  1 視頻編/解碼與龍芯3B

  1.1 視頻編/解碼

  目前,成熟的壓縮編/解碼方法有很多。其中H.261、MPEG-1、MPEG-3和H.263采用了第一代壓縮編碼方法,如預測編碼、變換編碼、熵編碼以及運動補償;而MPEG-4和H.264采用了第二代的壓縮編碼方法,如分段編碼和基于模型或對象的編碼等。

  視頻壓縮編碼的主要目的是減少存儲視頻所占用的資源,而解碼技術的目標則是提高解碼的速度,從而提高視頻播放的流暢性。常見的基于H.264編碼方法的軟解碼器包括CoreAVC、ffmpeg和JM等。其中JM是H.264官方網站提供的編/解碼器,集合了各種編/解碼算法,而且代碼的結構清晰,很適合應用于對視頻編/解碼技術的研究。而CoreAVC解碼器則主要用于商用,其解碼速率比ffmpeg快50%以上。ffmpeg是開源的解碼器,而且性能相對較好,很多開源項目都直接或間接地使用了ffmpeg,如mplayer播放器等。通過對性能以及開源特性的綜合考慮,本文選擇ffmlpeg作為移植和向量化對象。

  1.2 龍芯3B體系結構

  龍芯3B處理器在兼容了MIPS64指令集的同時,實現了針對多媒體應用的向量擴展指令,這對視頻編/解碼應用性能的提升有很大的幫助。

  龍芯3B提供了256位的向量寄存器并實現包括256位向量訪存在內的向量擴展指令。使用向量指令可以一次完成32個字節寬度數據的操作。而這樣的結構和指令集設計,使得龍芯3B非常適合于實現大規模相同類型數據的相同運算,比如矩陣乘法運算和FFT運算,以及視頻編/解碼運算等。

  不過由于ffmpeg并未實現對龍芯3B平臺的支持,因而需要完成ffmpeg到龍芯3B的移植工作。本文之前也有一些ffmpeg到其他平臺的移植工作和針對龍芯平臺的移植與優化工作,都取得了不錯效果。

  2 基于龍芯3B的ffmpeg移植

  2.1 ffmpeg的移植

  ffmpeg解碼器提供了對不同目標平臺的支持,而與這些平臺相關的文件都保存在以該目標平臺命名的目錄下。例如,ffmpeg解碼器實現了對arm和sparc平臺,以及x86平臺的支持。

  對于實現ffmpeg解碼器對龍芯3B的支持,主要完成以下5個步驟:

  (1)修改configure配置文件,增加與龍芯體系結構相關的配置選項;

  (2)新建龍芯專用文件夾godson,將龍芯體系結構相關的文件都存放于該文件夾中;

  (3)將godson文件夾下新增的需要編譯的文件添加到Makefile中;

  (4)增加與dsputil_init類似的新的初始化函數dsputil_init_godson;

  (5)在頭文件中添加新增函數的聲明。

  針對龍芯3B的ffmpeg移植工作相對比較簡單,因而本文重點介紹針對龍芯3B的向量化工作。

  2.2 移植后的ffmpeg的性能比較

  本節對移植后的ffmpeg解碼器進行了性能測試,對使用龍芯3B向量擴展指令和不使用龍芯3B擴展指令兩種情況下的性能進行了比較。測試時使用支持龍芯3B擴展指令集的GCC編譯器進行編譯,并且開啟-ftree-vectorize和-march=godson3b編譯選項來支持龍芯 3B擴展指令。使用的測試用例為視頻“walk_vag_640x480_qp26.264”,測試結果如表1所示。

  使用龍芯3B的向量擴展指令可以提高ffmpeg解碼器在龍芯3B上的性能,用來測試的視頻的解碼時間減少了約466s。盡管如此,由于GCC編譯器本身自動向量化能力的限制,ffmpeg解碼器的性能提升還是比較有限的,因而針對龍芯3B的指令集對移植后的ffmpeg解碼器進行向量化,就成為了進一步提高性能的重要工作。

免責聲明:本文來源于中國數字音視網,本文僅代表作者個人觀點,本站不作任何保證和承諾,若有任何疑問,請與本文作者聯系或有侵權行為聯系本站刪除。(原創稿件未經許可,不可轉載,轉載請注明來源)
掃一掃關注數字音視工程網公眾號

相關閱讀related

評論comment

 
驗證碼:
您還能輸入500
    主站蜘蛛池模板: 会理县| 天峨县| 集贤县| 天台县| 牙克石市| 邛崃市| 顺昌县| 黔南| 鹤峰县| 疏附县| 武汉市| 蒙自县| 彭水| 连州市| 合水县| 黑水县| 张掖市| 土默特右旗| 吴旗县| 乳源| 定州市| 扎兰屯市| 阿拉善盟| 明星| 晋城| 新绛县| 石家庄市| 丹阳市| 松溪县| 宁河县| 晋城| 陇川县| 武隆县| 盈江县| 县级市| 曲水县| 镇远县| 汕尾市| 武夷山市| 友谊县| 马龙县|