嵌入式流處理器

簡介

由於半導體技術的不斷進步和多媒體數據套用領域的不斷擴大，像素幀巨大的圖像處理套用的計算機體系結構，在嵌入式套用環境的體積與功耗的限制下，目前正面臨著三個要解決的關鍵問題。一是要解決千億次量級的運算速度；二是由於現代的半導體技術的集成度已經很高了，例如，中芯國際0.18mm的CMOS工藝在1cm2的晶片面積上可以集成40,000,000支電晶體，但由於晶片引出頭數目的增加是有限的，因此，必須解決引出頭的數目受限制的關鍵問題；三是由於多媒體數據處理幾乎沒有時間和空間局部性，一幅圖像中的每個像素通常只是被訪問一次，因而不僅要解決運算量大的問題，而且要解決處理器與存儲器之間的數據頻寬問題。

國內的處理器設計

現在還主要處於功能仿製階段，有單位正在研製具有MMX指令的奔騰晶片，以及具有數據並行處理能力的TMS 320C6711等晶片。就數據並行性計算來說，高性能奔騰處理器是通過57條MMX指令來支持數據並行性計算的，但其數據並行計算的程度是很低的，只能支持8個8位數據，或4個16位數據，或2個32位數據的數據並行計算。也有單位九五期間自主設計研製了含有64（8×8）個處理元的PE晶片，研製了具有4096個處理元的SIMD協處理器的圖像處理機系統。但是，這些處理器還不能滿足像素幀巨大的嵌入式圖像處理套用的要求。

國外對新一代多媒體處理器研究

針對上述三個關鍵問題，近十多年來,國外對新一代多媒體處理器體系結構進行了廣泛的研究，有專用多媒體處理器、可程式多媒體處理器、向量處理器以及流處理器等體系結構。

專用多媒體處理器

針對三維圖形套用，SGI公司研製了名為InfiniteReality的專用多媒體處理器系統（1997年公布）。它由4個專用的幾何引擎（Geometry Engine）和80〜320個專用的圖像引擎（Image Engine）構成，能提供每秒11,000,000次三角函式計算和每秒830,000,000個像素的處理。它是以存儲容量的冗餘為代價來提高存儲器頻寬的。最近，NVIDIA公司研製了名為GeForce256的專用單晶片圖形處理器。該處理器能提供每秒15,000,000次峰值運算和每秒480,000,000個像素處理。這些專用多媒體處理器的缺點是只要算法稍有變化，性能就會急劇下降。

可程式多媒體處理器

Chromatic公司研製了名為Mpact的多媒體處理器（1996年公布），Philip公司研製了名為TriMedia（1996年公布）和VSP（1994年公布）的多媒體處理器。它們比專用圖形處理系統要靈活得多。Mpact多媒體處理器有一個4KB的全局暫存器檔案（Register file），並且利用了高頻寬的Rambus DRAM來滿足3-D圖形處理對頻寬的需求。這個相當大的全局暫存器檔案，在很大程度上減小了圖形處理中對工作頁面進行顯式快取所需的頻寬量，進而減少了對存儲器的訪問次數。在奔騰等高性能處理器中，通過MMX，MAX-2,和VIS，增加了多媒體擴展，也就是增加了來自存儲器的預取流數據，並利用這些處理器中可以得到的數據頻寬，增加了浮點數據類型SIMD操作，以支持數據並行性。

嵌入式流處理器

基本介紹

簡介

國內的處理器設計

國外對新一代多媒體處理器研究

專用多媒體處理器

可程式多媒體處理器

向量處理器

流處理器

相關詞條

熱門詞條