SSE

SSE

SSE是指令集的簡稱,它包括70條指令,其中包含單指令多數據浮點計算、以及額外的SIMD整數和高速快取控制指令。其優勢包括:更高解析度的圖像瀏覽和處理、高質量音頻、MPEG2視頻、同時MPEG2加解密;語音識別占用更少CPU資源;更高精度和更快回響速度。

基本介紹

  • 外文名:Streaming SIMD Extensions
  • 簡介:是指令集的簡稱
  • 簡稱:SSE
  • 包括:70條指令
指令集,概述,後續版本,風向,英語SSE,數學SSE,A股SSE,

指令集

概述

SSE(Streaming SIMD Extensions)是英特爾在AMD的3D Now!發布一年之後,在其計算機晶片Pentium III中引入的指令集,是MMX的超集。AMD後來在Athlon XP中加入了對這個指令集的支持。這個指令集增加了對8個128位暫存器XMM0-XMM7的支持,每個暫存器可以存儲4個單精度浮點數。使用這些暫存器的程式必須使用FXSAVE和FXRSTR指令來保持和恢復狀態。但是在Pentium III對SSE的實現中,浮點數暫存器又一次被新的指令集占用了,但是這一次切換運算模式不是必要的了,只是SSE和浮點數指令不能同時進入CPU的處理線而已。
SSE2是Intel在P4的最初版本中引入的,但是AMD後來在Opteron 和Athlon 64中也加入了對它的支持。這個指令集添加了對64位雙精度浮點數的支持。這個指令集還增加了對CPU的快取的控制指令。AMD對它的擴展增加了8個XMM暫存器,但是需要切換到64位模式(AMD64)才可以使用這些暫存器Intel後來在其EM64T架構中也增加了對AMD64的支持。
SSE3是Intel在P4的Prescott版中引入的指令集,AMD在Athlon 64的第五個版本中也添加了對它的支持。以及對超執行緒技術的支持。
SSE4指令集將給英特爾下一代平台帶來“相當大的視頻性能提升”。,其它視頻增強技術還包括CVT(明晰視頻技術)--英特爾對ATI Avivo的回應--和對UDI的支持。上述兩項技術基於英特爾965晶片組。其它英特爾官方檔案把CVT技術定義為:支持高級解碼、擁有預處理和增強型3D處理能力。 SSE4指令集是Conroe架構所引入的新指令集。這項原本計畫套用於NetBurst微架構Tejas核心處理器之上的全新技術也隨著它的夭折最終沒能實現,這不能不說是個遺憾,但是SSE4指令集出現在了Conroe上又讓我們看到了希望。
SSE4指令集共包括16條指令,不過雖然扣肉處理器推出已經有一些時日。也許英特爾是基於特殊的考慮,僅讓少數合作軟體廠商取得數據,只是這種作法實在很沒有說服力就是了,天底下沒有哪家處理器廠商,希望自己新增的指令越少人用越好。
不過,從Intel Core微架構針對SSE指令所作出的修改被稱之為“Intel Advanced Digital Media Boost”技術來看,未來SSE4將更注重針對視頻方面的最佳化,我們認為SSE4主要改進之處可能將針對英特爾的Clear Video高清視頻技術及UDI接口規範提供強有力的支持。這兩項技術基於965晶片組,Intel的官方把Clear Video技術定義為:支持高級解碼、擁有預處理和增強型3D處理能力。值得一提的是,在SSE4中另一個重要的改進就是提供完整128位寬的SSE執行單元,一個頻率周期內可執行一個128位SSE指令。Conroe中SSE的ADDPS(4D 32bit共128bit,單精度加法)、MULPS(4D 32bit共128bit,單精度乘法)和SSE2的ADDPD(2D 64bit共128bit,雙精度加法)、MULPD(2D 64bit共128bit,雙精度乘法),這四條重要SSE算術指令的吞吐周期都降低到1個周期,真正做到了英特爾宣稱的每個周期執行一條128位向量加法指令和一條128位向量乘法指令的能力。
可以說 Conroe的向量單元已經全面引入了流水線化的設計。而支持SSE3的NetBurst微處理器架構雖然提供128位寬執行單元,但僅有一組,性能孰高孰低一目了然。更為重要的是,可見其套用範圍相當廣泛。
配合完整的128位SSE執行單元,以及龐大的執行單元數目,Conroe處理器可在一個頻率周期內,同時執行128位乘法、128位加法、128位數據載入與128位數據回存,或著是4個32位單倍浮點精確度乘法與4個32位單倍浮點精確度加法運算,這將使其更利於多媒體套用。因此,SSE4指令集能夠有效帶來系統性能上的提升,這一代在眾多測試中早已被證實。雖然其不會像當年SSE2指令集出現時那樣帶來巨大的性能提升,但是其在某些特殊方面的套用還是讓我們對它充滿了期待。

後續版本

SSE2
SSE2是Intel在Pentium 4處理器的最初版本中引入的,但是AMD後來在Opteron 和Athlon 64處理器中也加入了SSE2的支持。SSE2指令集添加了對64位雙精度浮點數的支持。這個指令集還增加了對CPU快取的控制指令。AMD對它的擴展增加了8個XMM暫存器,但是需要切換到64位模式(AMD64)才可以使用這些暫存器。
SSE3
SSE3是Intel在Pentium 4處理器的 Prescott 核心中引入的第三代SIMD指令集,AMD在Athlon 64的第五個版本,Venice核心中也加入了SSE3的支持。以及對超執行緒技術的支持。
SSSE3
SSSE3是Intel針對SSE3指令集的一次額外擴充,最早內建於Core 2 Duo處理器中。
SSE4
SSE4是Intel在Penryn核心的Core 2 Duo與Core 2 Solo處理器時,新增的47條新多媒體指令集,多媒體指令集,並內建在Phenom與Opteron等K10架構處理器中,不過無法與Intel的SSE4系列指令集相容。
SSE5
SSE5]是AMD為了打破Intel壟斷在處理器指令集的獨霸地位所提出的,SSE5初期規劃將加入超過100條新指令,其中最引人注目的就是三運算元指令(3-Operand Instructions)及熔合乘法累積(Fused Multiply Accumulate)。其中,三運算元指令讓處理器可將一個數學或邏輯函式庫,套用到運算元或輸入資料。藉由增加運算元的數量,一個 x86 指令能處理二至三筆資料, SSE5 允許將多個簡單指令匯整成一個指令,達到更有效率的指令處理模式。提升為三運算指令的運算能力,是少數 RISC 架構的水平。熔合乘法累積讓允許建立新的指令,有效率地執行各種複雜的運算。熔合乘法累積可結合乘法與加法運算,透過單一指令執行多筆重複計算。透過簡化程式碼,讓系統能迅速執行繪圖著色、快速相片著色、音場音效,以及複雜向量演算等效能密集的套用作業。SSE5最快將內建於AMD下一代Bulldozer核心。
AVX
AVX是Intel的SSE延伸架構,如IA16至IA32般的把暫存器XMM 128bit提升至YMM 256bit,以增加一倍的運算效率。此架構支持了三運算指令(3-Operand Instructions),減少在編碼上需要先複製才能運算的動作。在微碼部分使用了LES LDS這兩少用的指令作為延伸指令Prefix。
FMA
FMA是Intel的AVX擴充指令集,如名稱上熔合乘法累積(Fused Multiply Accumulate)的意思一樣。

風向

SSE表示南偏東風向。氣象觀測上,除了用度表示風向外,還用十六方位表示,即將360°劃分為16個區間。在風向的十六方位表示中,SSE代表南偏東風向,介於東南和南之間。氣象上一般以正北為0°,SSE風向的區間是:146.25°—168.75°。

英語SSE

SSE
abbr.
南東南(south-south-east)

數學SSE

SSE(Sum of Squares for Error)即誤差項平方和。反映每個樣本各觀測值的離散狀況,又稱為組內平方和或殘差平方和。

A股SSE

即 交易所和指數
上海證券交易所Shanghai Stock Exchange
上證指數(SH000001)全稱 上海證券交易所股票價格綜合指數,即SSE Composite Index
另外還有上證180指數,SSE 180
A股指數,SSE A等指數系列,其中最早編制的為上證綜合指數

相關詞條

熱門詞條

聯絡我們