SSE 4.1(SSE4.1)

SSE 4.1

SSE4.1一般指本詞條

集成在英特爾晶片中的指令集的名字,較之SSE4指令集,新指令集多了47條,因此被稱為SSE4.1。SSE 4.1指令的引入,進一步增強了CPU在視頻編碼/解碼、圖形處理以及遊戲等多媒體套用上的性能,增幅最大可達70%。

基本介紹

  • 外文名:Streaming SIMD Extensions 4
  • 簡稱:SSE 4.1
  • 屬於:英特爾晶片中的指令集
  • 主要針對:向量繪圖運算等
概述,指令集,效能對比,處理器,優點,對比特點,

概述

完整的SSE4(Streaming SIMD Extensions 4,流式單指令多數據流擴張)指令集共包含54條指令,其中的47條指令已在45nm的Core 2上實現,稱為SSE 4.1。
SSE 4.1指令的引入,進一步增強了CPU在視頻編碼/解碼、圖形處理以及遊戲等多媒體套用上的性能。
SSE 4.1版本的指令集新增加了47條指令,主要針對向量繪圖運算、3D游戲加速、視頻編碼加速及協同處理的加速。英特爾方面指出,在套用SSE4指令集後,45納米Penryn核心額外提供了2個不同的32位向量整數乘法運算支持,並且在此基礎上還引入了8位無符號最小值和最大值以及16位、32位有符號和無符號的運算,能夠有效地改善編譯器編譯效率,同時提高向量化整數和單精度運算地能力。另外,SSE4.1還改良了插入、提取、尋找、離散、跨步負載及存儲等動作,保證了向量運算地專一化。
SSE4.1還加入了6條浮點型運算指令,支援單、雙精度地浮點運算及浮點產生操作。其中IEEE 754指令可實現立即轉換運算路徑模式,大大減少延遲,保證數據運算通道的暢通。而這些改變,對於進行3D遊戲和相關的圖形製作是具有相當深遠的意義。除此之外,SSE4.1指令集還加入了串流式負載指令,可提高圖形幀緩衝區的讀取數據頻寬,理論上可獲取完整的快取行,即單次性讀取64位而非原來的8位 ,並可保持在臨時緩衝區內讓指令最多帶來8倍的讀取頻寬效能提升。對於圖形處理器中央處理器之間的數據共享起到重要作用。
SSE4.1指令集指令集主要是針對圖形及視頻編碼方面進行了最佳化,特別是引入了8位無符號最小值和最大值以及16位、32位有符號和無符號的運算,能夠有效地改善編譯器編譯效率,大大減少視頻解碼處理的時間。所以順著這個思路,編輯決定把集成有SSE4.1指令集Penryn核心與傳統的處理器進行視頻解碼速度的對比,由此可以直觀的分析出性能提升的幅度。

指令集

45納米加入了SSE4.1指令集,令處理器的多媒體處理能力得到最大70%的提升。SSE4加入了6條浮點型點積運算指令,支持單精度、雙精度浮點運算及浮點產生操作,且IEEE 754指令 (Nearest, -Inf, +Inf, and Truncate) 可立即轉換其路徑模式,大大減少延誤,這些改變會對遊戲及 3D 內容製作套用有重要意義。此外,SSE4加入串流式負載指令,可提高以圖形幀緩衝區的讀取數據頻寬,理論上可獲取完整的快取快取行,即每次讀取64Bit而非8Bit,並可保持在臨時緩衝區內,讓指令最多可帶來8倍的讀取頻寬效能提升,對於視訊處理、成像以及圖形處理器中央處理器之間的共享數據套用,有著明顯的效能提升。
SSE4指令集讓45nm Penryn處理器增加了2個不同的32Bit向量整數乘法運算單元,並加入8位無符號(Unsigned)最小值及最大值運算,以及16Bit及32Bit有符號 (Signed) 運算。在面對支持SSE4指令集的軟體時,可以有效的改善編譯器效率及提高向量化整數及單精度代碼的運算能力。同時,SSE4改良插入、提取、尋找、離散、跨步負載及存儲等動作,令向量運算進一步專門。

效能對比

作為在指令集方面的最大改進,SSE 4.1增加了47條指令,著重改善多媒體方面的性能,而據英特爾官方人士稱,在SSE 4.1指令集的測試中,使用最新的Divx編碼壓縮視頻,即使相比更高主頻的酷睿處理器Penryn核心處理器依舊可以領先105%以上。為了測試SSE 4.1指令集的實際效能,採用支持SSE 4.1指令集的Divx 6.8編碼器,以VirtualDub為平台,壓縮一部1080P的影片,測試SSE 4.1指令集帶來的改進。
SSE4.1指令集效能對比測試SSE4.1指令集效能對比測試
但是測試結果可以說非常不理想,在開啟了SSE 4.1支持之後,壓縮時間從104分鐘增長為123分鐘,反而延長了18.27%。看來即使是最新的Divx,對於SSE 4.1的支持依舊不太理想。SSE 4.1指令集帶來的改進,只能是期待真正支持的軟體發布,才能進行全面的測試。
主流中端PK,Penryn是進步還是倒退
根據目前了解到的資料,T8300作為未來的主流中端處理器,將要在未來全面取代目前的T7500處理器,但是這兩強的性能究竟孰勝孰負,我們就這兩款處理器進行一下全面的比拼。
在比較中,微架構得到改進的Penryn理論性能得到了不小的增幅,在Sisoftware Sandra中取得了9%-26%的增幅,多媒體方面也改進不少,CineBench取得了11%-16%的增幅,是相當可喜的增長。不過在整機性能方面,則可以說是基本持平,差距很小。類似的還有遊戲,目前處理器的發展遠遠領先於遊戲和顯示卡的發展,相比處理器而言,筆記本的顯示卡更是遊戲的絕對瓶頸。需要注意的是,搭配Penryn處理器的平台,記憶體性能取得了5%-7%的增長,這是一個相當不錯的成績,而續航時間16%的增長更是讓我們欣喜不已,表明英特爾的45nm工藝相當的成熟,功耗得到了很好的控制,而3MB的快取,相比T7500的4MB自然也省電不少。
整體而言,T8300的整體性能還是要略勝於T7500,續航方面的改進則更具意義。對於目前的主流機型,在Merom平台普遍可以實現150-200分鐘的續航,假設升級為Penryn之後續航時間同幅度增長,即將實現175到230分鐘的續航,續航時間可以延長近半小時,無疑還是非常具有意義的。

處理器

酷睿2四核處理器採用了45nm工藝製程,其優點在於進一步的壓縮了處理器線路與電晶體的尺寸,緊湊的方式會使處理器在遊戲、高清視頻等方面實現更高的性能表現,同時也讓CPU功耗更低,這更加適合用戶進行影音娛樂,因為在看高清電影時,不僅需要處理能力更流暢,也更喜歡電腦運行更安靜,相比上一代酷睿2處理器,45nm酷睿2四核處理器在獲得40%性能提升的同時也把功耗降低了40%,這讓酷睿2四核電腦更加適合高清娛樂,同時更低的功耗,也讓廠商可以把家用電腦做的更小、更時尚,噪音也更小,壽命也更長。
SSE 4.1(SSE4.1一般指本詞條)
相比普通雙核電腦酷睿2四核電腦的性能翻倍,功耗卻控制的更低,那么是否意味著,它的成本也翻倍呢?實際上並非如此,由於45納米技術的不斷成熟,酷睿2四核CPU的售價已經不再非常高,甚至有的酷睿2四核CPU與雙核CPU持平,譬如酷睿2雙核E8000系列和四核Q8000系列的價格差距就相當小,使得眾多PC廠商紛紛推出酷睿2四核台式機。而從市售產品情況來看,酷睿2四核的分布非常廣泛,有4000元以內的低價機型,也有5000元左右的主流娛樂機型,更有價格8000元甚至萬元的高端機型,而且性價比表現都非常不俗,對於消費者而言,則可以根據個人實際套用需要,買到一款適合自己的酷睿2四核電腦。
酷睿2 E8200散片
酷睿2 E8200仍採用LGA775接口,生產批次為O748A127,是專供OEM的正式版處理器。最大工作電壓為1.225V,產品封裝地仍然是馬來西亞工廠。
酷睿2 E8200的實際主頻為2.66GHz,共享式L2快取容量為6MB,前端匯流排為1333MHz,外頻為333MHZ,倍頻為8,供電需符合06規範。該產品採用最新的45nm工藝製造,採用Wolfdale核心架構,由4.1億個電晶體組成,相比之前65nm的2.91億個電晶體有了很大的提升,其支持MMXSSESSE2SSE3SSSE3、SSE4.1多媒體指令集,具備EM64T 64位運算指令集、EIST節能技術。
[編輯點評]:由於其採用的是45nm工藝,這樣就很好的控制節能和靜音等因素,同時也提高其超頻能力。
酷睿2 Q9300散片
酷睿2 Q9300處理器採用了45nm工藝製造,接口為LGA775,它的主頻為2.5GHz,外頻為333MHz,倍頻為8。它的前端匯流排為1333MHz,L2快取容量高達6MB,供電需符合05A標準。
該產品採用45nm製程工藝,核心屬於Yorkfield,目前市場上的大部分P35主機板都可支持。從外觀上看,酷睿2 Q9300與酷睿2雙核系列沒有較大差別,但由於其基於45nm生產工藝,而且擁有較高的主頻和L2快取,相信其會帶來更大的性能提升。另外,官方還沒有這款產品的詳細資訊。
目前Q9300和其他9系列產品相比,在二級快取上是有所縮減的。Q9450、Q9550擁有12MB的二級快取,而Q9300隻具備6MB的二級快取,整整缺少了一半,這可能是Intel有意禁止了Wolfdale二級快取後的結果,配合全新的倍頻模式,Intel能夠將產品的定位更加精確化,甚至每20美元的間隔都將出現一款Intel的產品。而其他的主要參數,Q9300和9系列產品都是完全一樣的。
和Q6600的參數相比,Q9300有著明顯的優勢。在製造工藝上,Q9300採用了更加先進的45nm製造工藝,而Q6600則是65nm製造工藝的產物;在前端匯流排部分,Intel將Q9300的前端匯流排升級到1333MT/s,Q6600為1066MT/s;二級快取方面,Q6600的二級快取達到了8MB,Q9300隻有6MB;電晶體數量上二者的差距也很大,Q9300是由兩顆4.1億電晶體的Wolfdale拼裝而成,Q6600則是由兩顆2.91億電晶體的Conroe拼裝而成。
而對於Q6600而言,Q9300最大的進步就是增加了SSE4.1指令集。在具備新指令集的套用類軟體中,Q9300能夠表現得更加得心應手。
[編輯點評]:作為Q6600的取代者,Q9300即將成為Intel最廉價的4核心處理器。和之前的Q6600相比,Q9300有著不爭的優勢:全新的製造工藝、前端匯流排速度的提升、SSE4指令集的套用、電源管理的完善以及處理器微架構的改變。Q9300的二級快取被縮減到6MB,但是在性能實測中,6MB的二級快取並不影響Q9300的表現。

優點

高溫的確是硬體的殺手,不但會導致系統不穩定,更嚴重的可能造成晶片內部的晶體結構損壞,而對溫度尤為敏感的硬體就要數CPU了。一款搭配普通的風扇也能工作的十分穩定的處理器特別被一些玩家與家庭用戶所關注,那么對於擔心處理器長時間使用會過熱的朋友不妨一起來關注一下Intel Core 2 (酷睿2)Duo E7400這款雙核處理器
Intel 的酷睿2 Duo E7400是出自Intel 新的45nm體系中的產品,採用了Wolfdale核心,提供了強勁性能的同時將TDP控制在了65W,這一點是目前市面雙核處理器所無法比擬的。
Intel Core 2 Duo E7400擁有2.8GHz的時鐘頻率,FSB匯流排速度為1066MHz,3MB的L2 Cache,儘管沒有與E8400的6MB L2 Cache差距不小,但是全速的Cache設計使其在有遊戲中的表現於E8400差距並不是非常懸殊,同時也更好地控制了發熱量。支持指令集有:MMXSSESSE2SSE3SSSE3SSE4.1、EM64T,豐富的指令集是E7400擁有出色的實際套用表現。
眼前天氣漸熱,考慮到自身涼爽舒適的同時,朋友們也肯定考慮到自己的愛機能不能在這個夏天繼續穩定工作吧,高主頻、大快取必然會帶來一定性能的提升,但是功耗和發熱量也隨之增高,一款保證用戶工作效率同時又擁有低發熱量和低功耗的處理器更是值得關注一下。

對比特點

SSE4.1指令集效能對比測試
作為近年來在指令集方面的最大改進,SSE 4.1增加了47條指令,著重改善多媒體方面的性能,而據英特爾官方人士稱,在SSE 4.1指令集的測試中,使用最新的Divx編碼壓縮視頻,即使相比更高主頻的酷睿處理器Penryn核心處理器依舊可以領先105%以上。為了測試SSE 4.1指令集的實際效能,我們採用支持SSE 4.1指令集的Divx 6.8編碼器,以VirtualDub為平台,壓縮一部1080P的影片,測試SSE 4.1指令集帶來的改進。
但是測試結果可以說非常不理想,在開啟了SSE 4.1支持之後,壓縮時間從104分鐘增長為123分鐘,反而延長了18.27%。看來即使是最新的Divx,對於SSE 4.1的支持依舊不太理想。SSE 4.1指令集帶來的改進,只能是期待真正支持的軟體發布,才能進行全面的測試。
主流中端PK,Penryn是進步還是倒退
根據目前了解到的資料,T8300作為未來的主流中端處理器,將要在未來全面取代目前的T7500處理器,但是這兩強的性能究竟孰勝孰負,我們就這兩款處理器進行一下全面的比拼。
在比較中,微架構得到改進的Penryn理論性能得到了不小的增幅,在Sisoftware Sandra中取得了9%-26%的增幅,多媒體方面也改進不少,CineBench取得了11%-16%的增幅,是相當可喜的增長。不過在整機性能方面,則可以說是基本持平,差距很小。類似的還有遊戲,目前處理器的發展遠遠領先於遊戲和顯示卡的發展,相比處理器而言,筆記本的顯示卡更是遊戲的絕對瓶頸。需要注意的是,搭配Penryn處理器的平台,記憶體性能取得了5%-7%的增長,這是一個相當不錯的成績,而續航時間16%的增長更是讓我們欣喜不已,表明英特爾的45nm工藝相當的成熟,功耗得到了很好的控制,而3MB的快取,相比T7500的4MB自然也省電不少。
整體而言,T8300的整體性能還是要略勝於T7500,續航方面的改進則更具意義。對於目前的主流機型,在Merom平台普遍可以實現150-200分鐘的續航,假設升級為Penryn之後續航時間同幅度增長,即將實現175到230分鐘的續航,續航時間可以延長近半小時,無疑還是非常具有意義的。

熱門詞條

聯絡我們