曙光-1000計算機系統

曙光-1000計算機系統

中國研製的大規模並行計算機系統。1995年由國家智慧型計算機研究院開發中心研製成功。

基本介紹

  • 中文名:曙光-1000計算機系統
  • 外文名:Dawn -1000 computer system
  • 採用:國際90年代的最新技術
  • 峰值速度:達到25億次/秒
  • 記憶體容量:達1024兆位元組
系統簡介,技術特點,主要技術指標,硬體系統,軟體系統,

系統簡介

該系統突破了一批大規模並行處理的關鍵技術,採用了國際90年代的最新技術它的峰值速度達到25億次/秒,實際運算速度達到15.8億次/秒浮點運算,記憶體容量達1024兆位元組,居中國之首。該系統能解決工作站和大型機難以解決的問題。如,一個全國範圍內的48小時天氣預報程式只需運行3小時左右,而一般計算機要運行60小時以上,這就提高了預報的準確度。這是中國研製成功的第一家有自己著作權的並行作業系統。

技術特點

1可擴展性好。連線網路、輸入輸出(I/O)、系統軟體等均可以擴展。它可以擴展到包括成百上千個結點計算機的MPP系統。它與對稱式多處理機(SMP)系統和傳統的向量(巨型)機相比,具有明顯的優勢。
2計算能力強,記憶體容量大,能解決工作站和大型機難以解決的大問題。它的實際運算速度達到每秒15.8億次浮點運算。它能在30分鐘內解出含15000個未知數的線性方程組,能在40小時內完成天然DNA整體電子結構計算,而小型機要連續計算3個月以上才能完成。
3獨立設計的蛀洞(Wormhole)路由器晶片創造性地採用了異步和同步相結合的工作方式,訊息傳送速度快,穩定可靠。
4並行系統軟體(作業系統、最佳化編譯器及工具)高效實用。
5全面採用並行編程和調試環境。
6廣泛採用國際標準,系統開放程度高,用戶移植軟體容易。

主要技術指標

曙光1000有36個結點機。其中,計算結點機32個,服務結點機2個,I/O結點機2個;峰值計算速度為浮點25.6億次/秒,實際達到15.8億次/秒;記憶體容量為1024兆位元組;採用基於Wormhole機制的二維Mesh通訊網,結點與網路通訊總頻寬為2.88GB/秒;運行C、C++和並行Fortran程式,提供並行最佳化重構工具PORT和串列程式自動並行化工具Autopar;採用基於UNIX的並行作業系統和並行檔案系統,並行編程環境PVM、EXPRESS和MPI並行程式行為動態監視工具ParaVision及並行程式調試環境NDB。 曙光1000可以用於天氣預報、石油地震數據處理、太空飛行器設計模擬、科學研究、教學、金融、證券等眾多領域。它已經在我國大規模科學工程計算中發揮了重大作用。以曙光1000為計算主機的高性能計算服務中心即將在國內若干中心城市建立起來。為支持用戶在曙光1000上進行算法研究和開發套用軟體,國家有關部門即將設立國家高性能計算基金。

硬體系統

系統總框圖
曙光1000是一個基於Message-passing機制的鬆散耦合大規模並行計算機系統。它包括32個基於i860的計算結點,1~2個系統服務結點子系統和2~3個I/O結點組成的外存子系統。這些結點由一個6×6的二維mesh網連線,每一個Mesh網路上有一個Wormhole路由器。整個系統有一個系統控制台,它負責系統的初始化和硬體故障診斷工作。用戶工作平台是SUN Sparc-2工作站(或其他工作站,如SGI等)和一些終端設備。由每秒10Mb的Ethernet區域網路將系統服務結點、控制台、Sparc-2工作站及終端設備連線起來。
Mesh網
圖1中的mesh是可擴充的。每一個結點機(包括系統服務結點機和I/O結點機)和一個Wormhole路由器(WRC)相連。結點的編號(物理地址)由X方向編號和Y方向編號兩部分組成。結點的相對地址信息包含在Message中,一個WRC有10個輸入或輸出通道,每一個通道包含8條數據線,一個表示Message結束的TAIL信號、一個請求傳輸線REQ和一條回答信號線ACK。當一個Message由初始結點傳到一個目的結點時,它只"穿過"途中的WRC,而不"進入"與這些WRC相連的結點機。Mesh採用X-Y路由算法。有多條虛通道共用一條單方向的物理通道。
計算結點
一個計算結點機為一塊外掛程式板,其核心是一塊i860XR晶片,主頻為40MHz,字長64位,浮點運算速度為單精80MFlops,雙精度60MFlops,標量運算速度為40MIPS。DRAM容量為32MB,帶奇偶檢測;EPROM容量為8KB。NVRAM容量為2KB,由電池供電。結點-mesh接口模組包含容量各為16KB的兩個FIFO。結點-mesh間傳輸頻寬為33MB/s,有CRC循環冗餘碼檢測。結點板的RS-232模組直接同控制台系統的一塊多用戶卡相連,為系統控制台提供監視和為診斷結點機提供支持。計算結點機運行860 OS和用戶程式。
系統服務結點
服務結點主要是為管理系統資源(主要是結點機)而設定的。一個服務結點由一台帶有ISA匯流排的486 PC擔任,主頻為50MHz。在EISA匯流排和Mesh網之間有一個EISA-Mesh Interface(EMI)模組。EMI具有DMA機制,是一塊EISA插板。同樣,數據通路FIFO-mesh-FIFO上具有CRC檢測。EMI與mesh網間的通訊速率為16MB/s。在用戶較多、圖形顯示較頻繁的情況下,可以設兩個服務結點,它們通過共享一個資源表來協調工作。
I/O結點機
一個I/O結點機由一台帶EISA匯流排的486 PC充任,同服務結點機一樣,帶有一塊EMI插板。通過插在EISA匯流排上的SCSI卡,一個I/O結點機可配容量為4GB的硬磁碟。系統可設1~2個I/O結點機。I/O流量要求大的用戶,可配更多的I/O結點機,但要相應減少計算結點機的數量。一個I/O結點機與Mesh網間傳輸數據的速度為16MB/s,各個I/O結點機運行並行檔案系統,以實現並行檔案操作。
系統控制台
整個系統設一系統控制台,運行UNIX。該機上插有一塊多用戶卡。同32塊計算結點機板上的RS-232串口相連。控制台同計算結點機可以點對點地通訊,也可以以廣播方式同時同所有計算結點機通訊。它的主要功能是系統初始化,監視計算結點作業系統和用戶程式的運行狀態,動態查詢結點機資源配置表和對計算結點機硬體故障進行診斷。
前端機網路系統
曙光1000的用戶工作平台是一台或多台SUN Sparc-2彩色圖形工作站(或SGI圖形工作站)及一些終端。這些設備通過區域網路(乙太網)與系統服務結點機連線。區域網路遵從TCP/IP協定,其數據傳輸率為10Mb/s。實際上,Mesh網系統是前端網路系統的計算伺服器,用戶程式在前端機上編輯、編譯、連結和調試,然後通過服務結點發往計算結點運行,計算結果在前端機上顯示。

軟體系統

作業系統
曙光1000的作業系統是以UNIX為基礎的。計算結點上的作業系統是一個微核心作業系統,支持虛存管理、trap處理、作業管理和訊息傳遞,而將檔案服務作為Client運行於用戶空間。 服務結點的作業系統以Mach2.6為基礎,支持多線機制。它主要用於系統的管理,即節點機的分配。I/O結點運行並行檔案伺服器PFS。這兩類結點與計算結點有相同的訊息傳遞界面。 曙光1000採用帶流量控制的訊息傳遞協定,這種協定既是高效的又是可靠的。
並行最佳化編譯器及工具
結點程式編譯最佳化分為源程式級和目標代碼級。對於前者,採用了循環交換、循環合併和循環條塊劃分等措施。對於後者,曙光1000充分利用i860流水線、雙指令與雙操作模式和浮點Load指令實現了循環向量化。這兩種級別的最佳化都取得了較好的效果。 Autopar是我們研製的自動程式並行化工具。它能識別並行循環,進行數據分割,最後得到循環級並行的並行FORTRAN源程式。 並行程式可視化工具是為曙光1000研製的,也可以移植到其他MPP系統。用戶通過它能觀察到程式動態進行狀態,包括通信情況、負載平衡情況以及有無死鎖發生等。
並行編程和調試工具環境
為方便用戶編制和運行並行程式,曙光1000移植改造了NX、EXPRESS和PVM三種主要的界面和工具環境。NX是Paragon系統採用的一種並行用戶程式界面,EXPRESS和PVM是都國際廣泛採用的並行程式編程和運行環境。 並行程式調試器分為源程式級調試器NDB和彙編級調試器ADB。它們的主要功能有顯示、設定和清除指令碼(或數據)斷點,讀寫記憶體,單步或連續執行程式,以及接收和傳遞當前進程現場內容,還能對多個結點上的程式進行調試。
並行檔案系統PFS
曙光1000的多個I/O結點運行PFS檔案伺服器,支持用戶讀寫檔案的並發操作,增加了讀寫檔案操作時同時工作的I/O通道數目,以便提高系統總的I/O頻寬。

相關詞條

熱門詞條

聯絡我們