介紹 Introduction

卓越計算中心之高效能運算服務

臺灣大學計算機中心 張傑生

隨著資訊科技日益發達,計算機設備日新月異,學術研究的進行方式也隨之變化演進。傳統的理論研究者,往往只能以 紙筆進行複雜的計算工作,然而當問題規模成長,人們的大腦已經無法容納許多複雜的問題,此時透過電腦進行程式模擬 ,便成為不可或缺的實驗工具。同樣的,許多風洞實驗、流體力學、高能物理、粒子碰撞、基因序列、藥物合成的研究者 ,也不再拘泥於過往的hands-on (dirty lab)實驗,取而代之的,是利用各種模擬計算程式,達到虛擬化實驗的目的,以取 得所需之實驗數據,完成研究。由此可知,對於校內許多研究團隊而言,高效能運算設備是不可或缺的實驗儀器,唯有藉 助資訊科技的協助,才能在短時間內獲得所需的實驗數據。

為提供校內研究團隊進行各式實驗模擬所需之科學計算能力,本中心自2003年起,開始規劃網格計算(Grid Computing) 服務,透過「推動研究型大學計畫」之經費補助,分別於 2003 年與 2005 年建置兩組平行化計算叢集(Cluster),共計 128 組計算節點。其後於 2006 年獲「邁向頂尖大學計畫」之經費補助,再度建置一組 106 計算節點之平行化計算叢集(Cluster) 以及一組SMP架構之大型運算主機。目前本中心之高效能運算設備架構圖如下:

平行化計算叢集(Cluster)提供平行分散式計算之程式環境,特別適合平行化程式之需求。程式可以將計算工作切成細 小等分,分散至不同計算節點上同時進行,以降低程式執行時間,加速實驗進行。

而SMP架構之大型運算主機,配備64顆CPU與256 GB之記憶體。其內建之大量記憶體,對於傳統的 sequential program 特別 有幫助,方便需要使用大量記憶體之計算程式,進行 large scale dataset 之處理。

計中四套高效能運算設備分工如下表:

設備名稱 硬體規格 適合用途
2003 cluster 每一節點
Dual P4 Xeon 2.0GHz CPU
1GB memory
由於硬體等級相對落伍,目前以支援教學課程為主,並提供使用者程式學習、練習、開發、除錯之環境。
2005 cluster 每一節點
Dual P4 Xeon 3.2GHz CPU
5GB memory
目前服務主力。由於nodes之間採用gigabit ethernet串接,在大量MPI資料交換的情況下overhead成本相對高昂。 因此我們鼓勵serial program及使用低於8 nodes以下的MPI program於此環境下執行
2006 SMP 單一主機
64 * Power5+ 1.9GHz CPU
256GB memory
目前服務主力。單機具備大量CPU及記憶體,特別適合使用OpenMP平行化之程式以及需要大量記憶體空間之程式執行。
2006 cluster 每一節點
Dual P4 Xeon 3.0GHz CPU with dual core
4GB memory
目前服務主力。Nodes之間採用高階Infiniband switch串接,因此網路傳輸之latency極低,特別適合大量MPI資料傳輸 交換之用。我們鼓勵需要大量計算節點之MPI程式於此環境下執行。

使用者可依照自己程式特性及需求,將程式submit至適合的環境下執行。每套系統都有一支scheduler排程軟體,負責系統資源分配及程 式執行優先順位之排序,使用者必須接受該scheduler之安排,以先進先出之原則依序前進。程式執行之流程大致如下圖所示:

除了上述所提之硬體建置之外,本中心亦針對校內研究所需,即將購置多套商業軟體,包括: Matlab, Mathematica, SAS, SPSS, Gaussian, VASP, Discovery Studio, Material Studio 等。希望能夠分別滿足數學、科學計算、統計、物理、生物、蛋白質、材料、 力學等領域之實驗計算。

為了讓使用者瞭解如何運用這些服務,本中心每年將分別針對硬體操作、軟體環境、程式設計、套裝軟體等議題,開授 160 小時 之教育訓練,並將課程錄影上網,方便研究團隊未來自我訓練精進。 相關課程資訊,請至本中心教學組網站查詢。

目前使用本中心高效能計算服務的研究團隊,遍及校內物理系、化學系、凝態中心、土木系、機械系、工科系、農藝系、光電所、 電子所、電信所、資工系與藥學系等單位,總計約三十餘組研究團隊。

最後,如果貴研究團隊有需要使用本中心所提供之「高效能運算」服務,敬請與我們聯絡。謝謝您的支持。

Let’s go computing!