當“天河二號”以每秒33.86千萬億次浮點運算速度再次榮登全球超級計算機500強排行榜榜首的時候,我一直有兩個疑問:一是33.86千萬億次計算能力是不是通過增加服務器數量就可以實現,有沒有這么簡單?第二什么應用需要如此強大并行計算能力,所謂計算能力是不是一個數字游戲。
基因研究和超級計算機
如今,這兩個問題都有了答案。首先要實現千萬億次浮點運算不是那么簡單的。以天河二號為例,參與LINPACK測試的節點有16000個,耗時5個多小時,在這個過程中,只要有一臺服務器出現故障,測試就會宣告失敗。這意味著如果節點服務器的故障率是萬分之一,1.6萬臺節點服務器就意味著測試100%不會成功。因此,參與運算的機器數量越大,失敗的風險越高。另外,節點之間的網絡延時、效率都是問題??傊?,要構建一臺千萬億次超級計算機還是有很多技術難點要克服。