• 台灣網移動版

    台灣網移動版

造芯、築魂、創“天河” 他們書寫超算中國速度

2021-03-15 08:41:00
來源:科技日報
字號

  黑色機櫃被整齊排成數行,高速運轉的機器持續發出低沉的嗡鳴聲,星星點點的負載指示燈不斷閃爍……這裡是“天河二號”的機房,碩大的超級電腦正在飛速運作。

  過去的一年,新冠肺炎疫情席捲全球,來勢洶洶。憑藉超強算力,“天河二號”助力藥物虛擬篩選,只用了3天時間便迅速定位了30余種潛在有效藥物。在“天河二號”上搭建的新冠肺炎CT影像智慧診斷平臺,15秒即可完成一次CT圖像診斷,為抗擊疫情作出了重大貢獻。

  作為幕後功臣,國防科技大學電腦學院“天河”高性能計算團隊(以下簡稱“天河”團隊)功不可沒。在剛剛過去的春節假期,團隊上下60余人堅守崗位,以這樣特殊的方式為祖國守歲。

  肖立權:用光互聯替代電互聯

  肖立權,“天河二號”副總設計師、“天河”團隊互聯通信方向負責人。

  我國高性能計算起步較晚,要想趕上西方國家,唯有奮起直追。為了讓我國高性能計算早日趕超西方國家,肖立權一拼就是30年。

  “走別人沒有走過的路很難,但我喜歡挑戰!”這是肖立權常説的一句話。20世紀末,大規模電腦系統中通常採用電互聯技術,資訊傳輸速率慢且易受干擾,影響系統穩定性。這是我國研製千萬億次級超級電腦路上的一塊“絆腳石”。

  搬開這塊“絆腳石”的最優解決方案,就是用光互聯替代電互聯,上級將這一重任交給了肖立權。

  這條別人沒有走過的路,註定充滿坎坷。接下任務後,肖立權立即著手解決這項技術難題。然而,按照他的思路做出來的系統根本“跑不起來”。

  “是哪出了問題?”肖立權滿腦子都是問號,午休時閉上眼睛,他腦海中全是螢幕上滾動的數據。

  “沒法睡!去實驗室!”架起示波器、邏輯分析儀,肖立權全神貫注地看著螢幕,生怕錯過關鍵數據。

  解決方案被一次次提出,但又被一次次推翻。有一天,肖立權突然冒出一個想法:是不是數據傳輸有問題?這次靈光突現,讓他一下找到了解決問題的“鑰匙”。由此,我國光互聯技術在大規模電腦系統中得到有效驗證,這為後續該技術在超級電腦系統中的應用奠定了堅實基礎。

  2013年,是“天河”團隊發展歷程中濃墨重彩的一年。當年6月,“天河二號”研製成功,登上了世界超級電腦排行榜的榜首。

  同年11月,為升級“天河二號”系統,肖立權和團隊成員展開了為期10個月的封閉式攻關,力爭完成核心器件國産化替代。經過這一輪攻關,肖立權帶領“天河”團隊大幅提升了“天河二號”高速互聯通信系統的性能,使其運作速度達到當時國際商用互聯繫統的2倍,為下一代超級電腦研製奠定了基礎。

  郭揚:讓國之重器澎湃“中國芯”

  “天河二號”的“成長環境”並不十分“友好”,長久以來,西方國家在這一領域對我國實現嚴格的技術封鎖。

  曾有很長一段時間,我國資訊系統軟、硬體受制於人的問題難以得到解決。為攻克這一難題,“天河”團隊再次奔赴戰場。

  “天河”團隊微電子方向負責人、國防科技大學電腦學院研究員郭揚就是核心晶片這個戰位上的先鋒。

  晶片製造技術是製造業的核心技術,超級電腦所需的晶片更被譽為“皇冠上的明珠”。為了摘取這顆“明珠”,郭揚堅守了20餘年。今年春節,他依舊堅守崗位,在機櫃間不停穿梭。在僅有幾十米寬的機房裏,他每天可以走出數萬步。

  運算速度(俗稱算力)和功耗是超級電腦晶片的核心指標。通常來説,要想實現更高算力,就需要在晶片中整合更多的電晶體,但這就會增加晶片面積和功耗。研製超級電腦晶片的難點在於,要在保證高算力的前提下,盡可能減少晶片的功耗。為了早日攻克這一難題,曾有一段時間,郭揚四處奔波,到軍隊內外各地調研考察,出國參加學術交流活動,研究業內發展趨勢,幾經週折最終確定了走“基於自主指令集的異構融合架構”的技術路線。

  這是一條崎嶇難走的路。研製自主指令集的處理器晶片,意味著研發團隊不僅要研製晶片,還必須同步研製出配套的編譯器、演算法庫等全套軟體系統。若採用現成的指令集晶片,工作量將減少數倍。

  “這條路必須走!跟在別人後面、走現成的路,已無法實現技術領先。這條路,我們就算披荊斬棘也要走!”郭揚説。

  此外,他還帶領團隊攻克了晶片研製中的其他大量技術難題,在他們的不懈努力下,最終使新一代超算晶片性能比前一代晶片提升了10倍以上。

  20餘年,從反向設計起步,到正向設計前行,再到向自主創新跨越;從架構設計,到前端驗證,再到後端實現,郭揚和大家一路過關斬將,最終孕育出了晶片領域響噹噹的“飛騰”品牌。

  2017年,“天河二號”系統升級完成,當時國內性能最優的4000余顆“飛騰”晶片被裝在“天河二號”的“心臟”部位;在慶祝新中國成立70週年閱兵式上,嵌有“飛騰”晶片的多款戰機、導彈在天安門廣場亮相;2020年,北斗三號組網、嫦娥五號奔月、“天問一號”飛赴火星,這些裝備上都鑲嵌著“飛騰”的“中國芯”。

  “未來,我和團隊還要繼續努力,讓更多國之重器澎湃‘中國芯’。”郭揚説。

  譚鬱松:實現國産系統零的突破

  “飛騰”晶片不是孤軍奮戰,“麒麟”作業系統是它的最佳搭檔,它也是“天河二號”的“靈魂”。它們一硬一軟,為“天河二號”搭臺唱戲。今年春節期間,負責系統調試的人員聚精會神地盯著螢幕,手指不停地敲擊著鍵盤。

  忙碌之餘,“天河”團隊國産基礎軟體方向負責人、國防科技大學電腦學院研究員譚鬱松説:“麒麟是中國的傳統瑞獸,寓意吉祥和長壽。以它的名字命名,是希望系統能更好地為國家和人民服務,最終能實現國産系統的自主創新和可持續發展。”

  “麒麟”是為超級電腦研製的伺服器作業系統。其誕生之初,該團隊將這一作業系統和國際主流作業系統進行了比較,而後發現了不少問題。一時間,網路上的質疑聲此起彼伏。

  怎麼辦?

  譚鬱松覺得,光在實驗室裏埋頭搞研究不行,必須要走出實驗室,在實踐中摸索前進。

  當時,“麒麟”深陷質疑聲中,推廣應用十分困難。“別人不用,我們自己先用。”從2011年開始,譚鬱松帶領團隊成員,挨個給國防科技大學學員做工作,逐一幫助他們在電腦上安裝系統。一圈兒下來,超過3萬名學員的電腦上安裝了“麒麟”系統。系統適配了超過300多款筆電終端及外接設備,為後續大規模推廣積累了豐富的經驗。

  經過反覆推廣、試用、驗證、升級,“麒麟”的用戶數量不斷攀升,連續多年成為活躍用戶量最多的國産作業系統。

  成為國內第一,只是第一步,要想趕超,必須爭分奪秒。多年來,對於譚鬱松及其團隊成員來説,“5+2”“白+黑”已是常態。

  在他們的努力下,如今“麒麟”作業系統已經成為我國安全等級最高、應用最廣的國産作業系統,被成功應用於各類國防裝備、重點資訊系統上。

  近年來,基於“飛騰”晶片、“麒麟”作業系統的伺服器、臺式機、一體機、筆電等系列産品,已在一些領域得到規模化應用,為實現我軍資訊系統自主可控、構建安全可控的資訊技術體系發揮了不可替代的重要作用。

  ◎劉于藍 本報記者 張 強

[責任編輯:楊永青]