国产无遮挡裸体免费视频-草的我好爽视频-国产成人免费一区二区三区-无码aⅴ免费中文字幕久久-性做久久久久久久免费看

行業(yè)新聞

行業(yè)新聞

Industry News

Nature:探秘世界最快超算的一天
發(fā)布時間:2024-09-19 09:09:54 | 瀏覽次數(shù):


在美國田納西州東部的山區(qū),一臺名為Frontier的破紀錄超算為科學(xué)家提供了前所未有的機會,讓他們得以研究從原子到星系的一切。
超算建設(shè)如火如荼,無論是主權(quán)AI還是科技巨頭,都在源源不斷地給英偉達輸血、建數(shù)據(jù)中心。
前段時間,馬斯克建成的有10萬張H100的Colossus集群,號稱是世界上最強大的AI訓(xùn)練系統(tǒng)。
而在這之前,截止到2023年12月,世界上運算速度最快的超算,是位于美國田納西州橡樹嶺的Frontier,也被稱為OLCF-5。
Frontier配備的是AMD的CPU和GPU,有5萬個處理器(其中包含3.8萬個GPU),運算速度為1.102 exaFLOPS,即每秒1.102百億億(1018)次浮點運算。
這個速度甚至比10萬臺筆記本同時工作還要更快,而且在2022年首次亮相時,F(xiàn)rontier還破了一個紀錄——第一次突破了百億億次運算速度的門檻。

Frontier超算的覆蓋面積比兩個籃球場還要大
之所以要追求如此卓越的速度和規(guī)模,是為了滿足各領(lǐng)域前沿科學(xué)研究中模擬計算的需要。
Frontier十分擅長創(chuàng)建模擬,并能同時捕捉到大尺度的模式和小尺度的細節(jié),比如微小的云滴如何影響氣候變暖的速度。
如今,研究人員們從世界各地登錄Frontier,創(chuàng)建從亞原子粒子到星系的一切尖端模型,包括模擬蛋白質(zhì)進行藥物發(fā)現(xiàn)和涉及、模擬湍流以改進飛機發(fā)動機,以及訓(xùn)練能和谷歌、OpenAI競爭的開源LLM。
但是,就在今年四月的一天,F(xiàn)rontier的運作出現(xiàn)了一點意外。
Frontier所在的田納西州橡樹嶺國家實驗室科學(xué)主任Bronson Messer表示,為了為了跟上世界各地科學(xué)家們的要求,F(xiàn)rontier的功耗急劇上升,峰值達到了約27兆瓦,足以為大約1萬個家庭供電。

這也為超算的冷卻系統(tǒng)帶來了挑戰(zhàn),用Messer的話說,「機器像一條被燙傷的狗一樣在運行」。
根據(jù)2023年的統(tǒng)計,F(xiàn)rontier共有1744個用戶,遍布18個國家,貢獻的計算和數(shù)據(jù)支撐了至少500篇已經(jīng)公開發(fā)表的論文。
和我們想象的場景類似,F(xiàn)rontier所在的機房類似于一個倉庫,運轉(zhuǎn)時發(fā)出的電子嗡嗡聲穩(wěn)定而輕柔。
機房中共有74個機架,每個節(jié)點分別包含4個GPU和1個CPU。之所以有如此快的運算速度,就是得益于龐大的GPU數(shù)量。
實驗室主任Messer形容道,「這些GPU運行得非常快,但也愚蠢至極,它們可以一遍又一遍地做同一件事。」
這種同時處理多項運算的功能對超算的快速工作非常有用,但除此之外,也沒什么其他任務(wù)了。
這種「愚蠢至極」的背后,是一種通用性,各領(lǐng)域的科學(xué)家都可以通過定制代碼來運行GPU。
Frontier的運轉(zhuǎn)日夜不停,同樣連軸轉(zhuǎn)的還有負責(zé)運營、維護的工程團隊。
負責(zé)建造這臺超算的工程師團隊來自惠普公司,其中一位技術(shù)人員Corey Edmonds表示,他們有一個工程團隊會對Frontier進行持續(xù)監(jiān)控,判斷是否存在故障跡象。
比如其中一位夜班人員Conner Cunningham的工作時間就是晚7點到早7點,負責(zé)用十多個監(jiān)視器關(guān)注網(wǎng)絡(luò)和建筑物的安全,并監(jiān)控當(dāng)?shù)靥鞖猓_保Frontier正常運轉(zhuǎn)。
實際上,大多數(shù)夜晚都是「平安夜」,Cunningham一般只需要巡查幾次,其余時間都可以在工位上學(xué)習(xí)。
「這項工作有點像消防員,如果發(fā)生任何事,需要有人在崗監(jiān)控。」
雖然Frontier日夜不停地運轉(zhuǎn),但研究人員想要申請到使用機會,也并不是一件容易的事。
科學(xué)主任Messer和其他3位同事負責(zé)使用提案的評估和批準,他們?nèi)ツ旯才鷾柿?31個項目,通過率約為1/4,
申請人需要表明其項目需要利用整個超算系統(tǒng)才能獲批,一般用于對各種時間和空間尺度進行建模。
Frontier每年共有約6500萬個節(jié)點時(node-hour)可用,研究人員得到的最常見的分配額度為50萬個節(jié)點時,相當(dāng)于全系統(tǒng)連續(xù)運行三天。
Messer表示,相比其他數(shù)據(jù)中心,研究人員在Frontier上獲得的計算資源大約多出十倍。

Frontier擁有超過5萬個處理器,并采用液冷
有了更快的運算速度、更多的計算資源,研究人員們就能做出更加雄心勃勃的「大科學(xué)」。
比如,在原子級精度精確地模擬生物過程,像是溶液中的蛋白質(zhì)或核酸如何與細胞其他部分發(fā)生相互作用。
今年5月,有學(xué)者用Frontier模擬了含有超過1550億個水分子的立方體形狀的水滴,大小約為人類頭發(fā)寬度的十分之一,是有史以來規(guī)模最大的原子級模擬之一。
短期內(nèi),研究人員希望模擬細胞器來為實驗室提供信息;此外他們還希望將這些高分辨率的模擬結(jié)果,與X射線自由電子激光器的超快成像相結(jié)合,以加速發(fā)現(xiàn)。
這些工作都是為今后更大的目標(biāo)做鋪墊——從原子開始對整個細胞進行建模。
有了Frontier,氣候模型也變得更加精確。

去年,氣候科學(xué)家Matt Norman和其他研究人員使用Frontier運行了分辨率為3.25公里的全球氣候模型,其中還結(jié)合了分辨率更加精細的復(fù)雜的云層運動。
為了創(chuàng)建長達數(shù)十年的預(yù)測模型,F(xiàn)rontier的計算能力是十分必要的,而且需要用上整個系統(tǒng)的算力才能做到。
對于一個適用于天氣和氣候預(yù)測的模型,至少需要每天進行一年的模擬運行。
Frontier每天可以模擬1.26年,這個速度可以使研究人員能夠創(chuàng)建比以前更準確的50年預(yù)測。
如果換到其他計算機上運行,要達到相同的分辨率,同時考慮云的影響,計算速度則會慢得多。
在更大的宇宙級尺度上,F(xiàn)rontier也能帶來更高的分辨率。
匹茲堡大學(xué)的天體物理學(xué)家Evan Schneider也在使用Frontier,研究銀河系大小的星系如何隨著年齡的增長而演化。
他們創(chuàng)建的星系模型跨越四個數(shù)量級,最大規(guī)模可達約10萬光年。而在Frontier之前,以類似的分辨率模擬的最大結(jié)構(gòu)是矮星系,質(zhì)量約為五十分之一。
作為曾經(jīng)的世界第一,F(xiàn)rontier的地位顯得更加獨特,因為這臺超算是為數(shù)不多的屬于公共部門的設(shè)備,而非由工業(yè)界主導(dǎo)。
由于AI領(lǐng)域的研究往往需要吞噬龐大的算力,學(xué)術(shù)界和工業(yè)界的成果存在巨大的鴻溝。
有學(xué)者統(tǒng)計過, 2021 年,96%的最大的AI模型來自工業(yè)界。平均而言,工業(yè)界模型的規(guī)模是學(xué)術(shù)模型的近30倍。
這種差異在投資金額方面也很明顯。美國的非國防公共機構(gòu)在2021年提供了15億美元支持AI研究。同年,全球工業(yè)界支出超過3400億美元。
而自從GPT-4、Gemini Ultra等商業(yè)LLM發(fā)布以來,兩者之前的差距又被進一步擴大,這種投資鴻溝導(dǎo)致工業(yè)界和學(xué)術(shù)界可用的計算資源明顯不對稱。
由于工業(yè)界的模型開發(fā)以盈利為目的,往往會忽視很多技術(shù)發(fā)展中必須要面對的重要問題,比如基礎(chǔ)研究、低收入群體的需求、評估模型風(fēng)險、糾正模型偏見等等。
如果學(xué)術(shù)界要承擔(dān)起這些責(zé)任,就需要能和行業(yè)規(guī)模匹配的算力,這就是Frontier的用武之地。
一個最典型的例子,科技公司訓(xùn)練出的LLM往往保留不同程度的專有性,但研究者們往往會獎自己開發(fā)的模型免費提供給任何人使用。
馬里蘭大學(xué)帕克分校的計算機科學(xué)家Abhinav Bhatele表示,這將有助于大學(xué)研究人員與公司競爭,「學(xué)術(shù)界人士訓(xùn)練類似規(guī)模模型的唯一方法是獲得像Frontier這樣的資源。」
Bhatele認為,F(xiàn)rontier等設(shè)施在AI領(lǐng)域就是發(fā)揮著這種至關(guān)重要的作用,讓更多的人參與到技術(shù)開發(fā)中,共享成果。
但值得注意的是,這場國家之間、科技公司和非營利機構(gòu)間的算力基礎(chǔ)設(shè)施競賽,依舊在持續(xù),能力強大如Frontier也終會有跌落的一天。
橡樹嶺實驗室已經(jīng)在規(guī)劃Frontier的繼任者,名為Discovery,計算速度將提升3~5倍。
作為參考,F(xiàn)rontier相比2014年的最快的超算天河二號A快了35倍,比2004年最快的超算Earth Simulator快3.3萬倍。

研究人員仍然渴望更快的速度,但工程師們面臨著持續(xù)的挑戰(zhàn),其中一方面就是能源。
Frontier的能源效率相比Summit就提升了4倍多,很大程度上是源于不同的冷卻方案。
Frontier使用室溫水進行冷卻,與Summit使用冷水不同。Frontier總能耗的大約3%~4%用于冷卻,而Summit 的這一比例為10%。
與 Summit 使用冷凍水不同。Frontier 總能耗的大約 3-4% 用于冷卻,而 Summit 的這一比例為 10%。
多年來,能源效率一直是構(gòu)建更先進超算的關(guān)鍵瓶頸,而在可預(yù)見的將來,這個瓶頸估計會持續(xù)存在。
實驗室主任Messer表示, 「我們本可以在2012年建造一臺百億億次級別的超算,但提供動力的成本太高了,需要多一兩個數(shù)量級的電力。」

 
打印本頁 || 關(guān)閉窗口
 上一篇:GPT Next年底來襲,有效計算量百倍GPT-4,OpenAI耗資數(shù)百億打造基建
 下一篇:馬斯克盯上了盲人,Neuralink下一代腦機接口產(chǎn)品獲批

行業(yè)新聞

優(yōu)質(zhì)項目

服務(wù)交流

0
分享到:
主站蜘蛛池模板: 国产高清在线精品一区免费| av无码动漫一区二区三区精品| 全部孕妇毛片| 麻豆精品久久久久久久99蜜桃| 人人超人人超碰超国产| 中文有码vs无码人妻| 暖暖 在线 日本 免费 中文| 久久婷婷色五月综合图区| 久久久久久久人妻无码中文字幕爆| 无码综合天天久久综合网| 中文字幕久久波多野结衣av| www夜片内射视频在观看视频| 超碰cao已满18进入离开官网| 国产精品99久久99久久久动漫| 大j8黑人w巨大888a片| 国产乱妇乱子在线视频| 韩国精品无码少妇在线观看| 免费人成黄页在线观看国产| 国语自产偷拍在线观看| 欧美做受视频播放| 影音先锋亚洲成aⅴ无码| 欧美真人性做爰全过程| 亚洲男人的天堂网站| av制服丝袜白丝国产网站| 国产欧美熟妇另类久久久| 精品第一国产综合精品aⅴ| 国产乱子伦在线一区二区| 亚洲国产精品无码久久久秋霞2| 久久青草资料网站| 无码丰满熟妇| 亚洲第一无码精品立川理惠| 免费国产污网站在线观看不要卡| 极品少妇xxxx| 国产精品1卡2卡3卡4卡| 亚洲精品久久久久久动漫器材一区| 国产成人亚洲综合无码加勒比一 | 国产成人精品福利一区二区| 国产成人亚洲综合无码品善网| 国产成人亚洲精品无码青app| 天堂а√在线最新版中文在线| 成人性生交大片免费看中文|