革新傳統(tǒng)超算中心使用體驗(yàn)
時(shí)間:2022-04-29 16:15:02 | 來源:行業(yè)動(dòng)態(tài)
時(shí)間:2022-04-29 16:15:02 來源:行業(yè)動(dòng)態(tài)
在陳海泉看來,傳統(tǒng)超算中心存在不方便和不安全的問題,例如傳統(tǒng)的超算中心用戶,在使用時(shí),需要提交一個(gè)申請(qǐng),并且有人工審批的環(huán)節(jié),當(dāng)他得到審批通過后,還需要自己安裝VPN客戶端連接超算中心提供的登錄節(jié)點(diǎn)。
超算中心的登錄節(jié)點(diǎn)往往是很多用戶共享的。共享的節(jié)點(diǎn)有兩個(gè)問題:一是超算中心為了保證其自身安全,不提供root權(quán)限,給安裝軟件帶來一些麻煩。比如用戶需要安裝系統(tǒng)軟件的時(shí)候,他需要出差到超算中心,現(xiàn)場(chǎng)指導(dǎo)當(dāng)?shù)剡\(yùn)維人員安裝自己要的軟件,過程非常麻煩。二是Linux隔一段時(shí)間就會(huì)暴露出一些系統(tǒng)漏洞,如果被用戶利用得到root權(quán)限,則能竊取平臺(tái)上其他用戶的數(shù)據(jù)。
針對(duì)這樣的問題,QingCloud EHPC融合了云服務(wù)與高性能計(jì)算,把傳統(tǒng)的審批制度變成用戶自服務(wù)的形式,并確保安全,這些舉措包括計(jì)算、網(wǎng)絡(luò)跟存儲(chǔ)的租戶隔離,管理節(jié)點(diǎn)跟計(jì)算節(jié)點(diǎn)分離;除了傳統(tǒng)的VPN接入,青云還能提供零信任客戶端,讓用戶登錄到超算中心的時(shí)候更便捷和安全。
在保障安全的同時(shí),QingCloud EHPC讓整個(gè)超算使用很靈活,提供了兩種不同類型的超算集群:偏傳統(tǒng)的共享型超算集群和新的獨(dú)享EHPC集群。QingCloud EHPC的服務(wù)架構(gòu)分為三層,資源層提供了高效的資源,管理層提供了方便快捷的管理服務(wù),用戶端提供交互使用體驗(yàn)極佳的控制臺(tái)。
最后,QingCloud EHPC還集成了化學(xué)工程、生物醫(yī)藥、大氣海洋等多種行業(yè)軟件平臺(tái)。如工業(yè)仿真軟件,提供一站式的使用體驗(yàn):一是其求解集群能夠提供彈性的算力,可以很快地完成運(yùn)算;二是提供桌面虛擬應(yīng)用,讓用戶完成圖形的前后處理,覆蓋用戶使用工業(yè)仿真軟件的整個(gè)流程。
EHPC集群分為四個(gè)節(jié)點(diǎn),分別是:登錄節(jié)點(diǎn)、管控節(jié)點(diǎn)、計(jì)算節(jié)點(diǎn)和GPU可視化節(jié)點(diǎn)。這四個(gè)節(jié)點(diǎn)完全掛載了青云的共享文件存儲(chǔ)以及共享軟件倉庫,這就是說用戶所有的作業(yè)都可以使用青云的共享軟件倉庫。苗慧介紹到。
超算業(yè)務(wù)大多是短期、大規(guī)模的方式,比如1萬個(gè)節(jié)點(diǎn)使用4個(gè)小時(shí),這就會(huì)導(dǎo)致兩個(gè)問題:一是經(jīng)常出現(xiàn)突發(fā)業(yè)務(wù)導(dǎo)致計(jì)算資源不夠,其他用戶要用的時(shí)候需要長(zhǎng)時(shí)間排隊(duì);二是業(yè)務(wù)少的時(shí)候會(huì)出現(xiàn)大量資源空置,造成成本的浪費(fèi)。
針對(duì)這樣的情況,陳海泉表示,青云希望跟超算中心合作共建算力共享的算力網(wǎng)絡(luò),通過青云可以連接全網(wǎng)算力,既能以外部資源支撐突發(fā)業(yè)務(wù),避免排隊(duì);又能在資源空置時(shí),對(duì)外出售算力增加運(yùn)營(yíng)收入。