項目概況
項目背景
由浙江大學(xué)計算機學(xué)院搭建的人工智能實驗平臺,涵蓋圖像分類、目標(biāo)分類、自然語言處理、視頻分類等課程項目,旨在培養(yǎng)學(xué)生自主開發(fā)的實操能力。
隨著多模態(tài)數(shù)據(jù)量的不斷增加,實驗平臺后端算力已進(jìn)行多期擴容,但由于資源不統(tǒng)一監(jiān)管分配、任務(wù)分布不均等問題,現(xiàn)有算力資源利用率低下。同時,隨著AI大模型教學(xué)項目的加入,后端算力面臨了更高挑戰(zhàn),算力優(yōu)化及升級迫在眉睫。
解決方案
依托于豐富的項目經(jīng)驗,超集信息通過對客戶項目的實際算力需求診斷,為其構(gòu)建了專屬的定制化算力方案,幫助其實現(xiàn)了精準(zhǔn)、高效、完善的算力升級,也進(jìn)一步實現(xiàn)了整體算力升級成本的降低。
同時,通過PlatforMax智算融合平臺的全節(jié)點部署(支持多種類CPU、GPU等資源的識別及適配),將已有及新建算力節(jié)點資源統(tǒng)一池化,幫助客戶實現(xiàn)異構(gòu)資源的高效管理、調(diào)度、分配和監(jiān)控,使整體算力資源得到更合理、更高效使用。
PlatforMax平臺還可進(jìn)行下層的硬件健康狀態(tài)、節(jié)點服務(wù)狀態(tài)等監(jiān)控,實現(xiàn)了算力集群狀態(tài)的全掌控。并且,平臺還配備實時監(jiān)控告警功能,能夠更快速、更便捷地完成定點故障排除,大幅降低運維難度及成本。
客戶價值
基于專業(yè)化診斷構(gòu)建的CPU、GPU、存儲、網(wǎng)絡(luò)等多模塊全定制的智算解決方案,高度契合客戶的實際算力需求,有效杜絕了標(biāo)準(zhǔn)化產(chǎn)品方案中某些模塊性能冗余造成的額外成本負(fù)擔(dān)。
通過PlatforMax平臺,客戶算力資源利用率較此前實現(xiàn)了30%以上提升,大量閑置資源得到高效利用,減少了后期擴容規(guī)劃及支出。