国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

目錄
數(shù)據(jù)與算力的關(guān)係演變與衍生挑戰(zhàn)
分散式儲存統(tǒng)一融合資料基座的突圍路徑
大模型時代HPDA AI的未來圖像
首頁 科技週邊 人工智慧 AI大模型時代,資料儲存新基座助推教科學研究數(shù)智化躍遷

AI大模型時代,資料儲存新基座助推教科學研究數(shù)智化躍遷

Jul 21, 2023 pm 09:53 PM
ai大模型 資料儲存 教育學研究所數(shù)學

生成式AI(AIGC)開啟了人工智慧通用化的新紀元,圍繞大模型的百舸爭流蔚為壯觀,算力基礎設施是首要的競逐焦點,而存力覺醒也日益成為業(yè)界共識。

AI大模型時代,資料儲存新基座助推教科學研究數(shù)智化躍遷

在新的時代,大模型從單模態(tài)走向多模態(tài),參數(shù)和訓練資料集的規(guī)模呈幾何級數(shù)增長,海量的非結(jié)構(gòu)化資料需要高性能混合負載能力的支撐;同時,資料密集型範式大行其道,超算、高效能運算(HPC)等應用場景邁向縱深,既有的資料儲存基座已難以滿足不斷升級的需求。

如果說算力、演算法、數(shù)據(jù)是驅(qū)動人工智慧發(fā)展的“三駕馬車”,那麼在外部環(huán)境發(fā)生巨大變化的背景下,三者亟需重新達成動態(tài)的平衡。演算法模型完善帶來的「軟實力」提升,算力供給優(yōu)化引發(fā)的「硬實力」增強,需要進一步的加持-資料傳輸?shù)摹高\力」和資料儲存的「存力」即是尚待改進的動力來源,新型的資料儲存基座將在應對諸多挑戰(zhàn)的過程中破繭成蝶。

需求複雜且持續(xù)進化的應用場景,是資料儲存新基座最好的試金石。從這個意義上講,教科研產(chǎn)業(yè)就是其中的典型代表:算力與資料是該領(lǐng)域數(shù)位轉(zhuǎn)型的關(guān)鍵要素,學科融合的科學研究運算與基於資料的決策支援同等重要。從HPC邁向HPDA(高效能資料分析)是改善教學及科研效率的一大步,而AI的賦能則有助於解決過往算不了、算不準、算不動的難題。

AI大模型時代,資料儲存新基座助推教科學研究數(shù)智化躍遷

在近日舉辦的2023世界人工智慧大會上,華為OceanStor Pacific分散式儲存輔助上海交通大學建構(gòu)的HPC AI存力底座正式上線,「交我算」統(tǒng)一資料基座將在今年再擴充25PB,其可望成為教科研數(shù)位化、智慧轉(zhuǎn)型的新標桿,也為資料儲存新基座的探索之旅樹立了里程碑。

數(shù)據(jù)與算力的關(guān)係演變與衍生挑戰(zhàn)

伴隨千行百業(yè)的數(shù)位轉(zhuǎn)型進入深水區(qū),以及人工智慧、大數(shù)據(jù)等新興技術(shù)的協(xié)同爆發(fā),數(shù)據(jù)與算力的關(guān)係正在發(fā)生微妙的變化。

AI大模型時代,資料儲存新基座助推教科學研究數(shù)智化躍遷

教科研領(lǐng)域身處數(shù)位經(jīng)濟的風口浪尖,對此變化頗為敏感。過去,數(shù)據(jù)必須跟著算力跑。為了應對複雜科學和工程問題的快速數(shù)值求解,教科研界在很長一段時間裡更專注於如何打造最強大的算力,而數(shù)據(jù)僅作為算力的配套設施來考慮。

如今,「算力圍著資料轉(zhuǎn)」逐漸成為新的趨勢。新興應用的湧現(xiàn)、資料量體的膨脹、資料安全問題的凸顯,讓資料本身的價值備受重視。基於AI、大數(shù)據(jù)等技術(shù)的突破,傳統(tǒng)超算正向資料密集型超算演變,多元異質(zhì)算力需要圍繞同一個資料儲存基座進行建構(gòu)。

上海交通大學網(wǎng)路資訊中心副主任林新華認為,數(shù)據(jù)與算力的主導權(quán)發(fā)生逆轉(zhuǎn),既是建設數(shù)據(jù)密集型超算平臺的契機,也為統(tǒng)一數(shù)據(jù)存儲基座的構(gòu)建帶來不少新的挑戰(zhàn)。

首先是資料爆發(fā)式成長,對儲存容量的需求顯著提高。根據(jù)統(tǒng)計,「交我算」平臺的資料規(guī)模成長幅度達到每年7PB,氣像海洋、能源探勘、衛(wèi)星遙感、基因定序、冷凍電鏡、AI自動駕駛、製造CAE、動畫渲染等應用情境的資料量都達到PB級,用一套資料基礎設施容納如此龐大的資料量殊為不易。

其次是新業(yè)務不斷湧現(xiàn),對儲存效能要求更高。 AI通用化進程的提速,特別是大模型、多模態(tài)的批量輸出,對IO性能構(gòu)成嚴峻挑戰(zhàn)。在百TB級資料集成為常態(tài)的情況下,自然語言處理、多模態(tài)應用加劇了資料量的增速,小檔案訓練資料集的高效存取更要求儲存效能再上新臺階。

再次,跨校區(qū)多叢集儲存共用,資料在異質(zhì)叢集間的流動可能造成資料遺失、運作緩慢等問題。 「交我算」平臺提供多種異質(zhì)算力,擁有ARM叢集、X86叢集以及AI叢集等。在眾多集群中,只有做到全數(shù)據(jù)流動和數(shù)據(jù)融合,才能釋放算力和數(shù)據(jù)的最大價值。

最後,傳統(tǒng)AI本地盤訓練,伴隨高並發(fā)資料分析,打破IO牆迫在眉睫。資料多次搬遷過程中的IO瓶頸非常突出-傳統(tǒng)的讀寫流程冗長,載入資料涉及三次資料搬遷,checkpoint也有兩次資料搬遷,其間產(chǎn)生的效率損失不容忽視。

分散式儲存統(tǒng)一融合資料基座的突圍路徑

為了因應上述挑戰(zhàn),自2019年起,上海交通大學與華為儲存展開深度合作,共同打造「交我算」資料密集型超算平臺。依託在技術(shù)與應用創(chuàng)新上的深厚積累,華為OceanStor Pacific分散式儲存產(chǎn)品協(xié)助「交我算」建構(gòu)統(tǒng)一資料基座,支撐起全校多種異質(zhì)算力平臺。

AI大模型時代,資料儲存新基座助推教科學研究數(shù)智化躍遷

建構(gòu)分散式統(tǒng)一融合資料基座,是「交我算」擁抱新興資料應用的必經(jīng)之路?;稒M向擴展分散式儲存架構(gòu),「交我算」平臺的儲存容量和頻寬可按需擴充。一是性能容量線性成長,單集群可達EB級容量;二是藉助高密大容量硬件,節(jié)省機櫃空間;三是採用大比例EC,以場景化壓縮提升磁碟利用率。

據(jù)了解,「交我算」平臺從初始的2PB容量、6GB/s頻寬,到2020年增至20PB容量、60GB/s頻寬,2022年又擴容至40PB容量、120GB/s頻寬,預計2023年容量將再擴充25PB。同時,華為OceanStor Pacific分散式儲存擁有5U 120碟位的超高密設計,結(jié)合超大比例EC資料冗餘保護演算法,在滿足高可靠性的基礎上將硬碟空間利用率提升至91.6%。

分散式全閃硬體加持是「交我算」應對儲存效能難題的基石。在華為OceanStor Pacific的助力下,「交我算」平臺採用全閃硬體加速,大幅提升頻寬與IOPS效能,每節(jié)點80萬IOPS、頻寬20GB/S能夠滿足混合負載條件下的高效能需求。

全域分散式儲存跨校區(qū)統(tǒng)一管理是「交我算」解決多叢集儲存共用難題的良方。透過採用全域檔案系統(tǒng)跨域多套儲存管理的方式,「交我算」平臺建構(gòu)起跨校區(qū)的統(tǒng)一資料基座,在華為OceanStor Pacific分散式儲存產(chǎn)品的支撐下,達成全域檔案視圖、資料管理與調(diào)度、全域資料流動、統(tǒng)一串流元資料等多重目標。

資料分析加速、多種協(xié)定存取無損互通、免搬遷高效用是「交我算」打破IO牆的利器?;度A為面向AI的儲存方案,以及華為OceanStor Pacific分散式儲存「一份數(shù)據(jù),多種協(xié)議存取」的能力,「交我算」平臺實現(xiàn)外部儲存減少數(shù)據(jù)搬遷,並大幅提升分析效率、節(jié)省存儲空間。

大模型時代HPDA AI的未來圖像

透過「交我算」平臺攜手華為儲存打造分散式統(tǒng)一融合資料新基座的演進軌跡,不難看出資料密集場景正在加速進化。

從早期的HPC到後來的HPDA,再到HPDA AI的比翼齊飛,教科研產(chǎn)業(yè)的應用場景不斷豐富,對儲存產(chǎn)品和資料基座的需求也持續(xù)躍遷。事實上,教科研只是千行百業(yè)數(shù)位化進程的冰山一角,資料儲存的大時代已呼嘯而來。

大模型時代的到來,將進一步重塑包括存力在內(nèi)的IT基礎設施,帶有嶄新AI基因的儲存產(chǎn)品有望成為產(chǎn)業(yè)數(shù)位化升級的新寵。 7月14日,主題為「資料新典範 釋放AI新動能」的大模型時代華為AI儲存新品發(fā)表會將在線上舉行。無論您正在企業(yè)內(nèi)部署AI,或是讓開發(fā)的應用具備AI能力,此次發(fā)表的方案都將提供更優(yōu)的技術(shù)架構(gòu)與產(chǎn)品,幫助您踏準時代的節(jié)拍。

人工智慧通用化的大幕已經(jīng)開啟,儲存產(chǎn)業(yè)的領(lǐng)頭羊率先吹響了衝鋒的號角,後面的每一個樂章都值得期待。

以上是AI大模型時代,資料儲存新基座助推教科學研究數(shù)智化躍遷的詳細內(nèi)容。更多資訊請關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本網(wǎng)站聲明
本文內(nèi)容由網(wǎng)友自願投稿,版權(quán)歸原作者所有。本站不承擔相應的法律責任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請聯(lián)絡admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅(qū)動的應用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Laravel 教程
1600
29
PHP教程
1502
276
為什麼localstorage無法成功保存資料? 為什麼localstorage無法成功保存資料? Jan 03, 2024 pm 01:41 PM

儲存資料到localstorage為何總是失?。啃枰唧w程式碼範例在前端開發(fā)中,我們經(jīng)常需要將資料儲存在瀏覽器端,以便提高使用者體驗和方便之後的資料存取。 Localstorage是HTML5提供的一項用於客戶端儲存資料的技術(shù),它提供了一種簡單的方法來儲存數(shù)據(jù),並且可以在頁面刷新或關(guān)閉後保持資料的持久化。然而,當我們使用localstorage進行資料儲存時,有時

以AI為導向的資料治理體系如何建構(gòu)? 以AI為導向的資料治理體系如何建構(gòu)? Apr 12, 2024 pm 02:31 PM

近年來,隨著新技術(shù)模式的出現(xiàn),各產(chǎn)業(yè)應用場景價值打磨與大量資料累積下的產(chǎn)品效果提升,人工智慧應用已從消費、網(wǎng)路等領(lǐng)域,向製造業(yè)、能源、電力等傳統(tǒng)產(chǎn)業(yè)輻射。各產(chǎn)業(yè)企業(yè)在設計、採購、生產(chǎn)、管理、銷售等經(jīng)濟生產(chǎn)活動主要環(huán)節(jié)的人工智慧技術(shù)和應用成熟度不斷提升,加速人工智慧在各環(huán)節(jié)的落地覆蓋,逐漸將其與主要業(yè)務相結(jié)合,以實現(xiàn)產(chǎn)業(yè)地位提高或經(jīng)營效益優(yōu)化,進一步擴大自身優(yōu)勢。人工智慧技術(shù)創(chuàng)新應用的大規(guī)模落地,推動了大數(shù)據(jù)智慧市場的蓬勃發(fā)展,同樣也為底層的資料治理服務注入了市場活力。伴隨著大數(shù)據(jù)、雲(yún)端運算以及算

如何在MongoDB中實現(xiàn)資料的影像儲存和處理功能 如何在MongoDB中實現(xiàn)資料的影像儲存和處理功能 Sep 22, 2023 am 10:30 AM

如何在MongoDB中實現(xiàn)資料的影像儲存和處理功能概述:在現(xiàn)代資料應用程式的開發(fā)中,影像處理和儲存是一個常見的需求。 MongoDB作為一種流行的NoSQL資料庫,提供了一些功能和工具使開發(fā)人員能夠在其平臺上實現(xiàn)映像儲存和處理。本文將介紹如何在MongoDB中實作資料的影像儲存和處理功能,並提供具體的程式碼範例。影像儲存:在MongoDB中,可以使用GridFS

Redis與Golang的互動:如何實現(xiàn)快速的資料儲存和檢索 Redis與Golang的互動:如何實現(xiàn)快速的資料儲存和檢索 Jul 30, 2023 pm 05:18 PM

Redis與Golang的互動:如何實現(xiàn)快速的資料儲存和檢索引言:隨著網(wǎng)路的快速發(fā)展,資料的儲存和檢索成為了各個應用領(lǐng)域中重要的需求。在這樣的背景下,Redis成為了重要的資料儲存中間件,而Golang則因其高效效能和簡單易用的特點,成為了越來越多開發(fā)者的選擇。本文將向讀者介紹如何透過Redis與Golang進行交互,實現(xiàn)快速的資料儲存和檢索。一、Re

Yii框架中間件:為應用程式提供多重資料儲存支持 Yii框架中間件:為應用程式提供多重資料儲存支持 Jul 28, 2023 pm 12:43 PM

Yii框架中間件:為應用程式提供多重資料儲存支援介紹中間件(middleware)是Yii框架中的重要概念,它為應用程式提供了多重資料儲存支援。中間件的作用類似於一個過濾器,它能夠在應用程式的請求和回應之間插入自訂程式碼。透過中間件,我們可以對請求進行處理、驗證、過濾,然後將處理後的結(jié)果傳遞給下一個中間件或最終的處理程序。 Yii框架中的中間件使用起來非常

如何利用C++進行高效率的資料壓縮與資料儲存? 如何利用C++進行高效率的資料壓縮與資料儲存? Aug 25, 2023 am 10:24 AM

如何利用C++進行高效率的資料壓縮與資料儲存?導言:隨著資料量的增加,資料壓縮和資料儲存變得越來越重要。在C++中,有許多方法可以實現(xiàn)高效率的資料壓縮和儲存。本文將介紹一些常見的資料壓縮演算法和C++中的資料儲存技術(shù),並提供對應的程式碼範例。一、資料壓縮演算法1.1基於哈夫曼編碼的壓縮演算法哈夫曼編碼是一種基於變長編碼的資料壓縮演算法。它通過對頻率較高的字符

vivo推出自主研發(fā)的通用AI大模型-藍心大模型 vivo推出自主研發(fā)的通用AI大模型-藍心大模型 Nov 01, 2023 pm 02:37 PM

vivo於11月1日在2023年的開發(fā)者大會上發(fā)布了自主研發(fā)的通用人工智慧大模型矩陣-藍心大模型vivo宣布,藍心大模型將推出5款不同參數(shù)量級的模型,分別包含十億、百億、千億三個等級的參數(shù),涵蓋核心場景,模型能力在產(chǎn)業(yè)中處於領(lǐng)先地位。 vivo認為,一個好的自研大模型需要滿足以下5點要求:規(guī)模大,功能全面,演算法強勁,安全可靠,自主進化,並且要廣泛開源重寫後的內(nèi)容如下:其中,首先是藍心大模型7B,這是一個70億級別的模型,旨在為手機端和雲(yún)端提供雙重服務。 vivo表示,該模型在語言理解、文字創(chuàng)作等場

MySQL中如何實作資料的多態(tài)儲存與多維查詢? MySQL中如何實作資料的多態(tài)儲存與多維查詢? Jul 31, 2023 pm 09:12 PM

MySQL中如何實作資料的多態(tài)儲存與多維查詢?在實際應用開發(fā)中,資料的多態(tài)儲存和多維查詢是一個非常常見的需求。 MySQL作為常用的關(guān)聯(lián)式資料庫管理系統(tǒng),提供了多種實作多態(tài)儲存和多維查詢的方式。本文將介紹使用MySQL實作資料的多態(tài)儲存和多維查詢的方法,並提供對應的程式碼範例,幫助讀者快速了解和使用。一、多態(tài)儲存多態(tài)儲存是指將不同類型的資料儲存在同一個欄位中的技

See all articles