激情国产视频_午夜黄色影院_久久久夜夜夜_亚洲视频二区_日日夜夜国产_欧美自拍偷拍

Internet Develppment
互聯(lián)網(wǎng)開發(fā)& 推廣服務提供商

我們擅長商業(yè)策略與用戶體驗的完美結合。

歡迎瀏覽我們的案例。

首頁 > 新聞中心 > 新聞動態(tài) > 正文

微軟推出 ZeRO++ 技術 可顯著減少大模型訓練時間和成本

發(fā)布時間:2023-06-27 14:43:14來源:IT之家

  微軟研究人員日前推出了名為 ZeRO++ 的新技術,用于優(yōu)化在訓練大型 AI 模型時,容易遇到的數(shù)據(jù)傳輸成本和帶寬限制的難題,可顯著減少大模型訓練時間和成本。

  據(jù)悉,ZeRO++ 建立在現(xiàn)有的 ZeRO 傳輸技術基礎上,并提供增強的通信策略,可提高訓練效率,同時減少訓練時間和成本。


圖片來自網(wǎng)絡/侵刪

  為了減少參數(shù)通信量,ZeRO++ 可對權重進行量化,其利用基于塊的量化方法來保持訓練精度,這種優(yōu)化的量化過程相對原始 Zero 傳輸技術更快更準確。為了能夠盡量減少通信開銷,ZeRO++ 通過在每臺機器上保持完整的模型副本,以向 GPU 顯存換取通信帶寬。而在梯度通信方面,ZeRO++ 引入了一種名為 qgZ 的新的量化梯度通信方式,可以減少跨節(jié)點的流量和延遲。

  這些改進的通信技術大大減少了通信量,微軟研究人員表示,與 ZeRO 相比,ZeRO++ 減少了高達 4 倍的通信量,提高了訓練吞吐量和效率。當在每個 GPU 上使用小批量大小時,在高帶寬集群中,ZeRO++ 相比 ZeRO-3 的吞吐量提高了 28% 至 36%。在低帶寬集群中,與 ZeRO-3 相比,ZeRO++ 實現(xiàn)了平均 2 倍的加速,使得大模型訓練在更多種類的集群上更為可行。

  IT之家注意到,例如 Turing-NLG、ChatGPT 和 GPT-4 這樣的大型模型,其訓練需要跨多個 GPU 設備占用大量顯存和計算資源,而 ZeRO++ 引入了通信優(yōu)化策略,以克服在低帶寬集群上進行訓練時原有 ZeRO 傳輸技術的帶寬限制。目前微軟已經放出了相關技術文檔,研究人員可以利用 ZeRO++ 更有效地訓練模型,在 AI 領域探索新的可能性。
  (碼上科技

最新資訊
? 2018 河北碼上網(wǎng)絡科技有限公司 版權所有 冀ICP備18021892號-1   
? 2018 河北碼上科技有限公司 版權所有.
主站蜘蛛池模板: 自偷自偷自亚洲首页精品 | 香蕉久久久久久av成人 | 国产亚洲综合色就色 | 五月丁香六月狠狠爱综合 | 国产精品无码一区二区在线观一 | 日本丰满少妇裸体自慰 | 成年视频在线观看免费 | 亚洲欧美中文日韩v在线观看 | 美女被视频在线看九色 | 欧美精品v国产精品v日韩精品 | 久久日本三级韩国三级 | 欧美在线黄| 亚洲天堂成人在线 | 91精品国产一区二区三区四区 | 久久久91精品国产一区二区 | 精品亚洲成a人无码成a在线观看 | 午夜久久免费视频 | 亚洲欧美日韩在线一区二区三区 | 精品一区二区三区视频日产 | 91中文字幕在线视频 | 久久免 | 又粗又硬又黄又爽的免费视频 | 992人人草| 日韩在线视频一区 | 男女一级毛片免费播放 | 在线a级毛片无码免费真人 在线a人片免费观看 | 国产日韩视频在线观看 | 少妇厨房愉情理伦片免费 | 曰本一级毛片 | 天天更新天天久久久更新影院 | 日韩 欧美 中文 | 久久综合琪琪狠狠天天 | 国产欧美日韩一区二区三区 | 在线观看视频福利 | 成人午夜电影在线观看 | 亚洲av无码一区二区二三区∝ | 亚洲精品人成电影网 | 天天色天天 | 特a级片 | 国产成人不卡亚洲精品91 | 91国内在线视频 |