激情国产视频_午夜黄色影院_久久久夜夜夜_亚洲视频二区_日日夜夜国产_欧美自拍偷拍

Internet Develppment
互聯(lián)網(wǎng)開發(fā)& 推廣服務提供商

我們擅長商業(yè)策略與用戶體驗的完美結合。

歡迎瀏覽我們的案例。

首頁 > 新聞中心 > 新聞動態(tài) > 正文

微軟推出 ZeRO++ 技術 可顯著減少大模型訓練時間和成本

發(fā)布時間:2023-06-27 14:43:14來源:IT之家

  微軟研究人員日前推出了名為 ZeRO++ 的新技術,用于優(yōu)化在訓練大型 AI 模型時,容易遇到的數(shù)據(jù)傳輸成本和帶寬限制的難題,可顯著減少大模型訓練時間和成本。

  據(jù)悉,ZeRO++ 建立在現(xiàn)有的 ZeRO 傳輸技術基礎上,并提供增強的通信策略,可提高訓練效率,同時減少訓練時間和成本。


圖片來自網(wǎng)絡/侵刪

  為了減少參數(shù)通信量,ZeRO++ 可對權重進行量化,其利用基于塊的量化方法來保持訓練精度,這種優(yōu)化的量化過程相對原始 Zero 傳輸技術更快更準確。為了能夠盡量減少通信開銷,ZeRO++ 通過在每臺機器上保持完整的模型副本,以向 GPU 顯存換取通信帶寬。而在梯度通信方面,ZeRO++ 引入了一種名為 qgZ 的新的量化梯度通信方式,可以減少跨節(jié)點的流量和延遲。

  這些改進的通信技術大大減少了通信量,微軟研究人員表示,與 ZeRO 相比,ZeRO++ 減少了高達 4 倍的通信量,提高了訓練吞吐量和效率。當在每個 GPU 上使用小批量大小時,在高帶寬集群中,ZeRO++ 相比 ZeRO-3 的吞吐量提高了 28% 至 36%。在低帶寬集群中,與 ZeRO-3 相比,ZeRO++ 實現(xiàn)了平均 2 倍的加速,使得大模型訓練在更多種類的集群上更為可行。

  IT之家注意到,例如 Turing-NLG、ChatGPT 和 GPT-4 這樣的大型模型,其訓練需要跨多個 GPU 設備占用大量顯存和計算資源,而 ZeRO++ 引入了通信優(yōu)化策略,以克服在低帶寬集群上進行訓練時原有 ZeRO 傳輸技術的帶寬限制。目前微軟已經放出了相關技術文檔,研究人員可以利用 ZeRO++ 更有效地訓練模型,在 AI 領域探索新的可能性。
  (碼上科技

最新資訊
? 2018 河北碼上網(wǎng)絡科技有限公司 版權所有 冀ICP備18021892號-1   
? 2018 河北碼上科技有限公司 版權所有.
主站蜘蛛池模板: 99riav国产精品视频 | 2020国产成人精品视频 | 欧美人与牲动交xxxx | 日韩国产成人无码av毛片 | 精品国产一区二区三区国产馆 | 日日摸夜夜添夜夜添人人爽 | 男人又粗又硬桶女人免费 | 欧美午夜精品一区二区三区 | 久久亚洲欧美日本精品品 | 成人精品视频在线 | 久久综合伊人 | 亚洲精品久久国产精品 | 忘穿内裤坐公交被挺进小说 | 亚洲免费三级电影 | 国产情趣酒店鸳鸯浴在线观看 | 午夜爱爱影院 | 日本一级α片在线看 | 亚洲国产精品视频在线观看 | 欧美一区1区三区3区公司 | 人妻夜夜爽天天爽三区丁香花 | 久久综合五月丁香久久激情 | 亚洲精品国精品久久99热 | 午夜精品久久久久久久爽 | 激情内射亚州一区二区三区爱妻 | 亚洲综合色婷婷在线观看 | 亚洲七七久久桃花影院 | 热久在线 | 又大又紧又粉嫩18p少妇 | 欧美中文字幕一区 | 亚洲天堂男人天堂 | 性高爱久久久久久久久 | 久草在线资源网站 | 日本免费的一级v一片 | 国农村精品国产自线拍 | 欧美成人午夜精品久久久 | 国产免费叼嘿网站免费 | 亚拍精品一区二区三区 | 99热久久这里只有精品7 | 久久久99精品| 国产在线精彩视频 | 国产剧情一区二区三区 |