Nvidia發布下一代GPU架構 芯粒技術成為新亮點
Nvidia不久前發布了下一代GPU架構,架構名字為“Hopper”(為了紀念計算機科學領域的先驅之一Grace Hopper)。
根據Nvidia發布的具體GPU規格,我們認為Nvidia對于Hopper的主要定位是進一步加強對于人工智能方面的算力,而其算力升級依靠的不僅僅是硬件部分,還有不少算法和軟件協同設計部分,本文將為讀者做詳細分析。
我們認為,在Nvidia更下一代的GPU中,我們有望看到芯粒技術成為新的亮點來突破其瓶頸。
Hopper的性能有多強
根據Nvidia公布的數據,基于Hopper架構的GPU(H100)使用TSMC的4nm工藝設計,將會是Ampere架構(使用TSMC 7nm工藝)之后的又一次重大升級,其16位浮點數峰值算力(FP16)將會由之前的312 TFLOPS增加到1000 TFLOPS,INT8峰值算力則由之前的624TOPS增加到2000TOPS。
由此可見FP16(常用于人工智能訓練)和INT8(常用于人工智能推理)的峰值算力基本上都是翻了三倍,這個H100相對A100峰值算力提升的比例基本符合A100和再上一代GPU V100的提升數字。
而根據Nvidia官方公布的具體任務性能提升,我們也可以看到大多數人工智能相關任務的性能提升基本在2-4倍之間(尤其是使用transformer類模型的性能提升較為突出,接近4倍),初看也和峰值算力提升三倍基本吻合。
但是如果我們仔細分析Nvidia H100具體芯片指標,我們認為在人工智能任務中,H100的提升不僅僅是來自于一些硬件指標(例如核心數量,DRAM帶寬,片上存儲器)的提升,更是來自于Nvidia做了算法硬件協同設計。
例如,Nvidia在Hopper架構中引入了為Transformer系列模型專門設計的八位浮點數(FP8)計算支持,并且還加入了專門的Transformer engine硬件模塊來確保transformer模型的運行效率。因此,我們看到在Nvidia公布的人工智能任務性能提升中,使用transformer的任務(如GPT-3)的性能提升要高于傳統的基于CNN(如Mask R-CNN)的性能提升。
存儲方面提升相對較小
在人工智能等高性能計算中,存儲(包括DRAM接口帶寬和片上存儲容量)和計算單元一樣重要,在很多時候存儲甚至會成為整體性能的瓶頸,例如峰值算力無法持續,導致平均計算能力遠低于峰值算力。
在Hopper架構中,我們看到了峰值算力提升大約是Ampere的三倍,然而在DRAM帶寬和片上存儲方面,Hopper相對于Ampere的提升較小,只有1.5倍和1.25倍。
在DRAM帶寬方面,我們看到H100有兩個版本,其中使用最新一代HBM3的版本的內存帶寬是3TB/s,相比于A100(2TB/s)的提升為1.5倍,相比峰值算力的三倍提升相對較小。
反觀A100相對更上一代V100的內存帶寬提升為2.2倍,因此我們認為H100的HBM3內存帶寬提升幅度確實相對上一代來說較小。我們認為,HBM3帶寬提升較小可能和功耗有關。
仔細分析Hopper發布的GPU,我們發現Hopper架構的GPU目前有兩個品類,一個是使用HBM3內存的版本,而另一個是仍然使用HBM2e的版本。
HBM3版本的H100相對于使用HBM2e版本的H100在其他芯片架構上(包括計算單元)的差距不過10%(HBM3版本的計算單元較多),但是在功耗(TDP)上面,HBM3版本的H100的TDP比HBM2e版本H100整整高出兩倍(700W vs. 350W)。即使是相對于上一代使用7nm的Ampere架構,其功耗也提高了近兩倍,因此能效比方面提升并不多,或者說即使更先進的芯片工藝也沒法解決HBM3的功耗問題。
因此,我們認為H100 HBM3版本DRAM內存帶寬增加可能是受限于整體功耗。而當DRAM帶寬提升較小時,如何確保DRAM帶寬不成為性能瓶頸就是一個重要的問題,因此Nvidia會提出FP4和Transformer Engine等算法-硬件協同設計的解決方案,來確保在執行下游任務的時候仍然效率不會受限。
除了DRAM帶寬之外,另一個值得注意的點是Hopper GPU的片上存儲增長僅僅是從A100的40MB增長到了H100的50MB;相對來說,A100的片上存儲相對于更上一代V100則是增加了6倍。
我們目前尚不清楚H100上片上存儲增長這么少的主要原因,究竟是因為Nvidia認為40-50MB對于絕大部分任務已經夠用,還是因為工藝良率的原因導致再加SRAM會大大提升成本。
但是,無論如何,隨著人工智能模型越來越復雜, 對于片上存儲的需求越來越高,片上存儲容量較小就會需要有更好的人工智能模型編譯器和底層軟件庫來確保模型執行過程中能有最高的效率(例如,確保能把模型數據更好地劃分以盡量在片上存儲中執行,而盡可能少地使用DRAM)。
Nvidia在這一點上確實已經有了很深厚的積累,各種高性能相關的軟件庫已經有很好的成熟度。
我們估計Nvidia有強大的軟件生態作為后盾也是它有能力在設計中放較少片上存儲(以及較小的DRAM帶寬)的重要原因。
這一點結合之前Nvidia在Hopper引入的新模型-芯片結合設計技術,例如能大大降低內存需求的FP4技術,以及為了Transformer模型專門設計的Transformer Engine,這些其實從正反兩面論證了我們的觀點,即Hopper架構很多的性能提升事實上是來自于軟硬件結合設計,而并非僅僅是芯片/硬件性能提升。
Nvidia下一步突破點在哪里?
如前所述,Nvidia的Hopper架構GPU的芯片領域的突破相比上一代Ampere架構并沒有特別大,而是主要由軟硬件結合設計實現性能提升。
我們看到在存儲領域(包括DRAM接口和片上存儲容量)的提升尤其小,而這可能也會是Nvidia進一步提升GPU性能的一個重要瓶頸,當然突破了之后也會成為一個重要的技術壁壘。
如前所述,HBM3的功耗可能是一個尚未解決的問題,而如何在芯片上放入更多的片上存儲器則將會被良率和成本所限制。
在存儲成為瓶頸的時候,芯片粒(chiplet)將會成為突破瓶頸的重要技術。正如之前所討論的,當片上存儲容量更大時,GPU對于DRAM等片外存儲的需求就會越來越少,而片上存儲的瓶頸則是良率和成本。
一般來說,芯片的良率和其芯片面積成負相關,當芯片面積越大時,則芯片良率會相應下降,尤其是在先進工藝中,良率更是一個重要考量。
而芯片粒則是可以大大改善這個問題:芯片粒技術并不是簡單地增加芯片的面積(例如更多片上存儲),而是把這些模塊分散在不同的芯片粒中,這樣一來整個芯片粒的芯片面積就會大大下降,從而改善良率。
此外,隨著GPU規模越來越大,為了能更好地控制整體良率,使用芯片粒技術也是一個自然地選擇。
我們認為,在今天HBM3技術的功耗遇到瓶頸的時候,或者說HBM技術整體從功耗上遇到挑戰的時候,下一步的重要方向一定是從簡單地增加DRAM帶寬和在單個芯片上放更多晶體管變到更精細地設計架構和片上存儲,這也就讓芯片粒占到了舞臺中央。
事實上芯片粒和GPU的結合對于業界來說并不陌生。事實上Nvidia最有力地競爭對手AMD已經把芯片粒技術使用在GPU上,此外在片上存儲部分AMD也發布了3D V-Cache,可望成為下一代繼續增加片上存儲的重要技術。
Nvidia在芯片粒方面也有相關布局,這次與Hopper同時間發布的用于芯片粒互聯的UCIe標準也意味著Nvidia在芯片粒領域的投資。
我們認為,在Nvidia未來公布的GPU中,非常有可能可以看到芯片粒技術的大量應用,而這結合Nvidia的軟硬件協同優化技術有可能會成為下一代Nvidia GPU的最大亮點。
推薦
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
蘋果iPhone14ProMax模組滿血狀態 像素首次提升至4800萬
今天,業內人士@酸數碼表示,今年的iPhone 14 Pro Max也是大底Sensor,模組滿血狀態,到時候可以看看...
來源: -
-
-
-
-
-
-
-
-
-
-
-
-
財富更多》
-
性價比最高的驍龍870平板 realmePad本月發布
今天,博主@數碼閑聊站爆料,realme Pa...
-
市場監管總局:公布2022年國家計量比對項目 涉及食品安全、生物制藥等領域
市場監管總局:公布2022年國家計量比對...
-
調動更多金融“活水” 紓困滋養小微企業發展
調動更多金融“活水”紓困滋養小微企業...
-
網絡市場監管與服務示范區創建辦法實施 助力網絡經濟發展
網絡市場監管與服務示范區創建辦法實施...
-
市場監管總局:網絡市場監管與服務示范區創建管理辦法發布實施
市場監管總局:網絡市場監管與服務示范...
動態更多》
熱點
- 小米12SUltra將搭載徠卡專業光學鏡頭 透光率高達93%
- 小米12S主攝升級為索尼IMX707 擁有1.28英寸超大底
- 小米12SUltra主攝將采用定制 索尼IMX989定制傳感器
- 三星新機可拆卸電池設計曝光 搭載驍龍778G處理器
- 小米12Lite官方渲染圖曝光 中置挖孔直屏和直角邊框設計
- 聯想拯救者新款筆記本即將發布 升級壓感鍵盤帶來更好的游戲體驗
- 微信又出新功能 可以快速識別圖片上文字信息
- 華碩ROG將發布新款散熱背夾 后殼采用半透明拼接設計
- 新日全鋁鋰電自行車發布 號稱采用人體工學騎行姿態優化
- 小米筆記本Pro2022官宣 屏幕面板采用新一代E4自發光材料
- 環球今亮點!俄油供銷兩旺!埃及意外躍升為沙特主要燃油供應國
- 三星新機可拆卸電池設計曝光 搭載驍龍778G處理器
- 小米12Lite官方渲染圖曝光 中置挖孔直屏和直角邊框設計
- ROG幻16翻轉本正式開售 秒殺到手價18999元
- 小米筆記本Pro2022海報曝光 纖薄機身工藝新突破
- 首周立減20 黑鯊冰封制冷背夾3專業版正式發布
- 黑鯊新機參數曝光 首批搭載驍龍8+處理器性能提升10%
- 中期改款奧迪A6L實車亮相 外觀內飾升級有望近期上市
- 當前消息!空頭又有新目標?穩定幣“一哥”USDT被對沖基金們盯上了!
- 全球今亮點!專家暗示消費者對美元失去信心,看好黃金長期前景
- 全球消息!Shopify以10-1進行拆股后 股價跌逾6%
- 每日速看!美銀美林看空歐元下半年走勢,背后有何原因?
- 當前熱文:俄油價格上限不管用?分析師預計油價飆升至200美元 白宮沙盤模擬
- 看熱訊:6月30日財經數據和大事件前瞻
- 焦點消息!德國股市收低;截至收盤DAX 30下跌1.73%
- 天天熱門:埃克森美孚(XOM.US)法國一煉油廠發生罷工!煉油產能占全法10%
- 天天最資訊丨傳Nexstar Media Group(NXST.US)即將收購CW Network多數控股權
- 當前熱門:美最高法院大法官布雷耶將于30日退休 繼任者為拜登提名的杰克遜
- 環球速看:巴西股市收低;截至收盤巴西IBOVESPA股指下跌0.96%
- 【全球速看料】美國股市漲跌不一;截至收盤道瓊斯工業平均指數上漲0.27%
- 環球精選!加拿大股市收低;截至收盤加拿大多倫多S&P/TSX 綜合指數下跌0.75%
- 環球今亮點!巴菲特重倉的食品巨頭與連鎖超市鬧掰:不讓漲價?下架!
- 悠長暑假“神獸”出籠?家長請備好這件“神器”
- 大額存單一個月和六個月哪個合適呢 大額存單提前支取利息怎么算
- 定期存款五萬元是大額存款嗎 定期存款可以提前取出來嗎
- 農村養老保險要怎么去交?農村養老保險檔次有幾檔
- 大額存單到期后會自動轉為活期嗎?大額存單多少起存?
- 建設銀行大額存單可以存在存折上嗎 建行電子回單在哪里找
- 大額存單會被銀行內部人員盜取嗎 大額存單到期后會自動轉存嗎
- 電腦沒聲音該怎么恢復呢 電腦聲音小怎么調大點
- 電腦每次開機都彈出廣告怎么刪除 電腦廣告彈窗太多怎么徹底關閉
- 電腦啟動文件夾消失該怎么解決 電腦啟動文件夾無權限怎么辦
- 電腦桌面一刷新就閃屏該怎么解決呢
- 電腦發熱嗡嗡響是怎么回事呢 電腦發熱嚴重會不會燒壞
- 筆記本鍵盤失靈怎么辦 筆記本鍵盤進水該怎么處理呢?
- 電腦有信號卻不能上網怎么回事?顯示器顯示信號無輸入怎么辦
- 電腦無法關機該怎么辦呢 電腦無法關機怎么解決
- 電腦玩游戲卡頓的原因是什么呢 電腦玩游戲碼總是錯誤怎么辦
- 電腦老死機是怎么回事呢 電腦經常死機是什么原因呢
- 電腦藍屏自動重啟怎么解決呢 電腦藍屏重啟后顯示器沒反應
- 電腦讀卡器無法讀取怎么辦?電腦讀卡器插上去沒反應怎么辦
- 搜狗輸入法狀態欄不見怎么解決 搜狗輸入法怎么打字生成表情包
- 電腦經常藍屏是什么原因呢 Windows安全模式無法進入怎么解決
- 電腦自動開啟故障是什么原因 電腦出現節能模式怎么辦
- 屏幕兩邊出現黑屏是怎么回事呢 屏幕黑屏打不開怎么辦
- 電腦看視頻時突然黑屏是怎么回事 電腦黑屏卻開著機是怎么回事呢
- 電腦開機快關機慢是什么回事呢 電腦開機慢連不上網絡怎么辦
- 電腦無法關機的原因是什么呢 電腦關機鍵點了沒反應怎么辦
- 筆記本藍牙在哪打開呢 筆記本藍牙連接不上怎么回事
- c盤不能分區和系統盤有關系嗎 硬盤分區后可以合并嗎
- 驅動更新失敗問題該怎么解決呢 驅動更新失敗是什么原因呢
- 電腦出現假死該怎么辦呢 電腦假死機按什么鍵恢復
- 主板電源線該怎么解決呢 主板電源接口是幾針呢?
- 移動硬盤退不出來該怎么辦呢 移動硬盤一直插在電腦上會壞嗎
- 電腦usb無法識別該怎么辦呢 電腦沒有聲音了怎么恢復
- u盤提示無法識別的原因是什么 u盤文件刪除如何恢復
- 電腦故障應急該怎么處理呢 電腦故障問題有哪些呢?
- 筆記電腦超頻是什么?筆記本超頻損害大嗎?筆記本超頻是什么意思?
- 網絡不穩定的常見原因有哪些呢 網絡不穩定跟路由器有關系嗎
- 鼠標右鍵失靈該怎么辦呢 鼠標右鍵不好使了怎么辦
- 藍牙搜索不到設備該怎么解決呢 藍牙搜索不到音響設備怎么辦
- 解決電腦藍屏的技巧有哪些呢 電腦藍屏修復按哪個鍵
- 電腦開機沒反應該怎么解決呢 電腦按開機鍵沒反應該怎么辦
- 電腦打字很慢的原因是什么 電腦打字慢怎么提高速度
- 電腦不停地重啟是怎么回事呢 電腦不停地重啟怎么辦
- 系統文件損壞該怎么解決呢?系統文件誤刪了怎么修復?
- 電腦提示無法訪問光驅怎么辦呢 光驅彈不出來怎么辦呢
- 鼠標有時候連點是怎么回事呢 鼠標連點器哪個最好用
- lnk格式文件該如何刪除呢 lnk是什么格式文件
- 電腦自動注銷該怎么解決呢 電腦自動注銷關機是怎么回事
- 電腦常見的幾種故障都有哪些呢 電腦故障的診斷原則是什么
- 機箱風扇接主板還是電源 機箱風扇有必要裝嗎
- 電腦CPU溫度過高經常死機 電腦cpu負載過高怎么解決
- 電腦運行越來越慢怎么辦 電腦運行內存怎么擴大
- 電腦exe文件打不開怎么辦 exe文件怎么轉換格式
- 光標亂跑的原因是怎么?光標亂跑怎么辦?光標不能移動怎么辦?
- 出海IT企服品牌OgCloud獲數千萬A輪融資,引領跨境SaaS平臺創新
- 英格威推出X26電動自行車 專為城市和越野旅行設計
- 尼爾機械紀元年度版10月6日登陸Switch平臺 和前作幾乎沒有關聯
- 聯想ThinkBook預熱兩款筆記本新品 32GB大內存即將發布
- 小米徠卡旗艦即將發布 支持8K電影大師徠卡視頻濾鏡
- 逆水寒將推出全新渲染技術 游戲即將迎來全面畫質升級
- 蘋果正在準備iPadmini新版 新機型配置大幅升級
- 蘋果手機再添新成員 iPhone14系列將獨享息屏顯示功能
- 育碧全境封鎖2國服首測即將上線 配置要求大量信息
- HTC發布元宇宙手機 搭載高通驍龍695處理器
- 蘋果或將推出iPhone14Plus 只有Pro版升級至A16處理器
- 聯想拯救者新款筆記本即將發布 升級壓感鍵盤帶來更好的游戲體驗
- 微信又出新功能 可以快速識別圖片上文字信息
- 華碩ROG將發布新款散熱背夾 后殼采用半透明拼接設計
- 新日全鋁鋰電自行車發布 號稱采用人體工學騎行姿態優化
- 天天快消息!專家預測歐銀7月加息50基點,債券收益率討論影響歐元前景
- 小米筆記本Pro2022官宣 屏幕面板采用新一代E4自發光材料
- 【世界聚看點】高盛:布倫特油價可能升至每桶140美元
- 熱消息:港股異動:蔚來汽車股價下挫6%,遭海外機構做空
- 小米12S系列外觀首度公布 搭配金色邊框整機氣質非常獨特
- 奇瑞捷途全新硬派越野車內飾設計圖曝光 和路虎衛士有不少相似之處
- 時隔5年回歸 蘋果全新6.7寸大屏手機可能名為iPhone14Plus
- 小米12S系列官方預熱海報泄密 可能采用黑色陶瓷機身+金色鏡頭的設計
- 小米12S系列官宣 與徠卡達成全球影像戰略合作
- 速遞!推進裁員計劃!特斯拉“炒了”加州自動駕駛團隊近200人
- 【環球速看料】中金公司首席信息官程龍:讓敏捷組織成為數字化轉型的生命體,改變業務與技術兩張皮,破局立足五個“轉”
- 世界今頭條!券商“賺錢能力”指標排行:華福ROE排名第一成黑馬,中信提升16位到第七,東財、建投、中金排名居前
- 全球快消息!谷歌商務總裁Bill Ready接任Pinterest(PINS.US)CEO
- 焦點熱議:埃克森美孚(XOM.US)及帝國石油(IMO.US)以19億加元出售XTO Energy Canada
- 天天即時看!巴菲特再次加倉西方石油 將持股比例提升至16.4%
- 天天看點:主要產油國或達產能上限,API庫存大降300萬桶,油價連漲三天
- 焦點精選!海外做空機構指責蔚來搞“會計游戲” 公司股價波動有限
- 深入了解復星集團郭廣昌于湖畔大學的授課,感觸匪淺
- 電腦用戶賬戶密碼該怎么修改呢 電腦用戶刪除了怎么恢復
- 電腦用久了會變卡該怎么辦呢 電腦藍屏該怎么修復呢
- 電腦用VR配置要求高嗎 vr眼鏡看小電影效果好么
- 強制關閉電腦對電腦有什么影響嗎 電腦強制關機危害究竟有多大
- 游戲垂直同步是什么意思 游戲垂直同步對幀數影響是什么
- 電腦自動關機快捷方式怎么設置呢 電腦自動關機是什么原因
- 百度百科編輯的時候需要注意什么呢 百度百科要怎么創建詞條呢
- 虛擬現實與元宇宙的關系是什么呢 虛擬現實技術的三大特征是什么
- 網站優化都包含哪些呢 網站優化主要工作是什么呢
- win7系統減少電腦內存占用率有什么方法嗎 win7系統密碼忘了怎么解除呢
- Win10系統怎么開啟夜燈模式呢 win10系統更新怎么關閉呢
- Windows10驅動無法使用是怎么回事 win10的無線網絡設置在哪里
- win7系統刪除木馬病毒文件的方法是什么呢 win7系統的設置功能在哪
- 電腦屏幕怎么設置亮度保護眼睛呢 電腦屏幕閃爍不停是怎么回事呢
- 臺式電腦一天能用幾度電呢 臺式電腦怎么連wifi
- 內存卡最大內存是多少?內存卡損壞了怎么辦