自去年 Arm 推出全新旗艦產品 Immortalis GPU 以來,收獲諸多好評。在面向搭載高端和旗艦片上系統 (SoC) 的全新高性能智能手機設備的各種基準測試中,Immortalis-G715[1] 憑借優異的性能和高效能脫穎而出。在光線追蹤方面,與配備同類 GPU 的 SoC 相比,基于 Immortalis-G715 的 SoC 實現了 67% 和 52% 的性能提升1。同時,在可變速率著色 (VRS) 基準測試中,該旗艦 GPU 的性能比同類 SoC 競品高出 5% 到 52%2。
全新旗艦級 Arm Immortalis-G720 GPU[2] 以及全新 Arm Mali-G720[3] 和 Mali-G620 GPU[4] 的推出進一步鞏固了我們的強勁勢頭,并完善了我們面向廣泛消費電子設備的高水平 GPU 產品組合。在基于第四代 Valhall 架構構建了前四代 GPU 之后,全新 Arm GPU 采用了新的第五代 GPU[5] 架構,充分彰顯了 Arm 旨在面向各類消費電子設備帶來下一代視覺計算性能的長期承諾。

全新 GPU 持續帶來了更先進的性能和效率表現,將為移動設備提供更逼真、出色的沉浸式游戲體驗,更低的耗電量確保更長的游戲暢游時間。第五代架構提高了所有 GPU 的系統級圖形性能,意味著我們不僅大幅提高了 GPU 性能,還優化了全新 Arm ?2023 全面計算解決方案[6] 中的外部內存、新的 CPU 集群和系統級緩存 (SLC) 之間的交互過程,從而提升了整體的性能表現。
迄今為止,Arm GPU 出貨量已逾 90 億顆,為眾多開發者的應用提供了規模空前的目標群體。今年的出貨量更是比去年增加 10 億,相當于地球上平均每個人都擁有超過一個 GPU。此外,Arm 提供的業內先進的圖形功能、優化和開發工具,可助力開發者打造更出色的應用體驗。

推出第五代 GPU 架構
隨著全球快步邁入全新視覺計算時代,第五代 GPU 架構將成為 Arm 未來 GPU 的堅實基石,帶來顛覆性的全新圖形功能。第五代架構計劃將在第一年聚焦三個關鍵處理趨勢:場景復雜性、更出色的圖形性能和內存系統能耗功率。

1 場景復雜性
隨著開發者紛紛設法實現更優質的視覺效果,移動設備上的場景復雜性也呈爆炸式增長。現在面臨的挑戰在于,更高的場景復雜性會讓幾何相關的內存訪問占據過多的可用帶寬,并最終影響性能。第五代架構致力于提升圖形管道,讓用戶能夠以更高的每秒幀數 (FPS) 暢玩其喜愛的游戲。與此同時,在移動設備上實現下一代高級別幾何學渲染游戲和實時 3D 應用也成為了可能。
為了處理這些更復雜的場景,圖形管道首先引入了延遲頂點著色 (DVS) 以重新定義 Arm GPU 中的圖形數據流。DVS 有助于將性能擴展到更大數量的內核中,使 Arm 的合作伙伴能夠在未來達到更高的性能水平。DVS 還有助于在高度復雜的游戲場景中保持穩定幀率,同時為未來下一代的幾何內容提供支持。
一系列熱門游戲已借助 DVS 實現了場景中的性能提升,這些提升包括在《原神》中的帶寬占用減少了 33%,在《堡壘之夜》中減少了 26%,以及在 Elven Ruins 上使用的帶寬減少了 41%,Elven Ruins 是著名游戲制作團隊 Epic Games 在虛幻引擎中為游戲開發者和創作者提供的游戲場景示意圖。此創新架構還為移動設備帶來了更流暢、更身臨其境且近似個人電腦和游戲主機的游戲體驗。除了游戲應用以外,DVS 還將 CAD 應用的帶寬減少了 37%。可幫助建筑師通過實時 3D 視圖將其建筑 CAD 平面圖轉變成數字現實。

2 更出色的圖形性能
開發者不斷在其應用中創建更多令人驚嘆的視覺效果,推動著高動態范圍 (HDR) 渲染的使用需求持續增加。Arm 也積極支持這項開發者正在擁抱的技術趨勢——HDR 渲染,因此我們提升了相關性能以幫助呈現更出色的視覺效果。Immortalis-G720 有助于控制 HDR 渲染中使用的高深度紋理的性能影響。DVS 的引入意味著超復雜幾何形狀的場景可被渲染,并可節省處理能力。在 2023 游戲開發者大會 (GDC)[7] 中,Arm 工程團隊為大家帶來了技術演示,與基于 Valhall 架構的 Immortalis-G715 相比,基于第五代架構的 Immortalis-G720 的寫入帶寬提高了 31%,FPS 估計提高了 20%。借此釋放了圖形管道的空間,用以增加媲美電腦端的質量效果,例如實時動態光照、高光溢出效果和景深。
3 內存系統能耗功率
我們越來越傾向于認為內存系統能耗功率是導致處理器散熱達到極限的主要因素。回顧去年的 Arm 全面計算解決方案 (TCS22)[8],我們發現 DRAM、互連和內存均大量導致了內存系統能耗功率。在第五代架構中,我們希望為 GPU 分配更多的內存系統效能以達到更好的視覺效果,同時也希望可以進一步節約能耗功率,以延長電池續航時間。
Arm GPU 的性能和效率將再創新高
除了引入第五代架構外,Immortalis 和 Mali GPU 的整體設計在性能和效率方面也實現了大幅提升。Immortalis-G720 支持十核或更多核心,并可選用優化的物理 IP 來加速 SoC 設計。Mali-G720 和 Mali-G620 的超強可擴展性有助于為廣泛的消費電子設備帶來優質的圖形功能,例如智能手機、筆記本電腦、數字電視、機頂盒 (STB) 和可穿戴設備。Mali-G720 可支持六到九個核心,而 Mali-G620 可支持至多五個核心,可助力 Arm 授權許可合作伙伴在更多市場中實現設計工作的快速復用。

我們對各方面進行了廣泛的提升以降低 GPU 功耗,從而為終端用戶帶來更持久的設備使用時間,確保其隨時隨地可以開展工作和享受娛樂時間。每個 Immortalis 和 Mali GPU 都實現了更高水平的能效表現,其平均能效比上一代產品提升了 15%。意味著新產品的每瓦性能更高,持久性能更出色。此外,系統級效率也有了顯著提高,內存帶寬使用減少了多達 40%,且 CPU 負載有所降低。這要歸功于全新添加的 GPU 指令和驅動程序的優化。
全新 GPU 在性能方面更上一層樓,其峰值性能平均提高了 15%。我們還將 64bpp 紋理的架構吞吐量提高了一倍,以設法提升高動態范圍紋理表現。
在所有 GPU 中,我們為可變速率著色 (VRS) 提供了更高性能的著色率。VRS 是我們在去年的 Arm GPU[9]? 中引入的圖形處理技術。對于開發者而言[5],這意味著 4x2 和 4x4 著色率的性能有所提高。VRS 技術有助于降低因復雜著色而增加的著色成本,確保在重要的地方提供高質量的圖形。
除了提升 VRS 相關產品外,我們還通過優化 2x 多重采樣抗鋸齒 (MSAA) 功能為開發者帶來了靈活性更高的體驗。對于希望在其應用中使用 2x MSAA 的開發者來說,這讓他們無需升級到 4x MSAA。對于需要 2x MSAA 的應用,我們測得相關性能與使用 4x MSAA 時相比提升了 7%。全新 GPU 還提升了對 Vulkan 動態緩沖區的支持。
對機器學習的持續承諾
Arm 將繼續致力于為面向機器學習 (ML) 的新應用進行 GPU 開發和測試。3D 場景重建是一個關鍵的機器學習應用場景,可以在移動 GPU 上渲染真實場景的新穎視圖。通過探索這個特定的應用場景,我們發現,與 Immortalis-G715 相比,Immortalis-G720 的峰值性能提高了 25%,占用的內存帶寬減少了 22%。
我們還在不斷平衡 CPU 和 GPU 之間的功率,以提供一致的用戶體驗。開發者可利用 Unity ML-Agents[10] 插件在游戲和模擬中訓練智能代理。在 GDC 2023 上,我們展示了在移動 SoC 上處理 100 個類似代理和復雜圖形的超強表現。

廣泛的生態系統支持
我們通過廣泛的 GPU 工具和資源保持對游戲開發者的生態系統支持。可免費下載的 Arm Mobile Studio[11] 提供了多種解析、性能分析和調試工具,以幫助開發者優化其應用的性能和效率。
我們很快將推出 Arm Frame Advisor,這是一款基于幀的分析器,適用于支持 OpenGL ES 3.2 和 Vulkan 1.1 的游戲。Frame Advisor 使用構建于驅動程序之上的軟件層捕獲幀中的所有 API 調用情況,并通過分析引擎為開發者提供情景反饋。這種反饋可以幫助開發者發現提升應用性能的機會,具體包括以下方面:
- 渲染圖和幀數據流的可視化;
- 違反最佳實踐的相關信息;
- (算力預算)上限超標的相關信息,例如超過 GPU 周期數或 GPU 功率預算。
我們已計劃與選定的游戲工作室合作完成 Frame Advisor 的早期發布測試,該工具將于 2023 年底公開發布。
我們也在與我們的生態系統合作,攜手合作伙伴一同開發新技術。例如 Arm 曾與 Google 和 Unity 一同合作開發 Adaptive Performance[12],此功能在固定的功率和熱限制條件下優化了 GPU 利用率。
光線追蹤繼續作為一項廣受歡迎的圖形功能。我們的一些合作伙伴在芯片和設備上采用了光線追蹤技術[13],并將其用于游戲應用,我們始終與他們保持密切合作。例如,我們正在與騰訊游戲和 MediaTek 合作,通過 SmartGI 技術以進一步提高行業采用率,并開發最佳實踐文檔,為游戲開發者提供有力支持。

最后,我們正在與 Epic Games 合作,計劃在安卓上啟用其 Unreal Engine 5 桌面渲染器。這將確保借助 Immortalis GPU 也能提供桌面級質量的渲染和圖形。我們創建了 Steel Arms 演示來測試開發者使用我們 GPU 產品的體驗,并演示該渲染器如何實現高質量的圖形,包括豐富的高光溢出效果、基于物理的優質著色、生動的模糊效果和細致的實時反射效果。

更高效率、更優性能、更豐富的開發者資源
我們的目標是每年都能在 GPU 領域提供行業出眾的性能和效率,同時為開發者提供豐富的工具和資源,助其打造美輪美奐的視覺盛宴。今年也不例外,Immortalis-G720 和 Mali GPU 系列顯著提高了效率和性能,并最終使開發者深受裨益。第五代架構為我們奠定了下一代視覺計算的基礎,并將為移動設備帶來具有突破性的全新圖形功能。總而言之,Arm 將繼續為用戶帶來更驚艷的視覺體驗。
附注:
1 光線追蹤使用“Basemark? GPUScore: In Vitro”進行基準測試。截至 2023 年 4 月 12 日,Arm 在旗艦級 Android 手機上測得的數據。
2 VRS 使用“Basemark? GPUScore:The Expedition VRS”進行基準測試。截至 2023 年 4 月 12 日,Arm 在旗艦級 Android 手機上測得的數據。
本文作者:Arm 終端事業部 GPU 產品管理總監 Dan Wilson
(文章來源公眾號:Arm社區)
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
關于億道電子
上海億道電子技術有限公司是國內資深的研發工具軟件提供商,公司成立于2009年,面向中國廣大的制造業客戶提供研發、設計、管理過程中使用的各種軟件開發工具,致力于幫助客戶提高研發管理效率、縮短產品設計周期,提升產品可靠性。
十多年來,先后與ARM、Altium、Ansys、QT、Green Hills、Minitab、EPLAN、QA Systems、OpenText、Visu-IT、HighTec、PLS、Ashling、MSC Software、Autodesk、Source Insight、IncrediBuild、Lauterbach、Adobe、Testplant、TeamEDA等多家全球知名公司建立戰略合作伙伴關系,并作為他們在中國區的主要分銷合作伙伴服務了數千家中國本土客戶,為客戶提供從芯片級開發工具、EDA設計工具、軟件編譯以及測試工具、結構設計工具、仿真工具、電氣設計工具、以及嵌入式GUI工具等等。億道電子憑借多年的經驗積累,真正的幫助客戶實現了讓研發更簡單、更可靠、更高效的目標。

歡迎關注“億道電子”公眾號
了解更多研發工具軟件知識

首頁 > 新聞資訊
