
NVIDIA 9 日正式發佈代號為「 Kal-El 」的新一代「 Tegra 3 」 ARM 架構處理器,是全球首款四核心行動處理器,採用了 4+1 核心 ARM Cortex A9 架構設計在性能與低表現作出最佳平衡,整體效能相較上代 Tegra 2 提升達 5 倍,並且進一步提升 3D 繪圖性能以滿足遊戲需求,同時亦支援 3D 立體播放,令使用體驗媲美傳統 PC 產品。
4 主核心 + 1 協同核心設計
NVIDIA 9 日正式發佈全新「 Tegra 3 」行動處理器產品,研發計劃代號為「 Kal-El 」,主要針對 Smartphone 、 Tablet 及 Netbook 市場,提供優秀的多工作業能力、高畫質的 3D 遊戲體驗,以及最佳的網路使用體驗,是全球首款 4 Cores ARM 處理器基於 Cortex A9 架構。
為了提供高運算性能與高電池續航力表現, NVIDIA 「 Tegra 3 」處理器採用 4 顆主核心 + 1 顆協同運算核心的「 vSMP 」可變對稱式多處理架構,有別於一般 SMP 設計,處理器內建了第 5 顆運算核心稱為「協同運算」核心,同樣基於 ARM Cortex A9 架構,但採用了低功耗矽晶製程以提升能源效益,在待機模式執行各種運算作業。
對於作業系統和應用程式層面,並不會發現這顆「協同運算」核心,但會自動地運用這顆「協同運算」核心,當面對高負載的運算需求,處理器會把工作切換至主運算核心,這四顆主核心同樣為 ARM Cortex A9 架構,並採用快速矽晶製程以達至更高運作時脈,處理器可按工作負載情況以漸進式電源閘控制核心開關,並按負載需求決定開啟的核心數目以達至最佳的電源管理,由於 vSMP 架構是硬體層面設計,因此不需要軟體重新編程同時提供極佳的相容性。
據 NVIDIA 表示,大部分行動裝置 80% 是處於主動式待機狀態,只有兩成的時間在處理密集式運算的行動應用程式,「 Tegra 3 」採用 4 + 1 核心設計讓處於「主動式待機」狀態、或是執行一些背景作業及低效能應用程,以「協同運算」核心提供最低的功耗,大幅延長待機時間卻同時留保高性能運算能力。
混合低功耗與標準的矽晶製程
NVIDIA 「 Tegra 3 」處理器的 4+1 核心設計,當中運用了低功耗矽晶製程與標準的矽晶製程,兩者均有不同的特性與優勢。晶片功耗等於漏電功耗和動態功耗的總和,其中漏電功耗的主要由矽製程技術決定,而動態功耗則由矽元件的製程技術、運作電壓和頻率來決定。
以快速製程技術製造的電晶體,無論閒置或主動式待機狀態時會消耗很高的漏電功耗,然而卻能夠在無需大幅提升操作電壓下於高時脈運行,採用低功耗製程技術的電晶體,雖然可做到較低的漏電功耗,但正常電壓下其切換速度會相對較慢,因此難以運作於高時脈,除非以更高的電壓以提升電晶體在切換速度。
低功耗的協同運算核心同樣基於 Cortex A9 架構,以低功耗製程技術製造其工作時脈最高為 500MHz , 500MHz 以下工作時它實現高於主核心的 Performance per Watt 表現,主要應用於待機狀態以及執行幕後工作時,例如電子郵件同步、 Twitter 更新以及 Facebook 更新等等,一些不需要強勁 CPU 處理能力的應用程式,例如串流音訊、離線音訊、線上視頻播放及離線視頻播放,由於音訊與視頻播放大多由硬體編碼器和解碼器來處理,因此只需要使用協同核心 足以應付。
以快速製程技術製造而成的主核心,可在較低工作電壓下運作於高時脈,能夠在不大幅增加動態功耗的情況下實現高性能,透過結合使用高性能主核心以及低 功耗協同運算,可變對稱式多處理技術不僅可以在活動待機狀態下實現超低功耗,而且能夠根據情況為這些需要高性能支援的行動應用提供峰值四核性能。此類應用 包括遊戲、網路瀏覽、 Flash 媒體以及視訊會議。
協同運算核心 | 主核心 | |
架構 | Cortex A9 | Cortex A9 |
製程技術 | 低功耗 (LP) | 普通 / 高速 (G) |
工作頻率 | 0 ~ 500MHz | 0 ~ 1.3GHz |
vSMP 可變對稱式多重處理技術
NVIDIA 「 Tegra 3 」是首款採用 vSMP 可變對稱式多處理技術的行動 SoC 晶片,不僅大幅降低待機狀功耗,採用了基於硬體的管理,又採用了基於低級軟體的管理,可根據需求提供高性能 4 Cores 運算。
「 Tegra 3 」根據應用程式及作業系統的要求,能自動管理主核心及協同運算之間的運算調度,這工作是由 NVIDIA 研發的動態電壓與頻率擴展 (DVFS) 以及 CPU 熱插拔管理軟體實現,並不需要對作業系統及軟體重新編程。
當協同運算核心關閉後,管理邏輯單元繼續監控 CPU 的協同運算以及每一個主核心的負載,動態啟用或關 1 、 2 、 3 、 4 主核心。像電子郵件、基礎遊戲或簡訊等應用程式一般只需要四個主核心中之一就足夠,對硬體要求較高的應用程式,例如 3D 遊戲及媒體編輯, CPU 管理程式會開啟全部核心,以提供更高性能。
vSMP 技術在不同頻率運行的核心之間,並不涉及快取記憶體同步補償問題,協同核心與主核心共用同相同的 L2 Cache ,通過對該 Cache 優化設計,「 Tegra 3 」處理器可以在幾十億萬分之一秒速度為由協同核心與主核心返回資料。
據了解, ASUS 將於 2011 年式推出首款採用 NVIDIA Tegra 3 處理器的 Eee Pad Transformer Prime 平板電腦,此外 HTC 也會於明年上半年推出採用 NVIDIA Tegra 3 處理器的 Smartphone 產品, NVIDIA 緊接於 2012 年推出效能比較「 Tegra 2 」提升達 10 倍,代號為「 Wayne 」新一代「 Tegra 」行動處理器。
圖為 Terga 2 ( 左 ) 與 Terga 3( 右 ) 在進行遊戲時的畫面效果分別