2011-11-09
代號 Kal-El、4+1 核心設計
NVIDIA 全新 Tegra 3 處理器登場
文: Gary Ng / 台北報導


NVIDIA 9 日正式發佈代號為「 Kal-El 」的新一代「 Tegra 3 」 ARM 架構處理器,是全球首款四核心行動處理器,採用了 4+1 核心 ARM Cortex A9 架構設計在性能與低表現作出最佳平衡,整體效能相較上代 Tegra 2 提升達 5 倍,並且進一步提升 3D 繪圖性能以滿足遊戲需求,同時亦支援 3D 立體播放,令使用體驗媲美傳統 PC 產品。



4 主核心 + 1 協同核心設計

 

 

Tegra 3

 

NVIDIA 9 日正式發佈全新「 Tegra 3 」行動處理器產品,研發計劃代號為「 Kal-El 」,主要針對 Smartphone 、 Tablet 及 Netbook 市場,提供優秀的多工作業能力、高畫質的 3D 遊戲體驗,以及最佳的網路使用體驗,是全球首款 4 Cores ARM 處理器基於 Cortex A9 架構。

 

為了提供高運算性能與高電池續航力表現, NVIDIA 「 Tegra 3 」處理器採用 4 顆主核心 + 1 顆協同運算核心的「 vSMP 」可變對稱式多處理架構,有別於一般 SMP 設計,處理器內建了第 5 顆運算核心稱為「協同運算」核心,同樣基於 ARM Cortex A9 架構,但採用了低功耗矽晶製程以提升能源效益,在待機模式執行各種運算作業。

 

對於作業系統和應用程式層面,並不會發現這顆「協同運算」核心,但會自動地運用這顆「協同運算」核心,當面對高負載的運算需求,處理器會把工作切換至主運算核心,這四顆主核心同樣為 ARM Cortex A9 架構,並採用快速矽晶製程以達至更高運作時脈,處理器可按工作負載情況以漸進式電源閘控制核心開關,並按負載需求決定開啟的核心數目以達至最佳的電源管理,由於 vSMP 架構是硬體層面設計,因此不需要軟體重新編程同時提供極佳的相容性。

 

據 NVIDIA 表示,大部分行動裝置 80% 是處於主動式待機狀態,只有兩成的時間在處理密集式運算的行動應用程式,「 Tegra 3 」採用 4 + 1 核心設計讓處於「主動式待機」狀態、或是執行一些背景作業及低效能應用程,以「協同運算」核心提供最低的功耗,大幅延長待機時間卻同時留保高性能運算能力。

 

混合低功耗與標準的矽晶製程

Tegra 3

 

NVIDIA 「 Tegra 3 」處理器的 4+1 核心設計,當中運用了低功耗矽晶製程與標準的矽晶製程,兩者均有不同的特性與優勢。晶片功耗等於漏電功耗和動態功耗的總和,其中漏電功耗的主要由矽製程技術決定,而動態功耗則由矽元件的製程技術、運作電壓和頻率來決定。

 

以快速製程技術製造的電晶體,無論閒置或主動式待機狀態時會消耗很高的漏電功耗,然而卻能夠在無需大幅提升操作電壓下於高時脈運行,採用低功耗製程技術的電晶體,雖然可做到較低的漏電功耗,但正常電壓下其切換速度會相對較慢,因此難以運作於高時脈,除非以更高的電壓以提升電晶體在切換速度。

 

低功耗的協同運算核心同樣基於 Cortex A9 架構,以低功耗製程技術製造其工作時脈最高為 500MHz , 500MHz 以下工作時它實現高於主核心的 Performance per Watt 表現,主要應用於待機狀態以及執行幕後工作時,例如電子郵件同步、 Twitter 更新以及 Facebook 更新等等,一些不需要強勁 CPU 處理能力的應用程式,例如串流音訊、離線音訊、線上視頻播放及離線視頻播放,由於音訊與視頻播放大多由硬體編碼器和解碼器來處理,因此只需要使用協同核心 足以應付。

 

以快速製程技術製造而成的主核心,可在較低工作電壓下運作於高時脈,能夠在不大幅增加動態功耗的情況下實現高性能,透過結合使用高性能主核心以及低 功耗協同運算,可變對稱式多處理技術不僅可以在活動待機狀態下實現超低功耗,而且能夠根據情況為這些需要高性能支援的行動應用提供峰值四核性能。此類應用 包括遊戲、網路瀏覽、 Flash 媒體以及視訊會議。

 

 協同運算核心主核心
架構Cortex A9Cortex A9
製程技術低功耗 (LP)普通 / 高速 (G)
工作頻率0 ~ 500MHz 0 ~ 1.3GHz

 

vSMP 可變對稱式多重處理技術

Tegra 3

 

NVIDIA 「 Tegra 3 」是首款採用 vSMP 可變對稱式多處理技術的行動 SoC 晶片,不僅大幅降低待機狀功耗,採用了基於硬體的管理,又採用了基於低級軟體的管理,可根據需求提供高性能 4 Cores 運算。

 

「 Tegra 3 」根據應用程式及作業系統的要求,能自動管理主核心及協同運算之間的運算調度,這工作是由 NVIDIA 研發的動態電壓與頻率擴展 (DVFS) 以及 CPU 熱插拔管理軟體實現,並不需要對作業系統及軟體重新編程。

 

當協同運算核心關閉後,管理邏輯單元繼續監控 CPU 的協同運算以及每一個主核心的負載,動態啟用或關 1 、 2 、 3 、 4 主核心。像電子郵件、基礎遊戲或簡訊等應用程式一般只需要四個主核心中之一就足夠,對硬體要求較高的應用程式,例如 3D 遊戲及媒體編輯, CPU 管理程式會開啟全部核心,以提供更高性能。

 

 vSMP 技術在不同頻率運行的核心之間,並不涉及快取記憶體同步補償問題,協同核心與主核心共用同相同的 L2 Cache ,通過對該 Cache 優化設計,「 Tegra 3 」處理器可以在幾十億萬分之一秒速度為由協同核心與主核心返回資料。

 

據了解, ASUS 將於 2011 年式推出首款採用 NVIDIA Tegra 3 處理器的 Eee Pad Transformer Prime 平板電腦,此外 HTC 也會於明年上半年推出採用 NVIDIA Tegra 3 處理器的 Smartphone 產品, NVIDIA 緊接於 2012 年推出效能比較「 Tegra 2 」提升達 10 倍,代號為「 Wayne 」新一代「 Tegra 」行動處理器。

 

Tegra 3Tegra 3
Tegra 3Tegra 3
圖為 Terga 2 ( 左 ) 與 Terga 3( 右 ) 在進行遊戲時的畫面效果分別

Tegra 3

文: Gary Ng/評測中心
分享到:
網友評論
本篇文章被 36501 人閱讀,共有 34 條評論
PC 級? atom 低頻單核?
4+1... 食電到暈都似
樓上
今次賣點係省電喎
又一人以為多核=哂電
無睇內文?佢會switch核架!
每次以超低功耗為賣點的產物,
介意提供一下在某個電池容量下能使用多少時間的情報嗎?
3至5樓,你認為呢粒Tegra 3會比Tegra 2省電咩?
在待機模式下我都覺得會,但overall黎講,一定食電到暈...
Tegra 3 的 3D graphics 效能大約只達 Apple A5 的 60%
講真, 咁嘅成績都幾醜吓!
多核=哂電
我唔信開盡4核會用得小電過單核
2014年 performance 上升100倍? XD
d smartphone 仲係用android2.2/2.3 not support multi-core(多核當單核)有鬼用咩
用曬四核都唔食電?

比廣告呃到了
成日打機咪大鑊
我寧願慢少少都唔想佢扯我電
係咪真係食電唔知啦,
但NV話8成時間只開啟低功耗果粒,
12小時VIDEO暫時信住先就唔發覺食得幾多電,
真係有產品出果時食電自然有人會嘈
T2已經吹了一次,Fans還信T3有奇蹟嗎?
老老實實,NV有心既就唔該POST埋SuperPI 1M result 先好講自己有幾勁
樓上CHING已經講左好多,效能與省電係根本的矛與盾問題,咁都攞黎吹?
樓上,使唔使跑埋3D mark11呀?
就快食晒ANDROID市場了~
太屈機
我諗樓上想NVIDIA 開埋pcmark vantage tim
即係14年先買好過
幾睇好呢個Kal-El,其實多核用電多過單核係正常嫁喎,
重點應該係放係就算唔玩game都會唔會係用咁多電先?
如果堅持用以前個角度睇『哂電』、4 + 1 vSMP 擺左出黎但硬是要expect主要時間係用4, 唔係用1。根本無得講...
正常人用一部handheld device, 部機、processor本身就唔應該經常full load, 好多application唔應該要求、唔需要用full speed去execute。就例如,好地地淨係睇document, powerpoint, excel, pdf, video, photo, fileExplorer ,或者拉動兩下個homescreen, app drawer, scroll下個file, facebook @background自己狂load - 點解要activate processor mid~full speed 去執行呢!? 為乜? 疾? - 可以optimize下source code嘛? 用accelerator會唔會effective一點? full load好哂電 - 首先今時今日有幾多full load係真正根據user需要而出現? 一個真正寫得好嘅handheld device OS加一部handheld device根本無今時今日嘅咁多processor full load situation 實施硬件管理排除一大堆無謂full load, is it okay?

Tegra 2 full load好嗮電, yes. 因為management 唔好, offload唔到無必要嘅full load、失控嘅app. 雖然handheld-use application processor design orientation not for full load for long, 所以designer應該要加硬件管理reduce full load occurrence.
我凈係知道,我用緊四核,部機永遠都用唔過25%,大部份時間粒U都係10%左右。。

咁,粒四核個TDP一定比P4高架喎,但同樣用途,P4要成70%負載。。
即係到底真正食電既,到底係P4定係四核先?
125W既25%係用電幾多,90W既70&係用電幾多,唔難計者,係嘛?

咁梗係啦,你見人地勁左,你又好努力咁扯行來用,鬼唔晒電乜?

都係好簡單既數學來者。。
睇到行SuperPI 1M result 個reply 笑左.
睇嚟要準備嗰行動電源先得!
很期待呀,如果不貴便入貨。
不如加強單核效能仲好啦~咁搞法,粒chips愈來愈大,愈來愈食電~!
無電咪換電囉,隻手廢架? 又要快又慳電,天真!嘈嘈嘈~~~~
果位初心者好on9,梗係唔知到雙核手機都好少挫倒一日,四核的話一日要換幾多次電.....你估似電腦加大(換)火牛watt數就得咩
上幾樓果個笑q死我,用P4同4核比果位人兄唔該答我:
1)P4一個時鐘做到幾多野???4核一個時鐘做到幾多野???
2)P4製程係幾多???果粒四核製程係幾多???
3)同樣架構製程下,i3@3.1ghz full load食電d,定係i5@3.3ghz 50%食電d????

Tegra2同Tegra3同樣係A9架構同40nm製程,但有2核同4+1核嘅分別

不過,雖然佢tegra3可以控制核數開關,但個clock speed其實唔同左,tegra3比tegra2高30-40%(4核係1.3ghz,單核可去1.4ghz)
如果tegra3開左2粒核之下,同tegra2比,大家full load....
因為tegra3時脈高d,所以係開2粒full load下會食電過tegra2 full load......
如果tegra3係28nm製程,我堅係會信佢慳電過tegra2
我堅信佢係超勁. NVIDIA要搶佔有率, 所以進程好快. 唔似intel同Qualcomm, 每年改少少, 但你要用無法. display card市場愈來愈細, 又無左入門級. handheld市場對nvidia即頭係生死關頭.

不過transformer prime最快都要復活假期吧, 其他device一定仲耐. 睇t3架構, 廠商要善用全部功能, 非要花不少功夫在firmware不可.
tegra 3 = superman
tegra 4 = batman
tegra 5 = wolverine
tegra 6 = ironman
全部都係DC漫畫主角。。。
大家都被蒙了,如果做好線程管理技術,1核可以快過10核,増效能、更省電,都是巿場信息吧了。邊個叫你相信多核一定好??!
t3的四核滿載,功耗是高通Q6 1.5GHZ雙核的4/5, (15XX VS 12XX)
雖說DIE SIZE好像很大, (110MM^2),但別忘了三星的4210也有118MM^2
待機TEGRA 3 和普通應用平均只有第二代TEGRA的1/3 耗電量
發表評論
僅限會員回應,請先登入。
用戶名 密碼