
為了讓電池續航力進一步提高,各大廠商均研發自家的節能技術,包括 AMD 與 NVIDIA 的 Switchable Graphics IGP/GPU 實時切換,只可惜此技術需要不僅令成本增加不少,更需佔用不少空間達成 MUX 線路,加上存在不少兼容性問題而未能普及。終於, NVIDIA 推出了全新「 Optimus 」技術,不僅低成本、高兼容性,而且可達成無縫實時切換,究竟此一技術關鍵為何 !?
自動、無縫的實時切換 全新 NVIDIA Optimus 技術
全新 NVIDIA Optimus 技術是節省成本又有效的聰明點子
第二代 Switchable Graphics 儘管已變得實用,但仍然不受到用戶注意,尤其是非專業用家的一般使用者,更是不願意付出更多的錢購買自已可能無法駕馭的技術,因此 NVIDIA 決定研發更智能、更先進的 GPU 省電技術,並命名為 NVIDIA Optimus 技術。
有別僅用硬體單純地透過切換顯示輸出線路,選擇在 IGP 或是 GPU 工作,而是以驅動程式層面把把需處理的所有 3D 渲染工作,交由 GPU 作出運算處理,但最終圖像輸出至屏幕的仍是 Intel IGP 處理器。因此 IGP 的只是被當作一個簡單的顯示控制器,但卻因此達成了無縫,無閃爍的經驗,沒有必要重新啟動,情況就如當年 3DFX 加速卡把 3D 工作完成,並以 2D 顯示卡作顯示輸出一樣。

NVIDIA Optimus 技術原理圖,透過 PCI-E 把 3D 渲染結果傳至 IGP
NVIDIA Optimus 技術不再需要額外的 MUX 線路, IGP/GPU 實時切換的架構成本大幅下降,僅在高負載的 3D 程序及需要 CUDA 運算時, GPU 才會從完全斷電的睡眠狀態自動醒過來,並在完成工作後自動關掉,一般使用下不會感到它的存在,而不太重負載的工作則會交由 Intel IGP 負責,令 Notebook 達至省電與高效能兼備的效果。
為達成 Optimus 架構, NVIDIA 的軟體工程師制作了由數 10 萬行序程所達成,完全符合 Microsoft API 及不同繪圖標準 API 的介面,以協議 Intel IGP 與 NVIDIA GPU 之間的分工,透過 PCI-E 的雙向設計,把運算及 3D 渲染結果傳送至 Intel IGP ,並沒有採用了非業界標準的序程,因此 NVIDIA Optimus 技術可以完美地融合於現有的繪圖軟件及 CUDA 軟件。
NVIDIA Optimus vs. Switchable Graphics Comparison
| Optimus Technology | Switchable Graphics | |
| Automatically Enable/Disable GPU | Yes | No |
| Instant Transition Time | Yes | No |
| No Screen Flicker during Transition | Yes | No |
| No Additional Components | Yes | No |
| Standard Industry API | Yes | No |

NVIDIA Optimus 技術不再需要 MUX 線路,成本與一般 Notebook 無異
有效減低延誤 NVIDIA 加入 Optimus Copy Engine
在全新的 NVIDIA Optimus 技術中,由於 IGP 和 GPU 是同是並存,兩者將負責不同的工作,與昔日採用硬體切換並獨立運作的原理並不相同,因為 GPU 必需要把完成的 3D 渲染資料傳送給 IGP 作顯示輸出,因此除了在 GPU 本地的 Framebuffer 需要存放顯示的資料外,同時亦會把顯示的資料抄送至系統記憶體給 IGP 作畫面輸出,這是一個非常浪費資源的動作,因此 NVIDIA 在 GPU 中入了全新的資料複製引擎,稱為「 Optimus Copy Engine 」 。
如果沒有 Optimus Copy Engine 的話, GPU 如果要把 3D 渲染的結果傳給 IGP 顯示,是需要把資訊複製給系統記憶體,讓 IGP 讀取並輸出至顯示屏,這是一個 Direct Memory Access 機制中的 mem2mem 寫入指令,但此舉有一個重大的缺憾,就是 GPU 需要等 Framebuffer 和系統記憶體完成同步化讀寫後,才有空讀取 Framebuffer 的資源進行下一幀畫面的渲染,導致 GPU 效能大幅下降。
為了解決此一問題讓 Optimus 技術得以實踐, NVIDIA 在新一代 40nm 的 GT200M 家族及未來的 GPU 架構中,入了 Optimus Copy Engine ,它代替了繪圖核心內的記憶體控制器,負責把 GPU Framebuffer 的資源直接拷貝至系統記憶體,讓 GPU 內的記憶體控制器可以專用負責 3D 渲染運算,不需要管 meme2mem 寫入動作。
而且 Optimus Copy Engine 支援雙向 PCI-E 傳輸技術,容許 3D 引擎在讀取系統記憶體的同時,亦可更新系統記憶體內的資料,這個非同步的 DMA 運作模式令資訊傳送更有效率並令 Optimus 技術不會令效能出現下降,是個十分聰明的設計。

圖左為傳統 GPU 的 DMA Access 設計,圖右為全新 Optimus Copy Engine 設計