gpu簡介及詳細資料
?GPU英文全稱Graphic Processing Unit,中文翻譯為“圖形處理器”。GPU是相對於CPU的壹個概念,由於在現代的電腦中(特別是家用系統,遊戲的發燒友)圖形的處理變得越來越重要,需要壹個專門的圖形的核心處理器。
主要特點GPU 是顯示卡的“大腦”,它決定了該顯示卡的檔次和大部分性能,同時也是2D顯示卡和3D顯示卡的區別依據。2D顯示晶片在處理3D圖像和特效時主要依賴CPU的處理能力,稱為“軟加速”。3D顯示晶片是將三維圖像和特效處理功能集中在顯示晶片內,也即所謂的“硬體加速”功能。顯示晶片通常是顯示卡上最大的晶片(也是引腳最多的)。現在市場上的顯示卡大多采用NVIDIA和 AMD-ATI兩家公司的圖形處理晶片。
今天,GPU已經不再局限於3D圖形處理了,GPU通用計算技術發展已經引起業界不少的關註,事實也證明在浮點運算、並行計算等部分計算方面,GPU可以提供數十倍乃至於上百倍於CPU的性能,如此強悍的“新星”難免會讓CPU廠商老大英特爾為未來而緊張, NVIDIA和英特爾也經常為CPU和GPU誰更重要而展開口水戰。GPU通用計算方面的標準目前有 OPEN CL、CUDA、ATI STREAM。其中,OpenCL(全稱Open Computing Language,開放運算語言)是第壹個面向異構系統通用目的並行編程的開放式、免費標準,也是壹個統壹的編程環境,便於軟體開發人員為高性能計算伺服器、桌面計算系統、手持設備編寫高效輕便的代碼,而且廣泛適用於多核心處理器(CPU)、圖形處理器(GPU)、Cell類型架構以及數位信號處理器(DSP)等其他並行處理器,在遊戲、娛樂、科研、醫療等各種領域都有廣闊的發展前景,AMD-ATI、NVIDIA現在的產品都支持OPEN CL。
1985年 8月20日 ATi公司成立,同年10月ATi使用ASIC技術開發出了第壹款圖形晶片和圖形卡,1992年 4月 ATi發布了 Mach32 圖形卡集成了圖形加速功能,1998年 4月 ATi被IDC評選為圖形晶片工業的市場領導者,但那時候這種晶片還沒有GPU的稱號,很長的壹段時間ATI都是把圖形處理器稱為VPU,直到AMD收購ATI之後其圖形晶片才正式采用GPU的名字。
NVIDIA公司在1999年發布GeForce 256圖形處理晶片時首先提出GPU的概念。從此NV顯示卡的芯就用這個新名字GPU來稱呼。GPU使顯示卡減少了對CPU的依賴,並進行部分原本CPU的工作,尤其是在3D圖形處理時。GPU所采用的核心技術有硬體T&L、立方環境材質貼圖和頂點混合、紋理壓縮和凹凸對應貼圖、雙重紋理四像素256位渲染引擎等,而硬體T&L技術可以說是GPU的標誌。
主要品牌
GPU有非常多的廠商都生產,和CPU壹樣,生產的廠商比較多,但大家熟悉的卻只有3個,以至於大家以為GPU只有AMD、NVIDIA、Intel3個生產廠商。
intel可能誰都想不到intel不但是世界上最大的CPU生產銷售商,也是世界最大的GPU生產銷售商。
intel的GPU在現在完全是集成顯示卡,用於intel的主機板和intel的筆記本。可能妳想不到,要是只按發售數量計算,intel隨著他主機板發售的集成GPU占據了整個GPU市場的60%以上。
Nvidia現在最大的獨立顯示卡生產銷售商,他的顯示卡包括現在大家熟悉的
Geforce系列,比如GTX580 GTX480 GTX470 GTX460 GTX295等,還有專業的Quadro系列等。
他也同樣銷售固化在主機板上的集成顯示卡,這些顯示卡隨著主機板壹起發售,但是由於AMD兼並ATI後自身主機板晶片能力提高,NV主機板已經失去了顯示卡界的半壁江山。
AMD世界上第二大的獨立顯示卡生產銷售商,他的前身就是ATI。他的顯示卡主要就是大家熟悉的HD系列,比如HD7970,HD7950,HD6970,HD6990等。在專業領域有FireGL系列
由於AMD收購ATI後,其主機板市場全面擴大,已經奪取了NVIDIA在AMD處理器主機板的全部份額。就發售量和發售盈利方面,AMD顯示卡方面仍然略輸於NVIDIA,不過兩者不相伯仲,差距只是幾個百分點。
Matrox當年和nv,ati壹起爭奪獨立顯示卡市場份額的壹家公司,在曾經的壹個時期Matrox的顯示卡和nv,ati曾經在性能上比肩過。但由於後來其開發能力日漸衰退,在GF5時期,也就是ati的9000系列時期,Matrox由於性能上整整落後了GF5900和Raden9800壹個世代而逐漸被淘汰,淡出了民用獨立顯示卡市場。
但現在Matrox仍然在工程用專業顯示卡方面有自己的地位。這些顯示卡用於工程主圖和多頭輸出仍然很強力。與nv和amd的專業顯示卡不同,nv,ati的專業顯示卡涉足的是3D領域,而Matrox得專業顯示卡涉足的是2D領域,也就是CAD。
但由於cuda的日漸普及,DX10以上顯示卡將在所有支持CUDA的程式上表現出驚人的性能,也就是說當CUDA在各種運用軟體普及的那天,Matrox也必將退出2D專業卡的市場。
sis和via硒統和威盛現在是對孿生兄弟,但他們曾經也是分開的兩家公司,並且都生產自己主機板的集成顯示卡。但這可憐的兩兄弟已經逐步在淡出主機板市場了,也就必定將淡出GPU市場。 由於GPU的利益多,也許以後也會誕生出新的廠商。
其他資料NVIDIA公司在1999年發布GeForce256圖形處理晶片時首先提出GPU的概念。GPU使顯示卡減少了對CPU的依賴,並進行部分原本CPU的工作,尤其是在3D圖形處理時。GPU所采用的核心技術有硬體T&L、立方環境材質貼圖和頂點混合、紋理壓縮和凹凸對應貼圖、雙重紋理四像素256位渲染引擎等,而硬體T&L技術可以說是GPU的標誌。 GPU 是顯示卡的“心臟”,也就相當於 CPU 在電腦中的作用,它決定了該顯示卡的檔次和大部分性能,同時也是2D顯示卡和3D顯示卡的區別依據。2D顯示晶片在處理3D圖像和特效時主要依賴CPU的處理能力,稱為“軟加速”。3D顯示晶片是將三維圖像和特效處理功能集中在顯示晶片內,也即所謂的“硬體加速”功能。顯示晶片通常是顯示卡上最大的晶片(也是引腳最多的)。現在市場上的顯示卡大多采用NVIDIA和AMD兩家公司的圖形處理晶片。
GPU能夠從硬體上支持T&L(TransformandLighting,多邊形轉換與光源處理)的顯示晶片,因為T&L是3D渲染中的壹個重要部分,其作用是計算多邊形的3D位置和處理動態光線效果,也可以稱為“幾何處理”。壹個好的T&L單元,可以提供細致的3D物體和高級的光線特效;只不過大多數PC中,T&L的大部分運算是交由CPU處理的(這就也就是所謂的軟體T&L),由於CPU的任務繁多,除了T&L之外,還要做記憶體管理、輸入回響等非3D圖形處理工作,因此在實際運算的時候性能會大打折扣,常常出現顯示卡等待CPU資料的情況,其運算速度遠跟不上今天復雜三維遊戲的要求。即使CPU的工作頻率超過1GHz或更高,對它的幫助也不大,由於這是PC本身設計造成的問題,與CPU的速度無太大關系。
工作原理簡單說 GPU 就是能夠從硬體上支持T&L(Transform and Lighting,多邊形轉換與光源處理)的顯示晶片,因為T&L是3D渲染中的壹個重要部分,其作用是計算多邊形的3D位置和處理動態光線效果,也可以稱為“幾何處理”。壹個好的T&L單元,可以提供細致的3D物體和高級的光線特效;只不過大多數PC中,T&L的大部分運算是交由CPU處理的(這也就是所謂的軟體T&L),由於CPU的任務繁多,除了T&L之外,還要做記憶體管理、輸入回響等非3D圖形處理工作,因此在實際運算的時候性能會大打折扣,常常出現顯示卡等待CPU資料的情況,其運算速度遠跟不上今天復雜三維遊戲的要求。即使CPU的工作頻率超過1GHz或更高,對它的幫助也不大,由於這是PC本身設計造成的問題,與CPU的速度無太大關系。
與DSP區別GPU 在幾個主要方面有別於 DSP (Digital Signal Processing,簡稱DSP(數位信號處理)架構。其所有計算均使用浮點演算法,而且目前還沒有位或整數運算指令。此外,由於GPU專為圖像處理設計,因此存儲系統實際上是壹個二維的分段存儲空間,包括壹個區段號(從中讀取圖像)和二維地址(圖像中的X、Y坐標)。此外,沒有任何間接寫指令。輸出寫地址由光柵處理器確定,而且不能由程式改變。這對於自然分布在存儲器之中的演算法而言是極大的挑戰。最後壹點,不同碎片的處理過程間不允許通信。實際上,碎片處理器是壹個SIMD資料並行執行單元,在所有碎片中獨立執行代碼。
盡管有上述約束,但是GPU還是可以有效地執行多種運算,從線性代數和信號處理到數值仿真。雖然概念簡單,但新使用者在使用GPU計算時還是會感到迷惑,因為GPU需要專有的圖形知識。這種情況下,壹些軟體工具可以提供幫助。兩種高級描影語言CG和HLSL能夠讓使用者編寫類似C的代碼,隨後編譯成碎片程式匯編語言。Brook是專為GPU計算設計,且不需要圖形知識的高級語言。因此對第壹次使用GPU進行開發的工作人員而言,它可以算是壹個很好的起點。Brook是C語言的延伸,整合了可以直接對應到GPU的簡單資料並行編程構造。經 GPU存儲和操作的資料被形象地比喻成“流”(stream),類似於標準C中的數組。核心(Kernel)是在流上操作的函式。在壹系列輸入流上調用壹個核心函式意味著在流元素上實施了隱含的回圈,即對每壹個流元素調用核心體。Brook還提供了約簡機制,例如對壹個流中所有的元素進行和、最大值或乘積計算。Brook還完全隱藏了圖形API的所有細節,並把GPU中類似二維存儲器系統這樣許多使用者不熟悉的部分進行了虛擬化處理。用Brook編寫的應用程式包括線性代數子程式、快速傅立葉轉換、光線追蹤和圖像處理。利用ATI的X800XT和Nvidia的GeForce 6800 Ultra型GPU,在相同高速快取、SSE匯編最佳化Pentium 4執行條件下,許多此類套用的速度提升高達7倍之多。
對GPU計算感興趣的使用者努力將演算法對應到圖形基本元素。類似Brook這樣的高級程式語言的問世使編程新手也能夠很容易就掌握GPU的性能優勢。訪問GPU計算功能的便利性也使得GPU的演變將繼續下去,不僅僅作為繪制引擎,而是會成為個人電腦的主要計算引擎。
識別軟體說起處理器識別工具 CPU-Z ,其知名度和必備度無需贅言。硬體網站TechPowerUp又給我們提供了壹個類似的工具,用於顯示卡識別的“GPU-Z”,支持XP/Vista/2000/2003。最新版本是2012年5月2日更新的0.6.2,檔案大小為1MB。
更新說明:
GPU-Z 0.6.2
修正NVIDIA 開普勒Boost工作頻率顯示問題
GPU-Z 0.6.1
新增支持GeForce605,NVIDIA GeForce GTX690,GTX 670, GT 640, GT 630,Quadro 3000M GTX 675M, GTX 670M。
新增支持AMD Radeon HD7970M,HD7450
新增支持英特爾Sandy Bridge和Ivy Bridge集成顯示卡
修正GK107 ROP偵測和顯示
改進對NVIDIA 開普勒Boost工作頻率檢測
修正在沒有安裝驅動情況下,AMD南方群島顯示卡GPU-Z崩潰問題
修正在Windows XP不能正常工作問題
禁用NVIDIA開普勒不完整BIOS儲存
BIOS檔案現在另外儲存為.rom
修正感測器圖表重繪,並提高其性能
相關問題第壹個問題:
GPU 的競爭遠比 CPU 的競爭來得激烈。通用PC的CPU就只有英特爾和AMD兩家大廠。而在GPU方面領先的是NVIDIA和AMD兩家廠商,但能生產中低端產品的還有英特爾、三星等好幾家廠商。它們的產品雖然不如前兩家,但在很多套用方面也能滿足使用者的需要,所以N記和A記只有拼命往前跑才不會死掉。CPU廠商沒有采用GPU的先進工藝是因為CPU廠商都有自己投資的生產線,不可能壹下把原來的生產線都淘汰了上新的生產線,那樣做可能連當初投入的資金都難以收回。而GPU廠商由於種種原因,壹般都是自己設計由別人代工的,比如找臺積電代工。代工廠商為了能接到業務,只有不停升級自己的生產設備,這樣才能生存下來。所以造成以上原因。
第二個問題
CPU除了處理遊戲的AI,情節等方面的資料外,對於有些圖像方面也是由它完成的。當微軟每次發布新的DX時,並不是每款GPU都能支持DX新的特征,所以有些圖像方面的任務還得由CPU來完成。還有有些特征比如重力特征以前是由CPU來完成,現在有些GPU也能支持了,這些任務就由GPU來完成了。
第三個問題
GPU相當於專用於圖像處理的CPU,正因為它專,所以它強,在處理圖像時它的工作效率遠高於CPU,但是CPU是通用的資料處理器,在處理數值計算時是它的強項,它能完成的任務是GPU無法代替的,所以不能用GPU來代替CPU。
另外
AMD在2006年以54億美元的巨資收購了ATI公司,AMD看到今後CPU和GPU只有走壹條融合的道路才能地競爭中占得先機。CPU和GPU如何配合默契才能最大地提高工作效率是AMD現在考慮的問題,也是英特爾的問題。
第四個問題
微軟發布Windows7 其中壹個顯著特征就是 聯合GPU和CPU的強大實力,提升GPU在硬體使用的價值,在Windows7中,CPU與GPU組成了協同處理環境。CPU運算非常復雜的序列代碼,而GPU則運行大規模並行應用程式。微軟利用DirectX Compute將GPU作為作業系統的核心組成部分之壹。DirectX Compute。它讓開發人員能夠利用 GPU的大規模並行計算能力,創造出引人入勝的消費級和專業級計算應用程式。簡單的說,DirectX Compute就是微軟開發的GPU通用計算接口,欲統壹GPU通用計算標準。也就是說windows7 以後GPU的硬體地位將僅次於CPU,發揮出更大的效用。英特爾發布的酷睿二代Sandy Bridge處理器集成的核芯顯示卡和AMD Llano APU已經將集成顯示卡提升到了壹個新的高度,英特爾下壹代Ivy Bridge處理器更是進壹步增強了核芯顯示卡的能力。