2012年2月1日 星期三

AMD技術長:處理器將走向異質系統架構

文章出處:電子工程專輯
http://www.eettaiwan.com/ART_8800660387_622964_NT_409e1781.HTM?click_from=8800090178,8610866762,2012-02-02,EETOL,ARTICLE_ALERT

AMD技術長:處理器將走向異質系統架構


超微(AMD)公司副總裁暨終端部門技術長 Joe Marci 稍早前表示,簡化平行運算的編程,同時讓軟體工程師能盡情發展他們的想像力,是這家公司下一個要追求的聖杯。

在稍早前的 DesignCon 大會上,Marci表示,AMD的工程師目前正在努力的目標,是讓今天的CPU程式設計師們都能運用異質系統架構(heterogeneous systems architecture, HSA)開發該公司的加速處理單元(APU)。

Marci表示, HSA 結合了 CPU 上的純量處理和 GPU 上的平行處理能力,同時能在更低功耗下提供更高的記憶體存取頻寬。他同時指出,硬體編程必須更加簡單,而且還必須更容易達到最佳化和負載平衡,但這一切都極具挑戰性。

儘管這些任務看起來困難重重,但Macri表示,硬體開發人員們並不需要重頭開始,因為憑藉著該公司超過40年的處理器開發經驗,工程人員可以開發出一種極具擴展力的系統。

Macri也指出,不斷地思考並完善硬體設計,也將使軟體開發人員能更自由地運用硬體來進行開發。“軟體工程師就像是現代的米開朗基羅,”他表示,AMD對HSA架構的期許,就是要讓軟體開發人員能更專注地進行開發,實現他們的願景。

“如果在軟體開發過程中還必須考慮到硬體,將會抑制這些工程師的創造力或想像力,”他說。

請按此觀看:AMD CTO Joe Marci的訪談視訊

當然,所謂的‘願景’也不斷在產生變化,如最近一段時間以來,人們與電腦的互動方式產生了很大改變,如迅速崛起的手勢觸控等。

"You need fixed function lower power and to immerse people in the experience," said Macri, noting that doing so would take incredible amounts of parallelism.

“你需要能在低功耗下執行的功能,而且還要為消費者提供良好的使用經驗,”Macri說。而這將需要極大的並行處理能力。



AMD將CPU和GPU融合在單一晶片而成的APU僅僅是個開端,Macri說,而未來的APU則將再納入HSA,他同時希望能儘快HSA成為業界標準。

“標準有助於建構完整的生態系統,讓所有廠商在公平的環境中競爭,”他解釋道,AMD正在推動真正開放和實際上的標準,讓整個產業都可以使用。

“時間會證明,開放標準終將獲得勝利,”Macri說,因為軟體開發人員也希望他們的應用程式能在多個硬體廠商提供的平台上執行。

Macri認為,所謂的“架構時代”(architected era)將包含完整的C++,並使用GPU作為協處理器。它還涉及統一的一致性地址空間、任務平行運行、巢狀資料平行編程、使用者模式調度、搶占(pre-emption)和環境切換等。

“今天,我們開發的每一種設備,都受到一定的功率限制,因此,動態功率平衡是至關重要的,”他表示。

同樣地,在GPU中使用可尋址記憶體也代表著向前跨出了一大步,Macri說。儘管一致性並不能確保元件執行得更快,但卻能讓軟體開發人員更加專注於他們的領域。

並非取代OpenCL
Macri進一步指出,HSA也不會取代OpenCL,相反地,HSA將會是為OpenCL最佳化的一種平台架構。“如果你想寫OpenCL,這將會是一種能讓OpenCL執行得更好的硬體。”

事實上,在HSA上使用OpenCL將能避免不必要的拷貝,並具備低延遲調度、改善記憶模型,以及能在CPU和GPU之間分享指針等優勢,他說。

此外,HSA也為那些希望能在最後階段進行控制並調整性能的開發者提供較低層的編程介面,同時,經過最佳化的庫也可以選擇這些較低層的介面。

今天的命令和調度流程步驟都太多了,Macri認為這很浪費,因為用了這麼多開銷,卻僅能執行部份功能。

他指出,在採用HSA之後,應用程式便能直接進入硬體佇列,不需要多餘的驅動器。“沒有API來處理這些,也沒有核心模式驅動器,更沒有軟體佇列,只要直接存取硬體就好了,”他解釋道。



但重點是要切換運算,而不是搬移資料。今天,所有的處理器都同時執行串列和平行核心,每個核心都應該能以不同的性能水準運作,而且也應該很容易編程。其架構必須能支援以編程模式為基礎的大規模資料集和任務,但同時維持開放性。


“未來的晶片架構路徑非常明確,”Marci說。“這條道路將從建構在對稱多處理器(SMP)系統上的可編程模式朝異構領域轉移。這種架構將會是開放的,它將擁有公開規格和開放原始碼軟體堆疊,異質核心將能運用一致性記憶體良好地相互運作,且延遲極低,也不會有軟體相沖問題。

不過,Macri也表示,這個願景恐怕不會很快來到。

編譯: Joy Teng
(參考原文: AMD's CTO talks heterogeneous systems architecture ,by Sylvie Barak)

沒有留言:

張貼留言