網頁

2026年5月31日 星期日

計算機硬體架構簡介(Introduction to Computer Hardware Architectures)-2026




image source:Google Gemini,X Grok

目前的硬體架構正處於一個「三強鼎立」與「異構計算」並行的時代。除了單一的 CPU 架構,現在主流的系統(尤其是 AI 領域)通常會結合多種不同的核心來達成最高效率。

以下是截至 2026 年的主流架構分析:

1. 三大 CPU 指令集架構 (ISA)

x86 (複雜指令集 CISC)

  • 代表廠商: Intel (Xeon, Core), AMD (EPYC, Ryzen)

  • 特點: 歷史悠久,軟體相容性最強。擅長處理複雜的運算任務與高效能桌面運算。

  • 現況: 雖然在能效比(Performance per Watt)面臨挑戰,但透過「混合架構」(效能核 P-core + 能效核 E-core)與先進封裝,依然統治著高效能 PC 與傳統伺服器市場。

ARM (精簡指令集 RISC)

  • 代表廠商: Apple (M系列), NVIDIA (Grace), Qualcomm, AWS (Graviton)

  • 特點: 省電、低功耗。

  • 現況: 已經從手機領域全面進入筆電與雲端資料中心。ARM 架構現在是許多 AI 雲端服務的首選,因為其高能效比可以大幅降低資料中心的電力成本。

RISC-V (開源指令集)

  • 代表廠商: SiFive, 晶心科技 (Andes), 許多新創 AI 晶片商。

  • 特點: 開源且免授權費,具備高度可客製化性。

  • 現況: 在「邊緣運算」(如智慧家電、車聯網)與中國市場普及極快。它是 AI 時代的黑馬,許多廠商利用 RISC-V 模組化特性,開發專門處理 AI 矩陣運算的自研指令。


2. AI 專用核心架構

現在的晶片很少單打獨鬥,通常是「異構計算」(Heterogeneous Computing),包含以下核心:

核心類型

名稱

擅長領域

代表範例

GPU

圖形處理器

大規模並行計算AI 訓練、深度學習)

NVIDIA H200/B200, AMD MI300

NPU

神經處理單元

端點設備 AI 推理(如手機、AI PC 的即時翻譯、美圖)

Apple NPU, Intel AI Boost, Qualcomm Hexagon

TPU

張量處理單元

專門針對張量 (Tensor) 運算優化的 ASIC

Google TPU v6

LPU

語言處理單元

極速推理(專門優化 LLM 大語言模型的讀取速度)

Grog LPU



3. 2026 年的趨勢:AI 進入 CPU

傳統上 CPU 負責邏輯調度,GPU 負責 AI 運算。但現在的趨勢是 CPU + NPU

  • AI PC 的崛起: 現在你買到的主流 CPU(如 Intel Core Ultra 或 AMD Ryzen 9000 系列),內部都整合了專門的 NPU 核心。這意味著簡單的 AI 任務(如模糊視訊背景、語音轉文字)不需要啟動耗電的 GPU,由CPU 內的 AI 核心就能完成。

  • 統一記憶體架構 (UMA) 如 Apple 的 系列或 NVIDIA 的 Grace Hopper,讓 CPU 和 GPU 共用同一塊高速記憶體,解決了數據在不同處理器間搬運產生的延遲瓶頸。

小總結: 
  • 追求極致效能與遊戲:選 x86
  • 追求省電與行動力:選 ARM
  • 追求客製化與開發彈性:選 RISC-V 
  • 執行 AI 模型:目前還是 GPU 與 NPU 的天下

以常見的·曼電腦的設計為例,系統架構設計包括了:

  • 指令集架構Instruction set architecture;簡稱ISA):被視為一種機器語言,包含了許多相關的指令集(記憶體定址、處理器控制,暫存器控制等等……)。

  • 微系統架構/微架構Microarchitecture)或稱電腦組織(Computer organization):是更詳細的敘述系統內部各元素如何進行合作與溝通。

  • 資料表示,即硬體能直接辨識和處理的資料類型和資料格式。

  • 定址方式,包括最小定址單位和位址運算等。

  • 暫存器定義,包括運算元暫存器、變址暫存器、控制暫存器等的定義、數量和使用方式。

  • 指令系統,包括機器指令的操作類型和格式、指令間的排序和控制機制等。

  • 異常機制,包括中斷、NMI和內部異常等。

  • 機器工作狀態的定義和切換,如管態和目態等。

  • 輸入輸出結構,包括處理機、記憶體與輸入輸出裝置之間的連接方式、資料傳送方式、資料流量、以及資料交換過程的控制等。


以下是清晰的比較資訊圖,涵蓋主要差異:
項目
x86
ARM
RISC-V
指令集類型
CISC(複雜指令集)
RISC(精簡指令集)
RISC(精簡指令集)
開放性
封閉(Intel/AMD 專有)
半開放(需授權)
完全開放源碼(免授權)
功耗
較高
低(高效能/瓦)
極低(可高度客製)
主要應用
個人電腦、伺服器、工作站
手機、平板、嵌入式、筆電
嵌入式、AI、IoT、客製晶片
性能特色
單執行緒強、相容性極佳
多核心效率高、移動端強
高度可擴展、客製化靈活
主要廠商
Intel、AMD
Apple、Qualcomm、MediaTek
SiFive、Alibaba、Western Digital
優點
軟體生態最完整
功耗低、生態成熟
免授權費、自由客製
缺點
功耗高、成本較高
需支付授權費
生態系尚在發展中

Reference

Google Gemini

Multi-Lingual Wikipedia


沒有留言: