隨著人工智慧(AI)模型日趨複雜,其背後龐大的運算需求與驚人的能源消耗,已成為半導體產業無法迴避的挑戰。然而,一項突破性的發展可能為此帶來解答。美國佛羅里達大學為首的優秀團隊成功開發出一款新型電腦晶片,它捨棄了傳統的電子訊號,改用「光」來執行 AI 中最為耗電的運算任務,能源效率(Energy Efficiency)驚人地提升了 10 到 100 倍。
AI 的核心瓶頸:卷積運算
當前 AI 系統,尤其是在圖像識別、影像分析和自然語言處理等領域,極度依賴一種名為「卷積」(Convolution)的數學運算。這項運算是神經網絡(Neural Network)理解和分析數據的基礎,但同時也佔用了大量的運算資源和電力。傳統的電子晶片在處理這些密集型任務時,會產生高溫並消耗不少能源,成為 AI 算力擴展的主要障礙。
以光取代電:光學運算的實現
為了解決這個難題,由佛羅里達大學教授 Volker J. Sorger 領導,並與加州大學洛杉磯分校(UCLA)、喬治華盛頓大學合作的研究團隊,首次將光學運算(Optical Computation)成功實現在 AI 神經網絡晶片上,這款創新的光學 AI 晶片運作原理如下:
資料光學化:首先,將機器學習的資料轉換為雷射光訊號。
光學卷積:晶片上整合了雷射以及數組微小的「菲涅耳透鏡」(Fresnel lenses)。這些二維透鏡的尺寸僅有人類髮絲的一小部分,可以直接在電路板上製造。雷射光訊號穿過這些特殊設計的透鏡陣列,便能以極低的功耗完成複雜的卷積運算。
訊號數位化:光學運算完成後,結果會被轉換回數位電子訊號,供 AI 系統的後續步驟使用。
這項技術最巧妙之處在於,它利用了光學物理的特性來執行數學運算,繞過了傳統電子電路中因電阻而產生的能量損失。值得注意的是,這與今年也在 SEMICON Taiwan 2025 展覽中有展出,大家熟知的「矽光子」(Silicon Photonics)技術有所不同。傳統的矽光子主要利用光來進行高速的「資料傳輸」,以解決晶片間的通訊瓶頸;而這項新技術則是更進一步,直接利用光來進行核心的「運算」任務,從根本上改變了計算的模式。
實測表現與未來潛力
在針對手寫數字的辨識測試中,這款光學晶片原型達到了約 98% 的準確率,其表現與當今主流的傳統電子晶片不相上下。然而,其最大的優勢在於能源效率。而除了讓業界高度關注的功耗降低,光學運算其實還具備其他優勢:
首先就是速度優勢,光的傳輸速度是電子在導體中移動無法比擬的,這為未來實現更高速的 AI 運算增加了更多的可能性。
其次是平行處理,我們可以透過使用不同顏色(波長)的雷射光,該晶片能夠同時處理多個資料流,進一步提升了運算通量(Throughput)。
該研究團隊指出,這項發表於《Advanced Photonics》期刊的研究 Near-energy-free photonic Fourier transformation for convolution operation acceleration,證明了晶片級光學技術的可行性與巨大潛力。隨著像 NVIDIA 這樣的晶片大廠已經在其 AI 系統中整合光學元件(例如用於資料傳輸的光模組),未來要將這種新型的光學卷積核心整合到現有的 AI 晶片架構中,整體的技術整合路徑將會比以往順暢。

(Figure Credit :Advanced Photonics, Vol. 7, Issue 5 ,上面這張圖是論文中提到的,執行卷積操作的概念構成了許多機器學習演算法的基礎。以左圖 (a) 來看,SC、FEC 和 FOC 在計算複雜性方面,使用光學晶片可以降低複雜度,可以藉由 FOC 降低耗電與成本,光子製程在此能實現基於晶片的解決方案。右邊圖的 (b) 的部分,FOC 可以藉由光學去生成組合輸入訊號和核心的傅里葉轉換,並進行強度偵測,在訊號和核心之間產生相關性。如果和經典的 4F 光學系統相比,這種新的方法 JTC 採用更少的元件,簡化了結構,並提高系統穩定性,更重要的,是降低了製造的難度。)
研究論文的內容後,可以發現這張圖很清楚地表現這項技術的優點,首先來看左邊的部分:
(a) 卷積運算方法與計算複雜度比較
這部分比較了三種實現卷積運算的方式,重點在於它們的計算複雜度,也就是運算量隨著資料大小變化的趨勢。
空間域卷積 (Spatial Convolution)
方法:這是最直觀的方式。如圖所示,一個小的「核心 (kernel)」(圖中的 k) 在一個大的輸入資料(如 N×N 的圖片)上滑動,並在每個位置進行乘加運算。
計算複雜度:O(N2k2)。這表示計算量會隨著輸入大小 (N) 和核心大小 (k) 的平方增長,效率較差。
傅立葉域電子卷積 (Fourier Electric Convolution)
方法:利用「卷積定理」,先將輸入資料和核心透過傅立葉轉換(使用數位晶片)變換到頻率域,在頻率域中直接相乘,再轉換回空間域。這個過程通常使用快速傅立葉轉換 (FFT) 演算法。
計算複雜度:O(N2logN)。效率遠高於空間域卷積,是目前數位電腦中常用的方法。
傅立葉域光學卷積 (Fourier Optic Convolution)
方法:利用透鏡 (lens) 本身就能執行傅立葉轉換的物理特性,用光學方式來完成運算。光在傳播通過透鏡時,其行為就等同於進行了一次二維傅立葉轉換。
計算複雜度:O(N2)。從擴展性來看,這是三者中效率最高的,因為光的並行處理特性讓運算幾乎是瞬間完成的。
圖 (a) 的核心概念是,利用光學晶片進行傅立葉卷積 (FOC) 可以大幅降低運算的複雜度,為高效能運算提供了一個潛在的解決方案。
至於右邊的圖,主要是講 JTC :
(b) 聯合轉換相關器 (Joint Transform Correlation, JTC)
這部分介紹了實現上述「傅立葉域光學卷積 (FOC)」的一種具體架構,稱為聯合轉換相關器 (JTC)。
運作流程如下:
聯合輸入:將信號 (Signal)(例如一張高跟鞋的圖片)和核心 (Kernel) 並排放在同一個輸入平面上。
第一次傅立葉轉換:用一個透鏡對這個聯合輸入進行光學傅立葉轉換。
強度偵測:在焦點平面上,用感光元件(如相機感測器)記錄下光的強度 (Intensity) 分佈。這個步驟在數學上相當於取傅立葉轉換結果的絕對值平方 (⋅)2。
第二次傅立葉轉換:再用另一個透鏡對這個強度圖案進行一次傅立葉轉換。
輸出結果:在最終的輸出平面上,會同時得到三種訊號:
自相關 (Auto-Correlation):位於中心的亮點,是信號與自身、核心與自身的相關結果。
互相關 (Cross-Correlation):位於中心點兩側的訊號,這就是我們真正想要的信號與核心之間的相關運算結果(在特定條件下等同於卷積結果)。
JTC 的優勢:相較於傳統的 4F 光學系統(另一種光學卷積架構),JTC 的組件更少、系統架構更簡單、穩定性更高,且在晶片製造上也更容易實現。
CyberQ 觀察,這項研究不僅是一次學術上的突破,更為 AI 硬體的未來發展提供了另一個明確的方向,也就是以光為重心的資料傳輸技術,由光子主導、更高效、更快速的 AI 運算時代,儘管還需要數年才會實現,但確實是一個不錯的新方向。
本文首圖為 Google Gemini AI 所生成的概念意象