隨著生成式人工智慧在程式碼編寫領域展現出強大實力,開發者們開始將目光投向更具挑戰性的空間幾何建構任務。近日,3D 建模平台 ModelRift 發布了一項有趣的實際測試,要求市場上主流的 AI 程式開發工具利用 OpenSCAD 語言,純粹依據兩張 2D 參考圖片,建構出歷史悠久的羅馬萬神殿 3D 模型。這場測試不僅檢驗了各家模型的幾何判斷力,更揭示了自動化空間程式碼的最新技術分水嶺。
萬神殿之所以被選為本次基準,主因在於其完美的幾何結構。這座建築融合了大型圓形穹頂、穹頂中央的採光圓窗、矩形門廊以及井然有序的柱列,辨識度極高,恰好落在 OpenSCAD 最擅長的布林運算與放射狀對稱處理範圍內。

之前去羅馬看萬神殿時就很感受到建築的美感和幾何的美好。

筆者在萬神殿拍攝的美麗圓頂。
相較於讓 AI 透過複雜的圖形介面去操作 Blender 等軟體,OpenSCAD 這種將幾何體直接轉化為純文字程式碼的特性,顯然更契合語言模型的推理邏輯。開發者可以直接命令模型執行在特定半徑上重複排列二十八根柱子,或是從穹頂數學式中減去圓窗,讓幾何形狀成為可審查、可重現的文字成果,這也是當前 3D 列印社群大量採用 STL 或 3MF 格式時所偏好的處理方式。

在參與測試的傳統強權中,各家工具展現出截然不同的執行風格。以快速開發著稱的 Cursor 搭配 Composer 雖然展現了極高的反應速度,然而其產出的萬神殿模型在比例、色彩管理與建築細節上都顯得較為粗糙,僅能作為初步的草稿。相比之下,Anthropic 的 Claude Code 搭配 Sonnet 4.6 雖然在實作速度上落後,卻展現了最均衡的整體結構與清爽的建築輪廓。
另一個值得注意的現象出現在 OpenAI 體系的 Codex 5.5 High,該模型展現了極高密度的細節捕捉能力,甚至在建築前端精準雕刻出歷史著名的銘文,但可惜在最終導出實體網格檔案時發生幾何干涉錯誤,導致最終成果受到影響。這也點出了當前自動化空間建構遭遇的核心問題:在預覽畫面上呈現的最佳化視覺效果,並不等同於最終導出的實體模型完全正確。
這場測試中最令人驚艷的轉折,來自於 Google 在 Google I/O 2026 大會上剛推出的全新技術組合。根據 Google 官方發布的 Antigravity 2.0 ,這款全新打造的桌面應用程式徹底翻轉了過往以編輯器為核心的開發邏輯,轉而採用由代理程式主導的全新架構。
配合隨之登場的 Gemini 3.5 Flash 技術說明文件 提到的代理與反覆週期測試能力,這套系統在萬神殿測試中拿下了完全自主生成的最高分。Gemini 3.5 Flash 高度發揮了其在空間處理上的潛力,它不單單只是觀察圖片,而是主動線上搜尋萬神殿的真實建築尺寸資料,並將其轉化為精確的參數。它不僅成功重現了萬神殿內部最知名的五層、每層二十八個方形藻井穹頂圖案,更貼心地編寫了剖面檢視切換功能,將自動化生成的品質推向全新高度。
CyberQ 觀察,儘管尖端模型在自主生成上取得了長足進步,ModelRift 的實驗也確認了現階段人機協同的不可或缺性。透過將 Gemini Flash 3.0 導入其特有的視覺標註編輯器,人類使用者可以直接在瀏覽器渲染圖上畫出紅箭頭或標註錯誤,引導 AI 進行精準修改。這種協同反覆的流程雖然花費雙倍時間,卻能有效修正自主生成時容易忽視的柱列錯位或穹頂比例問題。
正如 ModelRift 評測專文 所總結的觀點,空間幾何的修正用文字描述往往非常抽象,而直觀的視覺回饋正是克服現階段全自動化生成瓶頸的關鍵鑰匙。







