Edison Scientific 正式宣布推出名為 Kosmos 的新一代 AI 科學家系統,這是繼 FutureHouse 之前的 Robin 系統後的重大升級。Edison Scientific 作為從 FutureHouse 獨立出來的商業公司,將負責該平台的營運。Kosmos 的設計目標是解決過去 AI 科學家在合成大量資訊時面臨的瓶頸,透過架構的強化,使其能夠處理極大規模的科學文獻與複雜的推理任務,突破 LLM 過往上下文長度的限制。

突破 LLM 上下文限制的結構化世界模型
過去的 AI 科學家系統主要受限於語言模型的有限上下文長度。這導致 AI 在進行科學探索時,只能執行有限的步驟,一旦資訊量超出負荷,邏輯推理的連貫性就會中斷,限制了其發現複雜科學問題的能力。
而 Kosmos 的創新技術在於採用了結構化的世界模型。這項技術允許系統有效地整合來自數百個 AI Agent 軌跡中提取的資訊,並在長達數千萬個 Token 的長度範圍內,針對特定的研究目標保持推理的連貫性。
換言之 Kosmos 不再受限於傳統語言模型的記憶窗口,能夠進行需要長期記憶與複雜邏輯推演的研究任務,克服了過去模型在長期推理中容易迷失方向的問題。
在重現既有科學發現時,Kosmos 並非依賴最新論文或預印本作為提示來源,而是基於其模型可使用的既有資料與分析過程獨立推演,並最終得出與既有研究一致的結果,藉此證明系統具備可靠的推理與科學驗證能力。
單次執行可閱讀 1500 篇論文與 42,000 行程式碼
CyberQ 觀察,在實際運作的規模上,Kosmos 展現了驚人的資料處理能力。單次 Kosmos 的執行過程包含閱讀 1,500 篇學術論文,並執行高達 42,000 行的分析程式碼,這個規模遠超過目前市場上其他的 AI Agent。
這種大規模的資料吞吐量讓 Kosmos 能夠執行比前代 AI 工具更為精密的分析。根據測試用戶的評估,Kosmos 在一天內完成的工作量,相當於人類科學家平均 6.14 個月的研究工作。此外,其結論的準確率達到 79.4%。官方將其定位為一種深度研究工具或類似實驗室的試劑套件,而非一般的聊天機器人,專門用於針對高價值目標進行深入分析。
同時,Kosmos 的研究結論具備可審計性,每一項結果皆可追溯至特定的程式碼行或來源文獻,確保透明度與科學驗證標準。

橫跨生醫與材料領域 驗證七項科學發現與實際應用
為了證明系統的可靠性,Edison Scientific 在報告中詳述了 Kosmos 完成的七項發現。其中三項是獨立重現了人類科學家先前的發現,例如在低溫小鼠大腦中識別出核苷酸代謝是主要的改變途徑,以及在材料科學領域中,確認熱退火過程中的絕對濕度是決定鈣鈦礦太陽能電池效率的主因。
另外四項則屬於對科學文獻的全新貢獻。Kosmos 利用公開的 GWAS 和 pQTL 資料,提供了 SOD2 循環水平可能降低心肌 T1 時間並降低心肌纖維化的統計證據。在另一項針對阿茲海默症的研究中,Kosmos 分析了年輕與年老小鼠的單細胞轉錄組資料,發現內嗅皮層神經元隨年齡增長,其 Flippase 基因表現量降低,這可能導致細胞表面暴露特定信號,引發小膠質細胞的吞噬作用,進而導致神經元退化,這項發現隨後也在人類阿茲海默症患者的資料集中獲得驗證。
推論時間的擴展定律與未來展望
Kosmos 的研發團隊觀察到一個現象,即 AI Agent 所能完成的人類等效工作量,與其執行的深度呈現線性成長關係。這為科學研究領域提供了初步的推論時間擴展定律。
目前 Kosmos 已在 Edison Scientific 平台上開放使用,採用付費模式,單次執行的費用約為 200 美元。
本文題圖及配圖由 Google Gemini AI 生成









