Ollama 0.31 導入多 Token 預測技術,邊緣端執行 Gemma 4 效能提升近九成

邊緣端模型部署社群最近有很不錯的技術突破。開源模型執行框架 Ollama 正式發布 0.31 版本,針對蘋果生 … 閱讀全文 Ollama 0.31 導入多 Token 預測技術,邊緣端執行 Gemma 4 效能提升近九成