輝達最新：GeForce RTX 50 搭載 DeepSeek 加速推理模型在 PC 電腦本地運行

8 小時前

美中 AI 大戰持續燃燒，當川普選擇了 OpenAI 做為戰略夥伴時， DeepSeek 忽然異軍突起空降全球，其中的核心競爭力「推理模型」依然是靠著輝達的 GPU 馬力加速完成，迅速全面打臉所有認為輝達 GPU 已要被取代的新聞。

輝達官方部落格揭露 DeepSeek-R1 模型可讓開發團隊在保有客戶隱私的前提上運行複雜難解的數學和程式碼，輝達GeForce RTX 50 系列的 GPU 以每秒 3,352 兆次運算的馬力加速運行 DeepSeek 推理模型。

新型態的推理模型讓 AI 思考與反饋

Reasoning Models (推理模型) 是種新型態的大型語言模型，AI 會像人類一樣花費時間「思考」並對錯誤做出「反饋」，所以被命名為「推理」。就像人類解決問題一樣， AI 透過更多思考、理解與反饋解決問題。推理模型可了解使用者的深度需求，並允許 AI 對模型的思考過程提供回饋，進一步增強使用者體驗，並可解鎖 AI 代理工作流程，進而解決複雜的多步驟任務，例如市場分析研究、複雜的數學問題或程式碼等等。

DeepSeek 推理模型可在輝達的 RTX AI PC 本地快速運行

DeepSeek-R1 系列精簡模型為基於擁有 6,710 億個參數的大型專家混合 (MoE) 模型。 MoE 模型由多個較小的 Expert Models 專家模型組成，用於解決複雜問題。 DeepSeek 模型進一步分配工作並將子任務分配給較小的專家群組。

DeepSeek 採用一種名為 Distillation (蒸餾)的技術，就像是製造威士忌一樣，可將大部分的酒精經過蒸餾技術蒸發掉留下精萃，大型 DeepSeek 6,710 億個參數模型中可蒸餾出六個較小的學生模型，參數範圍從 15 億到 700 億個不等，由大的 DeepSeek-R1 6710 億參數模型將推理能力「傳授」給較小的 Llama 和 Qwen 學生模型，從而產生了功能強大但較小的推理模型，並在輝達 RTX AI PC 本地快速運行。