天风世界剖析师郭明錤发文称,DeepSeek 爆红后,端侧 AI 的开展速度加快。DeepSeek 的盛行直接推进了英伟达 H100 练习需求的增加,标明优化的练习方法(可有用下降成本)可以影响商场,一起也再次证明了 CUDA 生态的竞赛力(用户为何挑选 H100)。
郭明錤剖析粗心如下:
台积电和英伟达估计,到 2026 年,端侧 AI(on-device AI)将迎来快速增加。台积电在财报电话会议上说到,2026 年端侧 AI 开展将愈加显着,而英伟达计划在 2025 年第四季度至 2026 年上半年量产其 AI PC 芯片 N1X / N1。
DeepSeek 爆红后,端侧 AI 的开展速度加快。
DeepSeek 的盛行直接推进了英伟达 H100 练习需求的增加,标明优化的练习方法(可有用下降成本)可以影响商场,一起也再次证明了 CUDA 生态的竞赛力(用户为何挑选 H100)。
更值得重视的是,DeepSeek 带动了本地大模型(LLM)布置的热潮。DeepSeek R1 经过优化练习方法,提升了本地设备上中小规划 LLM 的功能,而用户对云端 DeepSeek 服务的数据安全忧虑也加快了这一趋势。估计未来将有更多相似 DeepSeek 的开源模型面世,进一步推进本地 LLM 生态的开展。
现在,常见的本地 DeepSeek 布置方法包含:运用 LM Studio 进行快捷布置,Ollama 运转模型,4-bit / 8-bit 量化下降显存需求一起坚持功能,模型规划掩盖 15 亿到 700 亿参数,硬件规划从低端笔记本到搭载英伟达独立 GPU 的高端 PC。
现在,本地 DeepSeek 布置仍处于小众商场,对英伟达云端 AI 芯片的需求影响不大。但从长时间来看,虽然终端核算会部分代替云核算,它相同或许带来新的云端需求(相似 H100)。端侧 AI 和云端核算估计将同步增加,并终究构成一个交融的 AI 生态系统。
虽然长时间来看云核算增加仍具潜力,但端侧 AI 开展速度超出预期,或许会导致云核算增速短期内低于商场预期,并影响出资心情。未来,或许削减云核算增加不确定性的要素包含 GB200 NVL72 量产成功带动核算规划扩展,以及 AI 在机器人、自动驾驶和多模态范畴的商业化开展逐渐明亮。
就台积电和英伟达而言,台积电仍是端侧 AI 开展的首要获益者(获益于芯片晋级),而英伟达在端侧 AI 商场面对的竞赛压力远超云核算商场,或许影响短期出资决心。