DeepSeek-V4 预览版发布

百万上下文窗口：支持 100万 Token 上下文（约50-75万汉字，相当于几本长篇小说或整个大型代码库），实现超长文本/全书级分析、复杂代码库一次性处理。
参数规模与架构：定位万亿参数（完整版约1-1.6T，Lite版更轻量），采用 MoE（混合专家）+ Engram 条件记忆等创新架构，实现“记”与“算”分离，长上下文检索高效、成本可控。
原生多模态：原生支持文本+图像+视频等多模态推理/生成，尤其在复杂 SVG 生成等高难度任务上表现突出。
性能与优化：性能超越主流在线模型；优先适配华为昇腾芯片，深度优化国产算力；推理效率提升显著（DualPath、DSA 等技术支持）。
预览版现状：轻量预览版（代号 sealion-lite / 海狮）已启动闭门内测，迈入“百万上下文普惠时代”，API 已部分升级支持百万 Token。

DeepSeek-V4 预览版：迈入百万上下文普惠时代

暂无评论