百万上下文窗口:支持 100万 Token 上下文(约50-75万汉字,相当于几本长篇小说或整个大型代码库),实现超长文本/全书级分析、复杂代码库一次性处理。
参数规模与架构:定位万亿参数(完整版约1-1.6T,Lite版更轻量),采用 MoE(混合专家)+ Engram 条件记忆等创新架构,实现“记”与“算”分离,长上下文检索高效、成本可控。
原生多模态:原生支持文本+图像+视频等多模态推理/生成,尤其在复杂 SVG 生成等高难度任务上表现突出。
性能与优化:性能超越主流在线模型;优先适配华为昇腾芯片,深度优化国产算力;推理效率提升显著(DualPath、DSA 等技术支持)。
预览版现状:轻量预览版(代号 sealion-lite / 海狮)已启动闭门内测,迈入“百万上下文普惠时代”,API 已部分升级支持百万 Token。

DeepSeek-V4 预览版:迈入百万上下文普惠时代
即刻体验顶级长文本记忆能力,模型配置选择更灵活
mp.weixin.qq.com
登录后评论