2 月 28 日消息,金融时报(FT)今天(2 月 28 日)发布博文,报道称深度求索(DeepSeek)将于下周发布全新多模态大语言模型 V4,原生支持图片、视频与文本生成功能。
这是 DeepSeek 自 2025 年 1 月推出 R1 推理模型以来的首个重大版本更新,有望进一步填补国内低成本、开源模型的市场需求。
援引博文介绍,在下周发布 V4 时,DeepSeek 计划同步公开一份简短的技术说明,并于约一个月后发布详尽的工程报告。
在硬件适配方面,消息称 DeepSeek 为国产算力提供深度支持,已联合华为和寒武纪优化 V4 模型的硬件适配,预估大幅提振本土半导体需求,并加速 AI 模型“推理”环节靠拢本土芯片。
相关阅读:
《DeepSeek 新论文剧透 V4 新框架:用闲置网卡加速智能体推理性能,打破 PD 分离瓶颈》
《消息称 DeepSeek V4 模型打破惯例:华为等国内厂商可早期访问,不让英伟达 AMD 先用》
《OpenRouter:中国 AI 模型 2 月全球 token 用量首超美国,MiniMax 等四款大模型霸榜前五》
《DeepSeek V4 Lite 原生多模态 AI 曝光:百万 tokens 上下文,非思考生图秒杀前代》
文章来源:
哈哈库
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至23467321@qq.com举报,一经查实,本站将立刻删除;如已特别标注为本站原创文章的,转载时请以链接形式注明文章出处,谢谢!