3月1日消息,据国外媒体最新报道,DeepSeek计划于下周正式发布全新的多模态大语言模型V4版本。
这款备受期待的新模型将原生支持图片、视频以及文本的生成功能。这也是DeepSeek自今年1月推出R1推理模型以来的首次重大版本迭代,有望进一步填补国内低成本开源模型的需求。
然而,比技术升级更引人注目的是DeepSeek在这一版本测试阶段采取的特殊举措。据知情人士透露,DeepSeek已经向包括华为在内的国内硬件供应商提供了V4模型的测试权限。
令人意外的是,DeepSeek此次打破了行业惯例,并未向英伟达和AMD这两家全球领先的芯片供应商提供预发布版本的访问权限,这一策略在业内引发了广泛讨论。
在人工智能开发领域,开发者通常会与领先的芯片制造商共享模型预发布版,以确保软件能在主流硬件上高效运行。DeepSeek此前也曾与英伟达技术团队保持过紧密合作。
此次DeepSeek选择优先支持国产硬件,却将英伟达和AMD拒之门外,背后的策略考量非常耐人寻味。
通过这种差异化的授权方式,以华为为代表的中国芯片制造商能够获得宝贵的领先时间。他们可以提前数周针对自家处理器进行软件层面的深度优化,从而在模型适配与运行效率上占据先机。
文章来源:
哈哈库
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至23467321@qq.com举报,一经查实,本站将立刻删除;如已特别标注为本站原创文章的,转载时请以链接形式注明文章出处,谢谢!