2 月 5 日消息,Mistral AI 当地时间昨日发布两款 Voxtral Transcribe 2 系列模型,包括面向批量处理的 Voxtral Mini Transcribe V2 和用于实时转录的 Voxtral Realtime,其中后者以 Apache 2.0 许可开放权重形式公开。
Voxtral Realtime 参数规模为 4B,专为对延迟要求严格的应用场景而设计,其采用了一种全新的流式架构,可在音频到达时立即进行转录,能将转录延迟压缩至 200ms 以下。
另一方面,Voxtral Mini Transcribe V2 拥有目前性价比最高的转录 API,准确率表现优于 GPT-4o mini Transcribe、Gemini 2.5 Flash,单次请求可处理长达 3 小时的录音。
这两款模型均支持包含中文在内的 13 种语言。定价上,Voxtral Mini Transcribe V2 的 API 价格为每分钟 0.003 美元,Voxtral Realtime 则为每分钟 0.006 美元。
文章来源:
哈哈库
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至23467321@qq.com举报,一经查实,本站将立刻删除;如已特别标注为本站原创文章的,转载时请以链接形式注明文章出处,谢谢!