苹果新 Speech 技术出击!34分钟4K视频转录仅需45秒,速度超OpenAI 55%

AI资讯2个月前发布 阿力
20 0

近日,科技媒体macstories通过一项实测,揭示了苹果公司全新推出的SpeechAPI的强大性能。通过转录一段长达34分钟、大小为7GB的4K视频,该技术仅用时45秒完成转录,速度之快令人惊叹。

这项技术的推出是在2025年WWDC全球开发者大会上宣布的,其中包括两个重要模块:SpeechAnalyzer和SpeechTranscriber。macstories团队使用了基于这些模块开发的Yap应用工具,对其转录性能进行了详细测试。结果显示,Yap在处理视频时展现出了显著的速度优势,远超目前市场上其他主流转录工具。

在与竞争对手的对比中,Yap完成转录所需时间为45秒,而OpenAI的Whisper(MacWhisperV3Turbo版本)则需要101秒,速度慢了55%。其他工具如VidCap和MacWhisperV2的转录时间分别为1分55秒和3分55秒,这进一步突显了Yap的优势。

尽管所有工具在专有名词识别方面存在一定误差,比如在转录“AppStories”时的识别不准确,但Yap的本地化运算能力使其在处理速度上具有无可比拟的优势。这意味着,如果用户每周处理多段视频,使用Yap将节省大量时间,提升工作效率。

苹果在转录技术领域的这一创新不仅提高了效率,也为创作者、教育工作者和内容制作者带来了便利。随着这项技术的普及,未来我们可能会看到更多企业在视频处理和内容生成方面的应用。总之,苹果的这项新技术标志着语音转录领域的一次革命,未来的内容生产将因其而变得更加高效与智能。

© 版权声明

相关文章

暂无评论

暂无评论...