科技媒体macstories发布了一篇关于苹果新推出的SpeechAPI的博文,引发了业界的广泛关注。通过对一段时长34分钟、大小达7GB的4K视频文件进行转录测试,结果显示,苹果的新SpeechAPI仅耗时45秒,速度远超其他同类工具。相较之下,OpenAI的Whisper转录时间为101秒,苹果的技术优势可见一斑,提升了约55%的效率。
苹果在2025年全球开发者大会WWDC上
在具体的测试中,媒体使用了基于新模块开发的Yap应用进行转录。通过对比不同工具的表现,Yap以45秒的快速转录时间,成为了市场上表现
虽然所有测试工具在识别专有名词时都出现了一定误差,比如“AppStories”的识别,但Yap在本地化运算上的优势,确保了其在处理多段视频时的效率更为显著。通过计算每周处理多段视频所节省的时间,用户可以显著提高工作效率。
这项技术的快速发展,不仅为视频内容创作者提供了便利,也为后续的应用场景拓展奠定了基础。未来,随着AI技术的不断演进,苹果在语音识别领域可能会推出更多创新的解决方案,进一步提升用户体验。
划重点:
🌟苹果新SpeechAPI转录34分钟4K视频仅需45秒,速度超越竞争对手。
⏱️与OpenAIWhisper相比,苹果技术提升了约55%的效率,表现显著。
📈本地化运算优势使Yap在多段视频处理上效率更高,为用户节省大量时间。