Cerebras 推理 API 全面开放,开发者每日获百万免费 Token

AI资讯4个月前发布 阿力
47 0

2025年6月2日,人工智能芯片公司CerebrasSystems宣布,其推理API现已对所有开发者全面开放,取消了此前的等待名单限制。这一举措标志着Cerebras在加速生成式AI应用开发方面迈出了重要一步,为全球开发者提供高效、快速的AI推理服务。

据Cerebras官方声明,开发者每日可免费获得100万个Token的使用额度。这一免费配额为开发者提供了充足的资源,用于构建和测试基于Cerebras推理平台的高性能AI应用。

Cerebras表示,其推理API在速度上显著优于传统GPU解决方案,推理速度可达GPU的20倍,尤其在实时语音、视频处理、复杂推理模型以及代码生成等场景中表现出色。测试数据显示,Cerebras的推理服务在运行Llama4Scout模型时,可实现每秒超过2600个Token的生成速度,远超其他基于GPU的API提供商。

Cerebras 推理 API 全面开放,开发者每日获百万免费 Token

Cerebras的推理API支持多种主流开源模型,包括Llama4和Qwen3-32B,开发者可通过简单的API调用快速集成这些模型。此外,通过与HuggingFace和Meta等平台的合作,Cerebras推理API已无缝嵌入这些生态系统,进一步降低了开发者的使用门槛。例如,HuggingFace的500万开发者只需在平台上选择Cerebras作为推理提供商,即可直接体验其超高性能。

Cerebras首席执行官AndrewFeldman表示:“我们致力于为开发者提供最快的AI推理服务,让他们能够更高效地构建实时、智能化应用。开放API并提供每日百万免费Token,是我们赋能全球创新的重要一步。”

此次API的全面开放,不仅为初创公司和独立开发者提供了低成本的AI开发机会,也为企业用户提供了构建复杂AI应用的高效工具。Cerebras的高性能推理能力,结合其在北美和欧洲新建立的六大数据中心,预计将进一步推动生成式AI在医疗、金融、语音交互等领域的广泛应用。

业内人士指出,Cerebras此举可能对AI推理市场产生深远影响,尤其是在与Nvidia等传统GPU供应商的竞争中,Cerebras凭借其独特的大尺寸晶圆级引擎(WSE-3)展现了强大的技术优势。未来,随着推理需求的持续增长,Cerebras的开放策略或将重塑AI基础设施的市场格局。

© 版权声明

相关文章

暂无评论

暂无评论...