Google发布AI编程助手AlphaCode2,基于Gemini系统

AI资讯3个月前发布 阿强
77 0

**划重点:**

1. 🌐 AlphaCode2是由Gemini模型驱动的改进版编程工具,在编程竞赛中表现优异,特别是在动态规划等复杂问题上。

2. 🏆 在Codeforces平台的编程竞赛中,相比前代提升,以Python、Java、C++和Go等语言编码,平均胜过约85%的竞争对手。

3. 🤖 AlphaCode2通过一系列策略模型生成代码样本,通过聚类算法选择最佳代码答案,展望未来作为协作工具助力整个软件开发过程。

日前发布了AlphaCode2,这是一款由模型驱动的编程工具,是对前代AlphaCode的改进版本。与Gemini模型同时亮相,AlphaCode2在编程竞赛中表现出色,尤其在动态规划等复杂问题上具备更强大的能力。

Google发布AI编程助手AlphaCode2,基于Gemini系统

研究人员通过在CodeForces竞赛网站上收集的约15000个问题和3000万份人类编写的代码的数据集上对Gemini Pro系统进行精细调整,为AlphaCode2的问题解决能力提供了强大支持。

根据谷歌在Codeforces平台上的数据,AlphaCode2在涵盖Python、Java、C++和Go等多语言的编程竞赛中,平均胜过了约85%的竞争对手,相较于前代,这是一次显著的提升。在技术白皮书中指出,在12场最近的竞赛中,AlphaCode2解决了77个问题中的43%,而前代仅在25%的问题上获得成功。

Google发布AI编程助手AlphaCode2,基于Gemini系统

动态规划是编程竞赛中常见的复杂问题之一,而AlphaCode2展现出其在这方面的卓越表现。DeepMind研究科学家Rémi Leblond在一段预录视频中解释说,AlphaCode2不仅知道何时正确实施动态规划策略,还知道在何处使用它。这对于原始AlphaCode在处理需要动态规划的编程问题时曾经遇到的困难而言,是一项显著的进步。

AlphaCode2的工作原理涉及一系列“策略模型”,这些模型为每个问题生成多个代码样本。不符合问题描述的代码样本被过滤掉,然后通过聚类算法将“语义相似的代码样本”分组,以避免冗余。最终,AlphaCode2内的评分模型确定每个最大代码样本“簇”中的最佳候选答案。

尽管AlphaCode2在编程竞赛中表现出色,但白皮书指出其存在一些缺陷。例如,AlphaCode2需要大量的试错,运营成本较高,且过于依赖于过滤明显错误的代码样本。据猜测,迁移到更强大的Gemini版本,如Gemini Ultra,可能会缓解这些问题。

Google DeepMind相信,通过使用Gemini Ultra,一个比Gemini Pro更大更强大的大型语言模型,他们可以构建一个更出色的代码编写模型,并表示正在努力将其能力提供给开发者。团队希望将AlphaCode2的独特能力引入基础Gemini模型,使这种新的编程范式成为所有人的首选

关于AlphaCode2是否会成为产品的问题,DeepMind的产品副总裁Eli Collins在一次简报中暗示了这一可能性。他表示:“关于最新结果最让我兴奋的事情之一是,当程序员与[由Gemini提供动力的] AlphaCode2合作时,通过定义代码应遵循的某些属性,[模型]的性能会变得更好。”他进一步指出:“在未来,我们预见程序员将利用高度 capable 的AI模型作为协作工具,从问题推理到辅助实施,助力整个软件开发过程。”

© 版权声明

相关文章

暂无评论

暂无评论...