标签:MoE架构

N百度文心新模型ERNIE-4.5-21B-A3B-Thinking强势登顶Hugging Face榜首

近日,百度旗下文心大模型家族迎来重大升级——ERNIE-4.5-21B-A3B-Thinking正式开源,并在HuggingFace平台迅速登顶文本生成模型榜单首位,同时位居整体模型榜第...

​硅基流动上线线蚂蚁集团Ling-mini-2.0,速度与性能双丰收

近日,硅基流动大模型服务平台正式上线了蚂蚁集团百灵团队最新开源的Ling-mini-2.0。这个新模型在保持先进性能的同时,展现出极高的生成速度,标志着在小体量...

Kimi K2 高速版 AI 模型再提速,输出速度达每秒 100 Tokens ​

近日,月之暗面发布了有关KimiK2高速版AI模型的最新消息。经过工程师们的努力,KimiK2turbo-preview模型的输出速度得到了显著提升,目前稳定输出速度已达到每...

腾讯开源“混元-A13B”:动态推理大模型,主打“会思考”

腾讯近日宣布开源其全新语言模型“**混元-A13B**”,该模型引入了创新的**动态推理方法**,使其能够根据任务复杂性在快速和深度“思考”之间智能切换。核心亮点:...