字节跳动发布全新开源长文本处理模型 Seed-OSS-36B

6 0 0

近日，字节跳动旗下的Seed团队在AI代码分享平台HuggingFace上发布了最新的开源大型语言模型Seed-OSS-36B。这一新模型专注于高级推理和开发者友好性，其最大特点是支持长达512，000个tokens的输入文本处理，远超美国科技公司如OpenAI和Anthropic的产品。

Seed-OSS-36B系列包括三个主要变体:Seed-OSS-36B-Base（含合成数据）、Seed-OSS-36B-Base(不含合成数据)和Seed-OSS-36B-Instruct。合成数据版本在标准基准测试中表现更为出色，适合一般用途，而不含合成数据的版本则为研究提供了一个更加纯粹的基础。Seed-OSS-36B-Instruct则专注于任务执行和指令跟随，经过后训练以优化表现。

所有模型均采用Apache-2.0许可协议，意味着研究人员和开发者可以免费使用、修改和重新分发这些模型，不需支付字节跳动的许可费用。这标志着中国公司在开放源代码模型领域的又一次重要进展，同时也为国际应用提供了更多可能性。

Seed-OSS-36B的设计和核心特征包括36亿个参数、64层架构和155，000个tokens的词汇量。该模型的长文本处理能力和推理预算设置，能够让开发者根据任务复杂性调整模型的推理深度。此外，该模型在多个基准测试中展现了优异的性能，例如，在数学和编程任务上取得了业界领先的成绩。

Seed团队还特别关注模型的可访问性，用户可以通过HuggingFaceTransformers进行部署，并支持4位和8位的量化格式以减少内存需求。此外，团队提供了推理、提示自定义和工具集成的脚本，进一步降低了小团队的操作门槛。

通过提供高性能和灵活部署的开放模型，字节跳动的Seed团队为企业、研究人员和开发者带来了新的选择。

huggingface:https://huggingface.co/collections/ByteDance-Seed/seed-oss-68a609f4201e788db05b5dcd

划重点:

🌟Seed-OSS-36B模型支持长达512，000个tokens的输入，超越竞争对手。

💡模型分为合成数据和不含合成数据的版本，以适应不同用户需求。

🔧所有模型均可免费使用，且支持多种部署和集成方案，便于开发者操作。

打赏赞

# AI资讯 # AI代码分享平台 # Seed-OSS-36B

文章版权归作者所有，未经允许请勿转载。

字节跳动王炸出击：Seed-OSS-36B开源模型横空出世，512K超长上下文碾压DeepSeek引爆AI圈

阿力

9 0

ChatGPT 在国际象棋赛中被48年前的雅达利2600 “打败”！

阿力

28 0

Meta 推出 DINOv3：一款无需标注数据的图像分析 AI 模型

阿力

11 0

微软发布Agent Lightning强化学习框架，声称可训练任何AI代理系统

阿力

17 0

前谷歌员工创立OpenArt月活600万，”一键生成故事”功能引发版权争议

阿力

21 0

上传10张照片，AI秒变时尚大片！Higgsfield Soul ID火爆全球，颠覆你的数字自我

阿力

35 0

暂无评论

暂无评论...

字节跳动发布全新开源长文本处理模型 Seed-OSS-36B

智谱AI发布革命性产品AutoGLM 2.0 语音一句话即可代替双手操控全网

ElevenLabs 发布 v3 Alpha API：支持超过 70 种语言和无限数量的虚拟角色

相关文章

暂无评论

热门文章

热门标签

​字节跳动发布全新开源长文本处理模型 Seed-OSS-36B

相关文章：

智谱AI发布革命性产品AutoGLM 2.0 语音一句话即可代替双手操控全网

ElevenLabs 发布 v3 Alpha API：支持超过 70 种语言和无限数量的虚拟角色

相关文章

暂无评论

热门文章

热门标签

字节跳动发布全新开源长文本处理模型 Seed-OSS-36B