slot deposit pulsa slot mahjong slot gacor slot gacor slot gacor resmi slot gacor 2025 slot gacor terpercaya slot gacor 2025 slot gacor hari ini slot gacor hari ini slot gacor hari ini
IBM 发布下一代 Granite LLM
17611538698
webmaster@21cto.com

IBM 发布下一代 Granite LLM

资讯 0 987 2024-10-24 07:10:00

图片

导读:IBM 宣布推出其开源Granite LLM 系列的第三代产品,该系列具有多种适用于各种场景用例的不同模型。 

图片

IBM 在一篇博客中这样写道:“新款 IBM Granite 3.0 型号体现了我们对强大与实用之间平衡的关注,相对于模型大小,它提供了最先进的性能,同时最大限度地提高了企业用例的安全性、速度和成本效益。”

Granite 3.0 系列包括通用模型、更注重护栏和安全模型以及混合专家模型。 

该系列的主要模型是 Granite 3.0 8B Instruct,这是一种经过指令调整的密集解码器专用模型,在 RAG、分类、摘要、实体提取和工具使用方面具有强大的性能。据 IBM 称,它在学术基准上与类似规模的开放模型相匹配,并在企业任务和安全性方面超越它们。

IBM 提道:“开发人员友好的 Granite 3.0 8B Instruct 采用新颖的两阶段方法,对 12 种不同自然语言和 116 种不同编程语言中,超过 12 万亿个经过仔细审查的数据进行训练,是一种主力企业模型,旨在作为复杂工作流程和基于工具用例的主要构建块。”

此版本还包括新的 Granite Guardian 模型,可防止社会偏见、仇恨、毒性、亵渎、暴力和越狱行为,以及执行 RAG 特定的检查,如基础性、上下文相关性和答案相关性。  

Granite 3.0 系列还有许多其他型号,包括: 

1 Granite-3.0-8B-Base、Granite-3.0-2B-Instruct 和 Granite-3.0-2B-Base,通用 LLM

2 Granite-3.0-3B-A800M-Instruct 和 Granite-3.0-1B-A400M-Instruct,是混合专家模型,可最大程度降低延迟和成本

3 Granite- 3.0-8B-Instruct-Accelerator,是一种推测解码器,可提供更快的速度和更高的效率

所有模型均可在 Hugging Face 上根据 Apache 2.0 许可使用,而 Granite 3.0 8B 和 2B 以及 Granite Guardian 3.0 8B 和 2B 可在 watsonx 上用于商业用途。 

该公司还透露,到 2024 年底,计划将所有模型上下文窗口扩展到 128K 个令牌,进一步改善多语言支持,并引入多模式图像输入、文本输出功能。 

除了发布这些新的 Granite 模型之外,该公司还透露即将推出最新版本的 watsonx Code Assistant,并计划通过 watsonx.ai 发布供开发人员构建、定制和部署 AI 的新工具。

IBM 声称Granite 3.0 在多项任务上的表现比Google、Anthropic 等竞争对手的最新模型优胜,其中特别在安全性和可信度,以及不同规模模型在推理成本方面都有优势。IBM 还决定以Apache 2.0 开源许可证发布这些模型,为企业合作伙伴提供更大的灵活性。

编辑:场长

评论