在美国时间10月21日举行的IBM(纽约证券交易所代码:IBM)年度TechXchange大会上,IBM宣布推出其迄今为止最先进的AI模型家族——Granite 3.0。IBM的第三代Granite旗舰语言模型在许多学术和行业基准测试中均能超越或匹敌同类领先模型提供商的模型,展示出强大的性能、透明性和安全性。
与公司对开源 AI 的承诺一致,Granite 模型在宽松的 Apache 2.0 许可证下发布,它们凭借在性能、灵活性和自主性方面的独特组合能够为企业客户和整个社区提供服务。
IBM的Granite 3.0家族系列包括:
- 通用/语言模型:Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
- 护栏与安全模型:Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
- 专家混合模型:Granite 3.0 3B-A800M Instruct, Granite 3.0 1B-A400M Instruct, Granite 3.0 3B-A800M Base, Granite 3.0 1B-A400M Base
新款 Granite 3.0 8B 和 2B 语言模型被设计为企业级AI的"主力"模型,能够在检索增强生成(RAG)、分类、摘要、实体提取和工具使用等任务中提供强大的性能。这些紧凑的多功能模型旨在根据企业数据进行微调,并在各种业务环境或工作流程中无缝集成。
许多大型语言模型(LLM)是基于公开可用的数据进行训练的,绝大多数企业数据仍然未被利用。通过将小型 Granite 模型与企业数据相结合,特别是使用 IBM 和 RedHat 在五月推出的革命性对齐技术 InstructLab, IBM 相信企业可以实现与大型模型相媲美的特定任务性能,而成本只是其中的一小部分(基于在几个早期概念验证中观察到的成本比大型前沿模型低 3 到 23 倍的范围[i])。
Granite 3.0 版本的发布重申了 IBM 对建立 AI 产品透明度、安全性和信任的承诺。Granite 3.0 技术报告和负责任使用指南提供了用于训练这些模型的数据集描述,详细说明了所应用的过滤、清洗和处理步骤,并全面展示了模型在主要学术和企业基准测试中的性能结果。
至关重要的是,IBM 为 watsonx.ai 上的所有 Granite 模型提供知识产权赔偿,旨在增强企业客户将企业数据融入模型的信心。
提高标准:Granite 3.0 基准测试
Granite 3.0 语言模型在原始性能上也展示出良好的结果。
在 Hugging Face 的 OpenLLM 排行榜定义的标准学术基准测试中,Granite 3.0 8B Instruct 模型的整体性能平均领先于 Meta 和 Mistral 中类似大小的开源模型的最先进性能。在 IBM 的先进 AttaQ 安全基准测试中,Granite 3.0 8B Instruct 模型在所有测量的安全维度上均领先于 Meta 和 Mistral 的模型[ii]。
在检索增强生成(RAG)、工具使用和网络安全领域的核心企业任务中,Granite 3.0 8B Instruct 模型的平均表现优于Mistral 和 Meta 中类似规模的开源模型[iii]。
Granite 3.0 模型是在超过 12 万亿个标记上进行训练的,这些数据来自 12 种不同的自然语言和 116 种不同的编程语言,采用了一种新颖的两阶段训练方法,利用了数千个旨在优化数据质量、数据选择和训练参数的实验结果。到今年年底,预计 3.0 8B 和 2B 语言模型将支持扩展的 128K 上下文窗口和多模态文档理解能力。
IBM 展示了性能和推理成本的完美平衡,提供了其 Granite 专家混合(MoE)机构模型,Granite 3.0 1B-A400M 和 Granite 3.0 3B-A800M,这些较小且轻量级的模型可用于低延迟应用程序以及基于 CPU 的部署。
IBM 还宣布了其预训练 Granite 时间序列模型的更新版本,早期版本于今年早些时候发布。这些新模型在 3 倍的数据上进行训练,在所有三个主要时间序列基准测试中表现出色,超越了来自 Google、Alibaba 等公司 10 倍更大模型的性能。更新后的模型还提供了更大的建模灵活性,支持外部变量和滚动预测[iv]。
Granite Guardian 3.0:开启负责任AI的新时代
作为此次发布的一部分,IBM 还推出了一个新的 Granite Guardian 模型系列,允许应用程序开发人员通过检查用户提示和 LLM 响应来实施安全护栏,以发现各种风险。Granite Guardian 3.0、8B 和 2B 型号提供了当今市场上最全面的风险和危害检测功能。
除了社会偏见、仇恨、毒性、亵渎、暴力、越狱等危害维度外,这些模型还提供了一系列独特的检索增强生成(RAG)特定检查,如基于事实性、上下文相关性和答案相关性。在针对 19 项安全性和 RAG 基准的广泛测试中,Granite Guardian 3.0 8B 模型在危害检测方面的整体准确性平均高于 Meta 的所有三代 Llama Guard 模型。它在幻觉检测方面的整体性能也与专门的幻觉检测模型 WeCheck 和 MiniCheck 相当[v]。
虽然 Granite Guardian 模型派生自相应的 Granite 语言模型,但它们可以与任何开放或专有的 AI 模型一起使用,以实施安全保护措施。
Granite 3.0 模型的可用性
整个 Granite 3.0 模型套件和更新的时间序列模型都可以在 HuggingFace 上根据宽松的 Apache 2.0 许可证下载。新的 Granite 3.0 8B 和 2B 语言模型的指令(instruct)变体以及 Granite Guardian 3.0 8B 和 2B 模型现已在 IBM 的 watsonx 平台上提供商业用途。部分 Granite 3.0 模型也将作为 NVIDIA NIM 微服务提供,并通过 Google Cloud 的 Vertex AI Model Garden与 HuggingFace 的集成提供。
为给开发者提供多种选择和易用性,并支持本地和边缘部署,一套精选的 Granite 3.0 模型也可在 Ollama 和 Replicate 上获得。最新一代 Granite 模型扩展了 IBM 强大的开源 LLM 目录。IBM 与 AWS、Docker、Domo、Qualcomm Technologies, Inc.(通过其 Qualcomm® AI Hub)、Salesforce、SAP 等生态系统合作伙伴合作,将多种 Granite 模型集成到这些合作伙伴的产品中,或在他们的平台上提供 Granite 模型,为全球企业提供更大的选择空间。
从助理(Assistants)到智能体(Agents):实现企业级AI 的未来
IBM 正在通过一系列技术推进企业级AI的发展,从模型和助理 (Assistants),到为公司独特的数据和用例调优和部署 AI 所需的工具。IBM 还在为未来能够自我导向、反思并在动态商业环境中执行复杂任务的 AI 智能体(AI agents)铺平道路。
IBM 不断发展其 AI 助理(Assitants)技术组合,从帮助公司通过低代码工具和自动化构建自己的助理的watsonx Orchestrate,到用于特定任务和领域(如客户服务、人力资源、销售和营销)的各种预构建助理。全球各地的组织已经使用 watsonx Assistant 帮助他们构建 AI 助理,用于回答客户或员工的日常问题、实现大型机和传统 IT 应用程序现代化、帮助学生探索潜在的职业路径,或为购房者提供数字抵押贷款支持等任务。
IBM 还公布了即将发布的下一代 watsonx Code Assistant,该版本由 Granite 代码模型提供支持,能够为 C、C++、Go、Java 和 Python 等语言提供通用编码辅助,并为企业级 Java 应用程序[vi]提供高级应用程序现代化功能。Granite 的代码功能现在也可以通过 Visual Studio Code 扩展程序 IBM Granite.Code访问。
IBM 还计划发布新工具来帮助开发人员,利用watsonx.ai 更高效地构建、定制和部署 AI,包括代理框架、与现有环境的集成以及用于常见用例(如 RAG 和智能体)的低代码自动化[vii]。
IBM 专注于开发具有更高自主性、复杂推理能力和多步骤问题解决能力的 AI 智能体(AI Agents)技术。Granite 3.0 8B 模型的初始版本支持关键的智能体功能,如高级推理和用于实现工具使用工作流程的高度结构化聊天模板和提示风格。IBM 还计划在 IBM watsonx Orchestrate 中引入新的 AI 智能体聊天功能,利用智能体功能协调 AI 助理、技能和自动化,帮助用户提高整体的团队生产力[viii]。IBM 计划在 2025 年继续在其产品组合中构建智能体功能,包括为特定领域和用例预构建的智能体。
扩展的 AI 驱动的交付平台,以 AI 增强 IBM 顾问的能力
IBM 还宣布大幅扩展其 AI 驱动的交付平台 IBM Consulting Advantage。该多模型平台包含 AI 智能体、应用程序和方法(如可重用的框架),赋能 16 万名 IBM 顾问,以更低的成本、更好更快地为客户提供价值。
作为扩展的一部分,Granite 3.0 语言模型将成为 Consulting Advantage 的默认模型。借助 Granite 的性能和效率, IBM Consulting 将能够帮助最大限度地提高 IBM 客户的生成式 AI 项目的投资回报。
扩展的另一个关键部分是引入 IBM Consulting Advantage for Cloud Transformation and Management 和 IBM Consulting Advantage for Business Operations。每一项都包括特定领域的 AI 智能体、应用程序和融合了 IBM 最佳实践的方法,使 IBM 顾问能够帮助客户加速云和 AI 转型任务(如代码现代化和质量工程),或跨领域(如财务、人力资源和采购)实施转型和运营。
暂无评论哦,快来评论一下吧!