谷歌 DeepMind 推出 Gemma AI 模型:2B / 7B 双版本、基准测试超越 Meta Llama-2

3个月前 (02-22) 0 点赞 0 收藏 0 评论 2 已阅读

2 月 21 日消息,据谷歌官方新闻稿,谷歌 DeepMind 团队今天推出一款 Gemma 开放模型,该 AI 模型号称受到 Gemini 启发,提供 Gemma 2B 和 Gemma 7B 两种规模版本可选。

▲ 图源 谷歌官方新闻稿(下同)

注意到,这款 Gemma 模型可以使用 Keras 3.0、PyTorch 等工具进行微调,能够在笔记本 / 物联网等性能较低的设备中运行,并号称相比同等规模竞品拥有更强的性能,据称在关键基准测试中“明显超越了 Meta Llama-2 模型”。

谷歌研究团队提到,这款 Gemma 模型号称基于“人工智能原则”打造,为了使 Gemma 模型“安全可靠”,研究人员使用自动化技术从训练集中过滤掉个人信息和其他敏感数据,并对模型经过大量微调,配合“强化学习(RLHF)”令模型实现行为一致性,同时还对模型进行了“红队测试”、“自动对抗测试”及模型能力评估,从而让模型获得了“负责任的特性”。


本文收录在
Array
0评论

登录

忘记密码 ?

切换登录

注册