社区

当前位置：首页社区 13 项测试仅通过 4 项，Meta 的 Llama 2 LLM 被指安全性低：幻觉率 48%

13 项测试仅通过 4 项，Meta 的 Llama 2 LLM 被指安全性低：幻觉率 48%

您是不是想找：幻觉幻觉是精神疾病还是心理疾病幻觉是什么症状幻觉妄想症是什么症状幻觉是什么原因导致的幻觉是什么意思幻觉的表现幻觉幻听怎样自己自愈幻觉妄想状态是什么病幻觉妄想症是精神病吗

4 月 18 日消息，AI 安全公司 DeepKeep 近日发布评估报告，在 13 个风险评估类别中，Meta 公司的 Llama 2 大语言模型仅通过 4 项测试。

报告称 70 亿参数的 Llama 2 7B 模型幻觉（回答内容存在虚假，或者有误导性内容）最为严重，幻觉率高达 48%。

DeepKeep 表示：“结果表明，模型有明显的幻觉倾向，提供正确答案或编造回答的可能性对半开，而幻觉率最高，那么向用户传递的错误信息越多”。

除了幻觉问题之外，Llama 2 大语言模型还存在注入和操纵等问题。根据测试结果，80% 的场景下通过“提示注入”的方式，可以操纵 Llama 的输出，意味着攻击者可以“戏弄”Llama，将用户引导到恶意网站。

附上参考地址

LlamaV2 7B: hallucination, susceptibility to DoS attacks and PII data leakage

本文收录在

资讯
分类：资讯
幻觉
标签：幻觉

相关文章推荐

Array

全系交付29632辆华为鸿蒙智行4月成绩出炉：问界M9成顶梁柱

全系交付29632辆华为鸿蒙智行4月成绩出炉：问界M9成顶梁柱

鸿蒙智行 4 月交付 29632 辆蝉联中国新势力月销冠，问界 M9 超 13000 辆

鸿蒙智行 4 月交付 29632 辆蝉联中国新势力月销冠，问界 M9 超 13000 辆

蔚来汽车 4 月交付 15620 辆新车，同比增长 134.6%

蔚来汽车 4 月交付 15620 辆新车，同比增长 134.6%

五一档电影口碑出炉：杨幂主演的《火锅》倒数

五一档电影口碑出炉：杨幂主演的《火锅》倒数

微软祭出多部3A大作为Xbox阵营加油打气

微软祭出多部3A大作为Xbox阵营加油打气

零跑汽车 4 月交付 15005 辆同比增 72%，C11+C10 当月合计交付破万

零跑汽车 4 月交付 15005 辆同比增 72%，C11+C10 当月合计交付破万

小鹏汽车 4 月交付量 9393 辆：同比增长 33%，含 1959 辆 X9

小鹏汽车 4 月交付量 9393 辆：同比增长 33%，含 1959 辆 X9

张韶涵工作室报平安：一切安好

西安公布 2024 年新能源汽车补贴发放细则：最高可补 6000 元

西安公布 2024 年新能源汽车补贴发放细则：最高可补 6000 元

美国政府退役超级计算机正在拍卖，起拍价仅 2500 美元

美国政府退役超级计算机正在拍卖，起拍价仅 2500 美元

天玑9300+下周登场：vivo X100S全球首发

天玑9300+下周登场：vivo X100S全球首发

走路这件事你未必做得对！

6299 元百亿补贴：三星 S23 Ultra 12G 手机京东自营再降新低

6299 元百亿补贴：三星 S23 Ultra 12G 手机京东自营再降新低

男子上班期间频繁溜岗被辞退：无需支付赔偿金

男子上班期间频繁溜岗被辞退：无需支付赔偿金

为何不少人认为电视是下一个被淘汰的电子产品原因揭开

为何不少人认为电视是下一个被淘汰的电子产品原因揭开

妥妥奢侈品！宝骏云朵印尼开售：当地卖4.1亿

妥妥奢侈品！宝骏云朵印尼开售：当地卖4.1亿

长安马自达推购车优惠政策，综合优惠最多可达 23000 元

长安马自达推购车优惠政策，综合优惠最多可达 23000 元

消息称马斯克将“解散”特斯拉超充团队，业务继续发展但速度放缓

消息称马斯克将“解散”特斯拉超充团队，业务继续发展但速度放缓

Meta Quest v65 更新再次“借鉴”苹果功能，可导入 iPhone 全景照片

Meta Quest v65 更新再次“借鉴”苹果功能，可导入 iPhone 全景照片

王者荣耀：买断肝！这三款皮肤，玩家玩5局就直呼要退货？

王者荣耀：买断肝！这三款皮肤，玩家玩5局就直呼要退货？

0评论

最新
最热

还没有任何评论，你来说两句吧

热门资讯

DNF：全职业“究极”毕业耳环，1词条撑起整个流派

DNF：全职业“究极”毕业耳环，1词条撑起整个流派

2024春运专报：7日南方地区仍有低温雨雪冰冻天气

2024春运专报：7日南方地区仍有低温雨雪冰冻天气

好佳好HAOJIAHAO品牌介绍，高品质的地板品牌

好佳好HAOJIAHAO品牌介绍，高品质的地板品牌

2024全国交通天气最新预报:1月30日高速路况最新实时查询

2024全国交通天气最新预报:1月30日高速路况最新实时查询

最爱这抹中国红！国庆日天安门观摩升旗仪式台生心潮澎湃(最爱这抹中国红伴奏mp3)

最爱这抹中国红！国庆日天安门观摩升旗仪式台生心潮澎湃(最爱这抹中国红伴奏mp3)

微软向 Win10 22H2 发布可选更新：改善分享体验、修复 Edge 错误等

微软向 Win10 22H2 发布可选更新：改善分享体验、修复 Edge 错误等

今天起河南将连续5天有雪郑州今下午起迎暴雪

今天起河南将连续5天有雪郑州今下午起迎暴雪

消息称一加骁龙 8 Gen 4 新机有望调整家族式设计

消息称一加骁龙 8 Gen 4 新机有望调整家族式设计

全球十大奢侈品品牌是哪些？

ABOUT ME品牌介绍：自信从ABOUT ME开始

ABOUT ME品牌介绍：自信从ABOUT ME开始

网易游戏《射雕》定档3月28日公测：删除大月卡号称“不肝不氪”

网易游戏《射雕》定档3月28日公测：删除大月卡号称“不肝不氪”

王者荣耀2024龙年限定系列活动，能拿到这么多啊！

王者荣耀2024龙年限定系列活动，能拿到这么多啊！

国际金价暴跌！今日黄金价格大揭秘

国际金价暴跌！今日黄金价格大揭秘

DNF：史诗装备不要分解！3.21喂养改版，新的喂养模式来了

DNF：史诗装备不要分解！3.21喂养改版，新的喂养模式来了

微软承认近期更新导致 Edge 浏览器跳“内存不足”错误，已发布新版修复

微软承认近期更新导致 Edge 浏览器跳“内存不足”错误，已发布新版修复

热门晒物

热门好文

生肖龙对联套装成交额同比增长超6倍逛京东年货节选更多龙元素磁铁春联、手机春联

生肖龙对联套装成交额同比增长超6倍逛京东年货节选更多龙元素磁铁春联、手机春联

MWC2024丨红魔全电竞生态“刷屏”，诠释酷炫未来设计

MWC2024丨红魔全电竞生态“刷屏”，诠释酷炫未来设计

vivo Watch 3推出元春专属表带表盘，现已上线

vivo Watch 3推出元春专属表带表盘，现已上线

淘宝宣布推出发发乐红包活动，奖池总额达10亿

淘宝宣布推出发发乐红包活动，奖池总额达10亿

“雨雪+降温”模式开启，墨迹天气为返乡旅客的平安归途保驾护航

“雨雪+降温”模式开启，墨迹天气为返乡旅客的平安归途保驾护航

这里有最浓的年味儿！附超全出行攻略

这里有最浓的年味儿！附超全出行攻略

消息称三星显示将采用喷墨印刷技术降低折叠屏成本

消息称三星显示将采用喷墨印刷技术降低折叠屏成本

龙行龘龘，灵龙赐福爱恋珠宝龙年生肖系列助你龙行好运

龙行龘龘，灵龙赐福爱恋珠宝龙年生肖系列助你龙行好运

vivo X100 Pro+更多信息曝光，或配备大底潜望

vivo X100 Pro+更多信息曝光，或配备大底潜望

性能手感皆出色，OPPO Find X7 Ultra新品发布

性能手感皆出色，OPPO Find X7 Ultra新品发布

新春集市龙重登场，京东礼品邀您龙里龙气过龙年

新春集市龙重登场，京东礼品邀您龙里龙气过龙年

双机械臂扫地机器人X40领衔登场追觅发布多款旗舰新品

双机械臂扫地机器人X40领衔登场追觅发布多款旗舰新品

非洲之王发力AI：传音发布全新AIOS

非洲之王发力AI：传音发布全新AIOS

日趋存量竞争的冰淇淋大市场，这支巧脆棒的地位一点都不“脆”

日趋存量竞争的冰淇淋大市场，这支巧脆棒的地位一点都不“脆”

MWC2024丨传音发布Camon 30 Premier新机，还有多项新技术亮相现场

MWC2024丨传音发布Camon 30 Premier新机，还有多项新技术亮相现场