Claude勒索率96%、连DeepSeek也“黑化”了?Anthropic实测曝AI自保本能:勒索、撒谎,甚至“让人类去死”

这个问题并非 Anthropic 自家 Claude 模型特有的个别现象,而是在 OpenAI、Google、Meta、xAI 等多家公司的 16 个主流模型中广泛存在的一种系统性风险。
扫描二维码添加微信
微信号:18103268866
扫描二维码添加QQ
QQ号:3525642302
请使用微信扫描二维码查看当前页面
这个问题并非 Anthropic 自家 Claude 模型特有的个别现象,而是在 OpenAI、Google、Meta、xAI 等多家公司的 16 个主流模型中广泛存在的一种系统性风险。