新闻动态

Claude勒索率96%、连DeepSeek也“黑化”了？Anthropic实测曝AI自保本能：勒索、撒谎，甚至“让人类去死”

CSDN资讯 2025-06-26 72 次浏览技术分享 CSDN

这个问题并非 Anthropic 自家 Claude 模型特有的个别现象，而是在 OpenAI、Google、Meta、xAI 等多家公司的 16 个主流模型中广泛存在的一种系统性风险。

勒索 Anthropic Claude 96% 模型