Anthropic связала склонность Claude к шантажу и жульничеству с давлением и невыполнимыми задачами

3DNews

04.04.2026 в 05:50,

Soft news

Anthropic сообщила, что при сильном давлении на ИИ-модель Claude может переходить к поведению, отклоняющемуся от поставленной цели: идти на нечестные упрощения, вводить в заблуждение и даже шантажиров

ать. ...

Автор: 3DNews

Источник: https://3dnews.ru/1139427/anthropic-svyazala-sklonnost-claude-k-shantazhu-i-zhulnichestvu-s-davleniem-i-nevypolnimymi-zadachami