Современные ИИ-лаборатории активно выпускают новые модели и чат-боты, чтобы закрепить свои бренды, но пользователи часто жалуются на их ошибки — от галлюцинаций до полностью неверных или вредоно
сных ответов. Совместное исследование Microsoft Research и Salesforce охватило более 200?000 диалогов с продвинутыми LLM, включая GPT?4.1, Gemini 2.5 Pro, Claude 3.7 Sonnet, o3, DeepSeek R1 и Llama 4, ...
Автор: DarthSahara@ixbt.com (Darth Sahara)
Источник: https://www.ixbt.com/news/2026/02/23/issledovanie-pokazalo-ii-terjaetsja-v-dlinnyh-dialogah-i-vvodit-polzovatelej-v-zabluzhdenie.html