ChatGPT после последнего обновления немного «отупел». Исследователи Стэнфордского университета задавали чат-боту различные вопросы и оценивали правильность ответов. И если в марте модель GPT-4 давала правильный ответ в 97,6% случаев, то в июне показатель упал до 2,4%. В случае GPT-3.5 показатель, напротив, вырос с 7,4% до 86,8% Ухудшилась и генерация кода. Учёные создали набор данных с 50 простыми задачами из LeetCode и измерили, сколько ответов GPT-4 выполнялись без каких-либо изменений. Мартовская версия успешно справилась с 52% проблем, а июньская — лишь с 10%