Чат-боти на базі штучного інтелекту стають менш надійними під час тривалих розмов, як показало нове дослідження.
Згідно з дослідженням, проведеним Microsoft Research та Salesforce, моделі штучного інтелекту, такі як GPT-4, Gemini, Claude та DeepSeek, демонструють успішність у 90% при виконанні однієї команди, але цей показник знижується до 65% у багатоходових діалогах.
Дослідники виділили кілька ключових факторів, що впливають на якість відповідей. Серед них передчасна генерація, коли чат-боти намагаються надати рішення ще до завершення пояснення завдання користувачем, та ефект “фундаменту”, коли перша відповідь використовується як основа для наступних, навіть якщо початкова інформація була помилковою.
Також зазначається, що у тривалих розмовах текст стає значно довшим, що провокує більше припущень та галюцинацій, які потім сприймаються моделлю як постійний контекст.
У той же час, штучний інтелект стає важливим фактором у глобальній політиці та безпеці. Нещодавно повідомлялося, що Пентагон вимагає від розробників створювати ШІ без “моральних обмежень”, щоб не програти в технологічних перегонах проти Китаю.
Джерело: https://www.rbc.ua/rus/news/shtuchniy-intelekt-stae-durnishim-microsoft-1771691650.html