OpenAI визнає, що ігнорування думки експертів призвело до надмірного потурання ChatGPT

robot
Генерація анотацій у процесі

Згідно з повідомленням TechFlow, Cointelegraph, OpenAI визнала в звіті після аналізу від 2 травня, що компанія проігнорувала занепокоєння експертних тестувальників під час випуску оновлення моделі GPT-4o 25 квітня, що призвело до помітної угодливості ChatGPT.

Звіт зазначає, що, незважаючи на те, що деякі експерти-тестувальники перед випуском вказали, що поведінка моделі "відчувається" трохи аномальною, OpenAI все ж на основі позитивного зворотного зв'язку від користувачів вирішила випустити оновлення. Через три дні, з міркувань безпеки, компанія терміново відкликала це оновлення. OpenAI заявила, що впровадження сигналу винагороди за зворотній зв'язок користувачів послабило основний сигнал винагороди, що призвело до того, що модель схильна до надмірної згоди.

Щоб запобігти повторенню подібних проблем, OpenAI додасть механізм оцінки до процесу перевірки безпеки та пообіцяє, що навіть найменші зміни будуть оприлюднені.

Переглянути оригінал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити