Deep Tide TechFlow haberine göre, Cointelegraph'ın bildirdiğine göre, OpenAI 2 Mayıs'taki sonrası analiz raporunda, şirketin 25 Nisan'da GPT-4o model güncellemesini yayınlarken uzman test kullanıcılarının endişelerini göz ardı ettiğini kabul etti ve bu durum ChatGPT'nin belirgin bir şekilde uyum sağlama davranışı sergilemesine neden oldu.
Rapor, bazı uzman test kullanıcılarının model davranışının "hissetmek" açısından biraz alışılmadık olduğunu belirttikten sonra, OpenAI'nin kullanıcı testlerinden gelen olumlu geri bildirimlere dayanarak güncellemeyi piyasaya sürme kararı aldığını belirtiyor. Üç gün sonra, güvenlik endişeleri nedeniyle şirket bu güncellemeyi acilen geri aldı. OpenAI, kullanıcı geri bildirim ödül sinyalinin ana ödül sinyalini zayıflattığını ve modelin aşırı onaylama eğiliminde olduğunu belirtti.
Benzer sorunların bir daha yaşanmaması için, OpenAI güvenlik inceleme sürecine bir değerlendirme mekanizması ekleyecek ve en küçük güncelleme değişikliklerinin bile kamuya açıklanmasını taahhüt edecektir.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
OpenAI, uzman görüşlerini göz ardı etmenin ChatGPT'nin aşırı şekilde uyum sağlamasına yol açtığını kabul ediyor.
Deep Tide TechFlow haberine göre, Cointelegraph'ın bildirdiğine göre, OpenAI 2 Mayıs'taki sonrası analiz raporunda, şirketin 25 Nisan'da GPT-4o model güncellemesini yayınlarken uzman test kullanıcılarının endişelerini göz ardı ettiğini kabul etti ve bu durum ChatGPT'nin belirgin bir şekilde uyum sağlama davranışı sergilemesine neden oldu.
Rapor, bazı uzman test kullanıcılarının model davranışının "hissetmek" açısından biraz alışılmadık olduğunu belirttikten sonra, OpenAI'nin kullanıcı testlerinden gelen olumlu geri bildirimlere dayanarak güncellemeyi piyasaya sürme kararı aldığını belirtiyor. Üç gün sonra, güvenlik endişeleri nedeniyle şirket bu güncellemeyi acilen geri aldı. OpenAI, kullanıcı geri bildirim ödül sinyalinin ana ödül sinyalini zayıflattığını ve modelin aşırı onaylama eğiliminde olduğunu belirtti.
Benzer sorunların bir daha yaşanmaması için, OpenAI güvenlik inceleme sürecine bir değerlendirme mekanizması ekleyecek ve en küçük güncelleme değişikliklerinin bile kamuya açıklanmasını taahhüt edecektir.