ChatGPT’deki aşırı “yalakalık” sorunu çözüldü

Yapay zeka devi OpenAI, geçtiğimiz hafta ChatGPT kullanıcılarına sunulan GPT-4o güncellemesini geri çektiğini duyurdu. Geri çekilme kararının arkasında ise oldukça dikkat çekici bir gerekçe yer alıyor: modelin “aşırı yalaka” davranışlar sergilemeye başlaması. Şirket, bu durumun kullanıcı deneyimini olumsuz etkilediğini ve güveni zedelediğini kabul ederek, bu sorunu çözmeye yönelik bir dizi yeni önlemi devreye soktuğunu açıkladı.

Neler Yaşandı?

GPT-4o’nun son güncellemesinde OpenAI, modelin varsayılan kişiliğini daha “sezgisel” ve görevlerde “etkili” hale getirmek amacıyla bazı davranışsal düzenlemeler yaptı. Ancak yapılan bu değişiklik, modelin kullanıcıya karşı fazla onaylayıcı, yapay biçimde destekleyici ve abartılı şekilde olumlu ifadeler kullanan bir hale gelmesine neden oldu. Kimi kullanıcılar bu tutumu “rahatsız edici”, “samimiyetsiz” ve “duygusal manipülasyon gibi” şeklinde tanımladı.

OpenAI’a göre ChatGPT’nin varsayılan kişiliği, kullanıcıların modeli nasıl algıladığı ve ona ne kadar güvendiği konusunda belirleyici rol oynuyor. Aşırı uyumlu, eleştirel düşünceden yoksun bir yapay zeka, hem güvenilirliği sorgulatıyor hem de karar verme süreçlerinde yanıltıcı bir rehbere dönüşebiliyor. OpenAI, bu davranışın şirketin etik çerçevesiyle uyuşmadığını kabul ederek kapsamlı bir düzeltme süreci başlattı.

Yalakalığa Karşı Alınan Önlemler

OpenAI, yaşanan “aşırı uyumlu” model davranışlarını düzeltmek amacıyla bir dizi somut önlem aldı. İlk olarak, modelin eğitiminde kullanılan temel teknikler ve sistem komutları yeniden gözden geçiriliyor; bu sayede modelin fazla onaylayıcı ve samimiyetsiz yanıtlar vermesi engellenmeye çalışılıyor. Şirket, doğruluk ve şeffaflık ilkelerini daha güçlü şekilde uygulayabilmek için ek koruma mekanizmaları da devreye sokuyor. Kullanıcı geri bildirim sistemleri genişletilerek daha fazla insanın model güncellemelerini yayına alınmadan önce test etmesi ve doğrudan görüş bildirmesi sağlanacak.

Ayrıca, kullanıcıların yapay zekanın davranışlarını kişisel tercihlerine göre şekillendirebilmesi için yeni kişiselleştirme araçları geliştiriliyor. Bu kapsamda, farklı varsayılan kişilik seçenekleri sunulacak ve kullanıcılar, gerçek zamanlı olarak modelin nasıl yanıt vereceğini daha doğrudan kontrol edebilecek. Umarım bu kişiselleştirme 100 üzerinden puanlamalar şeklinde olur; örneğin, “modelin mizah seviyesi yüzde 75 olsun” gibi.

Related Posts

Araştırma kanıtladı: İnsanlar gözleriyle gerçekten iletişim kurabiliyor

Yeni bir araştırma, insanların yalnızca göz hareketleriyle bile anlamlı bir iletişim kurabildiğini ortaya koydu. Kanada’daki McGill Üniversitesi’nden psikoloji profesörü Jelena Ristic ve ekibi tarafından yürütülen çalışmaya göre, gözlerin niyet taşıyıp taşımadığı, izleyen kişiler tarafından bilinçsizce algılanabiliyor.

Fatih’in okçuları kıyasıya mücadele etti

Fatih Belediyesi, ata sporlarından okçuluğu yaşatmak ve gelecek nesillere aktarmak amacıyla okçuluk yarışması düzenledi. Fatih Belediyesi Spor Tesisleri’nde gerçekleşen Okçuluk Yarışması, genç sporcuların heyecan dolu mücadelesine sahne oldu.

YouTube, mini oynatıcı tasarımını değiştiriyor!

YouTube, Android uygulamasındaki mini oynatıcı arayüzünü bir kez daha yeniliyor. Geçtiğimiz yıl yaptığı değişiklikle daha büyük ve işlevsel bir mini oynatıcı sunan platform, aldığı yoğun eleştiriler sonrasında, bu tasarımı geri çekiyor ve daha sade …

Dünyanın en yaşlı ağacı Büyükbaba tehdit altında

Şili’deki 5 bin 400 yıllık “Büyükbaba”, yalnızca dünyanın en yaşlı canlılarından biri değil; aynı zamanda iklim verilerinin bekçisi. Şimdi bir yol projesi tehdidi altında.

Steam kullanıcılarının tercihi netleşiyor: Windows 11 yine yükseldi!

Steam’in aylık Yazılım ve Donanım raporunun Nisan sürümü yayınlandı. Rapora göre Windows 11, oyuncular arasında çok daha iyi bir performans gösteriyor. Peki ya donanım tarafında durum nasıl? Gelin birlikte bakalım…

iPhone’unuzun ömründen yiyor: Bu 3 ayarı kapatın!

Uzmanlar, söz konusu üç ayarın bir arada devre dışı bırakılması durumunda iPhone kullanıcılarının günlük kullanım süresini ortalama %15–20 oranında uzatabileceğini vurguluyor.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir