Yapay zeka, dürüst olmaları için eğitilmiş olmalarına rağmen insanları kandırmayı öğreniyor

Kaydolun ve günde 1000 $ kazanın ⋙

Yeni bir araştırma, birçok üst düzey yapay zekanın dürüst olmak üzere eğitilmiş olmalarına rağmen, eğitim yoluyla aldatmayı öğrendiğini ve "sistematik olarak kullanıcıları yanlış inançlara yönlendirdiğini" buldu.

Araştırma ekibine Massachusetts Teknoloji Enstitüsü'nde (MIT) yapay zekanın hayatta kalması ve güvenliği konusunda lisansüstü öğrencisi olan Dr. Peter S. Park ve dört üye daha liderlik etti. Araştırma sırasında ekip, aralarında yapay zeka alanının gelişiminin kurucularından Geoffrey Hinton'ın da bulunduğu çok sayıda uzmandan da tavsiye aldı.

Yapay zeka, dürüst olmaları için eğitilmiş olmalarına rağmen insanları kandırmayı öğreniyor
İllüstrasyon: Orta.

Araştırma, birden fazla görevi yerine getirmek üzere eğitilmiş genel amaçlı bir sistem olan OpenAI'nin GPT-4'ü gibi iki yapay zeka sistemine odaklandı; ve Meta'nın Cicero'su gibi belirli bir görevi yerine getirmek için özel olarak tasarlanmış sistemler.

Bay Park, bu yapay zeka sistemlerinin dürüst olmak üzere eğitildiğini, ancak eğitim sırasında görevleri tamamlamak için sıklıkla aldatıcı numaralar öğrendiklerini söyledi.

Çalışmada, "sosyal bir unsurla oyun kazanmak" üzere eğitilen yapay zeka sistemlerinin özellikle aldatmaya meyilli olduğu bulundu.

Örneğin ekip, oyuncuların kendileri için ittifaklar kurmasını ve rakip ittifakları bozmasını gerektiren klasik bir strateji oyunu olan Diplomacy'yi oynamak için Meta tarafından eğitilmiş Cicero'yu kullanmayı denedi. Sonuç olarak bu yapay zeka sıklıkla müttefiklerine ihanet ediyor ve düpedüz yalan söylüyor.

GPT-4 ile yapılan deneyler, OpenAI'nin aracının, ev temizliği ve mobilya montajı hizmetleri veren bir şirket olan TaskRabbit'te çalışan bir çalışanı, ciddi görme bozukluğu nedeniyle bir Captcha kodunu geçmek için yardıma ihtiyacı olduğunu söyleyerek "psikolojik olarak manipüle etmeyi" başardığını gösterdi. Bu çalışan, daha önceki şüphelere rağmen OpenAI'nin yapay zekasının "sınırı geçmesine" yardımcı oldu.

Park'ın ekibi, Claude AI'nın arkasındaki şirket olan Anthropic'in yaptığı araştırmaya atıfta bulundu. Bu araştırmaya göre, büyük dil modeli (LLM) aldatmayı öğrendiğinde, güvenli eğitim yöntemleri işe yaramaz hale geliyor ve "geri döndürülmesi zor" oluyor. Grup, bunun yapay zekada endişe verici bir sorun olduğuna inanıyor.

Ekibin araştırma sonuçları, önde gelen disiplinlerarası bilimsel raporların yer aldığı Cell Press'te yayımlandı.

Meta ve OpenAI ise bu araştırmanın sonuçları hakkında bir yorum yapmadı.

Yapay zeka sistemlerinin önemli riskler oluşturabileceğinden endişe eden ekip, ayrıca politika yapıcılara daha güçlü yapay zeka düzenlemeleri getirmeleri çağrısında bulundu.

Araştırma ekibi, yapay zeka düzenlemelerine ihtiyaç duyulduğunu, hileli davranış gösteren modellerin risk değerlendirme gerekliliklerine uymaya zorlandığını ve yapay zeka sistemlerinin ve çıktılarının sıkı bir şekilde kontrol edilmesi gerektiğini belirtiyor. Gerekirse tüm verilerin silinip sıfırdan yeniden eğitilmesi gerekebilir.

Sign up and earn $1000 a day ⋙

Leave a Comment

Dizüstü bilgisayarınızı bir telefonla değiştirmek için ihtiyacınız olan her şey

Dizüstü bilgisayarınızı bir telefonla değiştirmek için ihtiyacınız olan her şey

Gerçekten dizüstü bilgisayarınızı telefonunuzla değiştirebilir misiniz? Evet, ancak telefonunuzu dizüstü bilgisayara dönüştürmek için doğru aksesuarlara ihtiyacınız olacak.

ChatGPT yakında ekranınızda olup biten her şeyi görebilecek

ChatGPT yakında ekranınızda olup biten her şeyi görebilecek

Etkinliğin tam videosunda dikkat çeken bir nokta ise, yakında çıkacak olan ChatGPT uygulama özelliğinin tanıtılması ancak gerçek detayların paylaşılmaması. ChatGPT'nin kullanıcının cihaz ekranında olup biten her şeyi görebilme yeteneğidir.

Yapay zeka, dürüst olmaları için eğitilmiş olmalarına rağmen insanları kandırmayı öğreniyor

Yapay zeka, dürüst olmaları için eğitilmiş olmalarına rağmen insanları kandırmayı öğreniyor

Yeni bir araştırma, birçok üst düzey yapay zekanın dürüst olmak üzere eğitilmiş olmasına rağmen, eğitim yoluyla aldatmayı öğrendiğini ve kullanıcıları sistematik olarak yanlış inançlara yönlendirdiğini ortaya koydu.

ChatGPTde sorular nasıl değiştirilir

ChatGPTde sorular nasıl değiştirilir

ChatGPT'de artık kullanıcıların ChatGPT ile paylaştıkları soruyu veya içeriği düzenleyebilmeleri için bir soru değiştirme seçeneği bulunuyor.

Sahte QR kodlarını nasıl tespit edebilir ve verilerinizi nasıl güvende tutabilirsiniz?

Sahte QR kodlarını nasıl tespit edebilir ve verilerinizi nasıl güvende tutabilirsiniz?

QR kodları, kötü bir QR kodunu taradığınızda ve sisteminize kötü bir şey fırlatıldığında oldukça zararsız görünür. Telefonunuzu ve verilerinizi güvende tutmak istiyorsanız sahte QR kodlarını tespit etmenin birkaç yolu vardır.

Qualcomm, Bir dizi Önemli İyileştirmeyle X85 5G Modemini Piyasaya Sürüyor

Qualcomm, Bir dizi Önemli İyileştirmeyle X85 5G Modemini Piyasaya Sürüyor

Qualcomm, MWC 2025'te sahnede, bu yılın sonlarında piyasaya sürülecek amiral gemisi akıllı telefonlarda kullanılması beklenen X85 adlı sekizinci nesil 5G modemini tanıtarak büyük yankı uyandırdı.

Yeni teknoloji telefonların esnek bir şekilde renk değiştirmesine olanak sağlıyor

Yeni teknoloji telefonların esnek bir şekilde renk değiştirmesine olanak sağlıyor

Moda olan "Ultramarine" iPhone 16'nız var, ancak bir gün aniden o renkten sıkıldığınızı hissediyorsunuz; Ne yapacaksın?

Microsoft, DeepSeeki PC Copilot+ platformuna entegre ediyor

Microsoft, DeepSeeki PC Copilot+ platformuna entegre ediyor

Microsoft, Ocak ayında DeepSeek-R1 modelinin NPU için optimize edilmiş sürümlerini Qualcomm Snapdragon X işlemcilerle çalışan Copilot+ bilgisayarlarına doğrudan getirmeyi planladığını duyurdu.

Excelde IF ve Switch işlevleri arasındaki fark

Excelde IF ve Switch işlevleri arasındaki fark

Eğer ifadesi Excel'de yaygın bir mantıksal fonksiyondur. SWITCH ifadesi daha az bilinir, ancak bazı durumlarda IF ifadesi yerine kullanabilirsiniz.

Adobe Camera Raw kullanarak nesnenizin arkasına spot ışığı efekti nasıl eklenir

Adobe Camera Raw kullanarak nesnenizin arkasına spot ışığı efekti nasıl eklenir

Fotoğrafta, konunun arkasına spot ışığı efekti eklemek, konuyu arka plandan ayırmanın harika bir yoludur. Portre fotoğraflarınıza derinlik katmak için spot ışığı efekti kullanabilirsiniz.

Outlook eki boyut sınırı nasıl artırılır

Outlook eki boyut sınırı nasıl artırılır

Outlook ve diğer e-posta servislerinde e-posta eklerinin boyutu konusunda sınırlamalar vardır. Outlook ek dosya boyutu sınırını artırmaya yönelik talimatlar aşağıdadır.

Lightroom diğer tüm fotoğraf düzenleme uygulamalarından neden daha iyidir?

Lightroom diğer tüm fotoğraf düzenleme uygulamalarından neden daha iyidir?

Birçok rakibi olmasına rağmen Adobe Lightroom hala en iyi fotoğraf düzenleme uygulamasıdır. Evet, erişim için ücret ödemeniz gerekiyor, ancak Lightroom'un özellikleri buna değer.

Apple Invitesı etkinlikler oluşturmak için nasıl kullanırsınız?

Apple Invitesı etkinlikler oluşturmak için nasıl kullanırsınız?

Apple, Invites ismiyle kendi etkinlik yönetim uygulamasını yayınladı. Bu uygulama, etkinlikler oluşturmanıza, davetiye göndermenize ve yanıtları yönetmenize olanak tanır.

Cheat Heroes 3, Heroes 3 kodları tüm sürümler

Cheat Heroes 3, Heroes 3 kodları tüm sürümler

İşte tüm Heroes 3 kodları, Heroes 3 WoG hilesi, Heroes 3 SoD, Heroes 3 of Might and Magic gibi tüm sürümler için Heroes 3 hileleri

En son Tay Du VNG Kodu ve kod nasıl girilir

En son Tay Du VNG Kodu ve kod nasıl girilir

En son Tay Du VNG kodu oyunculara iksirler, gümüş, altın külçeleri, ödül sandıkları ve yeni oyuncuların genel turları açmalarına yardımcı olacak bir dizi diğer öğe gibi bir dizi cazip ödül sunuyor.