Yapay zeka, dürüst olmaları için eğitilmiş olmalarına rağmen insanları kandırmayı öğreniyor

Yeni bir araştırma, birçok üst düzey yapay zekanın dürüst olmak üzere eğitilmiş olmalarına rağmen, eğitim yoluyla aldatmayı öğrendiğini ve "sistematik olarak kullanıcıları yanlış inançlara yönlendirdiğini" buldu.

Araştırma ekibine Massachusetts Teknoloji Enstitüsü'nde (MIT) yapay zekanın hayatta kalması ve güvenliği konusunda lisansüstü öğrencisi olan Dr. Peter S. Park ve dört üye daha liderlik etti. Araştırma sırasında ekip, aralarında yapay zeka alanının gelişiminin kurucularından Geoffrey Hinton'ın da bulunduğu çok sayıda uzmandan da tavsiye aldı.

Yapay zeka, dürüst olmaları için eğitilmiş olmalarına rağmen insanları kandırmayı öğreniyor — İllüstrasyon: Orta.

Araştırma, birden fazla görevi yerine getirmek üzere eğitilmiş genel amaçlı bir sistem olan OpenAI'nin GPT-4'ü gibi iki yapay zeka sistemine odaklandı; ve Meta'nın Cicero'su gibi belirli bir görevi yerine getirmek için özel olarak tasarlanmış sistemler.

Bay Park, bu yapay zeka sistemlerinin dürüst olmak üzere eğitildiğini, ancak eğitim sırasında görevleri tamamlamak için sıklıkla aldatıcı numaralar öğrendiklerini söyledi.

Çalışmada, "sosyal bir unsurla oyun kazanmak" üzere eğitilen yapay zeka sistemlerinin özellikle aldatmaya meyilli olduğu bulundu.

Örneğin ekip, oyuncuların kendileri için ittifaklar kurmasını ve rakip ittifakları bozmasını gerektiren klasik bir strateji oyunu olan Diplomacy'yi oynamak için Meta tarafından eğitilmiş Cicero'yu kullanmayı denedi. Sonuç olarak bu yapay zeka sıklıkla müttefiklerine ihanet ediyor ve düpedüz yalan söylüyor.

GPT-4 ile yapılan deneyler, OpenAI'nin aracının, ev temizliği ve mobilya montajı hizmetleri veren bir şirket olan TaskRabbit'te çalışan bir çalışanı, ciddi görme bozukluğu nedeniyle bir Captcha kodunu geçmek için yardıma ihtiyacı olduğunu söyleyerek "psikolojik olarak manipüle etmeyi" başardığını gösterdi. Bu çalışan, daha önceki şüphelere rağmen OpenAI'nin yapay zekasının "sınırı geçmesine" yardımcı oldu.

Park'ın ekibi, Claude AI'nın arkasındaki şirket olan Anthropic'in yaptığı araştırmaya atıfta bulundu. Bu araştırmaya göre, büyük dil modeli (LLM) aldatmayı öğrendiğinde, güvenli eğitim yöntemleri işe yaramaz hale geliyor ve "geri döndürülmesi zor" oluyor. Grup, bunun yapay zekada endişe verici bir sorun olduğuna inanıyor.

Ekibin araştırma sonuçları, önde gelen disiplinlerarası bilimsel raporların yer aldığı Cell Press'te yayımlandı.

Meta ve OpenAI ise bu araştırmanın sonuçları hakkında bir yorum yapmadı.

Yapay zeka sistemlerinin önemli riskler oluşturabileceğinden endişe eden ekip, ayrıca politika yapıcılara daha güçlü yapay zeka düzenlemeleri getirmeleri çağrısında bulundu.

Araştırma ekibi, yapay zeka düzenlemelerine ihtiyaç duyulduğunu, hileli davranış gösteren modellerin risk değerlendirme gerekliliklerine uymaya zorlandığını ve yapay zeka sistemlerinin ve çıktılarının sıkı bir şekilde kontrol edilmesi gerektiğini belirtiyor. Gerekirse tüm verilerin silinip sıfırdan yeniden eğitilmesi gerekebilir.

Yorum bırak

Yorum *

Ad *

Web Sitesi

Microsoft Teams Lisans Hatası Giderme

Microsoft Teams'te "Lisans Hatası" ile mi karşılaşıyorsunuz? Lisans sorunlarını hızlıca çözmek, erişimi geri yüklemek ve BT ekibiyle uğraşmadan verimliliği artırmak için bu adım adım sorun giderme kılavuzunu izleyin. En son düzeltmelerle güncellendi.

Microsoft Teams Ücretsiz Abonelik Hatası Nasıl Düzeltilir?

Microsoft Teams Ücretsiz Abonelik Hatası yüzünden toplantılarınızın aksamasından bıktınız mı? Sorunu hızlıca çözmek ve sorunsuz ekip çalışmasını yeniden sağlamak için kanıtlanmış, adım adım çözümleri keşfedin. En yeni sürümlerde çalışır!

Herkese Açık Wi-Fi Ağlarında Microsoft Teams Ağ Hatasını Çözme

Herkese açık Wi-Fi ağlarında Microsoft Teams ağ hatasıyla mı karşılaşıyorsunuz? Aramalarınızı ve toplantılarınızı sorunsuz bir şekilde geri yüklemek için VPN ayarları, port kontrolleri ve önbellek temizleme gibi anında çözümler bulun. Hızlı çözüm için adım adım kılavuz.

Microsoft Teams Wiki Sekmesinin Yüklenmeme Hatası Nasıl Düzeltilir?

Microsoft Teams Wiki sekmesinin yüklenmemesi hatasıyla mı karşılaşıyorsunuz? Sorunu hızlıca çözmek, Wiki sekmelerinizi geri yüklemek ve ekip verimliliğini sorunsuz bir şekilde artırmak için kanıtlanmış adım adım çözümleri keşfedin.

Microsoft Teams Mac Hata Anahtar Zinciri Sorunlarını Giderme

Microsoft Teams Mac'te Anahtar Zinciri hatasıyla mı mücadele ediyorsunuz? Sorunsuz iş birliğine geri dönmek için macOS için kanıtlanmış, adım adım sorun giderme çözümlerini keşfedin. Hızlı çözümler içeride!

Microsoft Teams Mikrofonunda Sesin Boğuk Gelmesi veya Hiç Gelmemesi Sorununu Nasıl Çözersiniz?

Microsoft Teams mikrofonunuzda boğuk veya hiç ses olmamasından bıktınız mı? Microsoft Teams mikrofon sorunlarını hızlı ve kanıtlanmış adımlarla nasıl çözeceğinizi keşfedin. Net ses sizi bekliyor!

Microsoft Teamse Hızlı Mobil Giriş İçin QR Kodunu Nerede Bulabilirsiniz?

Microsoft Teams QR kodunun nerede olduğunu ve mobil cihazınızdan süper hızlı nasıl giriş yapabileceğinizi tam olarak keşfedin. Adım adım, görsellerle desteklenmiş kılavuz sayesinde saniyeler içinde bağlantı kurabilirsiniz—şifreye gerek yok!

Microsoft Teams Neden Bu Kadar Yavaş? 2026da Hızlandırmak İçin 10 İpucu

Microsoft Teams'in yavaş çalışmasından mı rahatsızsınız? Microsoft Teams'in neden bu kadar yavaş olduğunu keşfedin ve 2026'da sorunsuz bir iş birliği için hızını önemli ölçüde artırmak üzere bu 10 kanıtlanmış ipucunu uygulayın.

Bilgisayarınızda Microsoft Teams Kurulum Klasörünü Nerede Bulabilirsiniz?

Bilgisayarınızda Microsoft Teams kurulum klasörünü bulmakta zorlanıyor musunuz? Bu adım adım kılavuz, yeni ve klasik Teams sürümleri için, kullanıcı ve makine bazında kurulumların tam yollarını gösteriyor. Sorun gidermede zamandan tasarruf edin!

Microsoft Teams Görev Yönetimi Senkronizasyon Hataları Nasıl Düzeltilir?

Microsoft Teams Görev Yönetimi Senkronizasyon Hatalarının iş akışınızı aksatmasından bıktınız mı? Teams, Planner ve To Do genelinde sorunsuz görev senkronizasyonunu geri yüklemek için uzmanlarımızın adım adım çözümlerini izleyin. Anında rahatlama için hızlı çözümler!