Yapay zeka, dürüst olmaları için eğitilmiş olmalarına rağmen insanları kandırmayı öğreniyor

Kaydolun ve günde 1000 $ kazanın ⋙

Yeni bir araştırma, birçok üst düzey yapay zekanın dürüst olmak üzere eğitilmiş olmalarına rağmen, eğitim yoluyla aldatmayı öğrendiğini ve "sistematik olarak kullanıcıları yanlış inançlara yönlendirdiğini" buldu.

Araştırma ekibine Massachusetts Teknoloji Enstitüsü'nde (MIT) yapay zekanın hayatta kalması ve güvenliği konusunda lisansüstü öğrencisi olan Dr. Peter S. Park ve dört üye daha liderlik etti. Araştırma sırasında ekip, aralarında yapay zeka alanının gelişiminin kurucularından Geoffrey Hinton'ın da bulunduğu çok sayıda uzmandan da tavsiye aldı.

Yapay zeka, dürüst olmaları için eğitilmiş olmalarına rağmen insanları kandırmayı öğreniyor
İllüstrasyon: Orta.

Araştırma, birden fazla görevi yerine getirmek üzere eğitilmiş genel amaçlı bir sistem olan OpenAI'nin GPT-4'ü gibi iki yapay zeka sistemine odaklandı; ve Meta'nın Cicero'su gibi belirli bir görevi yerine getirmek için özel olarak tasarlanmış sistemler.

Bay Park, bu yapay zeka sistemlerinin dürüst olmak üzere eğitildiğini, ancak eğitim sırasında görevleri tamamlamak için sıklıkla aldatıcı numaralar öğrendiklerini söyledi.

Çalışmada, "sosyal bir unsurla oyun kazanmak" üzere eğitilen yapay zeka sistemlerinin özellikle aldatmaya meyilli olduğu bulundu.

Örneğin ekip, oyuncuların kendileri için ittifaklar kurmasını ve rakip ittifakları bozmasını gerektiren klasik bir strateji oyunu olan Diplomacy'yi oynamak için Meta tarafından eğitilmiş Cicero'yu kullanmayı denedi. Sonuç olarak bu yapay zeka sıklıkla müttefiklerine ihanet ediyor ve düpedüz yalan söylüyor.

GPT-4 ile yapılan deneyler, OpenAI'nin aracının, ev temizliği ve mobilya montajı hizmetleri veren bir şirket olan TaskRabbit'te çalışan bir çalışanı, ciddi görme bozukluğu nedeniyle bir Captcha kodunu geçmek için yardıma ihtiyacı olduğunu söyleyerek "psikolojik olarak manipüle etmeyi" başardığını gösterdi. Bu çalışan, daha önceki şüphelere rağmen OpenAI'nin yapay zekasının "sınırı geçmesine" yardımcı oldu.

Park'ın ekibi, Claude AI'nın arkasındaki şirket olan Anthropic'in yaptığı araştırmaya atıfta bulundu. Bu araştırmaya göre, büyük dil modeli (LLM) aldatmayı öğrendiğinde, güvenli eğitim yöntemleri işe yaramaz hale geliyor ve "geri döndürülmesi zor" oluyor. Grup, bunun yapay zekada endişe verici bir sorun olduğuna inanıyor.

Ekibin araştırma sonuçları, önde gelen disiplinlerarası bilimsel raporların yer aldığı Cell Press'te yayımlandı.

Meta ve OpenAI ise bu araştırmanın sonuçları hakkında bir yorum yapmadı.

Yapay zeka sistemlerinin önemli riskler oluşturabileceğinden endişe eden ekip, ayrıca politika yapıcılara daha güçlü yapay zeka düzenlemeleri getirmeleri çağrısında bulundu.

Araştırma ekibi, yapay zeka düzenlemelerine ihtiyaç duyulduğunu, hileli davranış gösteren modellerin risk değerlendirme gerekliliklerine uymaya zorlandığını ve yapay zeka sistemlerinin ve çıktılarının sıkı bir şekilde kontrol edilmesi gerektiğini belirtiyor. Gerekirse tüm verilerin silinip sıfırdan yeniden eğitilmesi gerekebilir.

Sign up and earn $1000 a day ⋙

Leave a Comment

Normal TV ile Akıllı TV arasındaki fark

Normal TV ile Akıllı TV arasındaki fark

Akıllı televizyonlar gerçekten dünyayı kasıp kavurdu. Teknolojinin sunduğu pek çok harika özellik ve internet bağlantısı, televizyon izleme şeklimizi değiştirdi.

Dondurucuda ışık yokken buzdolabında neden ışık var?

Dondurucuda ışık yokken buzdolabında neden ışık var?

Buzdolapları evlerde sıkça kullanılan cihazlardır. Buzdolapları genellikle 2 bölmeden oluşur, soğutucu bölme geniştir ve kullanıcı her açtığında otomatik olarak yanan bir ışığa sahiptir, dondurucu bölme ise dardır ve hiç ışığı yoktur.

Wi-Fiyi Yavaşlatan Ağ Tıkanıklığını Gidermenin 2 Yolu

Wi-Fiyi Yavaşlatan Ağ Tıkanıklığını Gidermenin 2 Yolu

Wi-Fi ağları, yönlendiriciler, bant genişliği ve parazitlerin yanı sıra birçok faktörden etkilenir; ancak ağınızı güçlendirmenin bazı akıllı yolları vardır.

Tenorshare Reiboot Kullanarak Veri Kaybı Olmadan iOS 17den iOS 16ya Nasıl Geri Dönülür

Tenorshare Reiboot Kullanarak Veri Kaybı Olmadan iOS 17den iOS 16ya Nasıl Geri Dönülür

Telefonunuzda kararlı iOS 16'ya geri dönmek istiyorsanız, iOS 17'yi kaldırma ve iOS 17'den 16'ya geri dönme konusunda temel kılavuzu burada bulabilirsiniz.

Her gün yoğurt yediğinizde vücudunuzda neler olur?

Her gün yoğurt yediğinizde vücudunuzda neler olur?

Yoğurt harika bir besindir. Her gün yoğurt yemek faydalı mıdır? Her gün yoğurt yediğinizde vücudunuzda nasıl değişiklikler olur? Hadi birlikte öğrenelim!

Hangi pirinç türü sağlık açısından daha iyidir?

Hangi pirinç türü sağlık açısından daha iyidir?

Bu yazıda en besleyici pirinç türleri ve seçtiğiniz pirincin sağlık yararlarından nasıl en iyi şekilde yararlanabileceğiniz ele alınıyor.

Sabahları zamanında nasıl uyanılır

Sabahları zamanında nasıl uyanılır

Uyku düzeninizi ve uyku vakti rutininizi oluşturmak, çalar saatinizi değiştirmek ve beslenmenizi buna göre ayarlamak, daha iyi uyumanıza ve sabahları zamanında uyanmanıza yardımcı olabilecek önlemlerden birkaçıdır.

Rent Please! oynamak için ipuçları Yeni Başlayanlar İçin Ev Sahibi Simülasyonu

Rent Please! oynamak için ipuçları Yeni Başlayanlar İçin Ev Sahibi Simülasyonu

Kiralayın Lütfen! Landlord Sim, iOS ve Android'de oynanabilen bir simülasyon mobil oyunudur. Bir apartman kompleksinin ev sahibi olarak oynayacak ve dairenizin içini iyileştirme ve kiracılar için hazır hale getirme amacıyla bir daireyi kiralamaya başlayacaksınız.

En Son Banyo Kule Savunma Kodları ve Kodların Nasıl Girileceği

En Son Banyo Kule Savunma Kodları ve Kodların Nasıl Girileceği

Bathroom Tower Defense Roblox oyun kodunu alın ve heyecan verici ödüller için kullanın. Daha yüksek hasara sahip kuleleri yükseltmenize veya kilidini açmanıza yardımcı olacaklar.

Transformatörlerin yapısı, sembolleri ve çalışma prensipleri

Transformatörlerin yapısı, sembolleri ve çalışma prensipleri

Transformatörlerin yapısını, sembollerini ve çalışma prensiplerini en doğru şekilde öğrenelim.

Yapay Zekanın Akıllı TVleri Daha İyi Hale Getirmesinin 4 Yolu

Yapay Zekanın Akıllı TVleri Daha İyi Hale Getirmesinin 4 Yolu

Daha iyi görüntü ve ses kalitesinden ses kontrolüne ve daha fazlasına kadar, bu yapay zeka destekli özellikler akıllı televizyonları çok daha iyi hale getiriyor!

ChatGPT neden DeepSeekten daha iyidir

ChatGPT neden DeepSeekten daha iyidir

Başlangıçta DeepSeek'e yönelik büyük umutlar vardı. ChatGPT'ye güçlü bir rakip olarak pazarlanan bir yapay zeka sohbet robotu olarak, akıllı sohbet yetenekleri ve deneyimleri vadediyor.

Fireflies.ai ile tanışın: Size Saatlerce Çalışma Kazandıran Ücretsiz AI Sekreteri

Fireflies.ai ile tanışın: Size Saatlerce Çalışma Kazandıran Ücretsiz AI Sekreteri

Önemli ayrıntıları not alırken gözden kaçırmak kolaydır ve sohbet ederken not almaya çalışmak dikkat dağıtıcı olabilir. Çözüm Fireflies.ai'dır.

Axolotl Minecraft nasıl yetiştirilir, Minecraft Salamander nasıl evcilleştirilir

Axolotl Minecraft nasıl yetiştirilir, Minecraft Salamander nasıl evcilleştirilir

Axolot Minecraft, oyuncuların su altında görev yaparken nasıl kullanacaklarını bilmeleri durumunda harika bir yardımcı olacaktır.

Sessiz Bir Yer: Önümüzdeki Yol PC Oyun Yapılandırması

Sessiz Bir Yer: Önümüzdeki Yol PC Oyun Yapılandırması

A Quiet Place: The Road Ahead'in yapılandırması oldukça yüksek olarak derecelendirilmiştir, bu yüzden indirmeye karar vermeden önce yapılandırmayı göz önünde bulundurmanız gerekecektir.