Teknoloji dünyasını sarsan ücretsiz yapay zeka modelinin arkasındaki Çinli şirket DeepSeek, kendi adını taşıyan yapay zeka modelini eğitmek ve çalıştırmak için kaçak Nvidia GPU'larını kullandığı iddiası da dahil olmak üzere bir dizi olumsuz iddiayla karşı karşıya.
Buna göre, ABD Ticaret Bakanlığı, DeepSeek'in Singapur'daki aracılar aracılığıyla Nvidia GPU'larına yasadışı olarak erişip topladığını araştırmayı düşünüyor. ABD, teknoloji alanındaki lider konumunu korumak ve rakibinin hızlı gelişimini engellemek amacıyla son yıllarda Çin'e yönelik gelişmiş çip ihracatına yönelik sıkı kısıtlamalar uyguluyor.
DeepSeek yakın zamanda R1 çıkarım modelini yayınlayarak gündem oldu. Bu modelin, yalnızca ücretli abonelik gerektiren ChatGPT Pro abonelik planında kullanılabilen OpenAI'nin o1 modeline yakın bir performansa sahip olduğu söyleniyor. DeepSeek'i bu kadar değerli kılan şey, benzer performansa sahip olmasının yanı sıra, açık kaynaklı ve herkese ücretsiz olarak sunulmasıdır. OpenAI'nin son teknoloji çıkarım modelini daha önce deneyimleme şansı bulamayanlar için artık DeepSeek R1 değerli bir alternatif.
DeepSeek o kadar popüler oldu ki, uygulama ABD App Store listelerinde 1 numaraya yükseldi ve ABD borsasının sadece birkaç gün içinde 2 trilyon dolarlık piyasa değeri yok olarak çakılmasına neden oldu.
DeepSeek'in tüm bunları yalnızca 2.000 adet Nvidia H800 GPU ve yaklaşık 6 milyon dolarlık yatırım maliyetiyle yaptığını iddia etmesi dikkat çekici. Bu rakam, OpenAI ve benzeri birçok yapay zeka modeline yapılan büyük yatırımlarla kıyaslandığında oldukça düşük kalıyor.
Citigroup'a göre Microsoft, Meta, Amazon ve Alphabet gibi ABD'li teknoloji devleri geçen yıl veri altyapısına toplamda yaklaşık 209 milyar dolar harcadı ve bunun yüzde 80'i veri merkezlerine gitti. Bu durum, DeepSeek'in gerçekten OpenAI ve diğer ABD yapay zeka şirketlerinden farklı bir şey yapıp yapmadığını ve çok daha az kaynakla yapay zeka modellerini eğitmenin mümkün olup olmadığını merak eden birçok kişiye yol açtı.

ABD Başkanı Donald Trump döneminde yapay zeka alanında görev yapmış olan David Sacks, yakın zamanda verdiği bir röportajda, DeepSeek'in OpenAI'nin çıktılarını kendi modelini eğitmek için damıttığına dair "önemli kanıtlar" olduğunu söyledi. Bu damıtma süreci, insanların öğrenme biçimine benzer şekilde, "ebeveyn modelin" (OpenAI) mantığını taklit eden bir "çocuk modelin" (DeepSeek) milyonlarca soru sorarak çalışmasını içerir. Microsoft ve OpenAI da konuyla ilgili kendi soruşturmalarını başlattı; öncelikli amaç DeepSeek'in OpenAI'nin verilerine uygunsuz bir şekilde erişip erişmediğini açıklığa kavuşturmak.
DeepSeek, Nvidia'nın ilk olarak ihracat kontrolleri getirildikten sonra Çin pazarı için özel olarak geliştirdiği bir yapay zeka yonga seti olan H800 çipini kullandığını söyledi. DeepSeek'in Nvidia H800'leri nasıl edindiği henüz bilinmiyor ancak şirket bunları 2022'nin sonu veya 2023'te satın alabilir.
DeepSeek'in kaçak çip kullandığına dair henüz bir kanıt yok. Ancak birçok Çinli yapay zeka şirketinin bunu yaptığı söyleniyor. Yapay zeka çiplerinin Çin'e organize bir şekilde kaçırıldığı Malezya, Singapur ve Birleşik Arap Emirlikleri de dahil olmak üzere birçok ülkede tespit edildi.