Google, Gemini 2.5in OpenAI, DeepSeek ve Diğer Yapay Zeka Teknoloji Devlerinin En İyi Modellerinden Daha İyi Performans Gösterdiğini İddia Ediyor

Kaydolun ve günde 1000 $ kazanın ⋙

Google, şirketin "şimdiye kadarki en akıllı yapay zeka modeli" olarak adlandırdığı Gemini 2.5'i tanıttı. Modelin ilk versiyonu Gemini 2.5 Pro oldu ve birçok testte etkileyici benchmark puanları elde etti.

Google, Gemini 2.5'in OpenAI, DeepSeek ve diğer yapay zeka teknoloji devlerinin en iyi modellerinden daha iyi performans gösterdiğini iddia ediyor

Gemini 2.5 Pro şu anda Google AI Studio üzerinden ve Gemini Advanced kullanıcısıysanız Gemini uygulamasından edinilebilir . Gemini 2.5 Pro'nun yakın gelecekte Vertex AI üzerinden de satışa sunulması bekleniyor.

Google, Gemini 2.5 Pro veya diğer Gemini 2.5 modelleri için fiyatlandırmayı şu anda paylaşmadı.

Gemini 2.5 kullanan tüm modeller "düşünme modelleridir", yani bir yanıt üretmeden önce düşünce sürecini işleyebilirler. Bu "akıl yürütme" modelleri, daha karmaşık ve çoğu zaman daha doğru yanıtlar ürettikleri için yapay zeka alanındaki bir sonraki büyük adımdır.

Google , "Şimdi Gemini 2.5 ile önemli ölçüde iyileştirilmiş temel modeli iyileştirilmiş eğitim sonrası özelliklerle birleştirerek yeni bir performans düzeyine ulaştık " dedi.

"Gelecekte, bu düşünme yeteneklerini doğrudan tüm modellerimize entegre edeceğiz, böylece daha karmaşık sorunları ele alabilecek ve aracıları daha iyi bağlam farkındalığıyla destekleyebilecekler . "

Gemini 2.5, OpenAI modelleriyle karşılaştırıldığında nasıl görünüyor?

Google, Gemini 2.5'in OpenAI, DeepSeek ve Diğer Yapay Zeka Teknoloji Devlerinin En İyi Modellerinden Daha İyi Performans Gösterdiğini İddia Ediyor
Google Gemini 2.5 Karşılaştırması

Google'ın Gemini 2.5 Pro modelleri, OpenAI ve DeepSeek'in önceki üst düzey modellerinden daha iyi performans gösteriyor.

Google'ın Gemini 2.5 için paylaştığı kıyaslama puanları oldukça etkileyici. Gemini 2.5 Pro Experimental, Humanity's Last Exam'da %18.5 puan aldı.

Bu puan, en azından şimdilik, Gemini 2.5 Pro Experimental'ın bu ölçüte göre en iyi model olduğu anlamına geliyor. Puanı OpenAI 03-mini'yi (%14) ve DeepSeek R1'i (%8,6) geride bırakıyor.

Bu özel test zor olarak kabul ediliyor, ancak bir yapay zeka modelinin performansını ölçmenin tek yolu bu değil.

Google ayrıca Gemini 2.5 Pro'nun programlama yeteneklerini ve modelin matematik ve fen alanlarındaki kıyaslamalarını da vurguladı. Gemini 2.5 Pro, GPQA ve AIME 2025'te yapılan ölçümlere göre şu anda matematik ve fen bilimleri alanında lider konumda.

Gemini 2.5'te programlama yapmak mümkün mü?

Gemini 2.5'in ana odağı programlamadır. Google, "2.0'a göre büyük bir sıçrama" yaşandığını iddia ediyor ve daha fazla iyileştirmenin yolda olduğunu ima ediyor.

Google'ın yeni modeli web uygulamaları ve aracı kod uygulamaları oluşturabiliyor. Google'ın hazırladığı bir demoda, Gemini 2.5 Pro'nun tek satırlık komuttan oyun oluşturmak için nasıl kullanıldığı gösteriliyor.

Google'ın Gemini 2.5 Pro'sunun Kurumsal Yapay Zeka İçin Önemli Olmasının 4 Nedeni

Gemini 2.5 Pro'yu değerlendirirken kurumsal ekiplerin aklında bulundurması gereken dört önemli nokta şunlardır:

1. Yapılandırılmış, şeffaf muhakeme – düşüncenin netliği için yeni bir standart

Gemini 2.5 Pro'yu farklı kılan sadece zekası değil; bu zekanın işini nasıl net bir şekilde ortaya koyduğudur. Google'ın adım adım eğitim yöntemi, DeepSeek gibi modellerde gördüğümüz gibi saçma sapan konuşmalara veya tahminlere benzemeyen yapılandırılmış bir düşünce dizisi (CoT) oluşturur . Bu CoT'lar OpenAI'nin modelleri gibi yüzeysel özetlere indirgenmemiştir. Yeni Gemini modeli fikirleri numaralandırılmış adımlarla, alt maddeler halinde ve son derece açık ve şeffaf bir iç mantıkla sunuyor.

Pratik açıdan bakıldığında bu, güvenilirlik ve seyrüsefer kolaylığı açısından bir dönüm noktasıdır. Politika çıkarımlarını gözden geçirme, mantığı kodlama veya karmaşık araştırmaları özetleme gibi kritik görevler için çıktıları değerlendiren iş kullanıcıları artık modelin cevaba nasıl ulaştığını görebiliyor. Bu, cevapları daha güvenle doğrulayabilecekleri, düzeltebilecekleri veya yönlendirebilecekleri anlamına gelir. Bu, birçok büyük dil modeli (LLM) çıktısında hâlâ devam eden "kara kutu" hissine karşı büyük bir adımdır .

Bu modelin nasıl performans gösterdiğine dair daha ayrıntılı bir kılavuz için Gemini 2.5 Pro'nun canlı olarak test edildiği video dökümünü izleyin. Tartışılan bir örnek: Büyük dil modellerinin sınırlamaları sorulduğunda, Gemini 2.5 Pro dikkate değer bir farkındalık gösterdi. Yaygın zayıflıkları ana hatlarıyla belirtir ve bunları "fiziksel sezgi", "yeni kavram sentezi", "uzun vadeli planlama" ve "etik nüans" gibi alanlara ayırarak kullanıcıların modelin ne bildiğini ve soruna nasıl yaklaşılacağını anlamalarına yardımcı olan bir çerçeve sunar.

Kurumsal mühendislik ekipleri bu yeteneği şu amaçlarla kullanabilir:

  • Görev açısından kritik uygulamalarda karmaşık mantık zincirlerini hata ayıklayın
  • Belirli alanlardaki model sınırlamalarının daha iyi anlaşılması
  • Paydaşlara daha şeffaf, yapay zeka destekli kararlar sağlamak
  • Modelin yaklaşımını inceleyerek kendi eleştirel düşüncelerini geliştirin

Dikkat çeken bir sınırlama ise bu yapılandırılmış akıl yürütmenin Gemini uygulamasında ve Google AI Studio'da mevcut olmasına rağmen şu anda API aracılığıyla erişilebilir olmamasıdır. Bu durum, bu yeteneği kurumsal uygulamalara entegre etmek isteyen geliştiriciler için bir eksikliktir.

2. Sadece teoride değil, son teknoloji için gerçek bir yarışmacı

Model şu anda Chatbot Arena liderlik tablosunda önemli bir farkla zirvede yer alıyor; bir sonraki en iyi modelden 35 Elo puanı daha önde, özellikle de Gemini 2.5 Pro'nun piyasaya sürülmesinden bir gün sonra yayınlanan OpenAI 40 güncellemesi. Ve kıyaslama hakimiyeti çoğu zaman geçici olsa da (her hafta yeni modeller piyasaya sürüldüğünden), Gemini 2.5 Pro gerçekten farklı hissettiriyor.

Google, Gemini 2.5'in OpenAI, DeepSeek ve Diğer Yapay Zeka Teknoloji Devlerinin En İyi Modellerinden Daha İyi Performans Gösterdiğini İddia Ediyor

Derin muhakemeyi ödüllendiren görevlerde mükemmeldir: kodlama, ayrıntılı problem çözme, belgeler arasında özet çıkarma ve hatta soyut planlama. Dahili testlerde, soyut ve ayrıntılı alanlarda LLM zayıflıklarını tespit etmek için popüler bir ölçüt olan "İnsanlığın Son Sınavı" gibi daha önce zor olan ölçütlerde özellikle iyi performans gösterdi.

İş çevreleri hangi modelin hangi akademik sıralamayı kazandığını önemsemeyebilir. Ama bu modelin düşünebildiğini ve size nasıl düşündüğünü göstereceğini umursayacaklardır. Titreşim testi çok önemlidir.

Saygın AI mühendisi Nathan Lambert'in belirttiği gibi, "Google yine en iyi modellere sahip, çünkü bu AI patlamasını başlatmaları gerekirdi. Büyük hata düzeltildi." İş kullanıcıları bunu Google'ın yalnızca rakiplerini yakalaması olarak değil, aynı zamanda iş uygulamaları için önemli olan yeteneklerde onları geride bırakma potansiyeli olarak görmeli.

3. Son olarak, Google'ın şifreleme oyunu güçlüdür

Google geleneksel olarak geliştirici odaklı kodlama desteği açısından OpenAI ve Anthropic'in gerisinde kalmıştır. Gemini 2.5 Pro bunu değiştiriyor.

Uygulamalı testlerde, Replit'e aktarıldığında ilk denemede çalışan bir Tetris oyunu oluşturmak da dahil olmak üzere kodlama zorluklarının üstesinden güçlü bir şekilde gelebildiğini gösterdi; hata ayıklama gerekmiyordu. Daha da dikkat çekici olanı, kod yapısını açıkça açıklıyor, değişkenleri ve adımları dikkatlice etiketliyor ve tek bir satır kod yazmadan önce yaklaşımını sunuyor.

Bu model, kod üretimi alanında lider kabul edilen ve Anthropic'in bu alandaki başarısının en önemli nedenlerinden biri olan Anthropic'in Claude 3.7 Sonnet modeliyle rekabet ediyor. Ancak Gemini 2.5 önemli bir avantaj sunuyor: 1 milyona kadar devasa bir token bağlam penceresi. Claude 3.7 Sonnet şu anda yalnızca 500.000 token sunuyor.

Bu geniş bağlam penceresi, tüm kod tabanında akıl yürütme, çevrimiçi belgeleri okuma ve birden fazla birbirine bağlı dosya üzerinde çalışma için yeni olanaklar sunar. Yazılım mühendisi Simon Willison'ın deneyimi bu avantajı kanıtlıyor.

Kod tabanımızda yeni bir özelliği uygulamak için Gemini 2.5 Pro'yu kullandığımızda, model 18 farklı dosyada gerekli değişiklikleri belirledi ve tüm projeyi yaklaşık 45 dakikada tamamladı; bu da değiştirilen dosya başına ortalama 3 dakikadan az bir süre anlamına geliyor. Bu, aracı çerçeveleri veya yapay zeka destekli geliştirme ortamları ile denemeler yapan işletmeler için ciddi bir araçtır.

4. Ajan benzeri davranışa sahip çoklu yöntem entegrasyonu

OpenAI'nin son 40 modeli gibi bazı modeller daha göz alıcı görüntü üretimiyle daha gösterişli olsa da, Gemini 2.5 Pro, yerleşik çok modlu akıl yürütmenin nasıl göründüğünü sessizce yeniden tanımlıyor gibi görünüyor.

Bir örnekte, Ben Dickson'ın VentureBeat için gerçekleştirdiği uygulamalı bir deney, modelin arama algoritmalarıyla ilgili teknik bir makaleden temel bilgileri çıkarma ve buna karşılık gelen bir SVG akış diyagramı oluşturma becerisini gösterdi; ardından görsel hatalar içeren işlenmiş bir sürüm gösterildiğinde bu akış diyagramını iyileştirdi. Bu düzeydeki çok modlu akıl yürütme, daha önce yalnızca metin içeren modellerle mümkün olmayan yeni iş akışlarının oluşturulmasını mümkün kılıyor.

Başka bir örnekte, geliştirici Sam Witteveen Las Vegas haritasının basit bir ekran görüntüsünü yükledi ve 9 Nisan'da yakınlarda hangi Google etkinliklerinin gerçekleştiğini sordu. Model konumu belirledi, kullanıcının amacını çıkardı, çevrimiçi arama yaptı ve tarih, konum ve alıntı dahil olmak üzere Google Cloud Next hakkında doğru ayrıntıları döndürdü. Tüm bunlar özel bir aracı çerçevesi olmadan, yalnızca çekirdek model ve yerleşik arama ile yapılır.

Aslında bu çok modlu girdi akıl yürütme modeli sadece ona bakmanın ötesine geçiyor. 6 ay sonra bir iş akışının nasıl görünebileceğini önerir: Belgeleri, diyagramları ve panoları yükleyin ve modelin içeriğe göre anlamlı eylemler sentezlemesine, planlama yapmasına veya gerçekleştirmesine izin verin.

Sign up and earn $1000 a day ⋙

Leave a Comment

Google, Geminide AI Video Oluşturma Özelliğini Başlattı

Google, Geminide AI Video Oluşturma Özelliğini Başlattı

Google, kullanıcıların artık Gemini chatbot'u ve yakın zamanda kullanıma sunduğu deneysel aracı Whisk aracılığıyla yapay zeka kullanarak video oluşturabileceğini duyurdu.

Google, Mükemmel Kariyeri Seçmenize Yardımcı Olacak En Son Yapay Zeka Aracı Career Dreamerı Piyasaya Sürüyor

Google, Mükemmel Kariyeri Seçmenize Yardımcı Olacak En Son Yapay Zeka Aracı Career Dreamerı Piyasaya Sürüyor

İster iş gücüne ilk adımlarınızı atıyor olun, ister yeni bir sektöre geçiş yapıyor olun, Google'ın deneysel Career Dreamer'ı sizi uyumlu rollerle buluşturmak için tasarlandı.

Google, kullanıcıların evde elbise ve gömlek denemelerine olanak tanıyan yapay zekalı alışveriş aracı geliştiriyor

Google, kullanıcıların evde elbise ve gömlek denemelerine olanak tanıyan yapay zekalı alışveriş aracı geliştiriyor

Google, geçen yıl Arama'da kullanıcıların belirli bir vücut tipinde bir giysinin nasıl görüneceğine dair görsel bir fikir edinmelerini sağlayan yapay zeka destekli bir alışveriş asistanını tanıttı.

Google, cilt hastalıkları ve tüberkülozu teşhis edebilen yapay zeka algoritması geliştiriyor

Google, cilt hastalıkları ve tüberkülozu teşhis edebilen yapay zeka algoritması geliştiriyor

Google'ın tıp alanında yapay zeka uygulamalarına olan ilgisi giderek artıyor.

Google, ikinci nesil Chromecast ve Chromecast Audioda sorun olduğunu doğruladı

Google, ikinci nesil Chromecast ve Chromecast Audioda sorun olduğunu doğruladı

Birkaç gün süren karışıklığın ardından Google, sorunun hem ikinci nesil Chromecast hem de Chromecast Audio'da olduğunu resmen doğruladı.

Google, Aramanın Nasıl Çalıştığına Dair Belgeleri Yanlışlıkla Yayımladı

Google, Aramanın Nasıl Çalıştığına Dair Belgeleri Yanlışlıkla Yayımladı

Pazartesi günü, Google Arama'nın web sonuçlarını sıralarken ve görüntülerken dikkate aldığı faktörleri açıklayan dahili belgeler sızdırıldı.

Chrome Androidde Google Asistan nasıl etkinleştirilir ve kullanılır

Chrome Androidde Google Asistan nasıl etkinleştirilir ve kullanılır

Google, eski ses tanıma teknolojisini kademeli olarak kullanımdan kaldırıyor ve bunun yerine sanal asistanı Assistant'ı getiriyor.

Samsung, Dolby Atmos ile doğrudan rekabet eden 3D Eclipsa Audio ses teknolojisini piyasaya sürdü

Samsung, Dolby Atmos ile doğrudan rekabet eden 3D Eclipsa Audio ses teknolojisini piyasaya sürdü

Samsung Electronics, Google ortaklığıyla geliştirilen yepyeni bir 3D ses teknolojisi olan Eclipsa Audio'yu 2025 televizyon ve soundbar serisine entegre etmeyi planladığını duyurdu.

Google, Android Telefonlara Gelecek 6 Yeni Özelliği Duyurdu

Google, Android Telefonlara Gelecek 6 Yeni Özelliği Duyurdu

Google bugün Android akıllı telefonlara gelecek altı yeni özelliği duyurdu.

Android 12deki Gizlilik Panosu nedir? Bu neden gizlilikte bir dönüm noktası?

Android 12deki Gizlilik Panosu nedir? Bu neden gizlilikte bir dönüm noktası?

Güvenlik ve gizlilik, genel olarak akıllı telefon kullanıcıları için giderek daha önemli bir endişe haline geliyor.

ChatGPT Arama mı yoksa Google mı daha iyi?

ChatGPT Arama mı yoksa Google mı daha iyi?

Birçok kişi uzun zamandır Google'ın yerini ChatGPT Search Chrome eklentisiyle değiştirip değiştiremeyeceklerini görmeye çalışıyor.

Google, Chromedaki Manifest V2 Uzantılarını Resmen Kaldırdı

Google, Chromedaki Manifest V2 Uzantılarını Resmen Kaldırdı

Uzun zamandır beklenen gün nihayet geldi. İnsanlar eski Manifest v2 eklentisinin Chrome'dan kaldırıldığını bildiriyor. Peki şimdi ne olacak?

Google, çoğunluğu Gemini ile ilgili olan Aralık Pixel güncellemesini yayınladı

Google, çoğunluğu Gemini ile ilgili olan Aralık Pixel güncellemesini yayınladı

Son güncellemede kamera, ses ve görüntü araçları ve en önemlisi Google'ın yapay zeka asistanı Gemini ile ilgili iyileştirmeler yer alıyor.

Android Telefonlara Önceden Yüklü Olmayan 9 Faydalı Google Uygulaması

Android Telefonlara Önceden Yüklü Olmayan 9 Faydalı Google Uygulaması

Google hizmetlerini seviyorsanız, bu az bilinen uygulamalar cihazınıza şaşırtıcı bir değer katabilir.

Google, dolandırıcılıkları doğrudan Chromeda tespit etmek için yapay zekayı kullanıyor

Google, dolandırıcılıkları doğrudan Chromeda tespit etmek için yapay zekayı kullanıyor

Önde gelen tarayıcıların dolandırıcılıkları önlemek için yapay zekayı kullanmaya başlaması kullanıcılar için iyi bir haber.

Google, Geminide AI Video Oluşturma Özelliğini Başlattı

Google, Geminide AI Video Oluşturma Özelliğini Başlattı

Google, kullanıcıların artık Gemini chatbot'u ve yakın zamanda kullanıma sunduğu deneysel aracı Whisk aracılığıyla yapay zeka kullanarak video oluşturabileceğini duyurdu.

Herkesle sohbet etmek için kendi AI karakterinizi oluşturma talimatları

Herkesle sohbet etmek için kendi AI karakterinizi oluşturma talimatları

Meta AI Studio artık kendi AI karakterinizi yaratıp, kendi tasarladığınız ve yarattığınız karakterin tarzında insanlarla sohbet etmenize olanak sağlıyor.

Rusya, Googlea ağır ceza kesti, ceza miktarı dünya GSYİHsinin kat kat üzerinde

Rusya, Googlea ağır ceza kesti, ceza miktarı dünya GSYİHsinin kat kat üzerinde

Google ile Rusya arasında, Kremlin yanlısı YouTube hesaplarının askıya alınması nedeniyle çıkan hukuki anlaşmazlıkta büyük bir para cezası verildi.

Efsanevi Kahramanın En Son Kodu ve Nasıl Girilir

Efsanevi Kahramanın En Son Kodu ve Nasıl Girilir

Legend of the Proud'da Üç Krallık dünyasını keşfetme yolculuğunuz, bir dizi cazip hediye koduyla daha da kolaylaşacak. Şimdi keşfedelim.

Elektronik cihazları manipüle etmeye yardımcı olmak için beynine ChatGPT yerleştirilen ilk kişi

Elektronik cihazları manipüle etmeye yardımcı olmak için beynine ChatGPT yerleştirilen ilk kişi

ChatGPT, hastaların elektronik cihazları manipüle etmesine yardımcı olmak için beyin implantı (BCI) çiplerinin öncülerinden biri olan Synchron tarafından test ediliyor.

Yapay Zeka Sanat Üreticileri Günlük Fotoğraflarınızı Nasıl Geliştirir

Yapay Zeka Sanat Üreticileri Günlük Fotoğraflarınızı Nasıl Geliştirir

Günlük fotoğraflarınızın görünümünü değiştirmek mi istiyorsunuz? Yapay zeka sanat yaratma araçları, manuel düzenlemeyle elde edemeyeceğiniz benzersiz ve yaratıcı bir dokunuş katabilir.

Operanın Aria AIsının Faydalı Olmasının 5 Nedeni

Operanın Aria AIsının Faydalı Olmasının 5 Nedeni

Birçok kişi yapay zekayı sevmiyor, çünkü ham verileri okuyup kendileri analiz etmek istiyorlar. Ancak sıkıcı bir görevle karşılaştığınızda ve fikirlere ihtiyacınız olduğunda Opera'nın Aria AI'sını deneyebilirsiniz. Opera'nın Aria AI'sının kullanışlı olmasının nedenleri!

House of Flying Daggers için en son kod ve kodu nasıl kullanacağınız

House of Flying Daggers için en son kod ve kodu nasıl kullanacağınız

Code Thap Dien Mai Phuc oyunculara Kim Nguyen Bao, Hoan Khon Halo, Altın, Huyen Tinh, Huyen Tinh Sandığı veriyor

Black Myth: Wukong, Cyberpunk 2077nin rekorunu çaldı

Black Myth: Wukong, Cyberpunk 2077nin rekorunu çaldı

Çoğunluğu olumlu eleştirilerden oluşan Black Myth: Wukong'un Steam'de rekorlar kırması şaşırtıcı değil.

0xc00000e hata kodu ve nasıl düzeltileceği hakkında bilgi edinin

0xc00000e hata kodu ve nasıl düzeltileceği hakkında bilgi edinin

Windows 10'u başlatırken sıklıkla görülen korkunç Mavi Ekran (BSOD) hata kodu 0xc00000e kafa karıştırıcı olabilir.

Birlikte Oynama alanı, alana Birlikte Oynama adını verin

Birlikte Oynama alanı, alana Birlikte Oynama adını verin

Birçok kişi Play Together isimlerinde boşluklar kullanır veya isminizde yazdığınız harflerin arasına boşluk oluşturmak için küçük alt çizgiler kullanır.

Black Beacon PCyi nasıl indirebilirim?

Black Beacon PCyi nasıl indirebilirim?

Black Beacon'ı PC'de deneyimlemek tamamen mümkün olsa da, oyun şu anda bu platform için resmi olarak optimize edilmedi.

Kürenin yüzey alanı ve hacmini hesaplama formülü

Kürenin yüzey alanı ve hacmini hesaplama formülü

Bir kürenin yüzey alanı, büyük bir dairenin alanının dört katıdır; bu da kürenin yarıçapının karesiyle çarpılan Pi sabitinin dört katıdır.

Çinin Aya ilk insanlı iniş için seçtiği uzay giysisinin özelliği nedir?

Çinin Aya ilk insanlı iniş için seçtiği uzay giysisinin özelliği nedir?

Çin, 2030 yılına kadar ilk vatandaşlarını Ay'a göndermeyi hedefliyor ve ülke, yaklaşan tarihi görevde kullanılacak yeni tasarlanmış bir uzay giysisini tanıttı.

Vücutta kolayca iltihaplanmaya neden olan besinler

Vücutta kolayca iltihaplanmaya neden olan besinler

Pek çok besin iltihaplanmaya ve kronik hastalıklara yol açabilir. Vücudunuza hastalık bulaştırmak istemiyorsanız, aşırı tüketmemeniz gereken besinler şunlardır.