Google, Gemini 2.5in OpenAI, DeepSeek ve Diğer Yapay Zeka Teknoloji Devlerinin En İyi Modellerinden Daha İyi Performans Gösterdiğini İddia Ediyor

Kaydolun ve günde 1000 $ kazanın ⋙

Google, şirketin "şimdiye kadarki en akıllı yapay zeka modeli" olarak adlandırdığı Gemini 2.5'i tanıttı. Modelin ilk versiyonu Gemini 2.5 Pro oldu ve birçok testte etkileyici benchmark puanları elde etti.

Google, Gemini 2.5'in OpenAI, DeepSeek ve diğer yapay zeka teknoloji devlerinin en iyi modellerinden daha iyi performans gösterdiğini iddia ediyor

Gemini 2.5 Pro şu anda Google AI Studio üzerinden ve Gemini Advanced kullanıcısıysanız Gemini uygulamasından edinilebilir . Gemini 2.5 Pro'nun yakın gelecekte Vertex AI üzerinden de satışa sunulması bekleniyor.

Google, Gemini 2.5 Pro veya diğer Gemini 2.5 modelleri için fiyatlandırmayı şu anda paylaşmadı.

Gemini 2.5 kullanan tüm modeller "düşünme modelleridir", yani bir yanıt üretmeden önce düşünce sürecini işleyebilirler. Bu "akıl yürütme" modelleri, daha karmaşık ve çoğu zaman daha doğru yanıtlar ürettikleri için yapay zeka alanındaki bir sonraki büyük adımdır.

Google , "Şimdi Gemini 2.5 ile önemli ölçüde iyileştirilmiş temel modeli iyileştirilmiş eğitim sonrası özelliklerle birleştirerek yeni bir performans düzeyine ulaştık " dedi.

"Gelecekte, bu düşünme yeteneklerini doğrudan tüm modellerimize entegre edeceğiz, böylece daha karmaşık sorunları ele alabilecek ve aracıları daha iyi bağlam farkındalığıyla destekleyebilecekler . "

Gemini 2.5, OpenAI modelleriyle karşılaştırıldığında nasıl görünüyor?

Google, Gemini 2.5'in OpenAI, DeepSeek ve Diğer Yapay Zeka Teknoloji Devlerinin En İyi Modellerinden Daha İyi Performans Gösterdiğini İddia Ediyor
Google Gemini 2.5 Karşılaştırması

Google'ın Gemini 2.5 Pro modelleri, OpenAI ve DeepSeek'in önceki üst düzey modellerinden daha iyi performans gösteriyor.

Google'ın Gemini 2.5 için paylaştığı kıyaslama puanları oldukça etkileyici. Gemini 2.5 Pro Experimental, Humanity's Last Exam'da %18.5 puan aldı.

Bu puan, en azından şimdilik, Gemini 2.5 Pro Experimental'ın bu ölçüte göre en iyi model olduğu anlamına geliyor. Puanı OpenAI 03-mini'yi (%14) ve DeepSeek R1'i (%8,6) geride bırakıyor.

Bu özel test zor olarak kabul ediliyor, ancak bir yapay zeka modelinin performansını ölçmenin tek yolu bu değil.

Google ayrıca Gemini 2.5 Pro'nun programlama yeteneklerini ve modelin matematik ve fen alanlarındaki kıyaslamalarını da vurguladı. Gemini 2.5 Pro, GPQA ve AIME 2025'te yapılan ölçümlere göre şu anda matematik ve fen bilimleri alanında lider konumda.

Gemini 2.5'te programlama yapmak mümkün mü?

Gemini 2.5'in ana odağı programlamadır. Google, "2.0'a göre büyük bir sıçrama" yaşandığını iddia ediyor ve daha fazla iyileştirmenin yolda olduğunu ima ediyor.

Google'ın yeni modeli web uygulamaları ve aracı kod uygulamaları oluşturabiliyor. Google'ın hazırladığı bir demoda, Gemini 2.5 Pro'nun tek satırlık komuttan oyun oluşturmak için nasıl kullanıldığı gösteriliyor.

Google'ın Gemini 2.5 Pro'sunun Kurumsal Yapay Zeka İçin Önemli Olmasının 4 Nedeni

Gemini 2.5 Pro'yu değerlendirirken kurumsal ekiplerin aklında bulundurması gereken dört önemli nokta şunlardır:

1. Yapılandırılmış, şeffaf muhakeme – düşüncenin netliği için yeni bir standart

Gemini 2.5 Pro'yu farklı kılan sadece zekası değil; bu zekanın işini nasıl net bir şekilde ortaya koyduğudur. Google'ın adım adım eğitim yöntemi, DeepSeek gibi modellerde gördüğümüz gibi saçma sapan konuşmalara veya tahminlere benzemeyen yapılandırılmış bir düşünce dizisi (CoT) oluşturur . Bu CoT'lar OpenAI'nin modelleri gibi yüzeysel özetlere indirgenmemiştir. Yeni Gemini modeli fikirleri numaralandırılmış adımlarla, alt maddeler halinde ve son derece açık ve şeffaf bir iç mantıkla sunuyor.

Pratik açıdan bakıldığında bu, güvenilirlik ve seyrüsefer kolaylığı açısından bir dönüm noktasıdır. Politika çıkarımlarını gözden geçirme, mantığı kodlama veya karmaşık araştırmaları özetleme gibi kritik görevler için çıktıları değerlendiren iş kullanıcıları artık modelin cevaba nasıl ulaştığını görebiliyor. Bu, cevapları daha güvenle doğrulayabilecekleri, düzeltebilecekleri veya yönlendirebilecekleri anlamına gelir. Bu, birçok büyük dil modeli (LLM) çıktısında hâlâ devam eden "kara kutu" hissine karşı büyük bir adımdır .

Bu modelin nasıl performans gösterdiğine dair daha ayrıntılı bir kılavuz için Gemini 2.5 Pro'nun canlı olarak test edildiği video dökümünü izleyin. Tartışılan bir örnek: Büyük dil modellerinin sınırlamaları sorulduğunda, Gemini 2.5 Pro dikkate değer bir farkındalık gösterdi. Yaygın zayıflıkları ana hatlarıyla belirtir ve bunları "fiziksel sezgi", "yeni kavram sentezi", "uzun vadeli planlama" ve "etik nüans" gibi alanlara ayırarak kullanıcıların modelin ne bildiğini ve soruna nasıl yaklaşılacağını anlamalarına yardımcı olan bir çerçeve sunar.

Kurumsal mühendislik ekipleri bu yeteneği şu amaçlarla kullanabilir:

  • Görev açısından kritik uygulamalarda karmaşık mantık zincirlerini hata ayıklayın
  • Belirli alanlardaki model sınırlamalarının daha iyi anlaşılması
  • Paydaşlara daha şeffaf, yapay zeka destekli kararlar sağlamak
  • Modelin yaklaşımını inceleyerek kendi eleştirel düşüncelerini geliştirin

Dikkat çeken bir sınırlama ise bu yapılandırılmış akıl yürütmenin Gemini uygulamasında ve Google AI Studio'da mevcut olmasına rağmen şu anda API aracılığıyla erişilebilir olmamasıdır. Bu durum, bu yeteneği kurumsal uygulamalara entegre etmek isteyen geliştiriciler için bir eksikliktir.

2. Sadece teoride değil, son teknoloji için gerçek bir yarışmacı

Model şu anda Chatbot Arena liderlik tablosunda önemli bir farkla zirvede yer alıyor; bir sonraki en iyi modelden 35 Elo puanı daha önde, özellikle de Gemini 2.5 Pro'nun piyasaya sürülmesinden bir gün sonra yayınlanan OpenAI 40 güncellemesi. Ve kıyaslama hakimiyeti çoğu zaman geçici olsa da (her hafta yeni modeller piyasaya sürüldüğünden), Gemini 2.5 Pro gerçekten farklı hissettiriyor.

Google, Gemini 2.5'in OpenAI, DeepSeek ve Diğer Yapay Zeka Teknoloji Devlerinin En İyi Modellerinden Daha İyi Performans Gösterdiğini İddia Ediyor

Derin muhakemeyi ödüllendiren görevlerde mükemmeldir: kodlama, ayrıntılı problem çözme, belgeler arasında özet çıkarma ve hatta soyut planlama. Dahili testlerde, soyut ve ayrıntılı alanlarda LLM zayıflıklarını tespit etmek için popüler bir ölçüt olan "İnsanlığın Son Sınavı" gibi daha önce zor olan ölçütlerde özellikle iyi performans gösterdi.

İş çevreleri hangi modelin hangi akademik sıralamayı kazandığını önemsemeyebilir. Ama bu modelin düşünebildiğini ve size nasıl düşündüğünü göstereceğini umursayacaklardır. Titreşim testi çok önemlidir.

Saygın AI mühendisi Nathan Lambert'in belirttiği gibi, "Google yine en iyi modellere sahip, çünkü bu AI patlamasını başlatmaları gerekirdi. Büyük hata düzeltildi." İş kullanıcıları bunu Google'ın yalnızca rakiplerini yakalaması olarak değil, aynı zamanda iş uygulamaları için önemli olan yeteneklerde onları geride bırakma potansiyeli olarak görmeli.

3. Son olarak, Google'ın şifreleme oyunu güçlüdür

Google geleneksel olarak geliştirici odaklı kodlama desteği açısından OpenAI ve Anthropic'in gerisinde kalmıştır. Gemini 2.5 Pro bunu değiştiriyor.

Uygulamalı testlerde, Replit'e aktarıldığında ilk denemede çalışan bir Tetris oyunu oluşturmak da dahil olmak üzere kodlama zorluklarının üstesinden güçlü bir şekilde gelebildiğini gösterdi; hata ayıklama gerekmiyordu. Daha da dikkat çekici olanı, kod yapısını açıkça açıklıyor, değişkenleri ve adımları dikkatlice etiketliyor ve tek bir satır kod yazmadan önce yaklaşımını sunuyor.

Bu model, kod üretimi alanında lider kabul edilen ve Anthropic'in bu alandaki başarısının en önemli nedenlerinden biri olan Anthropic'in Claude 3.7 Sonnet modeliyle rekabet ediyor. Ancak Gemini 2.5 önemli bir avantaj sunuyor: 1 milyona kadar devasa bir token bağlam penceresi. Claude 3.7 Sonnet şu anda yalnızca 500.000 token sunuyor.

Bu geniş bağlam penceresi, tüm kod tabanında akıl yürütme, çevrimiçi belgeleri okuma ve birden fazla birbirine bağlı dosya üzerinde çalışma için yeni olanaklar sunar. Yazılım mühendisi Simon Willison'ın deneyimi bu avantajı kanıtlıyor.

Kod tabanımızda yeni bir özelliği uygulamak için Gemini 2.5 Pro'yu kullandığımızda, model 18 farklı dosyada gerekli değişiklikleri belirledi ve tüm projeyi yaklaşık 45 dakikada tamamladı; bu da değiştirilen dosya başına ortalama 3 dakikadan az bir süre anlamına geliyor. Bu, aracı çerçeveleri veya yapay zeka destekli geliştirme ortamları ile denemeler yapan işletmeler için ciddi bir araçtır.

4. Ajan benzeri davranışa sahip çoklu yöntem entegrasyonu

OpenAI'nin son 40 modeli gibi bazı modeller daha göz alıcı görüntü üretimiyle daha gösterişli olsa da, Gemini 2.5 Pro, yerleşik çok modlu akıl yürütmenin nasıl göründüğünü sessizce yeniden tanımlıyor gibi görünüyor.

Bir örnekte, Ben Dickson'ın VentureBeat için gerçekleştirdiği uygulamalı bir deney, modelin arama algoritmalarıyla ilgili teknik bir makaleden temel bilgileri çıkarma ve buna karşılık gelen bir SVG akış diyagramı oluşturma becerisini gösterdi; ardından görsel hatalar içeren işlenmiş bir sürüm gösterildiğinde bu akış diyagramını iyileştirdi. Bu düzeydeki çok modlu akıl yürütme, daha önce yalnızca metin içeren modellerle mümkün olmayan yeni iş akışlarının oluşturulmasını mümkün kılıyor.

Başka bir örnekte, geliştirici Sam Witteveen Las Vegas haritasının basit bir ekran görüntüsünü yükledi ve 9 Nisan'da yakınlarda hangi Google etkinliklerinin gerçekleştiğini sordu. Model konumu belirledi, kullanıcının amacını çıkardı, çevrimiçi arama yaptı ve tarih, konum ve alıntı dahil olmak üzere Google Cloud Next hakkında doğru ayrıntıları döndürdü. Tüm bunlar özel bir aracı çerçevesi olmadan, yalnızca çekirdek model ve yerleşik arama ile yapılır.

Aslında bu çok modlu girdi akıl yürütme modeli sadece ona bakmanın ötesine geçiyor. 6 ay sonra bir iş akışının nasıl görünebileceğini önerir: Belgeleri, diyagramları ve panoları yükleyin ve modelin içeriğe göre anlamlı eylemler sentezlemesine, planlama yapmasına veya gerçekleştirmesine izin verin.

Sign up and earn $1000 a day ⋙

Leave a Comment

Gmail, güvenilir gönderenleri doğrulamak için mavi onay işareti ekliyor

Gmail, güvenilir gönderenleri doğrulamak için mavi onay işareti ekliyor

Uzun zamandır sosyal paylaşım platformlarının gelişmesi ve yaygınlaşmasıyla birlikte "mavi tik" giderek internet dünyasının en güçlü karakterlerinden biri haline gelmeye başladı.

Chromecast resmen öldü

Chromecast resmen öldü

Akıllı TV deneyiminizi değiştirmek veya herhangi bir TV'yi akıllı TV'ye dönüştürmek istiyorsanız, Google'ın Chromecast serisi uzun zamandır popüler bir seçim olmuştur.

Google, Play Storea yüklenen uygulamaların otomatik olarak açılmasını sağlayan bir özellik ekledi

Google, Play Storea yüklenen uygulamaların otomatik olarak açılmasını sağlayan bir özellik ekledi

Google, Play Store'a küçük ama uzun zamandır beklenen yeni bir özellik ekliyor.

Google, AR ve VR Gözlükler için Yeni Bir İşletim Sistemi Platformu Olan Android XRyi Duyurdu

Google, AR ve VR Gözlükler için Yeni Bir İşletim Sistemi Platformu Olan Android XRyi Duyurdu

Google, yıllardır ihmal ettiği yatırımlarını sonunda kulaklık ve gözlük gibi genişletilmiş gerçeklik (XR) cihazlarına odaklamaya karar verdi.

Google Geminiyi Denemek İçin 5 Neden

Google Geminiyi Denemek İçin 5 Neden

Rakipleri kadar çok tartışılmasa da Google'ın Gemini AI'sı birçok avantaja sahip. İşte Gemini'nin dikkatinizi çekmesinin beş nedeni.

Hangi akıllı telefon üreticisinin Android güncellemeleri en iyi?

Hangi akıllı telefon üreticisinin Android güncellemeleri en iyi?

Pek çok Android üreticisi var ancak hepsi yazılım güncellemelerine önem vermiyor. Son on yılda durum iyileşmiş olsa da, tüm akıllı telefon üreticileri harika bir yazılım desteği sunmuyor.

Googleın Geminisi Bazı Kullanıcılara Garip, Tekrarlanan Saçma Sözlerle Yanıt Verdi

Googleın Geminisi Bazı Kullanıcılara Garip, Tekrarlanan Saçma Sözlerle Yanıt Verdi

Son zamanlarda bazı kullanıcılar Google Gemini'nin bazı yanıtlarında tekrarlayan metinler, garip karakterler ve tamamen saçmalıklar verdiğini fark ettiler.

Google, iPhone için Google Uygulamasından Gemini Erişimini Kaldırdı

Google, iPhone için Google Uygulamasından Gemini Erişimini Kaldırdı

Google'ın iPhone uygulaması, yakın zamanda bu uygulamadan Gemini AI'ya erişimi kaldırmasıyla birlikte biraz daha az kullanışlı hale gelecek.

Google hesabınızı kaybederseniz ne olur?

Google hesabınızı kaybederseniz ne olur?

Google hesabınıza erişiminizi kaybetmeniz, e-posta gönderip alamamanın ötesinde ciddi sonuçlara yol açabilir.

Google, Geminide AI Video Oluşturma Özelliğini Başlattı

Google, Geminide AI Video Oluşturma Özelliğini Başlattı

Google, kullanıcıların artık Gemini chatbot'u ve yakın zamanda kullanıma sunduğu deneysel aracı Whisk aracılığıyla yapay zeka kullanarak video oluşturabileceğini duyurdu.

Google, Mükemmel Kariyeri Seçmenize Yardımcı Olacak En Son Yapay Zeka Aracı Career Dreamerı Piyasaya Sürüyor

Google, Mükemmel Kariyeri Seçmenize Yardımcı Olacak En Son Yapay Zeka Aracı Career Dreamerı Piyasaya Sürüyor

İster iş gücüne ilk adımlarınızı atıyor olun, ister yeni bir sektöre geçiş yapıyor olun, Google'ın deneysel Career Dreamer'ı sizi uyumlu rollerle buluşturmak için tasarlandı.

Google, kullanıcıların evde elbise ve gömlek denemelerine olanak tanıyan yapay zekalı alışveriş aracı geliştiriyor

Google, kullanıcıların evde elbise ve gömlek denemelerine olanak tanıyan yapay zekalı alışveriş aracı geliştiriyor

Google, geçen yıl Arama'da kullanıcıların belirli bir vücut tipinde bir giysinin nasıl görüneceğine dair görsel bir fikir edinmelerini sağlayan yapay zeka destekli bir alışveriş asistanını tanıttı.

Google, cilt hastalıkları ve tüberkülozu teşhis edebilen yapay zeka algoritması geliştiriyor

Google, cilt hastalıkları ve tüberkülozu teşhis edebilen yapay zeka algoritması geliştiriyor

Google'ın tıp alanında yapay zeka uygulamalarına olan ilgisi giderek artıyor.

Google, ikinci nesil Chromecast ve Chromecast Audioda sorun olduğunu doğruladı

Google, ikinci nesil Chromecast ve Chromecast Audioda sorun olduğunu doğruladı

Birkaç gün süren karışıklığın ardından Google, sorunun hem ikinci nesil Chromecast hem de Chromecast Audio'da olduğunu resmen doğruladı.

Google, Aramanın Nasıl Çalıştığına Dair Belgeleri Yanlışlıkla Yayımladı

Google, Aramanın Nasıl Çalıştığına Dair Belgeleri Yanlışlıkla Yayımladı

Pazartesi günü, Google Arama'nın web sonuçlarını sıralarken ve görüntülerken dikkate aldığı faktörleri açıklayan dahili belgeler sızdırıldı.

Normal TV ile Akıllı TV arasındaki fark

Normal TV ile Akıllı TV arasındaki fark

Akıllı televizyonlar gerçekten dünyayı kasıp kavurdu. Teknolojinin sunduğu pek çok harika özellik ve internet bağlantısı, televizyon izleme şeklimizi değiştirdi.

Dondurucuda ışık yokken buzdolabında neden ışık var?

Dondurucuda ışık yokken buzdolabında neden ışık var?

Buzdolapları evlerde sıkça kullanılan cihazlardır. Buzdolapları genellikle 2 bölmeden oluşur, soğutucu bölme geniştir ve kullanıcı her açtığında otomatik olarak yanan bir ışığa sahiptir, dondurucu bölme ise dardır ve hiç ışığı yoktur.

Wi-Fiyi Yavaşlatan Ağ Tıkanıklığını Gidermenin 2 Yolu

Wi-Fiyi Yavaşlatan Ağ Tıkanıklığını Gidermenin 2 Yolu

Wi-Fi ağları, yönlendiriciler, bant genişliği ve parazitlerin yanı sıra birçok faktörden etkilenir; ancak ağınızı güçlendirmenin bazı akıllı yolları vardır.

Tenorshare Reiboot Kullanarak Veri Kaybı Olmadan iOS 17den iOS 16ya Nasıl Geri Dönülür

Tenorshare Reiboot Kullanarak Veri Kaybı Olmadan iOS 17den iOS 16ya Nasıl Geri Dönülür

Telefonunuzda kararlı iOS 16'ya geri dönmek istiyorsanız, iOS 17'yi kaldırma ve iOS 17'den 16'ya geri dönme konusunda temel kılavuzu burada bulabilirsiniz.

Her gün yoğurt yediğinizde vücudunuzda neler olur?

Her gün yoğurt yediğinizde vücudunuzda neler olur?

Yoğurt harika bir besindir. Her gün yoğurt yemek faydalı mıdır? Her gün yoğurt yediğinizde vücudunuzda nasıl değişiklikler olur? Hadi birlikte öğrenelim!

Hangi pirinç türü sağlık açısından daha iyidir?

Hangi pirinç türü sağlık açısından daha iyidir?

Bu yazıda en besleyici pirinç türleri ve seçtiğiniz pirincin sağlık yararlarından nasıl en iyi şekilde yararlanabileceğiniz ele alınıyor.

Sabahları zamanında nasıl uyanılır

Sabahları zamanında nasıl uyanılır

Uyku düzeninizi ve uyku vakti rutininizi oluşturmak, çalar saatinizi değiştirmek ve beslenmenizi buna göre ayarlamak, daha iyi uyumanıza ve sabahları zamanında uyanmanıza yardımcı olabilecek önlemlerden birkaçıdır.

Rent Please! oynamak için ipuçları Yeni Başlayanlar İçin Ev Sahibi Simülasyonu

Rent Please! oynamak için ipuçları Yeni Başlayanlar İçin Ev Sahibi Simülasyonu

Kiralayın Lütfen! Landlord Sim, iOS ve Android'de oynanabilen bir simülasyon mobil oyunudur. Bir apartman kompleksinin ev sahibi olarak oynayacak ve dairenizin içini iyileştirme ve kiracılar için hazır hale getirme amacıyla bir daireyi kiralamaya başlayacaksınız.

En Son Banyo Kule Savunma Kodları ve Kodların Nasıl Girileceği

En Son Banyo Kule Savunma Kodları ve Kodların Nasıl Girileceği

Bathroom Tower Defense Roblox oyun kodunu alın ve heyecan verici ödüller için kullanın. Daha yüksek hasara sahip kuleleri yükseltmenize veya kilidini açmanıza yardımcı olacaklar.

Transformatörlerin yapısı, sembolleri ve çalışma prensipleri

Transformatörlerin yapısı, sembolleri ve çalışma prensipleri

Transformatörlerin yapısını, sembollerini ve çalışma prensiplerini en doğru şekilde öğrenelim.

Yapay Zekanın Akıllı TVleri Daha İyi Hale Getirmesinin 4 Yolu

Yapay Zekanın Akıllı TVleri Daha İyi Hale Getirmesinin 4 Yolu

Daha iyi görüntü ve ses kalitesinden ses kontrolüne ve daha fazlasına kadar, bu yapay zeka destekli özellikler akıllı televizyonları çok daha iyi hale getiriyor!

ChatGPT neden DeepSeekten daha iyidir

ChatGPT neden DeepSeekten daha iyidir

Başlangıçta DeepSeek'e yönelik büyük umutlar vardı. ChatGPT'ye güçlü bir rakip olarak pazarlanan bir yapay zeka sohbet robotu olarak, akıllı sohbet yetenekleri ve deneyimleri vadediyor.

Fireflies.ai ile tanışın: Size Saatlerce Çalışma Kazandıran Ücretsiz AI Sekreteri

Fireflies.ai ile tanışın: Size Saatlerce Çalışma Kazandıran Ücretsiz AI Sekreteri

Önemli ayrıntıları not alırken gözden kaçırmak kolaydır ve sohbet ederken not almaya çalışmak dikkat dağıtıcı olabilir. Çözüm Fireflies.ai'dır.

Axolotl Minecraft nasıl yetiştirilir, Minecraft Salamander nasıl evcilleştirilir

Axolotl Minecraft nasıl yetiştirilir, Minecraft Salamander nasıl evcilleştirilir

Axolot Minecraft, oyuncuların su altında görev yaparken nasıl kullanacaklarını bilmeleri durumunda harika bir yardımcı olacaktır.

Sessiz Bir Yer: Önümüzdeki Yol PC Oyun Yapılandırması

Sessiz Bir Yer: Önümüzdeki Yol PC Oyun Yapılandırması

A Quiet Place: The Road Ahead'in yapılandırması oldukça yüksek olarak derecelendirilmiştir, bu yüzden indirmeye karar vermeden önce yapılandırmayı göz önünde bulundurmanız gerekecektir.