Çinli teknoloji grubu Alibaba, multimedya yapay zeka alanında çığır açan Qwen serisine ait QVQ-Max adlı yeni yapay zeka modelini duyurdu. Bu modelin özelliği, görüntü/video içeriklerinin analiz edilebilmesi, elde edilen bilgiler doğrultusunda argümanlar ve çözümler üretilebilmesidir.
Etkileyici yetenek
Alibaba, QVQ-Max'ı saf metin tabanlı yapay zeka modelleri ile gerçek dünya arasında bir köprü olarak tanımlıyor. Görsel muhakeme yetenekleri sayesinde sistem şunları yapabilir:
- Görüntüleri analiz edin ve temel unsurları belirleyin
- İllüstrasyon tasarımından, video senaryosu oluşturmaya ve karakter rol yapmaya kadar birçok alanda çok yönlü uygulama
- Diyagramlarla problemleri çözün (matematik, fizik)
- Tarif resimlerine dayalı adım adım pişirme talimatları
Alibaba, modelin yalnızca metin işleyen yapay zekalar ile gerçek dünya bilgileri arasındaki boşluğu kapatmaya yardımcı olduğunu söylüyor. QVQ-Max görsel muhakeme yeteneği sayesinde etrafındaki dünyayı "görebiliyor, anlayabiliyor ve düşünebiliyor". Şirket, görüntü analizinde üstün modelinin, anahtar unsurların belirlenmesinde ve illüstrasyon tasarımı, video senaryosu oluşturma veya rol yapma gibi birçok alanda uygulama esnekliğinin altını çiziyor.

Diğer yapay zeka sohbet robotları gibi QVQ-Max da iş, eğitim ve kişisel yaşamı destekliyor ancak görsel entegrasyon sayesinde diyagramlarla matematik/fizik problemlerini çözme, tarif görselleriyle yemek tarifi verme gibi daha spesifik görevleri de çözebiliyor.
Alibaba, QVQ-Max'ı ilk versiyon olarak değerlendiriyor ve sonraki versiyonlar için bir yükseltme yol haritası belirledi. Öncelikle topraklama tekniklerini kullanarak görüntü tanıma doğruluğunu artırmak istediler. İkinci olarak, model telefon, bilgisayar kullanımı veya oyun oynama gibi çoklu görevler ve karmaşık problemlerle başa çıkabilecek şekilde optimize edilecek. Alibaba, ilerleyen süreçte metin etkileşiminden araç doğrulama ve resim içeriği oluşturmaya doğru genişlemeyi planlıyor.
Kullanıcılar QVQ-Max deneyimini şu şekilde yaşayabilirler:
- chat.qwen.ai adresini ziyaret edin
- Sol köşedeki model menüsünü seçin → " Daha fazla modeli genişlet "
- QVQ-Max'ı seçin ve sohbete başlayın
- Yapay zeka işleme yeteneklerini keşfetmek için resim dosyalarını ekleyin
Alibaba, QVQ-Max'ı piyasaya sürerek multimedya yapay zeka geliştirme yarışındaki yerini sağlamlaştırmaya devam ediyor ve küresel teknoloji devleriyle doğrudan rekabet ediyor. Modelin iş, eğitim ve kişisel yaşamda pratik uygulamalar getirmesi bekleniyor.