Alibaba, son akıl yürütme modelini resmen duyurdu ve DeepSeek ile OpenAI'nin endişe verici olduğu anlaşılıyor; eğer Alibaba'nın tüm "abartıları" doğruysa. Bu model açık kaynaklıdır, dolayısıyla herkes ücretsiz olarak erişebilir ve deneyimleyebilir.
Alibaba'nın QwQ-32b (Quan-with-Questions) adı verilen yeni yapay zeka modeli, günümüzdeki hemen hemen tüm büyük dil modellerinden çok daha az parametreyle çalışıyor; bu da daha az kaynak gerektirdiği anlamına geliyor. Alibaba, QwQ-32b'nin DeepSeek veya OpenAI'nin o1-mini'siyle aynı seviyede performans gösterdiğini iddia ediyor.
DeepSeek-R1 büyük dil modeli (LLM), Şubat ayı başında piyasaya sürüldüğünde büyük ilgi gördü ve ChatGPT tarafından belirlenen altın standarda meydan okudu, ancak çok daha düşük bir işletme maliyetiyle. Alibaba'nın QwQ-32b ile bu sınırı daha da zorlamayı planladığı anlaşılıyor.
Teknik olarak DeepSeek-R1'in çalışması için 671 milyar parametreye ihtiyaç duyuluyor ve bunların 37 milyarı etkinleştirilmiş durumda. Bu arada Alibaba'nın QwQ-32b'si sadece 32 milyar parametreye ihtiyaç duyuyor. Bu sayılar çoğu kişiye soyut gelebilir, ancak işlem gücünde büyük bir fark yaratıyorlar: DeepSeek-R1'in çalışması için 1600 GB VRAM gerekirken, QwQ-32b'nin yalnızca 24 GB VRAM'e ihtiyacı var. Çoğu durumda bunun için Nvidia H100 veya eşdeğeri bir grafik kartına ihtiyaç duyulur, ancak oyunculara uygun RTX 4090'da bile 24 GB VRAM bulunur. Son çıkan RTX 5090 ile bu sayı 32 GB'a çıkıyor.
Hatta sadece 32 milyar parametreyle bile QwQ-32B'nin matematik, programlama ve genel problem çözme gibi alanlarda R1'e eşit veya daha üstün bir performans verdiği bile ileri sürülmektedir. Alibaba ayrıca QwQ-32B'nin 100 milyar parametreyle geliştirilen OpenAI'nin o1-mini'sinden daha iyi performans gösterdiğini söyledi. QwQ-32B, dünyanın en büyük açık kaynaklı yapay zeka modeli topluluğu olan Hugging Face'te mevcuttur.

Alibaba'nın QwQ-32b ürünü Apache 2.0 lisansı altında sunuluyor, yani şirketler ve araştırmacılar ürünü özgürce kullanabilir. Daha da önemlisi bunu Alibaba'nın Qwen Chat'i üzerinden deneyebiliriz. DeepSeek gibi QwQ-32b'nin de konu sınırlamaları açısından bazı kısıtlamaları bulunmaktadır. Örneğin, siyasi konular sorulduğunda Qwen Chat, bunun uygunsuz bir konu olduğuna dair bir mesaj verecektir. Ama hemen göze çarpan birkaç avantajı da var.
QwQ-32b, hızlı ve basit sorulara bile oldukça detaylı cevaplar verebiliyor gibi görünüyor. Bu iyi olabilir, ancak bir yandan da oldukça can sıkıcıdır çünkü istemediğiniz birçok gereksiz bilgi sunar. QwQ-32b'nin bir artısı da, ChatGPT'nin Derin Düşünme özelliğine benzer şekilde tüm akıl yürütme sürecini gösterebilmesi; ancak daha az derinlikle.
Alibaba'nın iddialarının gerçekleşip gerçekleşmeyeceği henüz belli değil ancak ChatGPT ve DeepSeek'in artık değerli bir rakibi var gibi görünüyor.