Nvidia, OpenAI, Anthropic, Meta ve Google'ın önde gelen tescilli modelleriyle aynı performansı gösterdiği söylenen açık kaynaklı büyük dil modeli (LLM)'ni duyurdu.
NVLM-D-72B adı verilen bu yeni model, 72 milyar parametreye sahip ve Nvidia'nın yakın zamanda yayınladığı geniş NVLM 1.0 dil modelleri ailesinin bir parçası. NVLM 1.0, esasen görsel dil görevlerinde en son teknoloji sonuçları elde eden, önde gelen tescilli modellerle (örneğin GPT-4o) ve açık erişimli modellerle rekabet eden büyük, sınırda çok modlu dil modelleri ailesidir.
Bu yeni büyük dil modelleri ailesinin, çeşitli görsel ve dil görevlerinde üstün performans göstermenin yanı sıra metin tabanlı geri bildirimi önemli ölçüde iyileştiren "endüstriyel düzeyde çok modlu yeteneklere" sahip olduğu bildiriliyor. Nvidia araştırmacıları bir açıklamada, "Bunu başarmak için, çok sayıda çok modlu matematiksel ve akıl yürütme verisiyle birlikte, çok sayıda modalitede gelişmiş matematiksel ve kodlama yetenekleriyle sonuçlanan, çok modlu eğitim sürecine yüksek kaliteli, yalnızca metinden oluşan bir veri seti oluşturuyor ve entegre ediyoruz." ifadelerini kullandı.
Sonuç, bir memenin neden komik olduğunu açıklamaktan, karmaşık matematiksel denklemlere kadar her şeyi adım adım gerçekleştirebilen yüksek performanslı bir LLM programıdır. Nvidia ayrıca, çok modlu eğitim stili sayesinde modelin yalnızca metin doğruluğunu sektör ölçütlerinin ortalama 4,3 puan üzerine çıkarmayı başardı.

Nvidia, yalnızca eğitim ağırlıklarını topluluk incelemesine açık hale getirmekle kalmayıp, aynı zamanda modelin kaynak kodunu yakın gelecekte yayınlama sözü vererek, bu modelin Açık Kaynak Girişimi'nin "açık kaynak" kavramının en son tanımına uymasını sağlama konusunda ciddi görünüyor. Bu, LLM modellerinin ağırlıkları ve kaynak kodları hakkındaki ayrıntıları gizli tutma konusunda çok ketum olan OpenAI ve Google gibi rakiplerin yaklaşımından önemli bir sapmadır. Nvidia, bunu yaparken NVLM'yi ChatGPT-4o ve Gemini 1.5 Pro'nun doğrudan rakibi olarak değil, üçüncü taraf geliştiricilerin kendi sohbet robotlarını ve yapay zeka uygulamalarını geliştirebilecekleri bir platform olarak konumlandırmış oldu.