OpenAI, yapay zekanın gerçek dünya durumlarında uygulanmasını teşvik etmeyi amaçlayan bir girişim olan Pioneers Programını duyurdu. Program, geliştiricilerin ve işletmelerin uygun modelleri seçmek ve optimize etmek için giderek daha fazla kıyaslama ölçütlerine güvenmesiyle, yapay zeka modellerinin değerlendirilme biçimini iyileştirmeye odaklanıyor.
Bu hamle, Meta'nın Llama 4 modelinin sıralamasını yükseltmek için LMArena kıyaslamasını manipüle ettiği iddialarının ardından geldi. Pioneers Programı, liderlik tablosunda puan kazanmak için yarışmaktan ziyade, gerçek dünyadaki zorlukları yansıtan değerlendirme standartları geliştirmek için şirketler ve OpenAI araştırmacılarıyla birlikte çalışmayı amaçlıyor.
OpenAI'ye göre seçilen şirketler, araştırma ekiplerinden doğrudan destek alacak ve iki temel hedefe odaklanacak:
- Her alan için kıyaslama ölçütleri oluşturun : Her alan için (hukuk, finans, tıp, sigortacılık, muhasebe) ayrı değerlendirme yöntemleri geliştirin.
- Model Eğitimini İnce Ayarlayın : Üç en önemli iş kullanım durumunu ele alan derin yapay zeka modelleri geliştirin.
OpenAI, bu alanların çoğunda yapay zeka performansını ölçmek için şu anda ortak bir standart bulunmadığını ve bu durumun modellerin adil bir şekilde değerlendirilmesi veya iyileştirilmesinde zorluklara yol açtığını vurguluyor. Şirket, doğrudan çalışarak her sektörde "neyin etkili olduğunu" net bir şekilde tanımlamayı ve bu kriterleri toplumun uygulaması için yayınlamayı umuyor.
Model ayarlama tarafında, katılımcı şirketlere, dar görev kümelerinde üstünlük sağlayan "uzman" modeller oluşturmak için bir OpenAI yöntemi olan Güçlendirme İnce Ayarı (RFT) kullanılarak yapay zekanın özel sürümlerinin eğitilmesi konusunda destek sağlanacak. Bu modeller üretim ölçeğinde dağıtıma hazır olma yönünde kararlıdır.
Uygulama yol haritasına gelince, ilk aşama esas olarak ürünün gerçek etkisine göre seçilmiş bir grup girişime odaklanacak. OpenAI, derin yapay zekanın somut bir fark yaratabileceği belirli sorunları ele alan ekiplere öncelik veriyor. Bununla birlikte gelecekte büyük işletmelere ve daha karmaşık alanlara doğru genişlemesi planlanıyor.