OpenAI, ChatGPT'deki AI görüntü oluşturma yeteneğinde dikkat çekici bir yükseltmeyi resmen duyurdu; bu, önceki DALL-E gibi ayrı bir görüntü oluşturma modeli kullanmak yerine önemli bir adım niteliğinde. Bu yeni özellik doğrudan GPT-4o'ya entegre edilerek önemli iyileştirmeler sağlandı.
İçsel sınırlamaların üstesinden gelmek
Günümüzdeki yapay zeka görüntü oluşturma modellerinin birçoğu etkileyici sanatsal görseller oluşturabiliyor ancak metin, logo veya günlük nesneler gibi öğelerle başa çıkmakta zorluk çekiyorlar. OpenAI, yeni GPT-4o'nun şu yetenekleri sayesinde bu sınırlamaların üstesinden gelebileceğini iddia ediyor:
- Metni doğru şekilde görüntüle
- Kullanıcı gereksinimlerine kesinlikle uyun
- Arka plan bilgisini ve konuşma bağlamını kullanın
- Yüklenen fotoğrafların düzenlenmesine veya orijinal fotoğraflara dayalı yeni fotoğrafların oluşturulmasına olanak tanır
- Yaygın olarak mevcuttur
Bu yeni özellik şu anda ChatGPT Free, ChatGPT Plus, Pro ve Team kullanıcılarına sunuluyor ve önümüzdeki haftalarda ChatGPT Enterprise ve Edu'da da kullanıma sunulacak. Özellikle bu, ChatGPT'deki varsayılan resim oluşturma aracı olacak ve kullanıcıların ek seçeneklere ihtiyaç duymadan kolayca erişebilmesini sağlayacak. Kullanıcılar fotoğrafları şu şekilde özelleştirebilir:
- Belirli en boy oranı
- Tam renk (hex kodu kullanılarak)
- Şeffaf arka plan
- Çoklu platform desteği

Bu özellik ChatGPT'ye ek olarak Sora (görüntü oluşturma), özel DALL·E GPT ve GPT-4o API (geliştiriciler için, önümüzdeki haftalarda kullanıma sunulacak) gibi platformlarda da kullanıma sunulacak.
Yeni modelin pek çok iyileştirme vaat etmesine rağmen hâlâ bazı sınırlamaları var:
- Yüksek detay nedeniyle görüntü oluşturma süresi 1 dakikaya kadar çıkabilir
- Dikey fotoğraflarda istenmeyen kırpma
- Bazen çok az bağlam gerektiren bilgileri "uydururuz"
- Aynı anda 10-20'den fazla kavramı işlemede zorluk
- Latin olmayan dillerde zorluk
- Ayrıntılı düzeltmeler (yazım hataları gibi) çok etkili değildir
- Küçük boyutlarda ayrıntılı bilgileri görüntülemek zor
GPT-4o ile oluşturulan tüm görüntüler C2PA meta verilerini içerecek ve bu sayede OpenAI'nin dahili araçları kullanılarak köken doğrulaması yapılabilecek.
Bazı sınırlamalara rağmen GPT-4o daha doğru ve özelleştirilebilir görüntüleme sunmayı vaat ediyor. OpenAI, önümüzdeki aylarda modeli geliştirmeye devam edeceğini ve yapay zeka destekli görsel içerik oluşturma için yeni olanaklar sunacağını söylüyor.
OpenAI, bu büyük güncellemeyle yaratıcı yapay zeka yarışındaki liderliğini güçlendirmeye devam ediyor ve birden fazla platformda kullanıcılara daha kusursuz ve güçlü bir deneyim sunuyor.