Amazon, Nova Sonic Ses Modelini Duyurdu, Performansının OpenAI ve Googleı Geçtiğini İddia Ediyor

Kaydolun ve günde 1000 $ kazanın ⋙

Amazon bugün, geliştiricilerin gerçek zamanlı olarak insan benzeri seslerle sohbet edebilen uygulamalar geliştirmelerine olanak tanıyan gelişmiş bir konuşma-konuşma modeli olan Nova Sonic'i tanıttı. Amazon, bu yeni ses modelinin sektör lideri fiyat performansı ve düşük gecikme süresine sahip olduğunu iddia ediyor.

Genellikle, sesle etkinleştirilen bir uygulama geliştirmek, geliştiricilerin aynı anda birden fazla modelle çalışmasını gerektirir:

  • Sesi metne dönüştürmek için konuşma tanıma modeli.
  • Yanıtları anlamak ve üretmek için Büyük Dil Modeli (LLM).
  • Metinden sese modeli.

Bu yaklaşım karmaşık olmanın yanı sıra ton, prozodi ve konuşma stili gibi önemli akustik bağlamları da sıklıkla göz ardı eder.

Amazon, Nova Sonic Ses Modelini Duyurdu, Performansının OpenAI ve Google'ı Geçtiğini İddia Ediyor

Nova Sonic, sağlam anlayışı ve üretimi tek bir modelde birleştirerek bu zorluğun üstesinden geliyor. Birleştirilmiş yaklaşım, modelin tonu, stili ve ses girişini yakalamasına yardımcı olarak daha doğal bir diyalog yaratılmasını sağlar. Ayrıca uygun tepki süresini belirler ve saldırıları daha iyi yönetir.

Nova Sonic, Amerikan, İngiliz gibi birçok İngiliz aksanının yanı sıra hem erkek hem de kadın seslerini destekliyor. Geliştiriciler, fonksiyon çağrılarını destekleyen çift yönlü bir akış API'sini kullanarak Amazon Bedrock üzerinden modellere erişebilirler. Bu modelde ayrıca içerik denetimi ve filigranlama gibi yerleşik koruma özellikleri de bulunuyor.

Bu bağlamda, OpenAI geçen ay yeni nesil konuşmadan metne modellerini duyurdu - gpt-4o-transcribe ve gpt-4o-mini-transcribe - bu modeller önceki Whisper modellerine kıyasla kelime hata oranı, dil tanıma ve doğrulukta önemli iyileştirmeler içeriyor.

Sign up and earn $1000 a day ⋙

Leave a Comment

Excelde FILTER işlevi nasıl kullanılır

Excelde FILTER işlevi nasıl kullanılır

Eğer Excel'de veri kümeleriyle düzenli olarak çalışıyorsanız, ihtiyacınız olan bilgiye hızlı bir şekilde ulaşabilmenin ne kadar önemli olduğunu biliyorsunuzdur.

W3 Total Cache Eklentisi Güvenlik Açığı 1 Milyon WordPress Sitesini Saldırılara Maruz Bıraktı

W3 Total Cache Eklentisi Güvenlik Açığı 1 Milyon WordPress Sitesini Saldırılara Maruz Bıraktı

Bir milyondan fazla WordPress web sitesine yüklendiği tahmin edilen W3 Total Cache eklentisinde, saldırganların bulut tabanlı uygulamalardaki meta veriler de dahil olmak üzere çeşitli bilgilere erişmesine olanak tanıyabilecek kritik bir hata keşfedildi.

Microsoft, WSUS sürücü senkronizasyonunu dağıtmayı durduruyor, kullanıcılar dikkat!

Microsoft, WSUS sürücü senkronizasyonunu dağıtmayı durduruyor, kullanıcılar dikkat!

Microsoft, Teknoloji Topluluğu web sitesinde yayınladığı yeni bir paylaşımda, en son bulut tabanlı sürücü hizmetleri lehine WSUS sürücü senkronizasyonunu durdurmayı planladığını duyurdu.

Samsungun GoodLock uygulaması yepyeni bir görünüme kavuşuyor

Samsungun GoodLock uygulaması yepyeni bir görünüme kavuşuyor

Samsung akıllı telefonlardaki GoodLock uygulaması kişiselleştirme özellikleri dünyasının kapılarını açıyor.

Son 3 ayda hamile kadınlarda uykusuzluk nasıl tedavi edilir

Son 3 ayda hamile kadınlarda uykusuzluk nasıl tedavi edilir

Hamileliğin üçüncü üç ayı genellikle uykunun en zor olduğu zamandır. İşte hamilelerin son 3 ayda yaşadığı uykusuzluk sorununa çözüm.

Olay açıklandı: Güneşin etrafındaki garip dairesel hale

Olay açıklandı: Güneşin etrafındaki garip dairesel hale

Güneş'in kendi etrafında daire çizmesi olayı nedir? Makalede sizlere Güneş etrafındaki daireler olgusu detaylı bir şekilde anlatılacaktır.

Apple: Siri, ChatGPTyi Geçmeye Gerçekten Hazır Değil

Apple: Siri, ChatGPTyi Geçmeye Gerçekten Hazır Değil

Apple, yeni nesil iPad Mini'yi piyasaya sürerek gelecekte "yapay zeka dolu" yazılım deneyimlerine yöneleceğini açıkça ortaya koydu.

TikTok, Getty Imagesı reklamlara ve yapay zeka tarafından oluşturulan avatarlara getiriyor

TikTok, Getty Imagesı reklamlara ve yapay zeka tarafından oluşturulan avatarlara getiriyor

TikTok, reklam verenlerin platformun yapay zeka reklam oluşturma aracını kullanırken Getty Images'dan içerik çekmesine olanak tanıyacak.

AI Reklamları TikTok Akışlarında Daha Fazla Görünecek

AI Reklamları TikTok Akışlarında Daha Fazla Görünecek

Hiç kimse reklam görmekten hoşlanmaz ancak bu, sosyal medya platformlarının sağladıkları hizmetlerden para kazanmalarının yollarından biridir.

Netflixi daha iyi hale getirmek için Chrome uzantısı Trim nasıl kullanılır

Netflixi daha iyi hale getirmek için Chrome uzantısı Trim nasıl kullanılır

İnsanlar eskiden Netflix'te gezinerek çok fazla zaman harcıyordu, karar yorgunluğu çekiyor ve ne izleyeceklerini bilemiyorlardı. Ancak Chrome eklentisi Trim'i bulduktan sonra Netflix deneyimim tamamen değişti.

En Son Evade Roblox Kodları ve Kodların Nasıl Kullanılacağı

En Son Evade Roblox Kodları ve Kodların Nasıl Kullanılacağı

Evade oyun kodu, hayatta kalma yolculuğunuzda size ilk etapta avantaj sağlayacak önemli eşyaları ücretsiz olarak almanızı sağlar.

Taurus takımı DTCL sezonu 14 nasıl oynanır

Taurus takımı DTCL sezonu 14 nasıl oynanır

Taurus TFT 14. sezon, kalıcı hasar artırma mekanizmasına ve düşmanları yok ettiğinde altın düşürme yeteneğine sahip özel bir klandır.

Akıllı telefonda güzel gece fotoğrafları nasıl çekilir

Akıllı telefonda güzel gece fotoğrafları nasıl çekilir

Doğru teknikleri kullanırsanız telefonunuzla keskin gece fotoğrafları çekebilirsiniz; hatta bazen profesyonel bir kameradan bile daha iyi sonuçlar elde edebilirsiniz.

Chromea ​​ChatGPT arama motoru nasıl eklenir

Chromea ​​ChatGPT arama motoru nasıl eklenir

OpenAI, ChatGPT'yi kendi yapay zeka destekli arama motorunuza dönüştürebilmeniz için ChatGPT Arama'yı yayınladı. İşte Chrome'a ​​ChatGPT arama motorunu ekleme talimatları.

ChatGPTnin arama özelliğini Perplexityden üstün kılan nedir?

ChatGPTnin arama özelliğini Perplexityden üstün kılan nedir?

Perplexity uzun zamandır güvenilir bir platform olsa da ChatGPT'nin yeni yetenekleri kullanıcıların yavaş yavaş orijinal Generative AI chatbot'una geri dönmesini sağlıyor.