Cerebras, NVIDIAdan 20 kat daha hızlı, dünyanın en hızlı yapay zeka çıkarım teknolojisini piyasaya sürdü

Kaydolun ve günde 1000 $ kazanın ⋙

Cerebras Systems, dünyanın en hızlı yapay zeka çıkarım çözümü olarak kabul edilen Cerebras Inference'ı resmen duyurdu. Bu Cerebras Çıkarımı, Llama 3.1 8B (8 milyar parametre) modelleri için saniyede 1.800 token'a kadar ve Llama 3.1 70B için saniyede 450 token'a kadar performans sağlıyor; bu da Microsoft Azure dahil olmak üzere günümüzün hiper ölçekli bulutlarında bulunan NVIDIA GPU tabanlı yapay zeka çıkarım çözümlerinden yaklaşık 20 kata kadar daha hızlı.

Bu yeni çıkarım çözümünün inanılmaz performansının yanı sıra, hizmet bedeli de oldukça ucuz; popüler GPU bulut platformlarının fiyatının çok daha altında. Örneğin, bir müşteri sadece 10 sent karşılığında bir milyon token alabilir ve bu sayede yapay zeka iş yükleri için 100 kat daha yüksek fiyat performansı sağlanabilir.

Cerebras'ın 16 bitlik hassasiyeti ve 20 kat daha hızlı çıkarım hızı, geliştiricilerin hızdan veya maliyetten ödün vermeden yeni nesil yüksek performanslı yapay zeka uygulamaları oluşturmasına olanak tanıyacak. Bu çığır açan fiyat/performans oranı, Cerebras CS-3 sistemi ve yapay zeka işlemcisi Wafer Scale Engine 3 (WSE-3) sayesinde mümkün oluyor. CS-3, Nvidia H100'den 7.000 kat daha fazla bellek bant genişliği sunarak, üretken yapay zeka için bellek bant genişliğinin teknik zorluğunu çözüyor.

Cerebras, NVIDIA'dan 20 kat daha hızlı, dünyanın en hızlı yapay zeka çıkarım teknolojisini piyasaya sürdü

Cerebras Inference şu anda aşağıdaki üç düzeyde mevcuttur:

  • Ücretsiz Katman, kaydolan herkese ücretsiz API erişimi ve cömert kullanım limitleri sunar.
  • Geliştirici Katmanı, esnek, sunucusuz dağıtımlar için tasarlanmıştır ve kullanıcılara piyasadaki mevcut alternatiflerin maliyetinin çok daha azı karşılığında API uç noktaları sağlar; Llama 3.1 8B ve 70B modelleri sırasıyla milyon token başına sadece 10 sent ve 60 sent fiyatla sunulmaktadır.
  • Kurumsal Katman planları, ince ayarlı modeller, özel hizmet düzeyi anlaşmaları ve özel destek sunar. Sürekli iş yükleri için ideal olan Cerebras Inference'a işletmeler, Cerebras tarafından yönetilen özel bulut veya şirket içi üzerinden erişebilir.

Rekor performans, rekabetçi fiyatlandırma ve açık API erişimiyle Cerebras Inference, açık LLM geliştirme ve dağıtımı için yeni bir standart belirliyor. Hem yüksek hızlı eğitim hem de çıkarım sağlama yeteneğine sahip tek çözüm olan Cerebras, yapay zeka için tamamen yeni olanaklar sunuyor.

Yapay zeka trendlerinin hızla gelişmesi ve NVIDIA'nın şu anda pazarda baskın bir konuma sahip olmasıyla Cerebras ve Groq gibi şirketlerin ortaya çıkması, tüm endüstrinin dinamiklerinde potansiyel bir değişime işaret ediyor. Daha hızlı ve daha uygun maliyetli yapay zeka çıkarım çözümlerine olan talep arttıkça, Cerebras Inference gibi çözümler, özellikle çıkarım alanında NVIDIA'nın hakimiyetine girme şansını yakalamak için iyi bir konumdadır.

Sign up and earn $1000 a day ⋙

Leave a Comment

W3 Total Cache Eklentisi Güvenlik Açığı 1 Milyon WordPress Sitesini Saldırılara Maruz Bıraktı

W3 Total Cache Eklentisi Güvenlik Açığı 1 Milyon WordPress Sitesini Saldırılara Maruz Bıraktı

Bir milyondan fazla WordPress web sitesine yüklendiği tahmin edilen W3 Total Cache eklentisinde, saldırganların bulut tabanlı uygulamalardaki meta veriler de dahil olmak üzere çeşitli bilgilere erişmesine olanak tanıyabilecek kritik bir hata keşfedildi.

Microsoft, WSUS sürücü senkronizasyonunu dağıtmayı durduruyor, kullanıcılar dikkat!

Microsoft, WSUS sürücü senkronizasyonunu dağıtmayı durduruyor, kullanıcılar dikkat!

Microsoft, Teknoloji Topluluğu web sitesinde yayınladığı yeni bir paylaşımda, en son bulut tabanlı sürücü hizmetleri lehine WSUS sürücü senkronizasyonunu durdurmayı planladığını duyurdu.

Samsungun GoodLock uygulaması yepyeni bir görünüme kavuşuyor

Samsungun GoodLock uygulaması yepyeni bir görünüme kavuşuyor

Samsung akıllı telefonlardaki GoodLock uygulaması kişiselleştirme özellikleri dünyasının kapılarını açıyor.

Son 3 ayda hamile kadınlarda uykusuzluk nasıl tedavi edilir

Son 3 ayda hamile kadınlarda uykusuzluk nasıl tedavi edilir

Hamileliğin üçüncü üç ayı genellikle uykunun en zor olduğu zamandır. İşte hamilelerin son 3 ayda yaşadığı uykusuzluk sorununa çözüm.

Olay açıklandı: Güneşin etrafındaki garip dairesel hale

Olay açıklandı: Güneşin etrafındaki garip dairesel hale

Güneş'in kendi etrafında daire çizmesi olayı nedir? Makalede sizlere Güneş etrafındaki daireler olgusu detaylı bir şekilde anlatılacaktır.

Apple: Siri, ChatGPTyi Geçmeye Gerçekten Hazır Değil

Apple: Siri, ChatGPTyi Geçmeye Gerçekten Hazır Değil

Apple, yeni nesil iPad Mini'yi piyasaya sürerek gelecekte "yapay zeka dolu" yazılım deneyimlerine yöneleceğini açıkça ortaya koydu.

TikTok, Getty Imagesı reklamlara ve yapay zeka tarafından oluşturulan avatarlara getiriyor

TikTok, Getty Imagesı reklamlara ve yapay zeka tarafından oluşturulan avatarlara getiriyor

TikTok, reklam verenlerin platformun yapay zeka reklam oluşturma aracını kullanırken Getty Images'dan içerik çekmesine olanak tanıyacak.

AI Reklamları TikTok Akışlarında Daha Fazla Görünecek

AI Reklamları TikTok Akışlarında Daha Fazla Görünecek

Hiç kimse reklam görmekten hoşlanmaz ancak bu, sosyal medya platformlarının sağladıkları hizmetlerden para kazanmalarının yollarından biridir.

Netflixi daha iyi hale getirmek için Chrome uzantısı Trim nasıl kullanılır

Netflixi daha iyi hale getirmek için Chrome uzantısı Trim nasıl kullanılır

İnsanlar eskiden Netflix'te gezinerek çok fazla zaman harcıyordu, karar yorgunluğu çekiyor ve ne izleyeceklerini bilemiyorlardı. Ancak Chrome eklentisi Trim'i bulduktan sonra Netflix deneyimim tamamen değişti.

En Son Evade Roblox Kodları ve Kodların Nasıl Kullanılacağı

En Son Evade Roblox Kodları ve Kodların Nasıl Kullanılacağı

Evade oyun kodu, hayatta kalma yolculuğunuzda size ilk etapta avantaj sağlayacak önemli eşyaları ücretsiz olarak almanızı sağlar.

Taurus takımı DTCL sezonu 14 nasıl oynanır

Taurus takımı DTCL sezonu 14 nasıl oynanır

Taurus TFT 14. sezon, kalıcı hasar artırma mekanizmasına ve düşmanları yok ettiğinde altın düşürme yeteneğine sahip özel bir klandır.

Akıllı telefonda güzel gece fotoğrafları nasıl çekilir

Akıllı telefonda güzel gece fotoğrafları nasıl çekilir

Doğru teknikleri kullanırsanız telefonunuzla keskin gece fotoğrafları çekebilirsiniz; hatta bazen profesyonel bir kameradan bile daha iyi sonuçlar elde edebilirsiniz.

Chromea ​​ChatGPT arama motoru nasıl eklenir

Chromea ​​ChatGPT arama motoru nasıl eklenir

OpenAI, ChatGPT'yi kendi yapay zeka destekli arama motorunuza dönüştürebilmeniz için ChatGPT Arama'yı yayınladı. İşte Chrome'a ​​ChatGPT arama motorunu ekleme talimatları.

ChatGPTnin arama özelliğini Perplexityden üstün kılan nedir?

ChatGPTnin arama özelliğini Perplexityden üstün kılan nedir?

Perplexity uzun zamandır güvenilir bir platform olsa da ChatGPT'nin yeni yetenekleri kullanıcıların yavaş yavaş orijinal Generative AI chatbot'una geri dönmesini sağlıyor.

Aynı ev ağında 2 yönlendirici kullanabilir miyim?

Aynı ev ağında 2 yönlendirici kullanabilir miyim?

Eğer geniş bir ev ağınız varsa, evinizin bazı noktalarından kablosuz olarak bağlanmada zorluk çekebilirsiniz. İkinci bir yönlendirici ağ performansını artırabilir ve evinizin herhangi bir yerinden bağlanmanıza yardımcı olabilir.