Microsoft, Copilotun ücretsiz sürümüne GPT-4 Turbo LLMyi ekliyor
2023 yılı Microsoft'un Copilot'u gerçeğe dönüştürmek için yapay zekaya ve OpenAI ile ortaklığına büyük yatırım yaptığı bir yıl oldu.
Kuantum LLM'leri artık HuggingFace'de mevcut ve H20, Text Gen ve GPT4All gibi AI ekosistemleri bilgisayarınıza LLM dersleri yüklemenize olanak tanıyor ; artık ücretsiz, esnek ve güvenli bir AI seçeneğine sahipsiniz. İşte hemen deneyebileceğiniz en iyi 9 yerel/çevrimdışı LLM!
İçindekiler
Hermes 2 Pro, Nous Research tarafından ince ayarlanmış gelişmiş bir dil modelidir. Şirketin kendisi tarafından geliştirilen yeni tanıtılan Fonksiyon Çağrısı ve JSON veri kümeleriyle birlikte, OpenHermes 2.5 veri kümesinin güncellenmiş ve sadeleştirilmiş bir versiyonunu kullanıyor. Bu model Mistral 7B mimarisine dayanmaktadır ve çoğunluğu sentetik verilerden oluşan GPT-4 kalitesinde veya daha iyi 1.000.000 talimat/konuşma ile eğitilmiştir.
Örnek |
Hermes 2 Pro GPTQ |
---|---|
Model boyutu |
7,26 GB |
Parametreler |
7 milyar |
niceleme |
4-bit |
Tip |
Mistral |
Lisans |
Apache 2.0 |
Mistral 7B'deki Hermes 2 Pro, AGIEval, BigBench Reasoning, GPT4All ve TruthfulQA gibi çeşitli ölçütlerde gelişmiş performans sunan yeni amiral gemisi Hermes 7B modelidir. Gelişmiş yetenekleri sayesinde kod üretimi, içerik oluşturma ve konuşma tabanlı yapay zeka uygulamaları gibi pek çok doğal dil işleme (NLP) görevi için uygun hale geliyor.
Zephyr, yardımcı asistanlar olarak eğitilmiş bir dizi dil modelidir. Zephyr-7B-Beta, serinin ikinci modeli olup, halka açık sentetik veri kümelerinin bir karışımı üzerinde Doğrudan Tercih Optimizasyonu (DPO) kullanılarak Mistral-7B-v0.1'den geliştirilmiştir.
Örnek |
Zephyr 7B Beta |
---|---|
Model boyutu |
7,26 GB |
Parametreler |
7 milyar |
niceleme |
4-bit |
Tip |
Mistral |
Lisans |
Apache 2.0 |
Zephyr-7B-Beta, eğitim veri kümelerinin yerleşik hizalamasını ortadan kaldırarak, MT-Bench gibi kıyaslamalarda gelişmiş performans göstererek çeşitli görevlerdeki kullanışlılığını artırıyor. Ancak bu ayarlama, bazı şekillerde istendiğinde sorunlu metin üretimine yol açabilir.
Falcon'un bu nicemlenmiş versiyonu, TII'nin ham Falcon-7b modeli üzerinde geliştirilen yalnızca kod çözücü mimarisine dayanmaktadır. Temel Falcon modeli, kamuya açık İnternet'ten elde edilen 1,5 trilyon adet dolaşımdaki token kullanılarak eğitildi. Apache 2 lisanslı komut tabanlı yalnızca kod çözücü modeli olan Falcon Instruct, dil çevirisi ve veri toplama için kullanılacak bir model arayan küçük işletmeler için mükemmeldir.
Örnek |
Falcon-7B-Talimat |
---|---|
Model boyutu |
7,58 GB |
Parametreler |
7 milyar |
niceleme |
4-bit |
Tip |
Şahin |
Lisans |
Apache 2.0 |
Ancak Falcon'un bu versiyonu ince ayar yapmak için ideal değildir ve sadece çıkarım yapmak için tasarlanmıştır. Falcon'u ince ayarlamak istiyorsanız, NVIDIA DGX veya AMD Instinct AI Accelerators gibi kurumsal düzeyde eğitim donanımlarına erişim gerektirebilecek ham modeli kullanmanız gerekecek.
GPT4All-J Groovy, Nomic AI tarafından ayarlanmış ve Apache 2.0 lisansı altında lisanslanmış, yalnızca kod çözücüye sahip bir modeldir. GPT4ALL-J Groovy, komutlardan metin üretmede harika olduğu bilinen orijinal GPT-J modeline dayanmaktadır. GPT4ALL -J Groovy, hızlı ve yaratıcı metin oluşturma uygulamaları için harika olan konuşma tabanlı bir modele dönüştürüldü. Bu, GPT4All-J Groovy'yi şiir, müzik veya hikaye olsun, içerik oluşturucularının yazma ve kompozisyon konusunda onlara yardımcı olmak için ideal hale getirir.
Örnek |
GPT4ALL-J Harika |
---|---|
Model boyutu |
3,53 GB |
Parametreler |
7 milyar |
niceleme |
4-bit |
Tip |
GPT-J |
Lisans |
Apache 2.0 |
Ne yazık ki, temel GPT-J modeli yalnızca İngilizce veri kümesi üzerinde eğitildi; bu da, bu ince ayarlı GPT4ALL-J modelinin bile yalnızca İngilizce dilinde konuşabildiği ve metin oluşturma uygulamaları gerçekleştirebildiği anlamına geliyor.
DeepSeek Coder V2, programlamayı ve matematiksel muhakemeyi geliştiren gelişmiş bir dil modelidir. DeepSeek Coder V2, birden fazla programlama dilini destekler ve genişletilmiş bağlam uzunluğu sunar, bu da onu geliştiriciler için çok yönlü bir araç haline getirir.
Örnek |
DeepSeek Coder V2 Talimatı |
---|---|
Model boyutu |
13 GB |
Parametreler |
33 milyar |
niceleme |
4-bit |
Tip |
Derin Arama |
Lisans |
Apache 2.0 |
DeepSeek Coder V2, selefine kıyasla kod, muhakeme ve genel yeteneklerle ilgili görevlerde önemli iyileştirmeler gösteriyor. Programlama dillerine desteği 86'dan 338'e, bağlam uzunluğunu ise 16K'dan 128K token'a çıkarıyor. Karşılaştırmalı testlerde GPT-4 Turbo, Claude 3 Opus ve Gemini 1.5 Pro gibi modelleri kriptografik ve matematiksel karşılaştırmalarda geride bırakıyor.
Mixtral-8x7B, Mistral AI tarafından geliştirilen uzman modeller (MoE) karışımıdır. Her MLP'de 8 uzman bulunmakta olup, toplam 45 milyar parametre bulunmaktadır. Ancak, çıkarım sırasında token başına yalnızca iki uzman etkinleştiriliyor, bu da onu hesaplama açısından verimli hale getiriyor ve hız ve maliyeti 12 milyar parametreli bir modele benzetiliyor.
Örnek |
Karıştırma tral-8x7B |
---|---|
Model boyutu |
12 GB |
Parametreler |
45 milyar (8 uzman) |
niceleme |
4-bit |
Tip |
Mistral Milli Eğitim Bakanlığı |
Lisans |
Apache 2.0 |
Mixtral, 32 bin token'lık bir bağlam uzunluğunu destekliyor ve çoğu kıyaslamada Llama 2'yi 70 milyar geride bırakarak GPT-3.5 performansına eşit veya onu geçiyor. İngilizce, Fransızca, Almanca, İspanyolca ve İtalyanca dahil olmak üzere birçok dili akıcı bir şekilde konuşabilmesi, onu çeşitli NLP görevleri için çok yönlü bir seçim haline getiriyor.
Wizard-Vicuna GPTQ, LlaMA modeline dayanan Wizard Vicuna'nın kuantum versiyonudur. Kamuya açık çoğu LLM'nin aksine, Wizard-Vicuna sansürsüz ve ilişkilendirilmemiş bir modeldir. Bu, modelin diğer modellerin çoğuyla aynı güvenlik ve etik standartlarına sahip olmadığı anlamına geliyor.
Örnek |
Sihirbaz-Vicuna-30B-Sansürsüz-GPTQ |
---|---|
Model boyutu |
16,94 GB |
Parametreler |
30 milyar |
niceleme |
4-bit |
Tip |
LaMA |
Lisans |
GPL3 |
Yapay zeka hizalama kontrolü için bir sorun teşkil edebilmesine rağmen, sansürsüz bir LLM'ye sahip olmak, herhangi bir kısıtlama olmaksızın cevap vermesine izin vererek modeldeki en iyiyi ortaya çıkarır. Bu ayrıca kullanıcıların, yapay zekanın belirli bir komut doğrultusunda nasıl davranması veya yanıt vermesi gerektiği konusunda kendi özel hizalamalarını eklemelerine de olanak tanır.
Benzersiz bir öğrenme yöntemi kullanılarak eğitilmiş bir modeli test etmek mi istiyorsunuz? Orca Mini, Microsoft'un Orca araştırma makalesinin resmi olmayan bir uygulamasıdır. Bu model, veri setinin yalnızca istemler ve yanıtlar yerine açıklamalarla doldurulduğu bir öğretmen-öğrenci öğrenme yaklaşımı kullanılarak eğitilmiştir. Teoride bu, öğrenciyi daha akıllı yapmalıdır çünkü model, geleneksel LLM'nin aksine sadece girdi ve çıktı çiftlerine bakmak yerine sorunu anlayabilir.
Llama 2 , orijinal Llama LLM'nin devamı niteliğinde olup geliştirilmiş performans ve çok yönlülük sunmaktadır. 13B Chat GPTQ varyantı, İngilizce diyalog için optimize edilmiş konuşma tabanlı yapay zeka uygulamaları için ayarlanmıştır.
Yukarıda listelenen modellerin bazıları teknik özellikler açısından birden fazla versiyona sahiptir. Genel olarak, daha yüksek özelliklere sahip versiyonlar daha iyi sonuçlar üretir ancak daha güçlü bir donanım gerektirirken, daha düşük özelliklere sahip versiyonlar daha düşük kalitede sonuçlar üretir ancak daha düşük donanımlarda çalışabilir. Bilgisayarınızın bu modeli çalıştırıp çalıştıramayacağından emin değilseniz, önce daha düşük özelliklere sahip bir sürümü deneyin, ardından performans düşüşünün artık kabul edilebilir olmadığını hissedene kadar denemeye devam edin.
2023 yılı Microsoft'un Copilot'u gerçeğe dönüştürmek için yapay zekaya ve OpenAI ile ortaklığına büyük yatırım yaptığı bir yıl oldu.
Nvidia, OpenAI, Anthropic, Meta ve Google'ın önde gelen tescilli modelleriyle aynı performansı gösterdiği söylenen açık kaynaklı büyük dil modeli (LLM)'ni duyurdu.
iPhone ve diğer Apple donanım ürünlerini üretmesiyle bilinen Foxconn, üretim ve tedarik zinciri yönetimini iyileştirmek için kullanılması amaçlanan FoxBrain adlı ilk büyük dil modelini (LLM) duyurarak herkesi şaşırttı.
Akıllı televizyonlar gerçekten dünyayı kasıp kavurdu. Teknolojinin sunduğu pek çok harika özellik ve internet bağlantısı, televizyon izleme şeklimizi değiştirdi.
Buzdolapları evlerde sıkça kullanılan cihazlardır. Buzdolapları genellikle 2 bölmeden oluşur, soğutucu bölme geniştir ve kullanıcı her açtığında otomatik olarak yanan bir ışığa sahiptir, dondurucu bölme ise dardır ve hiç ışığı yoktur.
Wi-Fi ağları, yönlendiriciler, bant genişliği ve parazitlerin yanı sıra birçok faktörden etkilenir; ancak ağınızı güçlendirmenin bazı akıllı yolları vardır.
Telefonunuzda kararlı iOS 16'ya geri dönmek istiyorsanız, iOS 17'yi kaldırma ve iOS 17'den 16'ya geri dönme konusunda temel kılavuzu burada bulabilirsiniz.
Yoğurt harika bir besindir. Her gün yoğurt yemek faydalı mıdır? Her gün yoğurt yediğinizde vücudunuzda nasıl değişiklikler olur? Hadi birlikte öğrenelim!
Bu yazıda en besleyici pirinç türleri ve seçtiğiniz pirincin sağlık yararlarından nasıl en iyi şekilde yararlanabileceğiniz ele alınıyor.
Uyku düzeninizi ve uyku vakti rutininizi oluşturmak, çalar saatinizi değiştirmek ve beslenmenizi buna göre ayarlamak, daha iyi uyumanıza ve sabahları zamanında uyanmanıza yardımcı olabilecek önlemlerden birkaçıdır.
Kiralayın Lütfen! Landlord Sim, iOS ve Android'de oynanabilen bir simülasyon mobil oyunudur. Bir apartman kompleksinin ev sahibi olarak oynayacak ve dairenizin içini iyileştirme ve kiracılar için hazır hale getirme amacıyla bir daireyi kiralamaya başlayacaksınız.
Bathroom Tower Defense Roblox oyun kodunu alın ve heyecan verici ödüller için kullanın. Daha yüksek hasara sahip kuleleri yükseltmenize veya kilidini açmanıza yardımcı olacaklar.
Transformatörlerin yapısını, sembollerini ve çalışma prensiplerini en doğru şekilde öğrenelim.
Daha iyi görüntü ve ses kalitesinden ses kontrolüne ve daha fazlasına kadar, bu yapay zeka destekli özellikler akıllı televizyonları çok daha iyi hale getiriyor!
Başlangıçta DeepSeek'e yönelik büyük umutlar vardı. ChatGPT'ye güçlü bir rakip olarak pazarlanan bir yapay zeka sohbet robotu olarak, akıllı sohbet yetenekleri ve deneyimleri vadediyor.
Önemli ayrıntıları not alırken gözden kaçırmak kolaydır ve sohbet ederken not almaya çalışmak dikkat dağıtıcı olabilir. Çözüm Fireflies.ai'dır.
Axolot Minecraft, oyuncuların su altında görev yaparken nasıl kullanacaklarını bilmeleri durumunda harika bir yardımcı olacaktır.
A Quiet Place: The Road Ahead'in yapılandırması oldukça yüksek olarak derecelendirilmiştir, bu yüzden indirmeye karar vermeden önce yapılandırmayı göz önünde bulundurmanız gerekecektir.