§ wiki.title / wiki.types.glossary
wiki.typeDescriptions.glossary
§ wiki.search.scopeLabel
wiki.search.title →2022'deki Hopper mimarisiyle frontier model eğitiminin standart donanımı hâline gelen GPU.
H100'ün bellek genişlemiş güncellemesi; uzun bağlam ve büyük modeller için tasarlandı.
NVIDIA'nın çoklu framework ve donanım için tasarladığı açık kaynak çıkarım sunucusu.
LLM'leri yerel makinede tek komutla indirip çalıştırmayı kolaylaştıran araç.
Modelin trilyonlarca tokenlık genel amaçlı veriden temel dil yetisini kazandığı ilk eğitim fazı.
Modellerin farklı framework'ler arasında taşınabilmesini sağlayan açık standart format.
Birden çok ajan, model ya da aracın koşturmasını planlayıp koordine eden ana bileşen.
Modelin olasılık dağılımından sıradaki tokeni hangi yöntemle seçtiğini belirleyen genel terim.
İnsan müdahalesi olmadan uzun süre boyunca kendi kararlarını alıp aksiyon üretebilen agent.
Bir ajanın hata, tutarsızlık ya da başarısız adımı tespit edip otomatik olarak düzeltmesi yeteneği.
Bir modelin kendi çıktısındaki hata ve zayıflıkları belirli kriterlerle değerlendirmesi tekniği.
Belgeleri önce büyük sınırlardan, sonra giderek daha küçük sınırlardan bölen pratik chunking stratejisi.
Sıradaki tokeni önceki tokenlere bakarak adım adım üreten model türü.
KV önbelleğini sayfalı bellek gibi yöneterek bellek savurganlığını ortadan kaldıran teknik.
Belgeleri RAG için anlamlı, sınırlı boyutlu parçalara bölme işlemi.
PostgreSQL'e vektör veri tipi ve benzerlik araması ekleyen açık kaynak eklenti.
Tam yönetilen, ölçeklenebilir bir vektör veritabanı SaaS hizmeti.
Bir ajanın hedefe ulaşmak için adımları önceden tasarlayıp sıralaması yeteneği.
Bir LLM'e verilen ve cevabın koşullarını belirleyen girdi metni.
Bir LLM'den istenen sonucu almak için promptu sistematik biçimde tasarlama disiplini.
Bir prompt içinde farklı bölümleri ayırmak için kullanılan XML benzeri etiketler.
Rust ile yazılmış, performans odaklı açık kaynak vektör veritabanı.
Tek bir tüketici GPU'sunda 65B modelleri ince ayar yapmayı mümkün kılan, kuantizasyonla birleşmiş LoRA varyantı.
Modelin akıl yürütme adımları ile araç çağrılarını dönüşümlü yapmasını sağlayan agent deseni.