§ wiki.title / wiki.types.glossary
wiki.typeDescriptions.glossary
§ wiki.search.scopeLabel
wiki.search.title →İnsan etiketçiler yerine başka bir LLM'i tercih sinyali kaynağı olarak kullanan hizalama yaklaşımı.
İnsan tercihlerini ödül modeline dönüştürerek LLM'i bu ödüle göre optimize eden hizalama tekniği.
Bir konuşmanın başında modele kalıcı talimat ve rol veren özel mesaj.
Modelin hiç örnek görmeden, sadece talimatla görev gerçekleştirmesi.
Bir modelin veya servisin uzun süre boşta kalıp ilk istekte yavaş yanıt vermesi durumu.
Ön eğitim sonrası modeli kullanışlı, güvenli ve talimat takip eden bir asistana dönüştüren faz.
Küçük taslak modelle birden çok tokeni öngörüp büyük modelle doğrulayarak hızlanma sağlayan teknik.
Sunucudan tarayıcıya tek yönlü canlı akış sağlayan, basit ve HTTP üzerinde çalışan standart.
Yeni isteklerin batch'in ortasına eklenip biten isteklerin hemen çıkmasını sağlayan dinamik servis tekniği.
Bir AI ajanının tarayıcıyı insan gibi kullanarak web sayfalarında gezinmesi ve eylem yapması.
NVIDIA donanımına özel olarak optimize edilmiş, yüksek hızlı çıkarım kütüphanesi.
Bir LLM'in cevabını doğrulanmış, harici bir kaynağa dayandırma pratiği.
Bir LLM'in saniyede ürettiği token sayısı; çıkarım hızının en görünür metriği.
Google'ın derin öğrenme iş yükleri için tasarladığı özel ASIC hızlandırıcı ailesi.
İstek atıldıktan sonra modelin ilk tokeni döndürmesine kadar geçen süre.
Her tokende sadece bir alt küme uzman alt-ağı aktive eden, devasa kapasiteyi düşük çıkarım maliyetiyle birleştiren mimari.
Bir oturumun ötesinde kalıcı şekilde saklanan, ajanın daha sonraki çalışmalarda erişebildiği bellek.
Yüksek boyutlu vektörleri saklayan ve onlara benzerlik araması yapan özelleşmiş veritabanı.
Bir sistemin birim zamanda işleyebildiği toplam token, istek veya görev miktarı.
PagedAttention ile yüksek verimli LLM servisi sunan, açık kaynaklı çıkarım framework'ü.
Hibrit arama ve modüler vektörleyiciler sunan açık kaynak vektör veritabanı.
Bir LLM'in kendi çıktısını eleştirip iyileştirmesini sağlayan iki adımlı ajan deseni.
Modelin çıktısını önceden tanımlanmış bir şemaya tam uyumlu hale getiren özellik.
İlk geri çağırma adımının sonuçlarını daha güçlü bir model ile yeniden sıralayan ikinci aşama.