MEVZU N°12909.05.2026ISTANBULYEAR I — VOL. III

MEVZU N° ETIKET / VOL. 012

#alignment

0 blog · 0 haber · 5 wiki

§03

Wiki

05

Hizalama (Alignment)

Bir AI sisteminin amaçlarını ve davranışlarını insan değerleri ve niyetlerine yaklaştırma sorunu.

EN: Alignment
TR: Hizalama (Alignment)

RLHF — İnsan Geri Bildirimiyle Pekiştirmeli Öğrenme

İnsan tercihlerini ödül modeline dönüştürerek LLM'i bu ödüle göre optimize eden hizalama tekniği.

EN: RLHF (Reinforcement Learning from Human Feedback)
TR: RLHF — İnsan Geri Bildirimiyle Pekiştirmeli Öğrenme

Anayasal Yapay Zeka

Modelin kendi çıktılarını yazılı bir ilkeler setine göre eleştirip düzelttiği Anthropic hizalama tekniği.

EN: Constitutional AI
TR: Anayasal Yapay Zeka

DPO — Doğrudan Tercih Optimizasyonu

RLHF'in karmaşık RL adımı olmadan, tercih verisinden doğrudan model güncellemesi yapan yöntem.

EN: DPO (Direct Preference Optimization)
TR: DPO — Doğrudan Tercih Optimizasyonu

RLAIF — AI Geri Bildirimiyle Pekiştirmeli Öğrenme

İnsan etiketçiler yerine başka bir LLM'i tercih sinyali kaynağı olarak kullanan hizalama yaklaşımı.

EN: RLAIF (RL from AI Feedback)
TR: RLAIF — AI Geri Bildirimiyle Pekiştirmeli Öğrenme