BLEU (Bilingual Evaluation Understudy), Papineni ve arkadaşlarının 2002'de IBM'de yayımladığı, makine çevirisini referans çevirilerle n-gram örtüşmesi üzerinden değerlendiren klasik bir metriktir. Yirmi yıldan uzun süre çeviri kalitesinin standart ölçütü olarak kaldı; basit, deterministik ve hızlı olması onu pratikte vazgeçilmez kıldı. Eleştirileri de aynı oranda yaygındır: yüzeysel kelime örtüşmesine dayanır, anlamı iyi yakalayamaz, anlamca aynı ama farklı sözcüklerle yazılmış cümleleri cezalandırır. Modern değerlendirme COMET, BERTScore ve LLM-as-Judge gibi yöntemlere kayıyor.
MEVZU N°124ISTANBULYEAR I — VOL. III
Sözlük · Orta · 2002
BLEU
Makine çevirisini referans çeviriyle n-gram örtüşmesi üzerinden değerlendiren klasik metrik.
- EN — İngilizce karşılığı
- BLEU
- TR — Türkçe karşılığı
- BLEU