İçeriğe atla
MEVZU N°127ISTANBUL

MEVZU N° ETIKET / VOL. 068

#generative

0 blog · 0 haber · 14 wiki

§03

Wiki

14
§01Sözlük

DALL-E

OpenAI'nin metinden görüntü üretme alanını kamuoyu gündemine taşıyan model serisi.

EN
DALL-E
TR
DALL-E
§02Sözlük

Midjourney

Estetik kalitesiyle öne çıkan, kapalı kaynak ticari görsel üretim modeli.

EN
Midjourney
TR
Midjourney
§03Sözlük

Görsel Üretimi

Bir modelin metin ya da başka koşullardan yola çıkarak yeni görseller ürettiği görev.

EN
Image Generation
TR
Görsel Üretimi
§04Sözlük

TTS — Metinden Sese

Yazılı metni doğal sesli konuşmaya dönüştüren teknoloji.

EN
TTS (Text-to-Speech)
TR
TTS — Metinden Sese
§05Sözlük

Sora

OpenAI'nin metinden video üreten ve alanda büyük yankı uyandıran modeli.

EN
Sora
TR
Sora
§06Sözlük

Veo

Google DeepMind'ın yüksek çözünürlüklü metinden video üretim modeli.

EN
Veo
TR
Veo
§07Sözlük

Ideogram

Görsel içinde metni doğru basabilmesiyle dikkat çeken bağımsız görsel üretim hizmeti.

EN
Ideogram
TR
Ideogram
§08Sözlük

ControlNet

Difüzyon modellerine kompozisyon, poz veya kenar gibi yapısal koşullar eklemeyi sağlayan teknik.

EN
ControlNet
TR
ControlNet
§09Sözlük

Flux

Black Forest Labs'ın 2024'te yayımladığı, fotogerçekçi sonuçlarıyla öne çıkan görsel modeli.

EN
Flux
TR
Flux
§10Sözlük

Stable Diffusion

Stability AI'ın Ağustos 2022'de açık kaynak yayımladığı, alanı dönüştüren difüzyon tabanlı görsel modeli.

EN
Stable Diffusion
TR
Stable Diffusion
§11Sözlük

Runway

Yaratıcı endüstrilere odaklanan ve AI video üretimini ürünleştiren New York merkezli şirket.

EN
Runway
TR
Runway
§12Sözlük

Ses Klonlama

Birkaç saniyelik örnekle bir kişinin sesini taklit eden ses sentezi yöntemi.

EN
Voice Cloning
TR
Ses Klonlama
§13Sözlük

Imagen

Google'ın yüksek kaliteli metinden görsel üretim modeli ailesi.

EN
Imagen
TR
Imagen
§14Sözlük

Difüzyon Modelleri

Gürültüyü adım adım temizleyerek görüntü, ses veya video üreten üretken model ailesi.

EN
Diffusion Models
TR
Difüzyon Modelleri