Apple, metin komutlarına göre fotoğrafları düzenleyebilen bir yapay zeka modeli başlatıyor

elma Bugün AI oyununun en iyi oyuncularından biri değil, ancak şirketin fotoğraf düzenlemeye yönelik yeni açık kaynaklı AI modeli, alana ne gibi katkılar sağlayabileceğini gösteriyor. Model, görüntüleri işlerken metin tabanlı komutları yorumlamak için çok modlu büyük dil modellerini (MLLM'ler) kullanan MLLM Kılavuzlu Görüntü Düzenleme (MGIE) olarak adlandırılır. Başka bir deyişle araç, kullanıcının yazdığı metne göre görselleri düzenleme yeteneğine sahiptir. Bunu yapabilen ilk araç olmasa da, “insan talimatları bazen mevcut yöntemlerin yakalanıp takip edilemeyeceği kadar kısa olabiliyor.” Proje sayfası (PDF) Okuyun.

Şirket, MGIE'yi Santa Barbara'daki Kaliforniya Üniversitesi'nden araştırmacılarla geliştirdi. MLLM'ler, basit veya belirsiz metin istemlerini, görüntü düzenleyicinin kendisinin izleyebileceği daha ayrıntılı ve net talimatlara dönüştürme yeteneğine sahiptir. Örneğin, bir kullanıcı biberli pizzanın görselini “daha sağlıklı hale getirmek” için düzenlemek isterse, MLLM'ler bunu “sebzeli soslar ekle” olarak yorumlayabilir ve görseli bu şekilde düzenleyebilir.

Pizza, çita, bilgisayar ve insan resimleri. (elma)

MGIE, görüntülerde önemli değişiklikler yapmanın yanı sıra, metin istemleri aracılığıyla görüntüleri kırpabilir, yeniden boyutlandırabilir ve döndürebilir; ayrıca parlaklığı, kontrastı ve renk dengesini iyileştirebilir. Ayrıca görüntünün belirli alanlarını değiştirebilir ve örneğin görüntüdeki kişinin saçını, gözlerini ve kıyafetlerini değiştirebilir veya arka plandaki nesneleri kaldırabilir.

beğenmek girişim atışı Notlar, Apple modeli aracılığıyla yayınladı githubancak ilgilenenler şunu da deneyebilir: deneysel Şu anda Hugging Face Spaces'ta barındırılıyor. Apple, bu projeden öğrendiklerini herhangi bir ürününe entegre edebileceği bir araç veya özellikte kullanmayı planlayıp planlamadığını henüz netleştirmedi.

P	S	Ç	P	C	C	P
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Apple, metin komutlarına göre fotoğrafları düzenleyebilen bir yapay zeka modeli başlatıyor

X870E anakartlar artık Gigabyte web sitesinde!

Google Pixel 9 ağırlığının üzerinde bir performans sergiliyor

Apple Music artık oynatma listelerini kolayca YouTube Music’e aktarmanıza olanak tanıyor

Bir yanıt yazın Yanıtı iptal et

Türkiye, yüksek enflasyon oranlarına rağmen küresel sıralamada servet artışında birinci sırada yer alıyor

Suudi Arabistan “Türk ekiplerinin Gazze ile ilgili olduğu söylenen pankartı açtığını yalanladı.”

Arızalardan Hızlı Açmalara: Koruma Rölelerinin Nasıl Çalıştığını Anlamak

Roma mozaiklerinin Türk Müzesi’ndeki başarısız restorasyon sırasında hasar gördüğü söyleniyor

Türk Hava Yolları’nda teknolojik eğlenceyi zenginleştiriyoruz

More Stories

Bir yanıt yazın Yanıtı iptal et

You may have missed