Apple, yapay zeka alanında yeni bir gelişmeye imza attı. MGIE ya da MLLM Kılavuzlu Görüntü Düzenleme adı verilen yeni bir yapay zeka modeli duyurdu. Bu model, kullanıcının yazdığı metne göre görüntüleri düzenleyebiliyor. Örneğin, bir fotoğraftaki kişinin saç rengini değiştirmek, arka planı silmek veya parlaklığı artırmak gibi işlemler yapabiliyor.

MGIE, çok modlu büyük dil modelleri (MLLM) teknolojisini kullanıyor. Bu teknoloji, metin, ses, görüntü ve video gibi farklı türdeki verileri anlayabiliyor ve akıl yürütebiliyor. MGIE, 1.5 milyar parametre ile çalışıyor. Bu, MGIE’nin, Google’ın MGIE adlı yapay zeka modelinden yaklaşık üç kat daha fazla parametreye sahip olduğu anlamına geliyor.
MGIE, üç farklı versiyona sahip: Nano, Pro ve Ultra. En hafif versiyon olan MGIE Nano, iOS cihazlarda yerleşik olarak yer alacak. Bu sayede, kullanıcılar, telefonlarından MGIE ile konuşabilecek, soru sorabilecek, arama yapabilecek, çeviri yapabilecek ve daha birçok işlemi yapabilecekler. Biraz daha güçlü olan MGIE Pro ise, Photos, iMovie, Clips gibi birçok Apple uygulamasına güç verecek. En güçlüsü olan MGIE Ultra ise, veri merkezleri ve kurumsal uygulamalarda kullanılacak. MGIE Ultra, fotoğraf, video ve ses üretebilecek, kod yazabilecek, fizik problemleri çözebilecek ve daha birçok karmaşık işlemi yapabilecek.

Apple, MGIE’nin yeteneklerini göstermek için birkaç örnek paylaştı. Bunlardan biri, MGIE’nin çizilen görselleri, yapılan hareketleri, gösterilen eşyaları anında tanımlayıp sesli cevap verebildiği bir videoydu. Bir diğeri ise, MGIE’nin kod yazma konusunda ne kadar iyi olduğunu gösteren bir testti. Testte, MGIE, Swift, Objective-C, C ve C++ gibi dillerde kod üretti ve rakiplerinden %90 daha iyi performans gösterdi.
Apple, MGIE’nin yapay zeka yarışında önemli bir rol oynayacağını ve kullanıcıların hayatını kolaylaştıracağını söylüyor. Apple CEO’su Tim Cook, yaptığı açıklamada, “MGIE, yapay zekanın geleceğini şekillendirecek bir modeldir. MGIE, kullanıcıların görüntüler üzerinde doğal bir şekilde etkileşim kurmasını sağlıyor. MGIE, Apple’ın yapay zekayı herkes için daha yararlı, erişilebilir ve güvenli hale getirme vizyonunu yansıtmaktadır.” dedi.
Apple, modeli GitHub aracılığıyla yayınladı ancak ilgilenenler şu anda Hugging Face Spaces’ta barındırılan bir demoyu da denebiliyor. Apple, bu projeden öğrendiklerini herhangi bir ürününe dahil edebileceği bir araç veya özellik olarak kullanmayı planlayıp planlamadığını ise detaylandırmadı.