Yapay zekânın günümüzün en dikkat çekici teknolojilerinden biri olduğuna şüphe yok. Dev teknoloji şirketleri tarafından geliştirilen yapay zekâ modelleri ve uygulamaları daha şimdiden pek çok farklı alanda kullanılıyor. Üstelik bu teknoloji müthiş bir hızla gelişmeye devam ediyor. İşte bu baş döndüren gelişimin en son ve en dikkat çeken ürünü ise OpenAI tarafından geliştirilen yeni yapay zeka modeli: Sora. Sora, daha önceki yapay zeka modellerinden ve uygulamalarından farklı olarak yazılı metinleri videolara dönüştürüyor. Yeni yapay zeka modeli ile üretilen videolardaki gerçeklik ise hem heyecan hem de şaşkınlık yaratacak düzeyde. Gelin, Sora yapay zeka modeli nedir ve nasıl kullanılır gibi soruların yanıtlarına birlikte bakalım.
Günümüzün en önemli teknolojileri arasında gösterilen yapay zeka daha şimdiden pek çok farklı alanda kullanılıyor
Bununla birlikte yapay zeka sektörü inanılmaz bir hızla gelişmeye devam ediyor. Bu alandaki gelişimin en son ve en şaşırtıcı örneği ise Sora isimli yapay zeka modeli.
Sora nedir?
Sora, yapay zeka alanının önde gelen aktörlerinden, ChatGPT’nin yaratıcısı OpenAI tarafından geliştirilen bir yapay zeka modeli. Bugüne kadar ortaya çıkan bazı yapay zeka uygulamaları yazılı metinleri gerçekçi fotoğraflara, çizimlere veya tasarımlara dönüştürebiliyor. Ancak Sora çok daha şaşırtıcı bir alanda hizmet veriyor!
Sora, yazılı metinleri video haline getiren bir yapay zeka modeli
Yani Sora, kullanıcıların yazılı olarak verdiği bilgiler ve komutlar doğrultusunda videolar oluşturuyor. Örneğin aşağıdaki video, birkaç dev mamut karlı bir ovada yürüyerek yaklaşıyor gibi sıradan bir cümlenin ve manzaraya dair basit ayrıntıların yer aldığı yazılı metinden üretildi:
Yeni model birden fazla karakter, belirli hareket türleri ile arka planların olduğu detaylı ve karmaşık sahneler oluşturabiliyor
Örneğin yeni yapay zeka modeli ile canlı bir şehirde yürüyen ve koşan insanların, gerçekçi yapıların, bitki ve hayvanların, hava olaylarının ve daha pek çok ayrıntının yer aldığı videolar oluşturmak mümkün. Sora ile üretilen videolarda anlatımı güçlendirecek farklı kamera hareketlerine, açılarına ve dramatik etkiyi artıracak teknik detaylara da yer verilebiliyor. Bu ise kullanıcıların yalnızca birkaç cümlelik komutlarla bir sinema filmine aitmiş gibi görünen videolar oluşturabileceği anlamına geliyor.
OpenAI, Sora’nın çalışma prensibine dair “yapay zekaya hareket halindeki fiziksel dünyayı anlamayı ve simüle etmeyi öğretiyoruz.” ifadelerini kullanıyor
Yani Sora yalnızca kullanıcıların komutlarını anlamakla kalmıyor. Yazılı metindeki şeylerin gerçek ve fiziki bir dünyada nasıl var olacağını, nasıl hareket edeceğini ve nasıl görüneceğini de anlıyor. Komutları son derece başarılı bir şekilde algılayabilen Sora, bu sayede karakterlerin duygularını da gerçekçi bir şekilde yansıtabiliyor.
Sora ile yaratılan videoların görsel kalitesi ve gerçekçilik düzeyi ise hayli şaşırtıcı
Öyle ki bazı teknoloji yazarları Sora hakkındaki ilk izlenimlerini “korkutucu” olarak tanımlıyor.
Yapay zeka modeli ile şimdilik yalnızca bir dakikalık videolar oluşturulabiliyor
Ancak kullanıcıların komutlarına bağlılık ve gerçekçilik konusunda oldukça başarılı. Bu doğruluda Sora’nın başta sanat olmak üzere pek çok farklı alanda yeni bir dönemin başlangıcına öncülük edebileceği dile getiriliyor.
Oldukça kolay bir şekilde gerçekçi videoların üretimine olanak tanıması, Sora’yı aynı zamanda tehlikeli bir araç haline getiriyor
Bu doğrultuda şirket, yeni yapay zeka modelinin kötüye kullanımına yönelik bazı önlemler aldığını açıkladı. Örneğin bir videonun Sora tarafından ne zaman oluşturulduğunu anlayabilen bazı araçlar geliştiriliyor. Ayrıca Sora’nın ilk etapta yalnızca belirli profesyoneller tarafından test edileceği ifade ediliyor.
Sora nasıl kullanılır?
Yukarıda da değindiğimiz gibi Sora ile gerçekçi videolar oluşturmak için yapmanız gereken tek şey zihninizdekileri yazıya dökmek. Ancak model, henüz herkesin kullanımına açılmış değil. Yeni yapay zeka modeli güvenlik önlemleri kapsamında belirli profesyonellerce test ediliyor. OpenAI tarafından yapılan açıklamaya göre takip eden süreçte ise sinemacılar ve tasarımcılar gibi görsel sanatlarla uğraşan kişilere öncelikli olarak kullanıma sunulacak.
OpenAI, Sora’nın bazı zayıf noktalarının da olduğunu dile getiriyor
Şirketin açıklamasına göre metinleri videolara dönüştüren model, bazı talepleri karıştırabilir veya karmaşık bir sahnenin fiziksel gerçekliğini simüle etmekte zorlanabilir. Şirket bu hususta “bir kişi bir kurabiyeden bir ısırık alabilir ancak sonrasında kurabiyede herhangi bir ısırık izi kalmayabilir.” örneğini veriyor. Öte yandan modelin uzamsal ayrıntıları da karıştırabileceği belirtiliyor.
Kaynak: 1