Teknoloji alanında öncü konumda bulunan Google, yapay zeka (AI) bazlı içerik oluşturma alanında önemli bir yenilik olan Veo 3’ü tanıttı.
Yeni yapay zeka modeli, sadece videolar üretmekle kalmıyor; aynı zamanda bu videolar için ses efektleri, arka plan müzikleri ve diyaloglar gibi çeşitli ses unsurlarını senkronize bir biçimde oluşturma kabiliyetiyle dikkat çekiyor.
VEO 3, ses üretimindeki benzersiz özellikleri sayesinde rakiplerinden ayrışıyor.
Görsellerle uyum içerisinde ses üretebilme yeteneği, bu yeni modelin video üretim araçları arasında öne çıkmasını sağlıyor.
Metin veya görsel komutları kullanarak video oluşturabilen Veo 3, Runway ve OpenAI gibi rakiplerinin önünde bir konumda bulunuyor.
Veo 3, şu anda ABD’deki kullanıcılar için, ayda 249,99 dolarlık bir abonelik ücreti karşılığında Google’ın AI Ultra planı aracılığıyla Gemini sohbet robotu uygulamasında erişilebilir durumda.
VEO 3’ÜN GELİŞİMİNDE DERİN ÖĞRENME TEKNİKLERİ KULLANILDI
Veo 3’ün geliştirilmesinde, DeepMind’ın “videodan sese” konusunda yaptığı çalışmaların önemli bir etkisi olduğu düşünülüyor.
Google, bu modelin eğitimi için kullanılan verilerin kesin kaynağını açıklamamış olsa da, YouTube’un bu bağlamda güçlü bir ihtimal olduğu ifade ediliyor.
DeepMind, Deepfake tehditleriyle mücadele amacıyla Veo 3 tarafından üretilen görüntülere görünmez işaretçiler yerleştirmek için SynthID adını verdiği filigranlama teknolojisini kullanıyor.
Ayrıca, Google, Veo 3 ile birlikte, önceki versiyonu Veo 2 için karakter ve sahne tutarlılığını artırmak ve kamera hareketlerini anlama yeteneklerini geliştirme gibi yenilikler de duyurdu.