Google, son dönemde yeni bir yapay zeka tabanlı video üretim aracı olan VideoPoet’i geliştirdi. Bu araç, büyük ve geniş dil modellerini kullanarak metin ve kod üretiminde genel olarak kullanılan teknolojileri video üretimi için uyarladı. VideoPoet, uzun metinler ve yüksek kaliteli videolar yapabilme yeteneğiyle dikkat çekmektedir. Ancak Google VideoPoet’i henüz kullanıcılara sunmadı ama duyurulan özellikleri heyecan uyandırıyor. Kullanıclar, VideoPet ile müzik ve açıklayıcı videolar, kısa videolar dahil olmak üzere farklı türlerde videolar oluşturabilir. Gelişmiş özellikleriyle şimdiden heyecan yaratan VideoPet hakkında bilgi sahibi olalım.
Google Araştırma ekibindeki 31 araştırmacı tarafından gerçekleştirilen detaylı ön eğitim sürecinin bir ürünü olan bu yenilikçi teknoloji, 270 milyon video ve 1 milyardan fazla metin-görüntü eşleşmesi üzerinde çalışılmıştır. Google VideoPet, metin ve video veri kümesi üzerinde eğitilmiş bir dil modeline sahiptir. Metin ve video arasındaki ilişkiyi kavrayabilme yeteneği ise oldukça merak uyandırıcı. Metinle uyumlu aynı zamanda görsel olarak da etkili videolar üretebilmesi öne çıkan bir özelliktir.
Video üretimi görevini yerine getirmek için tasarlanan VideoPoet, Google’ı yeni çok modlu yapay zeka video oluşturucusu olarak da tanımlanabilir. VideoPoet, hareketlerin bozulmuş olduğu kısa videolar yerine tutarlı hareketler içinde olan daha uzun videolar üretebilme yeteneğidir. Bu, çoğunlukla yapay zeka tarafından yapılan videoların belirli bir süreden sonra kalitesinin düşmesi sorununu ortadan kaldırabilir. Bunun yanı sıra farklı kamera hareketlerini ve görsel sitilleri simüle edebilir, seçilmiş olan video kliplere uygun yeni sesler oluşturabilir ve metin, resim ve video gibi farklı girdileri bir araya getirerek kullanılabilir.
Google VideoPoet henüz kullanıcılara sunulmadı. 2023 Mayıs ayında Google Araştırma ekibi tarafından geliştirilmeye başlanan Google VideoPoet için henüz kullanıma sunulacağı tarih hakkında resmi bir açıklama yapılmadı. Ancak Google Araştırma ekibi, ilerleyen dönemlerde bu aracın yeteneklerini geliştirerek video üretimi alanında daha çok yenilik yapmayı planlamaktadır.
Google Araştırma ekibi, genellikle yapay zeka kullanarak video araçlarında difüzyon modeli (sabit bilgilerin bileştirilmeye dayalı) kullanmak yerine, LLM kullanmaya karar verdi. LLM’ler metin ve kod üretimi için kullanılan dönüştürücü mimarisine bağlı farklı bir yapay zeka modeli türü olarak konumlanıyor. LLM genel olarak ChatGPT, Claude 2 ya da LIama 2 gibi ürünlerde görülebilir. Google VideoPoet’in en çok yapılabilecekleri şunlardır:
VideoPoet’in bir diğer özelliği, dikkat çeken dikey video üretme yeteneğinin olmasıdır. Dikey video formatı, özellikle mobil cihazlarda genel olarak kullanılan bir format olup sosyal medya platformunda geniş kullanıcı kitlesine erişme potansiyeline sahiptir. Bu nedenle VideoPoet’in dikey video üretimini desteklemesi, içerik oluşturucuların çeşitli platformlarda etkin bir biçimde içerik yayınlamalarına yardımcı olabilir. Ayrıca kullanıma açıldıktan sonra birçok firmanın story, reels, gibi video içeriklerinde karşımıza çıkabilir.