Σε ανταγωνισμό με τα πρόσφατα μοντέλα text-to-video που λανσάρουν οι τεχνολογικοί κολοσσοί, η Meta παρουσίασε την beta έκδοση του Movie Gen, η οποία μπορεί να δημιουργήσει βίντεο κλιπ HD 1080p από text prompts και να επεξεργαστεί το πρόσωπο ενός χρήστη σε υπάρχον υλικό με συγχρονισμένο ήχο.
Σύμφωνα με paper της Meta που δημοσίευσε για το Movie Gen, το μοντέλο είναι προεκπαιδευμένο σε δεδομένα εικόνας και ήχου σε κλίμακα διαδικτύου, με τη δυνατότητα δημιουργίας νέων βίντεο με τεχνητή νοημοσύνη και εξατομικευμένων βίντεο προσαρμοσμένων στο πρόσωπο ενός ατόμου. Στην ανακοίνωση της Meta η εταιρεία δείχνει μια φωτογραφία που τραβήχτηκε με το πρόσωπο μιας πραγματικής γυναίκας, η οποία στη συνέχεια μεταμορφώνεται σε βίντεο όπου κάθεται σε ένα χωράφι με κολοκύθες, πίνοντας ρόφημα που μοιάζει με latte.
Η εξατομικευμένη ικανότητα της Meta μπορεί να είναι η πιο αξιοσημείωτη πτυχή για το λανσάρισμα του Movie Gen, καθώς το ξεχωρίζει από άλλες κορυφαίες εταιρείες τεχνολογίας που λανσάρουν κείμενο σε βίντεο, όπως το Sora της OpenAI, το οποίο κυκλοφόρησε τον Φεβρουάριο με τη δυνατότητα δημιουργίας βίντεο έως διάρκεια ενός λεπτού. Η πρόσφατη κυκλοφορία του Jimeng AI στην Κίνα από την ByteDance περιέχει πολλές από τις βασικές λειτουργίες του Sora, αλλά κέντρισε το ενδιαφέρον λόγω των πιθανών ευκαιριών στο TikTok. Ωστόσο σύμφωνα με post στο Threads, το Movie Gen δεν αναμένεται να κυκλοφορήσει σύντομα ως προϊόν λόγω των υψηλών εξόδων και του υπερβολικά μεγάλου χρόνου παραγωγής.