Przez ostatnie dwa lata kilkukrotnie próbowaliśmy tworzyć spoty reklamowe przy użyciu narzędzi generatywnej sztucznej inteligencji. Za każdym razem efekty były jednak dość rozczarowujące. Sceny wyglądały nienaturalnie, światło było przypadkowe, a całość przypominała raczej eksperyment technologiczny niż materiał marketingowy. Aby osiągać przyzwoite rezultaty należało uzbroić się w dużą dawkę wolnego czasu oraz potężny pakiet kredytów – powyżej 1000 zł na każde 30 sekund wideo.

W ostatnich miesiącach sytuacja zaczęła się jednak wyraźnie zmieniać. Nowe modele generatywne potrafią tworzyć coraz bardziej realistyczne obrazy i krótkie sekwencje wideo. Dzięki temu pojawiło się ponownie pytanie, które dziś zadaje sobie wiele firm:

czy AI może stworzyć reklamę wideo, która wygląda jak prawdziwa produkcja filmowa?

Postanowiliśmy to sprawdzić.

Celem eksperymentu było stworzenie krótkiego, około 30-sekundowego spotu reklamowego przy użyciu generatywnych narzędzi AI i sprawdzenie, jak wygląda rzeczywisty workflow pracy przy użyciu narzędzi AI.

Finalny efekt możesz zobaczyć poniżej:

Koncepcja na spot

Pomysł na historię był bardzo prosty.

Bohaterka zakłada słuchawki i idzie ulicą miasta. Zatrzymuje się przy witrynie sklepowej, gdzie widzi identyczny model słuchawek. W pewnym momencie zaczyna się unosić w powietrzu – jakby muzyka dosłownie odrywała ją od rzeczywistości.

Całość kończy się spokojnym, emocjonalnym ujęciem twarzy.

Taki scenariusz jest dość typowy dla reklam lifestyle’owych produktów audio. W klasycznej produkcji oznaczałoby to plan zdjęciowy, ekipę filmową, oświetlenie, aktora i kilka dni pracy.

W tym przypadku całość została wygenerowana przy użyciu narzędzi AI. Wyjątkiem była muzyka, którą pobraliśmy z bazy stockowej (chociaż nie mamy pewności czy nie została wygenerowana przez AI). 

Narzędzia wykorzystane w projekcie

Do stworzenia materiału użyliśmy kilku różnych narzędzi, które odpowiadały za poszczególne etapy procesu.

ChatGPT pomagał przy pracy nad promptami i koncepcją scen. Nano Banana Pro pozwoliło stworzyć referencyjne kadry sceny i scenografii. Fragmenty wideo generowane były przy użyciu modelu Veo 3.1.

Głos lektora został wygenerowany w ElevenLabs, natomiast montaż i finalna korekta kolorystyczna powstały w DaVinci Resolve.

Warto podkreślić, że w całym projekcie nie było żadnych efektów VFX ani compositingu. Postprodukcja ograniczyła się wyłącznie do montażu i lekkiego color gradingu.

Całość zajęła około ok. 16 godzin pracy.

Koszt narzędzi wykorzystanych w projekcie wyniósł około 280 zł.

Kadr referencyjny sceny

AI Commercial model

Pierwszym krokiem było stworzenie jednego referencyjnego kadru, który definiował klimat całej historii: oświetlenie, kolorystykę i kompozycję sceny. Ten kadr stał się podstawą dla wszystkich kolejnych generacji.

AI shots
Sceny z aktorką, produktem i przestrzeni​ą

Jednym z ciekawszych elementów eksperymentu było generowanie scen z produktem w przestrzeni miejskiej. W przypadku generatywnego wideo największym wyzwaniem nie jest dziś już jakość pojedynczego kadru, ale spójność całej sceny.

Modele AI potrafią tworzyć bardzo realistyczne obrazy, jednak często zmieniają detale pomiędzy kolejnymi generacjami – kompozycję kadru, proporcje obiektów czy sposób, w jaki światło odbija się od powierzchni.

Dlatego proces tworzenia scen polegał głównie na iteracji kolejnych wersji obrazu i selekcji tych, które najlepiej pasowały do historii spotu. W praktyce oznaczało to wiele generacji i wybór kilku ujęć, które zachowały spójny klimat wizualny.

Dopiero na tej podstawie powstały krótkie fragmenty wideo wykorzystane w finalnym montażu.

Koszt AI vs tradycyjna produkcja wideo

Jednym z najciekawszych wniosków z eksperymentu jest stosunek kosztu do efektu.

Koszt narzędzi potrzebnych do stworzenia spotu wyniósł około 280 zł.

Dla porównania produkcja podobnego materiału reklamowego w klasycznym modelu oznacza zwykle budżet od kilkunastu do kilkudziesięciu tysięcy złotych.

Oczywiście oba modele produkcji mają zupełnie inne możliwości i ograniczenia. Tradycyjny plan zdjęciowy nadal daje większą kontrolę nad obrazem, światłem i aktorstwem.

Jednak w wielu przypadkach – szczególnie w materiałach digitalowych i social media – produkcja wideoprzez AI może stać się ciekawą alternatywą.

AI w produkcji wideo – czy to przyszłość marketingu?

Generatywne wideo nie zastępuje kreatywności ani pracy reżyserskiej. Nadal potrzebny jest pomysł, wizja sceny i ktoś, kto potrafi ocenić, które ujęcia działają, a które nie.

Zmienia się natomiast ekonomia produkcji.

Podobnie jak w przypadku AI Avatar dla firm, który pozwala tworzyć cyfrowe klony do nagrań wewnętrznych, materiałów szkoleniowych czy edukacyjnych, generatywne narzędzia mogą stać się nowym elementem workflow produkcyjnego.

Jednocześnie warto pamiętać, że pewne elementy produkcji wideo bardzo trudno zastąpić. Praca z aktorem na planie daje możliwość bieżącej korekty sceny, przekazywania wskazówek reżyserskich i reagowania na to, co dzieje się w kadrze. Podobnie operator kamery może na bieżąco dostosowywać ruch kamery, kompozycję czy światło. Dzięki temu powstają ujęcia, które są nie tylko bardziej naturalne, ale też lepiej dopasowane do wyobrażenia twórców.

Wnioski dla przyszłości branży filmowej

Ten szybki eksperyment pokazał, że przy użyciu powszechnie dostępnych narzędzi generatywnych można stworzyć krótki spot reklamowy w ciągu 1-2 dni pracy i przy minimalnym budżecie. Nie oznacza to końca tradycyjnej produkcji filmowej, ale pokazuje, że pojawia się nowy styl pracy, który prawdopodobnie będzie coraz częściej wykorzystywany w marketingu.

Technologia rozwija się bardzo szybko, a kolejne modele generatywne, takie jak np. Seedance 2.0, potrafią tworzyć coraz bardziej realistyczne sceny, jak chociażby walka Brada Pitta z Tomem Cruisem. W najbliższym czasie planujemy przetestować jeszcze bardziej zaawansowany pipeline generatywnego wideo i sprawdzić, jak bardzo może on zbliżyć się do klasycznej produkcji filmowej.