đ€ŻâĄïžHar du ett kit-bashing mindset?
AI-video nÀrmar sig professionell kvalitet. Detta förÀndrar ju allt!
Det hÀr Àr nyhetsbrevet dÀr Tomas Seo, innovationsstrateg pÄ Phorecast, avslöjar hÀndelser, upptÀckter och ny teknik som fÄr honom att utbrista: Detta förÀndrar ju allt! Du prenumererar pÄ det hÀr för att fortsÀtta vara steget före med de senaste trenderna och fÄ konkreta tips för att framtidssÀkra dig och din organisation. Har du fÄtt det hÀr av en vÀn? DÄ vill du kanske starta en egen prenumeration?
Vad har hÀnt?
- AI-video nÄr nÀsta nivÄ av realism pÄ grund av sin förstÄelse av vÄr vÀrld.
Flera nya tjÀnster för att kunna skapa rörliga bilder med hjÀlp av generativ AI uppvisar kraftigt ökad kvalitet den senaste tiden.
Denna vecka lanserar marknadsledaren Runway ML gen 3 av sin text-to-video-tjÀnst. Filmerna som tjÀnsten visar gÄr att göra upp till 10 sekunder lÄnga och till skillnad frÄn tidigare version sÄ morphar inte mÀnniskors utseende lika mycket. AI-modellen Àr speciellt trÀnad för att förstÄ samma termer som professionella filmskapare anvÀnder för att beskriva kameraÄkningar och bildkomposition. Precis som Sora berÀttar Runway att anledningen till att de fÄr sÄ mycket bÀttre resultat Àr pÄ grund av att deras AI anvÀnder en sÄ kallad world-modell. Modellen bygger alltsÄ upp vÀrlden innan den skapar bilderna, förstÄr hur objekten förhÄller sig till varandra och hur fysikens lagar skulle pÄverka objekten. SÄ som att vatten slÀcker eld och dÄ blir det Änga, ett glas som stÄr för lÄngt ut pÄ en kant kommer att falla eller att tvÄ hÀnder som strÀcks mot varandra kommer att skaka hand.
Veckans stora nyhet innan det var att Luma Labs slÀppte Dream Machine utan vÀntelista. Alla kunde plötsligt fÄ Sora-kvalitet pÄ sina videogenereringar gratis. Max 5 om dagen, max 30 pÄ en mÄnad, mer Àn sÄ behöver du betala för. Men för att testa rÀcker det lÄngt. Dream Machine pÄvisade ett helt nytt beteende i videogenerering. IstÀllet för slowmotion-klippen vi har vant oss vid att AI genererar sÄ klarar Dream Machine klipp med mycket action och rörelse. Det finns Àn sÄ lÀnge vÀldigt liten kontroll över resultatet men du kan göra image-to-video och fÄ ut 5 sekunder lÄnga videos. (Men mina tester visar att det gÄr att fÄ ut runt 2 sekunder innan ansikten pÄ mÀnniskor morphar för mycket för att se ut som samma person.)
Förra veckan slĂ€pptes den kinesiska videogenereringstjĂ€nsten Kling AI sĂ„ alla med ett kinesiskt telefonnummer kunde börja anvĂ€nda den. Ăven Kling anses kunna generera lika bra resultat som Sora, och bygger Ă€ven den pĂ„ world-model-förstĂ„else av vĂ„r vĂ€rld.
Den mesta forskningen för AI-video just nu Àgnar sig Ät world-model-modellerna. Största planerna kring det hÀr Àr tjÀnsten Showrunner, vars löfte Àr att ge oss ett autogenererat Netflix. Tv-shower som skapar sig sjÀlva med karaktÀrer som improviserar fram content speciellt genererat för dig. Bakom det stÄr Fable som förra Äret visade upp automatgenererade South Park-episoder i sitt experiment The Simulation.
Men vÀrdet för fungerade world models Àr mycket större Àn att bara försöka konkurrera ut Hollywood. AI-modellernas förmÄga att korrekt simulera vÄr vÀrld Àr nyckeln till att generativ AI kommer ha högre förstÄelse för vÄr vÀrld inom alla omrÄden.
Detta förÀndrar ju allt
Jag Àlskar film och tv-serier, men Àven om jag har haft god koll pÄ Hollywoods industrinyheter och kÀndisbabbel sÄ Àr det inte den delen som gjort mig till film-buff. För mig har det frÄn ett beteendevetenskapligt perspektiv alltid varit fascinerande nÀr en manusförfattare skriver fungerande vÀrldar. För att göra det mÄste författaren ha god förstÄelse för hur mÀnniskor fungerar och ha gÄtt igenom mÄnga tusen varianter av hur olika karaktÀrer skulle kunna handla i varje given situation för att komma fram till vilken action och reaktion som bÀst berÀttar den story som författaren vill driva. Författare Àr vÄra mÀnskliga worldmodel-simuleringsexperter. Det Àr dÀrför jag verkligen ser fram emot att fler författare kan ta steget till att visualisera sina berÀttelser helt sjÀlva.
NĂ€r jag experimenterade med video förra Ă„ret sĂ„ höll kvaliteten pĂ„ video till att göra weirda experimentella missfoster. Trailers till skrĂ€ckfilmer och mardrömssekvenser var lĂ€tt, med lite högre kreativ höjd gick det att fĂ„ till surrealistiska kortfilmer. Men vad klarar vi att göra i Ă„r? Under ett par mĂ„nader har jag testat alla AI-video-tjĂ€nster jag hittat för att kunna skriva en rapport till er om dagslĂ€get för AI-video. Ăkad kvalitet pĂ„ videotjĂ€nsterna gör inte automatiskt att vem som helst klarar av att bli en högkvalitativ filmskapare exakt just nu.
För att fĂ„ till en fiktiv deadline för denna State of AI-video-report sĂ„ bestĂ€mde jag mig för att försöka Ă„terskapa den klassiska Pripps BlĂ„-reklamfilmen och slĂ€ppa den lagom till midsommar.Â
HÀr kan du se resultatet och glad midsommar pÄ dig förresten!
Jag har gjort en version med Tommy Nilssons lÄt, men eftersom jag inte har rÄd med rÀttigheterna sÄ skrev jag en egen, anvÀnde Udio för att göra delar och klippte ihop musiken i ljudredigeringsprogram. Den hÀr versionen av videon Àr klippt till min musik, men jag har en version klippt till ursprungliga musiken klipp för klipp som jag kan visa pÄ förelÀsningar (boka mig gÀrna för kick-offer i höst redan nu!).
AI-versionen av PrippsblÄ-reklamfilmen lÀrde mig följande:
Min första slutsats Àr att det gÄr att komma ganska lÄngt helt utan AI-video idag. Med bara AI-genererade stillbilder som animeras i andra verktyg (till exempel After Effects eller Davinci Resolve) kan till och med jag skapa rörliga filmer som ser bra ut. För att göra en ny version av Pripps-reklamen klipp för klipp rÀcker det dock inte. Dels Àr det för mycket rörelse och dels skulle det ta för lÄng tid för att vara vÀrt det.
Min andra slutsats Àr att AI-video som endast animerar kamerarörelser inte bara Àr onödiga, utan till och med irriterande. Vi fÄr mer kontroll över utseendet genom att ha objekten i bilden som rör sig men sjÀlva kamerarörelser sÄsom inzoomning eller panoreringar Àr mycket enklare att bara lÀgga pÄ i redigeringsprogrammet. PÄ ett flertal stÀllen behöver jag istÀllet stabilisera kameraÄkningarna i efterhand i redigeringsprogrammet för att fÄ kontroll över dem.
Min sista slutsats Àr att ge upp pÄ gruppbilder dÀr samma karaktÀrer ska Äterkomma. De Àr möjliga att fÄ till genom att bygga upp flera lager med enskilda utklippta personer, men att fÄ till klipp som passar ihop tar för lÄng tid. Stillbilder med tvÄ Äterkommande karaktÀrer gÄr att fÄ till men Àven dÀr krÀvs mÄnga timmars tÄlamod för att fÄ till det ungefÀr som man vill ha det. Det Àr i tillgÀngliga AI-video-tjÀnster ocksÄ svÄra att fÄ till bÄde att de rör sig mycket och att de inte morphar pÄ ett weird sÀtt.
Baserat pÄ det hÀr projektet sÄ tÀnker jag ÀndÄ att det idag skulle vara möjligt att berÀtta enklare historier och faktiskt fÄ till ett proffsigt resultat. SÄ lÀnge man Àr redo att vara lite flexibel med exakt vilka videoklipp som man behöver fÄ till och bygger sin story runt begrÀnsningarna. Jag tycker inte att det Ànnu blir tillrÀckligt snyggt nÀr AI-videotjÀnsterna gör lÀppsynkning sÄ filmer som bygger helt pÄ dialog Àr Àn sÄ lÀnge uteslutet. Men vi har gÄtt frÄn att endast horror-trailers Àr möjliga till att vi nu Àven kan göra stories med vackra fotorealistiska videos dÀr en till tre Äterkommande karaktÀrer kan castas.
Om vi höjer blicken sĂ„ tror jag definitivt att vi kommer ha flera nya typer av autogenererade underhĂ„llningsformat. Men jag Ă€r ganska övertygad om att unika stories skapade av mĂ€nniskor fortfarande kommer ha en stor kulturell betydelse. MĂ€nniskor konsumerar kultur baserade pĂ„ sitt eget sammanhang. Vi svenskar konsumerar mer kultur gjord av svenskar Ă€n av koreaner, jag som gillar framtiden konsumerar mer kultur gjord av andra som gillar scifi, och jag Ă€r övertygad om att vi som Ă€r mĂ€nniskor kommer fortsĂ€tta konsumera mer kultur gjord av mĂ€nniskor Ă€n kultur gjord av bottar.Â
Den stora förÀndringen blir istÀllet den explosion av kreativa mÀnniskor som kan blomma ut och testa att visualisera sina berÀttelser. De som redan Àr professionella författare kan göra film av sina stories som inte Àr tÀnkta att bli sommarens blockbusters utan intressanta berÀttelser för en mer nischad publik. De som Ànnu inte Àr avlönade författare kan plötsligt vÀlja att skapa sina berÀttelser direkt mot oss tittare, eller mycket enkelt skapa engagerande demofilmer pÄ sitt manus för att visa sin vision för nÀsta sommars blockbuster för demonproducenterna i etablerade Hollywood.
Varje mÀnniska har ett unikt sÀtt att se vÀrlden, och jag tror att vÄr förstÄelse för varandra kan öka dramatiskt om fler mÀnniskor kan skapa berÀttelser frÄn sin point-of-view, och detta förÀndrar ju allt!
Vad kan du göra idag?
FörstÄ
Idag kan vi med sÄ kallad kit-bashing (det vill sÀga inte förlita oss pÄ en AI-tjÀnst utan se varje tjÀnst som ett verktyg vi kan kombinera med befintliga andra verktyg) skapa filmer med enorm kvalitet. Det gÄr till och med att göra gratis men det tar ganska lÄng tid dÄ filmklippen vi kan generera gratis varje dag Àr fÄ, och runt ett av 10 klipp blir superbra. (För min Pripps-reklam fick jag tvinga mig vÀlja ett av högst fem genererade klipp för att klara av att fÄ det fÀrdigt utan att betala).
Ăven om angreppssĂ€ttet att skapa world models och AI-agentsystem Ă€r mycket intressanta sĂ„ Ă€r arbetsprocessen med dem ganska annorlunda. Jag tĂ€nker pĂ„ det som om du skulle spela in en Hollywoodfilm utan skĂ„disar genom att först vara ute pĂ„ gatorna och leta upp nĂ„gon person som liknade en karaktĂ€r du vill ha. Sedan, utan att tillfrĂ„ga personen, följa efter hen och filma för att hoppas att personen gjorde exakt det du behövde till din film. Sedan skulle du behöva hitta en ny person som liknade den första och följa efter den och filma tills hen gjorde rörelser som du behöver till nĂ€sta klipp. Det hela Ă€r lite bakvĂ€nt.
IstĂ€llet kommer andra typer av AI-modeller, mer specialiserade pĂ„ kontroll över vad vi ser, att spela en stor roll för nĂ€sta generation av AI-video. Förra veckan lanserades forskningsprojektet Toon Crafter. DĂ€r vi istĂ€llet för att endast kunna ladda upp första bilden i klippet kan ladda upp bĂ„de startbild och slutbild. Det Ă€r mer sĂ„ som vi mĂ€nniskor tĂ€nker nĂ€r vi animerar. Toon Crafter Ă€r körbart och fungerar för tecknad film, men forskningen kommer att leda till fler verktyg som kan ge den hĂ€r typen av kontroll. Ăven Krea Video som lanserades veckan innan visar upplĂ€gget dĂ€r AI anvĂ€nds för sĂ„ kallad tweening, det vill sĂ€ga att hitta pĂ„ alla bilder emellan startbild och slutbild.
Kit-bashing Àr ett kreativt angreppssÀtt för hur vi mÀnniskor slÄr ihop olika verktyg till en arbetsprocess. Men angreppssÀttet gÀller Àven för hur nÀsta generations kodare kommer att tÀnka. IstÀllet för nuvarande strikta kodarkitekters metod att planera först och bygga sedan sÄ öppnar AI för att kombinera ihop olika AI-modeller och angreppssÀtt och se vad det blir nÀr de kombineras. Det blir lite mindre baka efter recept och mer laga mat pÄ kÀnsla. SÄ förmodligen kommer world model konceptet att fylla en stor funktion som motor för generering av AI-video men för att bli anvÀndbart kommer modeller som Toon Crafter bli dominerande modeller. Speciellt nÀr det Àr en mÀnniskas manus som ska visualiseras. NÀr AI sjÀlv blir regissör och manusförfattare sÄ fÄr hen sjÀlv kit-basha bÀst hen vill.
Planera
Inget verktyg idag kan göra allt. För att skapa pĂ„ ett kreativt sĂ€tt behöver vi utbilda oss i att se möjligheter med verktyg som de som utvecklar dem inte sjĂ€lva sett Ă€n. Det krĂ€ver en annan typ av utbildning Ă€n att gĂ„ kurser av typen âLĂ€r dig anvĂ€nda Office-paketetâ eller âSĂ„ promptar du i AI-tjĂ€nsten Xâ. IstĂ€llet behöver din organisation utbilda din personal i kit-bashing, hur kan de dela upp uppgifter i olika steg som kan lösas med hjĂ€lp av en kombination av olika verktyg.Â
Det hÀr gÀller inte bara kontorsarbete. Till exempel har startupen Machina Labs inspirerats av hur gammaldags smeder böjde metall för att Äterskapa processen med hjÀlp av gamla industrirobotar och nya AI-modeller. Grundaren berÀttar att nÀr han jobbade med 3D-printing för SpaceX sÄ fanns det problem dÀr skalan blev för stor för att lösa med modern tillverkningsteknik. Han visar att vi kan ÄteranvÀnda gamla verktyg och processer tillsammans med nya AI-modeller för att skapa nya sÀtt att lösa problem som tidigare var omöjliga.
För oss tjĂ€nstemĂ€n sĂ„ kĂ€nns det just nu lite bökigt att hoppa mellan en massa olika verktyg men det Ă€r början pĂ„ nĂ€sta steg dĂ€r vi promptar vĂ„ra AI-agenter annorlunda. Medarbetare behöver lĂ€ra sig att prompta pĂ„ ett sĂ€tt dĂ€r de inte frĂ„gar efter svar utan istĂ€llet beskriver processen och verktyg de kan anvĂ€nda sig av för att lösa en uppgift.Â
Gör
Testa att ladda upp bilder till Luma Labs Dream Machine för att fĂ„ svaret pĂ„ frĂ„gan â men vad hĂ€nde sen dĂ„?
LĂ€nkar
Runway berÀttar om sin kommande modell Gen 3.
https://runwayml.com/blog/introducing-gen-3-alpha
Runway berÀttar om hur de anvÀnder world models.
https://research.runwayml.com/introducing-general-world-models
Jag skrev om world models nÀr jag tvivlade pÄ om vi nÄgonsin kommer fÄ Sora som konsumentprodukt eftersom det Àr world models för AI som Àr det egentliga vÀrdet.
https://dettaforandrarjuallt.substack.com/p/sora-video-ar-en-slaskprodukt
Venture beat skrev om de automatiska South Park-avsnitten.
https://venturebeat.com/games/the-simulation-unveils-showrunner-ai-to-create-south-park-like-tv-shows-with-you-as-the-star/
Signup till Showrunner
https://www.showrunner.xyz/
Det Àr nÀstan exakt ett Är sedan jag skrev om Runways Gen2 och funderade över hur Hollywood kommer personaliseras pÄ grund av automatiskt generated media. https://dettaforandrarjuallt.substack.com/p/ditt-egna-personliga-hollywood
Den nya kinesiska tjÀnsten Kling (jag har inte testat den dÄ jag saknar kinesiskt telefonnummer, hör av dig om du testat den!)
https://kling.kuaishou.com/
Mer om ToonCrafter
https://doubiiu.github.io/projects/ToonCrafter/
Och hÀr kan du testa ToonCrafter
https://huggingface.co/spaces/Doubiiu/tooncrafter
Inslag om Machina Labs
Sedan sist vi hördes
Jag har mest Àgnat mig Ät att fÄ fÀrdigt midsommarvideon men hÀr kommer en lista pÄ tjÀnster som jag anvÀnt mig av för att göra den:
Jag anvÀnder Midjouney som grund för alla bilderna, sedan fixar jag till dem i Photoshop.
Luma labs Dream Machine kom lite sent, men det Àr definitivt min favorittjÀnst just nu. https://lumalabs.ai/dream-machine
Pixverse gör korta videos men deras videos Àr definitivt bÀst pÄ att hÄlla kvar utseendet pÄ mÀnniskor av tjÀnsterna.
https://pixverse.ai/
Pika Àr den jag anvÀnder minst av de bra modellerna, men den Àr bra pÄ ambient-rörelser.
https://pika.art/
Viggle hade jag tÀnkt anvÀnda mig mer av, men det tar lite för mycket tid att förpreppa bitar av videos för att det skulle vara görbart för just det hÀr projektet.
https://viggle.ai/
Runway anvÀnde jag för att det gick att fÄ till bra motion brush, vilket ger kontroll, men sedan sÄ kom det till Pixverse ocksÄ och dÄ föredrog jag det eftersom det var gratis.
https://runwayml.com/
Om du Àr mer intresserad av vilka verktyg jag anvÀnder sÄ kan betalande prenumeranter alltid se min aktuella verktygslista hÀr https://dettaforandrarjuallt.substack.com/p/ai-verktyg. Saknar ni nÄgot omrÄde av appar som borde listas dÀr sÄ hojta till!
Ăr du en insiktsdelare?
KÀnner du nÄgon som Àr intresserad av att fÄ en uppdatering pÄ vad tjÀnsterna för generering av AI-video klarar just nu? Eller kanske nÄgon som skulle behöva min hjÀlp att göra internutbildning för att förstÄ grunderna i kit-bashing för AI-video? Vem tÀnkte du pÄ? Skicka vidare!
Det Àr mÄnga som planerar för hösten just nu. Behöver din organisation nÄgon som kommer och pratar om AI, framtid eller nÄgot annat som du lÀst om i nÄgot av mina nyhetsbrev sÄ Àr jag bokningsbar.
Nyhetsbrevet tar sommarlov nu! Om du kÀnner abstinens och behöver snacka av dig om dina funderingar kring framtiden Gör en post i vÄr Facebookgrupp. Jag kommer ocksÄ att dela intressanta saker som jag ser dyker upp dÀr. https://www.facebook.com/groups/1673478106390188/
Glad midsommar!
Tomas Seo
Har du fÄtt dagens nyhetsbrev utan att vara prenumerant?
Gillade du det hÀr och vill ha mer sÄ Àr det bara att skriva upp sig hÀr
(du vÀljer sjÀlv om du vill betala):



