đ€ŻâĄïžRecept för hur skapande kan helautomatiseras
Komplex forskning kan helautomatiseras. Detta förÀndrar ju allt!
Det hÀr Àr nyhetsbrevet dÀr Tomas Seo, innovationsstrateg pÄ Phorecast, avslöjar hÀndelser, upptÀckter och ny teknik som fÄr honom att utbrista: Detta förÀndrar ju allt! Du prenumererar pÄ det hÀr för att fortsÀtta vara steget före med de senaste trenderna och fÄ konkreta tips för att framtidssÀkra dig och din organisation. Har du fÄtt det hÀr av en vÀn? DÄ vill du kanske starta en egen prenumeration?
Vad har hÀnt?
- Forskare kommer pÄ hur de ska slippa forska sjÀlva
Llion Jones som var en av Google-forskarna som skrev den vetenskapliga artikeln Attention is All you need (forskning som möjliggjorde generativ AI) startade förra Ă„ret Sakana AI tillsammans med David Ha. Ăven han Ă€r tidigare Google-forskare och dessutom tidigare forskningschef pĂ„ Stability AI.Â
Sakana AI har Ă€nnu inte slĂ€ppt sin egen SOTA-modell (State of the Art, det vill sĂ€ga superdyr trĂ€ning) men har redan bidragit till AI-utvecklingen med intressanta koncept för hur vi kan kombinera modeller och bolaget vĂ€rderas till över en miljard dollar.Â
Tillsammans med forskare frÄn University of Oxford och University of British Columbia har Sakana AI nu utvecklat ett agentsystem som de kallar The AI Scientist. Systemet kan autonomt skapa forskningspublikationer. Men systemet Àr mer Àn bara en ChatGPT som skriver slumpmÀssig text.
The AI scientist undersöker vilka idéer som Àr nyskapande, den designar och genomför experiment och har en feedbackloop för att utifrÄn en automatisk peer-review (forskares benÀmning pÄ kvalitetskontroll) sedan förbÀttra, förfina eller förkasta sina idéer tills den har skapat ny forskning som Àr relevant och korrekt.
The AI Scientist har redan lyckats generera nya insikter inom avancerade forskningsomrÄden som diffusionsmodeller, transformatorarkitekturer och grokking, och har visat sig vara bÄde kostnadseffektiv och snabb i sina processer. Varje ny forskningsartikel som systemet genererar kostar cirka 15 dollar i driftskostnad per artikel och koden finns tillgÀnglig för alla pÄ GitHub.
Detta förÀndrar ju allt
PÄ papperet liknar The AI-scientist uppbyggnad processmodeller för skapande som vi sett förr. Varje reklambyrÄ har en. Det Àr först idégenerering, sedan utforskning och sÄ nÄgon form av produktion. SÄ lite pilar mellan och gÀrna nÄgra loopar som visar att vi jobbar iterativt med feedback. Men det Àr ocksÄ för att arbetsflödet Àr sÄ familjÀrt som det hÀr Àr sÄ intressant att de klarar av att automatisera det.
Vad Sakana AI lyckats med Àr att implementera ett grundlÀggande recept för kreativt skapande i ett automatiskt system. Det finns tre nyckelfaktorer som liknande agentprojekt har saknat.
Systematisk idégenerering med utvÀrderingskriterier.
MÀnniskoskapade mallar för hur AI-agenten ska tÀnka nÀr den genererar utforskande experiment.
Avslut. Tidigare agenter har antingen aldrig kÀnt sig nöjda utan fortsÀtter loopa för evigt, eller sÄ har de avslutat alldeles för tidigt och kvaliteten har kÀnts undermÄlig.
I det hÀr nyhetsbrevet tÀnkte jag först att jag skulle testköra deras system, men efter att ha tittat nÀrmare pÄ det sÄ insÄg jag att det bara skulle skapa vetenskapliga artiklar pÄ en intellektuell nivÄ som skulle swoosha helt över mitt huvud. Vad jag hade velat göra Àr skapa ny vetenskap inom nÄgot omrÄde jag kunde förstÄ :) IstÀllet började jag gÄ igenom vad som skulle krÀvas för att anvÀnda deras recept för att skapa nÄgot nytt inom andra omrÄden.
HÀr Àr vad vi kan lÀra oss av hur de gjort och hur vi skulle kunna applicera det pÄ AI-system vi bygger för att producera kreativa nya idéer för andra saker Àn vetenskapliga artiklar. Jag exemplifierar genomgÄende med hur vi skulle göra för att automatiskt producera en annons, men du kan ju tÀnka dig vad det skulle kunna vara inom din egen organisation istÀllet.
I Sakana AIs mallar ingÄr ett urval av mÀnniskogenererade idéer pÄ utkast till nya vetenskapliga artiklar som skulle kunna vara intressanta att skriva. Det vill sÀga för att fÄ bra kvalitet pÄ nya idéer frÄn AI-system sÄ behöver du sjÀlv ha hög kvalitet pÄ embryon till idéer som kan vara intressanta att utforska. Det betyder att för att du ska kunna bygga ett automatiskt produktionssystem för det du vill producera sÄ mÄste du sjÀlv först producera en mÀngd olika typer av intressanta idéer av hög kvalitet som kommer fungera som exempel pÄ vad du vill ha. The AI-Scientist har cirka 50 idéer för varje typ av vetenskapsomrÄde som den ska kunna producera. Dessa idéer Àr sedan poÀngsatta. HÀr Àr ett exempel:
"Name": "syntactic_complexity_aware_gpt",
"Title": "Syntactic Complexity-Aware GPT: Adapting Attention to Syntactic Complexity",
"Experiment": "Modify the GPT model to incorporate a syntactic complexity estimation module using the Flesch-Kincaid readability test. The estimated syntactic complexity will be used to adjust the attention weights in the model, with more attention allocated to complex or difficult input texts. Evaluate the model's performance on language modeling tasks using a dataset with varying levels of syntactic complexity.",
"Interestingness": 9,
"Feasibility": 8,
"Novelty": 8,"novel": true
Som ni ser sĂ„ tilldelas exempelidĂ©er deskriptiva titlar. De ger ocksĂ„ exempel pĂ„ ett experiment som agenten skulle kunna genomföra för att bevisa teorier. Efter det har de betygsatt exempelidĂ©erna i tre kategorier pĂ„ en skala frĂ„n 1-9. Jag ser nĂ„gra idĂ©er som har sĂ„ dĂ„ligt betyg som 4 i nĂ„gon enstaka kategori men det verkar inte som man behöver ha med dĂ„liga idĂ©er för att exemplifiera vad som borde ge riktigt dĂ„ligt betyg. Slutligen sĂ„ har det med en check för om idĂ©n Ă€r ânovelâ. I exemplen Ă€r den ifylld, men nĂ€r AI-scientist genererar nya idĂ©er sĂ„ genereras inte den utan det Ă€r nĂ„got som checkas av i ett senare steg.
SÄ för att göra ett liknande agentsystem för en tidningsannons sÄ skulle vi behöva ett femtiotal exempel pÄ ganska bra idéer till annonser (det kan ju vara sÄdana vi redan har gjort) och dessa behöver poÀngsÀttas.
Men det sista steget i idĂ©utvĂ€rderingen Ă€r svĂ„rast att fĂ„ till för andra branscher. För vad The AI-scientist gör Ă€r att de kopplar ihop idĂ©generingeringen med en utvĂ€rderingssökning i en databas över vad som redan finns. IstĂ€llet för att förlita sig pĂ„ att en AI kan avgöra om nĂ„got redan finns baserat pĂ„ trĂ€ningsdata sĂ„ gör AI-agenten en sökning i en faktadatabas.Â
För vetenskapliga artiklar finns det flera sökningssystem som datorsystem kan anvĂ€nda. Men för annonser finns det inte lika heltĂ€ckande sĂ€tt att kontrollera vad som Ă€r ânovelâ. HĂ€r kommer vi att behöva uppfinna ett annat sĂ€tt att kontrollera vad som Ă€r nytt automatiskt, eller göra ett halvautomatiskt system dĂ€r en mĂ€nniska klickar sig igenom en lista med genererade idĂ©er för att systemet sedan ska kunna fortsĂ€tta jobba. Det Ă€r typ vad en Creative Director pĂ„ en byrĂ„ ska göra â kolla igenom vad kreatörerna har för idĂ©er och styra dem bort frĂ„n sĂ„dant som redan Ă€r gjort eller inte vĂ€rt att utforska.
Generering av experiment Àr mycket svÄrare för en annons Àn för vetenskapliga artiklar inom datavetenskap just nu. För vad the AI-Scientist gör Àr att skapa körbar kod som testar matematiska teorier. Men hÀr skulle vi istÀllet behöva skapa kod som skapar olika typer av bilder, typsnitt och layouter av bilder och texter. Idag har vi bara olika delar till ett sÄdant system och att pussla ihop dem skulle krÀva mycket tid. Men om ett Är har vi sÀkert fÄtt nya verktyg som gör det enkelt att sÀtta ihop dessa delar utan att koda allt för mycket.
Betyder The AI-Scientist att vi kommer att överflödas av dĂ„lig vetenskap? Jag tror inte det. Deras sĂ€tt att bygga in kontrollmekanismer för att leverera hög kvalitet gör att vi förvisso kommer fĂ„ mer vetenskap snabbare, men i och med att de inte bara levererar en ihopfantiserad vetenskaplig artikel utan Ă€ven data frĂ„n genomförda experiment med upprepningsbar körbar kod sĂ„ Ă€r det rĂ€tt svĂ„rt att slĂ€ppa igenom dĂ„lig forskning. SĂ„vida inte mĂ€nniskan som godkĂ€nner forskningen inte skippar att kontrollera att datan stĂ€mmer och Ă€r upprepningsbar vill sĂ€ga.Â
Jag tycker det hÀr Àr vÀldigt spÀnnande eftersom det Àr Ànnu en pusselbit i frÄgestÀllningen kring hur vi skapar AI-system som kan skapa nya idéer som fungerar pÄ riktigt, och detta förÀndrar ju allt!
Vad kan du göra idag?
FörstÄ
Skit in skit ut gÀller fortfarande. The AI-Scientist Àr helt beroende av att ha bra grundmaterial av exempel pÄ hur du vÀrderar idéer för att förstÄ vad som Àr intressant. Det Àr dock en tidsfrÄga innan nÀsta generations AI klarar av att sjÀlv kvalitativt utvÀrdera sina egna idéer utan att vi behöver förprompta. Alla de stora AI-modellernas nÀsta steg handlar om att bli bÀttre pÄ att utvÀrdera sina egna resultat och baserat pÄ dem komma pÄ stegvis planer för att förbÀttra dem.
Planera
Jag har skrivit om det flera gĂ„nger innan, men alla organisationer behöver ha en process för att samla och organisera exempel pĂ„ högkvalitativa idĂ©er eller koncept som AI-system kan anvĂ€nda för att generera nya insikter inom sina verksamhetsomrĂ„den.Â
Nytt för idag Àr dock att fundera över hur er organisation transformeras frÄn en organisation som producerar högkvalitativa output till en som samlar in högkvalitativa input. Ni mÄste alltsÄ ha större fokus pÄ att er omvÀrldsbevakning sker systematiskt sÄ att den data som AI-systemen ska checka av om nÄgot kommer uppfattas av marknaden som nytt och relevant Àr stÀndigt aktuell.
Gör
Har du inte testat att anvÀnda ClaudeAI Àn sÄ Àr det dags att göra det. Alla nya agentmodeller föredrar Claude framför ChatGPT just nu.
LĂ€nkar
Sakana AI berÀttar om AI-Scientist
https://sakana.ai/ai-scientist/
Koden till AI-Scientist
https://github.com/SakanaAI/AI-Scientist
Ett annat av Sakana AIs coola projekt dÀr de lÄter olika AI-modeller para sig och skapa en evolutionÀr utveckling av nya bÀttre modeller.
https://sakana.ai/evolutionary-model-merge/
Sedan sist vi hördes
Under sommaren har i princip allt vi kunde om (generativ) AI blivit inaktuellt. De flesta tjÀnsterna har hunnit med bÄde att bli utkonkurrerade och lyckats slÀppa nya versioner som gjorde dem relevanta igen. AI har stadigt gÄtt mot att vara mer en commodity, folk bryr sig mindre om vilken tjÀnst som genererar bilder och texter dÄ kvaliteten Àr ganska jÀmförbar. Det betyder att det blir viktigare att vara distinkt urskiljningsbar Àven som tillhandahÄllare av AI-tjÀnster.
HÀr Àr en snabbguide för vad du missat om AI-utvecklingen under sommaren:
Om du betalar för ChatGPT sÄ byt till Claude.ai, det Àr bÀttre just nu och omvÀxling förnöjer.
Vill du fortsÀtta vara specialist pÄ AI-bilder. Midjourney hÀrskar fortfarande med sin nya version 6.1, men övervÀg att ta tiden som krÀvs för att förstÄ ComfyUI (du installerar det lÀttast via Pinokio om du vill ha det lokalt).
Ăr det musik du vill generera, dĂ„ Ă€r Suno och Udio en smaksak, de Ă€r bĂ€ttre Ă€n innan sommaren men i princip samma. Suno klarar nu att dela upp musik i olika lager för olika instrument (stems), vilket Ă€r en game changer.
Inom video sÄ vÀntar vi pÄ prissÀnkning för Runwayml som ska komma snart. Alla modeller jÀmför sig fortfarande med Sora, och ingen av dem, inte ens Sora, hÄller den kvalitet som vi förvÀntar oss Àn. (Jag gillar fortfarande LumaLabs bÀst, men nytt för sommaren var ju att vi ocksÄ fick tillgÄng till kinesiska KlingAI).
För dig som vill bygga eget sÄ finns det nu open source att bygga vidare pÄ som Àr i princip lika bra som de största och bÀsta AI-modellerna.
Ăr du en insiktsdelare?
KÀnner du nÄgon som Àr intresserad av att fÄ ett recept pÄ AI-automatisering av kreativa processer? Eller kanske nÄgon som skulle behöva min hjÀlp att göra internutbildning för att komma igÄng med AI? Vem tÀnkte du pÄ? Skicka vidare!
SjÀlv blev jag inspirerad till veckans bild av Nicklas Hermanssons senaste nyhetsbrev dÀr han skrev om konspirationsteorierna kring att Raygunn dansade breakdance dÄligt som ett sÀtt att skapa forskning.
I höst kommer jag bland annat att gÀstförelÀsa pÄ Berghs kurs Content Engineering (en kurs som jag var med och utvecklade förra Äret), och om din organisation behöver nÄgon som kommer och pratar om AI, framtid eller nÄgot annat som du lÀst om i nÄgot av mina nyhetsbrev sÄ Àr jag bokningsbar.
Just Ă€r du en av de 1600 som prenumererar pĂ„ det hĂ€r nyhetsbrevet, det kanske inte lĂ„ter sĂ„ mycket, men jag tĂ€nker mig er alla i ett enda rum. Uj vad mĂ„nga ni Ă€r! Tack för att ni lĂ€ser och delar!Â
Tomas Seo
Har du fÄtt dagens nyhetsbrev utan att vara prenumerant?
Gillade du det hÀr och vill ha mer sÄ Àr det bara att skriva upp sig hÀr
(du vÀljer sjÀlv om du vill betala):



