đ€ŻâĄïž1000 riktiga personer fĂ„ngade i AI-simulerad vĂ€rld
Kvalitativa undersökningar gÄr att göra i stor kvantitet. Detta förÀndrar ju allt!
Det hÀr Àr nyhetsbrevet dÀr Tomas Seo, innovationsstrateg pÄ Phorecast, avslöjar hÀndelser, upptÀckter och ny teknik som fÄr honom att utbrista: Detta förÀndrar ju allt! Du prenumererar pÄ det hÀr för att fortsÀtta vara steget före med de senaste trenderna och fÄ konkreta tips för att framtidssÀkra dig och din organisation. Har du fÄtt det hÀr av en vÀn? DÄ vill du kanske starta en egen prenumeration?
Vad har hÀnt?
- Forskare kopierar 1000 mÀnniskor och bygger en modell för simulerad opinionsbildning.
Ett forskarteam har djupintervjuat personer för att skapa 1000 digitala tvillingar â autonoma AI-agenter som simulerar intervjupersonernas vĂ€rderingar, preferenser och beteendemönster. För att verifiera att AI-agenterna efterliknade sin förlaga fick mĂ€nniskan och agenten genomgĂ„ sociala experiment. Agenterna uppvisade 85% likhet med sin mĂ€nniskoförlaga.
AI-agenterna fick virtuella kroppar inne i en nystartad Minecraft-vÀrld dÀr de spontant började simulera mÀnskliga beteenden och sociala strukturer, som att skapa yrkesroller, utforma skattesystem och till och med sprida en religion.
Forskarteamet Ă€r det samma som för nĂ„got Ă„r sedan byggde en by med autonoma AI-agenter som började sjĂ€lvorganisera dejter till en alla-hjĂ€rtans-dag-fest. Dr Robert Young som ledde den forskningen har sedan dess sagt upp sig frĂ„n MIT för att tillsammans med forskare med frĂ„n Stanford och Google Deepmind starta Altera â ett bolag som gör mĂ€nniskolika AI-agenter för spel.
De 1000 digitala tvillingarna ingÄr i Alteras forskningsprojekt, kallat "Project Sid", och Àr en utforskning av hur vi kan bygga simuleringar av hela samhÀllen befolkade av AI-replikanter. Project Sid anvÀnder agenter som har flera AI-moduler specialiserade pÄ olika uppgifter, som planering, kommunikation och social interaktion. Bland exempel som tas upp i forskningen Àr att agenterna började bedöma varandras popularitet och dela resurser baserat pÄ sociala relationer, som att en kock i spelet prioriterade att ge mat till de agenter som uppskattade hans arbete mest. Det gick Àven att observera kulturella fenomen som hur memes sprids.
Detta förÀndrar ju allt
1000 autonoma AI-agenter som leker med varandra inne i Minecraft lÄter kanske inte relevant för alla, men implikationerna av att vi kommer kunna simulera hur mÀnniskor kÀnner och reagerar pÄ saker som hÀnder i samhÀllet Àr fantastisk. Idag anvÀnder vi matematiska modeller för att förutsÀga hur stora populationer av mÀnniskor kommer bete sig om vi till exempel höjer en skatt eller inför ett förbud. De fokuserar pÄ faktisk beteendeförÀndring, men den hÀr typen av generativa AI-simuleringar skulle kunna anvÀndas för att förstÄ attitydförÀndringar i samhÀllet och opinionsbildning. Vi kommer fÄ se mÄnga fler generativa AI-system dÀr vi kan testköra implementeringar av samhÀllsförÀndrande hÀndelser.
Redan nĂ€r jag skrev om forskningsteamets första projekt â den simulerade byn sĂ„ fokuserade jag pĂ„ hur det hĂ€r kommer anvĂ€ndas för att göra marknadsundersökningar dĂ€r vi frĂ„gar AI-bottar istĂ€llet för mĂ€nniskor. Strax dĂ€refter publicerade Harvard Business Review forskning som visade att en AI klarade av att skapa syntetiska svar som gav samma resultat som om man hade frĂ„gat mĂ€nniskor. Sedan dess har strategen i mig experimenterat med att intervjua LLM:er för att förstĂ„ hur det fungerar och hur jag kan utnyttja det.
NÀr jag har experimenterat med att frÄga AI som lÄtsas vara en mÀnniska tidigare har jag byggt deras personligheter pÄ generiska antaganden. Till exempel matat in en beskrivning av personen (persona, early adopter, swiftie) kombinerat med lite allmÀn demografi (bor i storstad, kvinna, jobbar pÄ kontor). Hittills har jag kommit fram till följande:
Det jag fÄr fram av att simulera ett 100-tal frÄgade mÀnniskor för svensk marknad Àr minst lika bra som nÀr alla pÄ byrÄn/marknadsavdelningen ber folk att fylla i en enkÀt. Det vill sÀga urvalet blir snedfördelat och vi tror vi hittar sanningar nÀr vi mest bekrÀftar det vi redan tror oss veta. Trots detta sÄ kan det trigga tankar som gör att vi kommer pÄ intressanta antaganden. Men vi mÄste vara medvetna om att det inte bevisar nÄgot.
NÀr vi bygger AI-system som fungerar i flera steg ökar tillförlitligheten. Första steget genererar en mÀngd fiktiva personportrÀtt med hög variation. I steg tvÄ genererar en AI, promptad med ett personportrÀtt i taget, svar pÄ frÄgorna som vi vill undersöka. DÄ ökar likheterna med svaren som vi skulle fÄ frÄn ett urval av mÀnniskor mycket. SÄ det gÄr att bygga en simulerad panel som ger samma tendenser i sina svar som om du skulle frÄgat riktiga personer. Du kan fÄ ut ungefÀr samma insikter som frÄn en medioker online-enkÀt.
Efter det har jag lite tappat sugen, dÄ nÀsta nivÄ krÀver större körningar. Jag har testat med lokala open source-modeller men de Àr inte tillrÀckligt bra, och att köra den mÀngd experiment jag skulle behöva blir för dyrt om jag skulle anvÀnda de bÀsta AI-modellerna.
Project Sid har istĂ€llet för att utgĂ„ ifrĂ„n generiskt genererade AI-personligheter byggt AI-replikanter genom djupintervjuer. En riktig mĂ€nniska blir en AI-replikant. SĂ„ som de har byggt systemet sĂ„ har varje replikant promptats med minnen som Ă€r de renskrivna djupintervjuerna dĂ€r mĂ€nniskorna berĂ€ttade om sitt livs historia och om stora livshĂ€ndelser som pĂ„verkat dem i deras liv. En liknande âmodellâ för ett helt land skulle ju behöva tvĂ„ timmars intervju med varje invĂ„nare i landet, men wow vilken hĂ€ftig trĂ€ningsdata det skulle vara!
Project Sids AI-replikanter kunde förusÀga vad originalmÀnniskan skulle svara pÄ en frÄga med 85% sannolikhet. Det Àr förstÄs lÀgre Àn 100% men de jÀmförde med de sÀtt jag sjÀlv har testat, det vill sÀga att anvÀnda generiska antaganden om personerna. Agenter som byggde pÄ demografi kunde förutsÀga vad originalmÀnniskan skulle svara i 71% av fallen, och agenter som byggde pÄ persona-antagande hade rÀtt 70% av gÄngerna. SÄ det bekrÀftar att generisk data inte kan förutsÀga en persons beteende lika bra som 2 timmar av skrÀddarsydd data. Gissningsvis skulle det aldrig gÄ att nÄ 100% men procenten kommer gÄ upp ju mer intervjutid som AI-replikantens minne skulle bygga pÄ.
Förutom att AI-replikanterna i sig Àr ett intressant sÀtt att skapa syntetisk data sÄ fastnar jag, nÀr jag lÀser forskningsrapporten, pÄ att de hÀr 1052 djupintervjuerna inte Àr gjorda av mÀnniskor utan av en röst-AI i ett digitalt möte som intervjupersonerna fick 60 dollar för att genomföra. Företaget som rekryterade intervjupersonerna hade i uppgift att rekrytera 1000 personer som var ett nationellt representativt urval baserat pÄ Älder, ras, kön, bostadsregion, utbildningsnivÄ och politisk ideologi.
Min erfarenhet hittills Àr att AI-baserade intervjuverktyg för undersökning fÄr sÀmre svar eftersom mÀnniskor kÀnner att de kan avsluta dem snabbare, men betalningen hjÀlpte nog till med det för hÀr Àr ett exempel pÄ en dialog som deras AI intervjuare genomfört:
Interviewee: I was raised in a rural town in
[Redacted]where there are actually more cows than people. I'm[Redacted]years old, so I am a child of the 70s and 80s. I wound up being a latchkey kid and was largely raised either by myself or by daycare and babysitters. Childhood was not really great and I was really glad to move on to high School.AI-Interviewer: I'm sorry to hear that childhood wasn't great for you. Could you tell me more about your experiences in high school? What was it like for you there, and were there any particular events or people that had a significant impact on your life during that time?
Interviewee: So I had a head injury while I was in elementary school and the full weight of that untreated injury came to bear when I was in about 8th grade and I started having these really bad mood swings. So I spent most of my high school years in deep depression and no one got me any help for it. It was pretty awful. I excelled in English, in theater, did pretty well in science, won a lot of awards at the end of the school time when it was time to graduate. Didn't have the greatest GPA because I had a habit of skipping classes and not doing any homework but acing finals. Particular events or people that had a significant impact, I would say that the album Pink Floyd The Wall pretty much helped me with my really terrible mood. I felt understood by that music. And I had two high school sweethearts. One was a boy and one was a girl. So they made a big impact. One of them I'm no longer in touch with and today is the girl's birthday.
AI-Interviewer: Thank you for sharing that with me. It sounds like high school was a particularly challenging yet formative time for you. After high school, what path did you take with your education? Did you go to college, or did you jump straight into a career?
Interviewee: After high school I went off to college originally to study criminal justice, but I changed over to English literature with a concentration in behavioral studies. After college, well, during college I had a bunch of different jobs. I worked with radioactive waste disposal, I worked at a woman's bookstore, I worked at a nightclub. I went off to law school and was there until I had to take a leave of absence because of my bipolar disorder, which was finally diagnosed. Years later, like 20 years later, I wound up going back to school again and got a business degree, mainly because I thought it would be fun to do. In the meantime, between law school and going back to business school, I worked as a legislative aide. I was a legislation director for a state senator and I wrote bills and got them passed into law. Then I took over my parents' business as a manager when my dad got breast cancer. After I worked as a manager there and I moved out of state in order to get married, I wound up buying into that business, so now I'm a part owner of the motel business where I'd started working when I was 15 as a housekeeper, so it's kind of gone full circle. Now I'm going to be working as a part-time firearms instructor.
Det skulle vara svÄrt att fÄ till en representativ mÀngd variation i Äsikter och bakgrundshistorier om jag sjÀlv skulle generera fram 1000 syntetiska AI-personligheter. SÄ det hÀr sÀttet att massgenomföra kvalitativa djupintervjuer kommer definitivt förÀndra hur forskning kan bedrivas. Men att bygga ett system som Àr proof of concept för ett nytt sÀtt som forskning kan bedrivas pÄ var ju bara en biprodukt. Huvudsyftet med Project Sid Àr att se hur stora mÀngder AI-agenter baserade pÄ riktiga mÀnniskor beter sig tillsammans.
I forskningsrapporten beskriver de kriterierna för urval som en stratifieringsstrategi. Vilket alltsĂ„ Ă€r ett fancy sociologiskt ord för att urvalet ska Ă„terskapa de hierarkiska strukturer som delar upp vĂ„rt samhĂ€lle i klasser och grupper med olika social status. Sociologer Ă€r dock inte eniga om stratifiering Ă€r nödvĂ€ndigt för att en stabil samhĂ€llsstruktur ska uppstĂ„ eller om det Ă€r ett maktmedel som förtrycker mĂ€nniskor. Project Sid tar inte stĂ€llning till denna frĂ„ga utan försöker bara kopiera de sociala hierarkier som Ă„terfinns i USA. Men tĂ€nk er nĂ€r det hĂ€r fungerar, dĂ„ kan vi utföra simuleringar pĂ„ samhĂ€llen dĂ€r det finns fler rasister, eller bara rasister? Hur skulle det se ut? Eller ett samhĂ€lle dĂ€r vi pĂ„ dagen inför medborgarlön och ingen behöver jobba för att fĂ„ mat eller boende? Hur kaosigt blir det och blir det mindre kaosigt om vi gör det stegvis? Det finns sĂ„ mĂ„nga What ifâs som jag vill frĂ„ga, nĂ„gra för att jag vill veta, nĂ„gra för att jag vill experimentera med ytterligheter. Generativ AI öppnar upp för inte bara ett utan mĂ€ngder av nya sĂ€tt att göra forskning kring opinion och samhĂ€llsfrĂ„gor och detta förĂ€ndrar ju allt!
Vad kan du göra idag?
FörstÄ
NÀr kostnaden för djupintervjuer sjunker möjliggörs en forskningstyp som tidigare varit omöjlig att genomföra. En kvalitativ undersökningsmetod i volymer som liknar kvantitativ metod. PÄ sikt betyder det att forskning dÀr vi bara har gjort antaganden baserat pÄ volymdata kan ge större djup och mening. Vi kan förstÄ vad nÄgot vi observerar kvantitativt fÄr individer att kÀnna kvalitativt.
Beslutsstöd Àr ett vÀxande omrÄde dÀr chefer i USA sÀger sig anvÀnda AI. Nya simuleringsverktyg av möjliga scenarion kommer vara extremt attraktiva. De kommer bÄde kÀnnas vÀrdeskapande pÄ ett professionellt plan, samtidigt som det blir som att chefer kan leka med ett skrÀddarsytt SimCity pÄ arbetstid.
Djupintervjuer med alla medborgare behövs inte ens för att skapa en simulerad version av vÀrlden. Din aktivitet pÄ sociala nÀtverk anvÀnds redan för att förutse vad du kommer göra. BÄde Facebook och kreditkortsföretag i USA vet om du kommer skilja dig innan du gör det. De har redan tillrÀckligt med beteendedata för att bygga upp ett simulerat samhÀlle. Förra veckan berÀttade Niantic att de skulle börja anvÀnda Pokemon Go-data för att bygga en AI-modell som förstod hur vi rör oss i vÀrlden. Det Àr inte osannolikt att sociala medier bolag sÄ smÄningom (ju mer de förbjuds) byter affÀrsmodell sÄ de kan leva pÄ den datan som de redan har samlat in. De har den största kollektionen av Àkta beteendeprofiler som vÀrlden skÄdat. Steget till att skapa anonymiserade AI-replikanter av dessa och göra Truman show Àr ganska kort. DÄ kan vi beskÄda hur meta-jorden beter sig nÀr vi likt gudar slÀnger in olika utmaningar för scenarioplanering/lek.
Det gÄr ju inte heller att ta upp utvecklingen av mer realistiska simulerade AI-replikanter utan att ocksÄ Äterknyta till tanken om att det Àr omöjligt att avgöra om vi finns pÄ riktigt eller om vi Àr en avancerad AI-simulering.
Planera
Redan nu gÄr det att bygga AI-bottar som kan genomföra telefonsamtal. De kan anvÀndas till att ringa upp för att frÄga om information eller för att ta emot samtal och sköta vidareslussning av Àrenden eller bokningar. PÄ nÀsta möte ni har inom organisationens interna AI-kommission kan ni planera kring om och i sÄ fall hur ni skulle testa att anvÀnda AI-uppringare för marknadsundersökningar.
Kom ihÄg att det Àr verifiering av urvalet och granskning av kvaliteten pÄ svaren som avgör om datan gÄr att dra slutsatser frÄn. Det Àndras inte av AI. Granskningen av kvaliteten pÄ svaren gÄr ju dÀremot utmÀrkt att anvÀnda AI till.
Gör
ChatGPTs avancerade röstfunktion Àr numera gratis för alla, arkitekturen som Project Sid anvÀnt Àr mer avancerade Àn en enda prompt, men vill du kÀnna pÄ att bli livsstilsintervjuad sÄ starta ChatGPTs röstlÀge, och lÀs upp följande:
Hej!
Idag vill jag att du intervjuar mig som om du genomför en semistrukturerad djupintervju. Du ska frÄga pÄ svenska och frÄga livsstilsfrÄgorna i American Voices Survey. SÄ inga frÄgor om min dialekt.
[nÀr man har med American Voices i prompten sÄ börjar ChatGPT frÄgor om dialekter trots att det inte det sjÀlva frÄgorna handlade om]
Kom ihÄg att frÄga en frÄga i taget, undvik alternativfrÄgor och frÄga öppna frÄgor som en erfaren djupintervjuare.
Efter varje svar kan du tyst reflektera över vad om det finns nÄgon meningsfull följdfrÄga du kan stÀlla baserat pÄ vad jag just svarat, men ocksÄ baserat pÄ hur jag svarat pÄ tidigare frÄgor.
Du mÄste balansera behovet av följdfrÄgor med att driva pÄ intervjun för att tÀcka alla omrÄden.
Avsluta inte intervjun förrÀn du fÄtt tillrÀckligt mÄnga svar för att du sjÀlv skulle kunna fylla i American Community Survey och General Social Survey heltÀckande.
DÄ kör vi!
Efter ni Àr fÀrdiga med intervjun kan du avsluta voice-mode och be ChatGPT sammanfatta dig
Kan du skriva en persona-profil baserat pÄ min intervju?
Den texten kan du spara, sÄ kan du kopiera in den i prompter som behöver dina vÀrderingar. SÄ du kan frÄga dig sjÀlv frÄgor stil med:
LĂ„tsas att du Ă€r jag och besvara frĂ„gan âVilket bilmĂ€rke gillar du och varför?â
Bonusuppgift: Kan ChatGPT förutse vad du skulle svara? Om inte, förstÄr du varför?
LĂ€nkar
Skrivet om forskningen utifrÄn perspektivet att simulera stora grupper
https://www.technologyreview.com/2024/11/27/1107377/a-minecraft-town-of-ai-characters-made-friends-invented-jobs-and-spread-religion/ (paywall â rensa kakor för att lĂ€sa)
Skrivet om forskningen utifrÄn perspektivet att kopiera personligheter
https://www.technologyreview.com/2024/11/20/1107100/ai-can-now-create-a-replica-of-your-personality/ (paywall â rensa kakor för att lĂ€sa)
Kort publik version av Project Sid-artikeln
https://arxiv.org/abs/2411.10109
LÀngre utförligare Project Sid-rapport
https://www.alphaxiv.org/abs/2411.10109v1
Sedan sist vi hördes
Det talas ju oftast om risker med smart AI. Men SvD:s granskning av hur FörsÀkringskassan anvÀnder AI Àr ett exempel pÄ att traditionell AI (eller ML) gör precis som den Àr tillsagd pÄ grund av mönster som mÀnniskor matat in i dem. NÀr jag lÀste artikeln undrade jag förstÄs hur grÀvet fÄtt ut datan sÄ de kunde granska den. Det finns det redogörelser för hÀr:
The dataset contains 6,129 people that were selected for investigation in 2017 and the outcome of that investigation: whether mistakes were or were not found in the benefit recipientsâ application. Of the 6,129 cases, 1,047 were randomly selected and 5,082 were selected by the machine learning model.
Datasetet finns utlagt pÄ github.
Exemplariskt skött journalistik. Dessutom ett intressant fall att följa för oss som tycker att AI EU Act faktiskt Àr helt okej dÄ den i princip bara förbjuder oacceptabla anvÀndningsomrÄden för AI som:
âOacceptabel risk: Social poĂ€ngsĂ€ttning: klassificering av mĂ€nniskor baserat pĂ„ beteende, socioekonomisk status, personliga egenskaper.â
Ăr du en insiktsdelare?
KÀnner du nÄgon som skulle ha nytta av AI som kan intervjua? Eller kanske nÄgon som skulle gilla att AI-simulera scenarion? Vem tÀnkte du pÄ? Skicka vidare!
Har ni pengar kvar i budgeten som ska spenderas innan Äret Àr slut? Boka in mig för en inspirationsförelÀsning, skrÀddarsydda utbildningar eller strategiworkshop. Bara att svara pÄ det hÀr mejlet eller kontakta mig via Linkedin.
FortsÀtt utforska sÄ ses vi nÀsta vecka!
Tomas Seo
Har du fÄtt dagens nyhetsbrev utan att vara prenumerant?
Gillade du det hÀr och vill ha mer sÄ Àr det bara att skriva upp sig hÀr
(du vÀljer sjÀlv om du vill betala):


