🤯⚡️Jag hatar att GPT5 gör det jag ber den.

Stor GPT5-guide med praktiska exempel. Detta förändrar ju allt!

Sep 03, 2025

Det här är nyhetsbrevet där Tomas Seo, innovationsstrateg på Phorecast, berättar om händelser, upptäckter och ny teknik som får honom att utbrista: Detta förändrar ju allt! Du prenumererar på det här för att fortsätta vara steget före med de senaste trenderna och få konkreta tips för att framtidssäkra dig och din organisation. Har du fått det här av en vän? Då vill du kanske starta en egen prenumeration?

Vad har hänt?

- OpenAI säger: ”GPT-5 minskar dramatiskt hallucinationer och följer komplexa instruktioner bättre.” Oberoende tester: ”Vi håller med, det räcker till en andraplats.”

När OpenAI släppte GPT-5 tidigare i början av augusti var huvudbudskapet tydligt: modellen är både betydligt mindre benägen att ”hallucinera” (hitta på fakta eller tappa bort detaljer från tidigare i konversationen) och bättre på att följa komplexa instruktioner.

På deras så kallade systemkort (den säkerhets- och kapabilitetsrapport OpenAI publicerar vid varje modellrelease) uppgav de att gpt-5-thinking ger 78 % färre svar med minst ett större faktafel än tidigare modell o3 och 65 % lägre hallucinationsgrad på påståendenivå. Deras egna tester satte också nya rekord på benchmarks för instruktionsefterlevnad (toppscore på 69,6 på Scales MultiChallenge benchmark)

Nu börjar oberoende rapporter testa effekterna i praktiken. I slutet av augusti genomförde Washington Post ett omfattande test där bibliotekarier graderade nio AI-tjänster på faktakvalitet och källhänvisning, GPT5 kom tvåa. Bäst på att inte hallucinera var Googles AI Mode (det är inte samma som Googles AI Overview-rutor utan en annan Google Search-tjänst som finns inte i Sverige än).

I slutet av augusti uppdaterade Scale AI själva sin MultiChallenge-leaderboard. GPT-5 fick då inte lika högt score som OpenAI själva gett den. GPT5 fick nöja sig med en andraplats (med score 58,6) och OpenAIs o3 PRO-high var fortfarande bäst (med score 63,77). Benchmarken är särskilt framtagen för att ”straffa” AI-modeller som tappar bort tidigare instruktioner eller följer otydliga och motsägelsefulla prompter på ett inkonsekvent sätt.

GPT5 lever inte riktigt upp till den första plats OpenAI ville ha, men det är tydligt att de lyckats med väsentliga förbättringar med stora minskningar av påhittade fakta och större respekt för vad som faktiskt står i prompten.

Detta förändrar ju allt

Det finns alltså bättre AI än GPT5, men som i alla kategorier av produkter så är det sällan den allra bästa som är den mest älskade. ChatGPT är marknadsledare och att marknadsledarens produkt (som dessutom är gratis för alla att använda) blir avsevärt bättre på att både inte hitta på och följa instruktioner bättre förändrar resultatet för de flesta användare.

Jag frågade förra veckan om ni skulle vara intresserade av en genomgång av hur lanseringen av GPT5 förändrat hur jag själv använder OpenAI. Tillräckligt många tyckte att det verkade intressant så här kommer konkret vad jag har kommit fram till. Två användningsområden har blivit så mycket bättre att det kommer påverka vår samtid.

1. Bättre på kodning

För första gången kan jag be AI om att skapa ett fungerande verktyg som jag kan leka runt med. Det är väldigt bra för att förstå scenarion. Min process är följande.

Prompta GPT5-thinking så hen gör research kring forskning kring hur något fungerar.
Be GPT5-thinking att skapa en interaktiv app där jag kan experimentera med forskningen.
Kör appen. Se om det behövs någon förändring.

Exempel:

Steg 1.

What does the latest peer reviewed science say about how much an organisation should value an instagram like on a post compared to a bought google ad, from a brand building perspective? Think this through from different angles silently and after that research for concrete ways to put together an evaluation formula. Your task is to create the formula that should help the organisation evaluate how much money that could be efficient to spend on production cost of an instagram post/reel compared to if that money just were spent on a Google Ad. Before reporting on the final formula, test your formula candidates in parallel by creating a rubric that can test your prototype formulas silently by yourself to assure that the one you give back to me is thoroughly tested to deliver the highest score on your rubric.

Steg 2.

I would like you to use these insights to code an interactive web app with a beautiful design where a manager could play around with the model. So that they could see if a proposed high cost type of instagram post production should be prioritised over putting the money on Google Ads spend. It's important that the app displays the rhetoric of this or that. So it becomes clear for the user when it might be worth considering a higher production cost for the next Instagram post. Design the app from the assumption that the user wants to know "You need X likes on this post or you should consider Google Ads instead" And then a text that gives the reasoning "because Y" The app should include some entertaining animations when presenting the result.

Steg 3.
Testa din app. Om du tycker att något ska vara annorlunda så berätta, eller kör samma prompt igen och se om det blir bättre med ett helt nytt försök.

Du kan testa resultatet här och se hela min prompting för den här.

2. Tillförlitligare för hälsofrågor

Alla AI-bolag har fram tills nu sett till att ha disclamers för hälsofrågor. Chatbottarna har varit tvungna att förklara att lägga till att användaren bör rådfråga sin läkare istället och ibland till och med vägrat svara. Men OpenAI lanserade GPT5 med att visa upp hur bra hen är på att besvara hälsofrågor korrekt. En cancerpatient togs upp på scen som berättade om hur hon fått stor hjälp att välja vård genom uppladdade hälsodata och analys av den senaste forskningen.

OpenAI litar så mycket på sina interna mätningar i hur korrekt GPT5s utlåtanden om medicinsk behandling är att de marknadsför GPT5 som en vägledare i USA. Landet där stämningar kan leda till skadeståndsbelopp på flera miljoner och miljarder i rättegångskostnader för organisationerna. Antingen så tror de väldigt mycket på GTP5s förmåga inom hälsa, eller så har de extremt dåliga juridiska rådgivare. Oavsett kommer fler att börja lita på alla chattbottar för råd i hälsofrågor i större utsträckning och det kommer på sikt förändra spelplanen för alla som jobbar inom sjukvård och läkemedelsindustri.

3. Mina slutsatser kring användning av GPT5

Min upplevelse är att GPT5 är extremt mycket bättre på att följa mina prompter och att det den producerar är välgrundat och faktagranskat. Tyvärr visar det sig att det inte alls är det jag behöver i de flesta fall (men superbra för kodning och hälsa).

Vi som jobbat med grafisk produktion har alla något exempel på när en trycksak kommit tillbaka med Lorem ipsum (skisstext) istället för den skarpa texten. Men ingen av de som har sett det på vägen har tänkt att det är deras roll att påpeka det.

När ingen tar initiativ till att gå utanför sin arbetsinstruktion så blir vi omgivna av medarbetare som inte använder det sunda förnuft vi räknar med att alla har. Så känner jag med GPT5. Hen följer prompter på ett så fyrkantigt sätt att jag nu behöver berätta för den att det är okej att ta ett varv extra för att tänka igenom om det finns något mer vi borde tänka på. Jag kommer att tänka på memesnubben James Fridmans photoshop-request. Hans grej är att alltid tolka vad folk ber om lite för bokstavligt.

Det är verkligen viktigt att en AI modell inte hittar på, men om vi ska vara ärliga så har ju hela appealen med ChatGPT varit att hen kan fantisera vad våra halvtaskiga instruktioner förmodligen skulle kunna betyda.

Vi gillar chattbottarna för att resultatet de levererar är tillräckligt bra utan att vi behöver instruera dem. Arbetsflödet blev bättre än att fundera ut hur vi skulle instruera en junior medarbetare utan erfarenhet. Med GPT5 måste vi formulera det vi ännu inte vet att vi inte vet, för att vi ännu inte gjort jobbet. Det är svårt.

När GPT4 kom så var det en skill att prompta, ju bättre prompt desto bättre resultat. Därför blommade en hel industri med promptkurser upp. Men sedan drygt ett år tillbaka har det varit helt onödigt med prompting (i de allra flesta usecase). Det har inte blivit någon större skillnad i kvalitet på svaren du fått från bra chattbottar (exempelvis ChatGPT o3 PRO, eller Gemini 2.5) om du gett en lång väluttänkt prompt eller en kort vag prompt. Vissa studier har till och med pekat på att längre prompter har gjort resultaten sämre då det infört fler felaktiga antaganden.

Så det känns superjobbigt att behöva skriva långa prompter igen. Vi vet också att AI själv skriver bättre prompter än oss, så det som behövs för att få till de allra bästa svaren är att prompta i flera steg. Först prompta fram teorier, sedan prompta fram hur dessa teorier skulle kunna formuleras till prompter. Och först efter det använda de prompterna.

Det betyder inte att promptlösa prompter inte ger okej resultat. Det gör de. Till och med bättre än tidigare modeller. Men vetskapen att de svar jag skulle kunna få om jag optimerade bättre gnager, och gör att tiden för problemlösning med AI gått upp igen.

Jag kände en liknande känsla för runt två år sedan. Promptning spelade stor roll, så jag jobbade hårt på att göra mina prompter så bra de kunde vara för varje problem. Detta resulterade nästan alltid att när jag väl var klar med en bra prompt så hade jag hunnit tänka igenom problemet så noggrant och researchat allt runt omkring. Så problemet som prompten skulle lösa var redan löst.

Skillnaden mellan då och nu är att på den tiden kunde ChatGPT inte lösa problem som jag själv inte kunde lösa. Nu klarar jag inte längre att veta om en lösning jag får inom svåra specialistområden är genialiska nya lösningar eller AI-skräp. Ett exempel är Sébastien Bubeck, en ledande forskare på Microsoft som använde GPT-5-Pro på ett olöst matteproblem (convex optimizering). Proffsversionen av GPT5 klarade att producera ett nytt matematiskt bevis som var 50% bättre på att optimera än tidigare kända matematiska lösningar. Det gav sedan matteforskare idéer på hur de ytterligare kunde göra formeln ännu bättre. Så GPT5 hittade inte den bästa lösningen, men den hittade på hur insatta människor kunde hitta den bästa lösningen.

Hade GPT5 gett mig sådana pärlor så kan jag garantera att den elkostnaden varit rent svinn. Prompten för Bubeck bestod då av en vetenskaplig artikel med ett matematiskt bevis på 13 sidor följt av en tydlig instruktion om vad GPT5 skulle göra. Så min poäng är att nivån där GPT5 kan ge nya idéer nu ligger på en nivå där jag måste vara extremt kunnig för att förstå om det som genereras är pärlor.

Min utforskning av GPT5 i kombination med de starka reaktioner som modellen väckt för att den inte gör lika mycket ombedd leder mig till insikten att vi redan vant oss vid att AI är kreativ. Många säger att AI inte är det, men för att förstå det som inte är uttalat och lösa uppgifter med ofullständig instruktion, då är det kreativ problemlösningsförmåga som krävs.

Eftersom GPT5 fejlar på samarbeten där vi fyller i varandras … om vi inte explicit ber hen om det så kommer vi få vänta till nästa modell tar allt det smarta som GPT5 har och paketerar om det i en mer användarvänlig personlighet. Tills dess är det återigen värdefullt med promptkurser. Det kommer gå snabbt innan vi har en lika smart AI som GPT5 men som är lika självinstruerande som tidigare generationer, jag gissar på högst någon månad eller så.

För efterfrågan på en AI som kan överraska och ta initiativ är större än på en AI som kan ta order, precis som alla värdefulla medarbetare, och detta förändrar ju allt!

Vad kan du göra idag?

Förstå

Här är konkreta tips du behöver förstå för att bemästra GPT5:

GPT5 är inte en modell utan flera. Så om du använder GPT5 så är det som att ringa till en supporttelefon. Om du inte säger rätt saker så fastnar du med den okunniga som ber dig dra ur sladden och sätta i den igen. GPT5 routar dig vidare till en bättre modell först när du visar att du förtjänar det. För att inte vara osäker på om du faktiskt fått en bra eller dålig AI som besvarar dina önskemål behöver du ha ett abonnemang. Då kan du välja GPT5-thinking som garanterat behandlar ditt önskemål som att det är värt att tänka lite extra kring. Om du inte vill betala så behöver du använda prompter som innehåller instruktioner som ”think this through extra hard”, problemet är att du aldrig kan vara säker på vilken modell du fått med det arbetssättet.
Använd ordet ”rubric”. En rubric är ett testprotokoll för att verifiera hur bra kriterier uppfylls. GPT5 verkar vara duktig på att skapa svåra rubrics för sig själv och genom att se till att få bra score på skalan hen själv uppfunnit så blir svaren av högre kvalitet.
Till exempel ”skapa en rubric och poängsätt potentiella lösningar” Då får du ett bättre svar.
Använd ”Tänk tyst för dig själv”. GPT5 kan processa många saker för att komma fram till vad hen ska svara dig, men när hen börjar formulera svaret så har den tänkt färdigt. Så om du beskriver vad hen ska göra för sig själv tyst först.
Till exempel ”skapa en rubric och poängsätt potentiella lösningar tyst för dig själv innan du väljer vilka som du försöker förbättra.” Då får du ett bättre svar.
Använd ordet ”parallellt”. Eftersom vi vill att GPT5 ska tänka mer innan hen börjar formulera svaret, så är det bra att be hen att göra uppgifter parallellt. Om GPT5 faktiskt gör det på baksidan kan vi aldrig veta, men det blir oftast bättre jämförda lösningar på ditt problem om du ber om parallella processer.
Till exempel ”Researcha olika lösningar parallellt och utvärdera dem tyst för dig själv med en rubric skapat. Du poängsätter parallellt de potentiella lösningarna du kommit fram till tyst för dig själv innan du väljer vilka som du försöker förbättra.” Då får du ett bättre svar.

Planera

Organisera en mini-workshop där ditt team testar GPT5 tillsammans för att snabbkoda interna små verktyg (som scenario-simulatorer eller interaktiva kalkylatorer).

Ett tips till er som tidigare gjort Custom GPTs som används är att dessa behöver verifieras igen. Även om man väljer GPT4o som modell så fungerar de inte exakt som de gjorde innan, och om användaren väljer att använda den med GPT5 istället så blir resultatet helt annorlunda.

Gör

Jag tycker att alla behöver ha en egen åsikt om GPT5 är bra för just dem. Så här gör du för att skaffa en egen:

Testa något som du brukade göra med ChatGPT innan och se hur det känns nu? Är du berövad på en gammal vän eller känns det som att du fått en ny smartare kollega? För dig som är gratisätare så behöver du be ChatGPT tänka länge för att eventuellt få routerfunktionen att ge dig lite mer kraft. Du som är betalande för plus kan slå på settingen GPT-5-thinking så får du svar ungefär motsvarande tidigare o3. Eller slå av GPT5 så du kan ha GPT4o (något som krävs för att alla tidigare CustomGPTs ska fungera som de brukade). Och du som betalar för PRO kan slå på GPT-5-PRO som motsvarar tidigare o3-PRO fast bättre.
Testa att koda något med GPT5. Be hen koda ett enkelt spel eller simulering. I de flesta fall får du något som fungerar på första försöket direkt i webbläsaren. Avgör om du blir imponerad av det. Är du i lägret som tycker att det är fantastiskt att AI nu kan koda enkla appar med bara en kort prompt utan specifika tekniska detaljer som klargörs, eller är du i lägret som tycker att det inte blir exakt som du vill direkt och det borde det bli?
Om du ska ha en mer välgrundad åsikt om GPT-5 som kodare så behöver du komma igång med att använda något av verktygen för AI-assisterad kodning. Jag körde själv Windsurf innan sommaren, men efter att det först skulle bli uppköpt av OpenAI för att sedan gå upp i rök då all talang splittrades i ett rekryteringskrig så är det Cursor.AI som gäller igen. Det ser komplicerat ut om du aldrig öppnat ett sådant här program. Men ta det bara steg för steg så är det inte så svårt:
1. Skapa en mapp där du tänker ha din kod.
2. Öppna Cursor-appen
3. Tryck på Open Project och öppna din nyskapade mapp
4. Du borde nu se “new chat”. Innan du börjar chatta väljer du modell
5. Välj Agent (om det inte redan är valt) och gpt-5-high som modell.
6. Klistra in spec för vad du vill bygga.

Länkar

OpenAIs egna mätningar
https://openai.com/index/introducing-gpt-5/

OpenAIs GPT5-systemkort
https://openai.com/index/gpt-5-system-card

OpenAIs egna prompt-förbättrare för GPT5. Du kan köra dina prompter genom den för att få bättre prompter. Det visar vad OpenAI själva har kommit fram till fungerar.
https://platform.openai.com/chat/edit?models=gpt-5&optimize=true

Washington Posts test av olika chattbottar (bjuder på ett sätt att läsa den gratis)
https://www.washingtonpost.com/technology/2025/08/27/ai-search-best-answers-facts

Läs mer om Google AI Mode (som finns i 180 länder som inte är Sverige)
https://blog.google/products/search/ai-mode-agentic-personalized

Scales benchmark
https://scale.com/leaderboard/multichallenge

Fler kul Photoshop-edits från James Fridman
https://www.boredpanda.com/photoshop-guy-james-fridman-best-all-time/

https://www.instagram.com/fjamie013/

Sebastien Bubecks matematiska bevis
https://threadreaderapp.com/thread/1958198661139009862.html

Ladda ner Cursor för AI-kodning.
https://cursor.com/

Sedan sist vi hördes

Annika Bäckström hörde av sig efter mitt förra nyhetsbrev om AI-video och upplyste mig om att Midjourneys videogenererare också klarar first frame last frame. Det såg riktigt bra ut! Jag hade missat det eftersom jag har slutat betala för deras tjänster. Det blev för dyrt och jag behöver välja några tjänster jag betalar för varje månad.

Sedan förra veckan har också min favoritvideotjänst MiniMax adderat first fram last frame. Och det har kommit två nya videomodeller som verkar bra. Som vanligt är mitt tips när det gäller att ha koll på vad som är ”bäst” att göra en research den dagen.

Ett ställe att börja kan vara min lista på AI-verktyg som betalande prenumeranter har tillgång till. https://dettaforandrarjuallt.substack.com/p/ai-verktyg

Är du en insiktsdelare?

Känner du någon som är intresserad av hur de kan använda GPT5 bättre? Eller kanske någon som vill förstå varför GPT5 beter sig annorlunda? Vem tänkte du på? Skicka vidare!

Själv vill jag tipsa om ett nytt nyhetsbrev: AI Experiment av Emelie Fågelstedt
Emelie gör alltid roliga experiment så jag kommer följa vad hon gör med nyfikenhet!

Kom ihåg att om ni gillar vad jag gör, sprid det vidare till fler. Och tack till er som också väljer att betala för nyhetsbrevet! Det gör att jag kan ägna mer tid åt att analysera och högre budget för att testa nya tjänster åt er.

Den 18 september kl 12 kör vi en nätverksträff online för betalande prenumeranter igen. Jag gör en dragning och så utbyter vi erfarenheter och ställer frågor till varandra.

Fortsätt utforska så ses vi nästa vecka!

Tomas Seo

Har du fått dagens nyhetsbrev utan att vara prenumerant?
Gillade du det här och vill ha mer så är det bara att skriva upp sig här
(du väljer själv om du vill betala):

Prenumerera

Detta förändrar ju allt!