đ€ŻâĄïžJag hatar att GPT5 gör det jag ber den.
Stor GPT5-guide med praktiska exempel. Detta förÀndrar ju allt!
Det hÀr Àr nyhetsbrevet dÀr Tomas Seo, innovationsstrateg pÄ Phorecast, berÀttar om hÀndelser, upptÀckter och ny teknik som fÄr honom att utbrista: Detta förÀndrar ju allt! Du prenumererar pÄ det hÀr för att fortsÀtta vara steget före med de senaste trenderna och fÄ konkreta tips för att framtidssÀkra dig och din organisation. Har du fÄtt det hÀr av en vÀn? DÄ vill du kanske starta en egen prenumeration?
Vad har hÀnt?
- OpenAI sĂ€ger: âGPT-5 minskar dramatiskt hallucinationer och följer komplexa instruktioner bĂ€ttre.â Oberoende tester: âVi hĂ„ller med, det rĂ€cker till en andraplats.â
NĂ€r OpenAI slĂ€ppte GPT-5 tidigare i början av augusti var huvudbudskapet tydligt: modellen Ă€r bĂ„de betydligt mindre benĂ€gen att âhallucineraâ (hitta pĂ„ fakta eller tappa bort detaljer frĂ„n tidigare i konversationen) och bĂ€ttre pĂ„ att följa komplexa instruktioner.
PĂ„ deras sĂ„ kallade systemkort (den sĂ€kerhets- och kapabilitetsÂrapport OpenAI publicerar vid varje modellÂrelease) uppgav de att gpt-5-thinking ger 78 % fĂ€rre svar med minst ett större faktafel Ă€n tidigare modell o3 och 65 % lĂ€gre hallucinationsgrad pĂ„ pĂ„stĂ„endenivĂ„. Deras egna tester satte ocksĂ„ nya rekord pĂ„ benchmarks för instruktionsefterlevnad (toppscore pĂ„ 69,6 pĂ„ Scales MultiChallenge benchmark)
Nu börjar oberoende rapporter testa effekterna i praktiken. I slutet av augusti genomförde Washington Post ett omfattande test dÀr bibliotekarier graderade nio AI-tjÀnster pÄ faktakvalitet och kÀllhÀnvisning, GPT5 kom tvÄa. BÀst pÄ att inte hallucinera var Googles AI Mode (det Àr inte samma som Googles AI Overview-rutor utan en annan Google Search-tjÀnst som finns inte i Sverige Àn).
I slutet av augusti uppdaterade Scale AI sjĂ€lva sin MultiChallenge-leaderboard. GPT-5 fick dĂ„ inte lika högt score som OpenAI sjĂ€lva gett den. GPT5 fick nöja sig med en andraplats (med score 58,6) och OpenAIs o3 PRO-high var fortfarande bĂ€st (med score 63,77). Benchmarken Ă€r sĂ€rskilt framtagen för att âstraffaâ AI-modeller som tappar bort tidigare instruktioner eller följer otydliga och motsĂ€gelsefulla prompter pĂ„ ett inkonsekvent sĂ€tt.
GPT5 lever inte riktigt upp till den första plats OpenAI ville ha, men det Àr tydligt att de lyckats med vÀsentliga förbÀttringar med stora minskningar av pÄhittade fakta och större respekt för vad som faktiskt stÄr i prompten.
Detta förÀndrar ju allt
Det finns alltsÄ bÀttre AI Àn GPT5, men som i alla kategorier av produkter sÄ Àr det sÀllan den allra bÀsta som Àr den mest Àlskade. ChatGPT Àr marknadsledare och att marknadsledarens produkt (som dessutom Àr gratis för alla att anvÀnda) blir avsevÀrt bÀttre pÄ att bÄde inte hitta pÄ och följa instruktioner bÀttre förÀndrar resultatet för de flesta anvÀndare.
Jag frÄgade förra veckan om ni skulle vara intresserade av en genomgÄng av hur lanseringen av GPT5 förÀndrat hur jag sjÀlv anvÀnder OpenAI. TillrÀckligt mÄnga tyckte att det verkade intressant sÄ hÀr kommer konkret vad jag har kommit fram till. TvÄ anvÀndningsomrÄden har blivit sÄ mycket bÀttre att det kommer pÄverka vÄr samtid.
1. BÀttre pÄ kodning
För första gÄngen kan jag be AI om att skapa ett fungerande verktyg som jag kan leka runt med. Det Àr vÀldigt bra för att förstÄ scenarion. Min process Àr följande.
Prompta GPT5-thinking sÄ hen gör research kring forskning kring hur nÄgot fungerar.
Be GPT5-thinking att skapa en interaktiv app dÀr jag kan experimentera med forskningen.
Kör appen. Se om det behövs nÄgon förÀndring.
Exempel:
Steg 1.
What does the latest peer reviewed science say about how much an organisation should value an instagram like on a post compared to a bought google ad, from a brand building perspective? Think this through from different angles silently and after that research for concrete ways to put together an evaluation formula. Your task is to create the formula that should help the organisation evaluate how much money that could be efficient to spend on production cost of an instagram post/reel compared to if that money just were spent on a Google Ad. Before reporting on the final formula, test your formula candidates in parallel by creating a rubric that can test your prototype formulas silently by yourself to assure that the one you give back to me is thoroughly tested to deliver the highest score on your rubric.Steg 2.
I would like you to use these insights to code an interactive web app with a beautiful design where a manager could play around with the model. So that they could see if a proposed high cost type of instagram post production should be prioritised over putting the money on Google Ads spend. It's important that the app displays the rhetoric of this or that. So it becomes clear for the user when it might be worth considering a higher production cost for the next Instagram post. Design the app from the assumption that the user wants to know "You need X likes on this post or you should consider Google Ads instead" And then a text that gives the reasoning "because Y" The app should include some entertaining animations when presenting the result.Steg 3.
Testa din app. Om du tycker att nÄgot ska vara annorlunda sÄ berÀtta, eller kör samma prompt igen och se om det blir bÀttre med ett helt nytt försök.
Du kan testa resultatet hÀr och se hela min prompting för den hÀr.
2. Tillförlitligare för hÀlsofrÄgor
Alla AI-bolag har fram tills nu sett till att ha disclamers för hÀlsofrÄgor. Chatbottarna har varit tvungna att förklara att lÀgga till att anvÀndaren bör rÄdfrÄga sin lÀkare istÀllet och ibland till och med vÀgrat svara. Men OpenAI lanserade GPT5 med att visa upp hur bra hen Àr pÄ att besvara hÀlsofrÄgor korrekt. En cancerpatient togs upp pÄ scen som berÀttade om hur hon fÄtt stor hjÀlp att vÀlja vÄrd genom uppladdade hÀlsodata och analys av den senaste forskningen.
OpenAI litar sÄ mycket pÄ sina interna mÀtningar i hur korrekt GPT5s utlÄtanden om medicinsk behandling Àr att de marknadsför GPT5 som en vÀgledare i USA. Landet dÀr stÀmningar kan leda till skadestÄndsbelopp pÄ flera miljoner och miljarder i rÀttegÄngskostnader för organisationerna. Antingen sÄ tror de vÀldigt mycket pÄ GTP5s förmÄga inom hÀlsa, eller sÄ har de extremt dÄliga juridiska rÄdgivare. Oavsett kommer fler att börja lita pÄ alla chattbottar för rÄd i hÀlsofrÄgor i större utstrÀckning och det kommer pÄ sikt förÀndra spelplanen för alla som jobbar inom sjukvÄrd och lÀkemedelsindustri.
3. Mina slutsatser kring anvÀndning av GPT5
Min upplevelse Àr att GPT5 Àr extremt mycket bÀttre pÄ att följa mina prompter och att det den producerar Àr vÀlgrundat och faktagranskat. TyvÀrr visar det sig att det inte alls Àr det jag behöver i de flesta fall (men superbra för kodning och hÀlsa).
Vi som jobbat med grafisk produktion har alla nÄgot exempel pÄ nÀr en trycksak kommit tillbaka med Lorem ipsum (skisstext) istÀllet för den skarpa texten. Men ingen av de som har sett det pÄ vÀgen har tÀnkt att det Àr deras roll att pÄpeka det.
NÀr ingen tar initiativ till att gÄ utanför sin arbetsinstruktion sÄ blir vi omgivna av medarbetare som inte anvÀnder det sunda förnuft vi rÀknar med att alla har. SÄ kÀnner jag med GPT5. Hen följer prompter pÄ ett sÄ fyrkantigt sÀtt att jag nu behöver berÀtta för den att det Àr okej att ta ett varv extra för att tÀnka igenom om det finns nÄgot mer vi borde tÀnka pÄ. Jag kommer att tÀnka pÄ memesnubben James Fridmans photoshop-request. Hans grej Àr att alltid tolka vad folk ber om lite för bokstavligt.
Det Àr verkligen viktigt att en AI modell inte hittar pÄ, men om vi ska vara Àrliga sÄ har ju hela appealen med ChatGPT varit att hen kan fantisera vad vÄra halvtaskiga instruktioner förmodligen skulle kunna betyda.
Vi gillar chattbottarna för att resultatet de levererar Àr tillrÀckligt bra utan att vi behöver instruera dem. Arbetsflödet blev bÀttre Àn att fundera ut hur vi skulle instruera en junior medarbetare utan erfarenhet. Med GPT5 mÄste vi formulera det vi Ànnu inte vet att vi inte vet, för att vi Ànnu inte gjort jobbet. Det Àr svÄrt.
NÀr GPT4 kom sÄ var det en skill att prompta, ju bÀttre prompt desto bÀttre resultat. DÀrför blommade en hel industri med promptkurser upp. Men sedan drygt ett Är tillbaka har det varit helt onödigt med prompting (i de allra flesta usecase). Det har inte blivit nÄgon större skillnad i kvalitet pÄ svaren du fÄtt frÄn bra chattbottar (exempelvis ChatGPT o3 PRO, eller Gemini 2.5) om du gett en lÄng vÀluttÀnkt prompt eller en kort vag prompt. Vissa studier har till och med pekat pÄ att lÀngre prompter har gjort resultaten sÀmre dÄ det infört fler felaktiga antaganden.
SÄ det kÀnns superjobbigt att behöva skriva lÄnga prompter igen. Vi vet ocksÄ att AI sjÀlv skriver bÀttre prompter Àn oss, sÄ det som behövs för att fÄ till de allra bÀsta svaren Àr att prompta i flera steg. Först prompta fram teorier, sedan prompta fram hur dessa teorier skulle kunna formuleras till prompter. Och först efter det anvÀnda de prompterna.
Det betyder inte att promptlösa prompter inte ger okej resultat. Det gör de. Till och med bÀttre Àn tidigare modeller. Men vetskapen att de svar jag skulle kunna fÄ om jag optimerade bÀttre gnager, och gör att tiden för problemlösning med AI gÄtt upp igen.
Jag kÀnde en liknande kÀnsla för runt tvÄ Är sedan. Promptning spelade stor roll, sÄ jag jobbade hÄrt pÄ att göra mina prompter sÄ bra de kunde vara för varje problem. Detta resulterade nÀstan alltid att nÀr jag vÀl var klar med en bra prompt sÄ hade jag hunnit tÀnka igenom problemet sÄ noggrant och researchat allt runt omkring. SÄ problemet som prompten skulle lösa var redan löst.
Skillnaden mellan dÄ och nu Àr att pÄ den tiden kunde ChatGPT inte lösa problem som jag sjÀlv inte kunde lösa. Nu klarar jag inte lÀngre att veta om en lösning jag fÄr inom svÄra specialistomrÄden Àr genialiska nya lösningar eller AI-skrÀp. Ett exempel Àr Sébastien Bubeck, en ledande forskare pÄ Microsoft som anvÀnde GPT-5-Pro pÄ ett olöst matteproblem (convex optimizering). Proffsversionen av GPT5 klarade att producera ett nytt matematiskt bevis som var 50% bÀttre pÄ att optimera Àn tidigare kÀnda matematiska lösningar. Det gav sedan matteforskare idéer pÄ hur de ytterligare kunde göra formeln Ànnu bÀttre. SÄ GPT5 hittade inte den bÀsta lösningen, men den hittade pÄ hur insatta mÀnniskor kunde hitta den bÀsta lösningen.
Hade GPT5 gett mig sÄdana pÀrlor sÄ kan jag garantera att den elkostnaden varit rent svinn. Prompten för Bubeck bestod dÄ av en vetenskaplig artikel med ett matematiskt bevis pÄ 13 sidor följt av en tydlig instruktion om vad GPT5 skulle göra. SÄ min poÀng Àr att nivÄn dÀr GPT5 kan ge nya idéer nu ligger pÄ en nivÄ dÀr jag mÄste vara extremt kunnig för att förstÄ om det som genereras Àr pÀrlor.
Min utforskning av GPT5 i kombination med de starka reaktioner som modellen vÀckt för att den inte gör lika mycket ombedd leder mig till insikten att vi redan vant oss vid att AI Àr kreativ. MÄnga sÀger att AI inte Àr det, men för att förstÄ det som inte Àr uttalat och lösa uppgifter med ofullstÀndig instruktion, dÄ Àr det kreativ problemlösningsförmÄga som krÀvs.
Eftersom GPT5 fejlar pÄ samarbeten dÀr vi fyller i varandras ⊠om vi inte explicit ber hen om det sÄ kommer vi fÄ vÀnta till nÀsta modell tar allt det smarta som GPT5 har och paketerar om det i en mer anvÀndarvÀnlig personlighet. Tills dess Àr det Äterigen vÀrdefullt med promptkurser. Det kommer gÄ snabbt innan vi har en lika smart AI som GPT5 men som Àr lika sjÀlvinstruerande som tidigare generationer, jag gissar pÄ högst nÄgon mÄnad eller sÄ.
För efterfrÄgan pÄ en AI som kan överraska och ta initiativ Àr större Àn pÄ en AI som kan ta order, precis som alla vÀrdefulla medarbetare, och detta förÀndrar ju allt!
Vad kan du göra idag?
FörstÄ
HÀr Àr konkreta tips du behöver förstÄ för att bemÀstra GPT5:
GPT5 Ă€r inte en modell utan flera. SĂ„ om du anvĂ€nder GPT5 sĂ„ Ă€r det som att ringa till en supporttelefon. Om du inte sĂ€ger rĂ€tt saker sĂ„ fastnar du med den okunniga som ber dig dra ur sladden och sĂ€tta i den igen. GPT5 routar dig vidare till en bĂ€ttre modell först nĂ€r du visar att du förtjĂ€nar det. För att inte vara osĂ€ker pĂ„ om du faktiskt fĂ„tt en bra eller dĂ„lig AI som besvarar dina önskemĂ„l behöver du ha ett abonnemang. DĂ„ kan du vĂ€lja GPT5-thinking som garanterat behandlar ditt önskemĂ„l som att det Ă€r vĂ€rt att tĂ€nka lite extra kring. Om du inte vill betala sĂ„ behöver du anvĂ€nda prompter som innehĂ„ller instruktioner som âthink this through extra hardâ, problemet Ă€r att du aldrig kan vara sĂ€ker pĂ„ vilken modell du fĂ„tt med det arbetssĂ€ttet.
AnvĂ€nd ordet ârubricâ. En rubric Ă€r ett testprotokoll för att verifiera hur bra kriterier uppfylls. GPT5 verkar vara duktig pĂ„ att skapa svĂ„ra rubrics för sig sjĂ€lv och genom att se till att fĂ„ bra score pĂ„ skalan hen sjĂ€lv uppfunnit sĂ„ blir svaren av högre kvalitet.
Till exempel âskapa en rubric och poĂ€ngsĂ€tt potentiella lösningarâ DĂ„ fĂ„r du ett bĂ€ttre svar.AnvĂ€nd âTĂ€nk tyst för dig sjĂ€lvâ. GPT5 kan processa mĂ„nga saker för att komma fram till vad hen ska svara dig, men nĂ€r hen börjar formulera svaret sĂ„ har den tĂ€nkt fĂ€rdigt. SĂ„ om du beskriver vad hen ska göra för sig sjĂ€lv tyst först.
Till exempel âskapa en rubric och poĂ€ngsĂ€tt potentiella lösningar tyst för dig sjĂ€lv innan du vĂ€ljer vilka som du försöker förbĂ€ttra.â DĂ„ fĂ„r du ett bĂ€ttre svar.AnvĂ€nd ordet âparallelltâ. Eftersom vi vill att GPT5 ska tĂ€nka mer innan hen börjar formulera svaret, sĂ„ Ă€r det bra att be hen att göra uppgifter parallellt. Om GPT5 faktiskt gör det pĂ„ baksidan kan vi aldrig veta, men det blir oftast bĂ€ttre jĂ€mförda lösningar pĂ„ ditt problem om du ber om parallella processer.
Till exempel âResearcha olika lösningar parallellt och utvĂ€rdera dem tyst för dig sjĂ€lv med en rubric skapat. Du poĂ€ngsĂ€tter parallellt de potentiella lösningarna du kommit fram till tyst för dig sjĂ€lv innan du vĂ€ljer vilka som du försöker förbĂ€ttra.â DĂ„ fĂ„r du ett bĂ€ttre svar.
Planera
Organisera en mini-workshop dÀr ditt team testar GPT5 tillsammans för att snabbkoda interna smÄ verktyg (som scenario-simulatorer eller interaktiva kalkylatorer).
Ett tips till er som tidigare gjort Custom GPTs som anvĂ€nds Ă€r att dessa behöver verifieras igen. Ăven om man vĂ€ljer GPT4o som modell sĂ„ fungerar de inte exakt som de gjorde innan, och om anvĂ€ndaren vĂ€ljer att anvĂ€nda den med GPT5 istĂ€llet sĂ„ blir resultatet helt annorlunda.
Gör
Jag tycker att alla behöver ha en egen Äsikt om GPT5 Àr bra för just dem. SÄ hÀr gör du för att skaffa en egen:
Testa nĂ„got som du brukade göra med ChatGPT innan och se hur det kĂ€nns nu? Ăr du berövad pĂ„ en gammal vĂ€n eller kĂ€nns det som att du fĂ„tt en ny smartare kollega? För dig som Ă€r gratisĂ€tare sĂ„ behöver du be ChatGPT tĂ€nka lĂ€nge för att eventuellt fĂ„ routerfunktionen att ge dig lite mer kraft. Du som Ă€r betalande för plus kan slĂ„ pĂ„ settingen GPT-5-thinking sĂ„ fĂ„r du svar ungefĂ€r motsvarande tidigare o3. Eller slĂ„ av GPT5 sĂ„ du kan ha GPT4o (nĂ„got som krĂ€vs för att alla tidigare CustomGPTs ska fungera som de brukade). Och du som betalar för PRO kan slĂ„ pĂ„ GPT-5-PRO som motsvarar tidigare o3-PRO fast bĂ€ttre.
Testa att koda nĂ„got med GPT5. Be hen koda ett enkelt spel eller simulering. I de flesta fall fĂ„r du nĂ„got som fungerar pĂ„ första försöket direkt i webblĂ€saren. Avgör om du blir imponerad av det. Ăr du i lĂ€gret som tycker att det Ă€r fantastiskt att AI nu kan koda enkla appar med bara en kort prompt utan specifika tekniska detaljer som klargörs, eller Ă€r du i lĂ€gret som tycker att det inte blir exakt som du vill direkt och det borde det bli?
Om du ska ha en mer vÀlgrundad Äsikt om GPT-5 som kodare sÄ behöver du komma igÄng med att anvÀnda nÄgot av verktygen för AI-assisterad kodning. Jag körde sjÀlv Windsurf innan sommaren, men efter att det först skulle bli uppköpt av OpenAI för att sedan gÄ upp i rök dÄ all talang splittrades i ett rekryteringskrig sÄ Àr det Cursor.AI som gÀller igen. Det ser komplicerat ut om du aldrig öppnat ett sÄdant hÀr program. Men ta det bara steg för steg sÄ Àr det inte sÄ svÄrt:
Skapa en mapp dÀr du tÀnker ha din kod.
Ăppna Cursor-appen
Tryck pÄ Open Project och öppna din nyskapade mapp
Du borde nu se ânew chatâ. Innan du börjar chatta vĂ€ljer du modell
VÀlj Agent (om det inte redan Àr valt) och gpt-5-high som modell.
Klistra in spec för vad du vill bygga.
LĂ€nkar
OpenAIs egna mÀtningar
https://openai.com/index/introducing-gpt-5/
OpenAIs GPT5-systemkort
https://openai.com/index/gpt-5-system-card
OpenAIs egna prompt-förbÀttrare för GPT5. Du kan köra dina prompter genom den för att fÄ bÀttre prompter. Det visar vad OpenAI sjÀlva har kommit fram till fungerar.
https://platform.openai.com/chat/edit?models=gpt-5&optimize=true
Washington Posts test av olika chattbottar (bjuder pÄ ett sÀtt att lÀsa den gratis)
https://www.washingtonpost.com/technology/2025/08/27/ai-search-best-answers-facts
LÀs mer om Google AI Mode (som finns i 180 lÀnder som inte Àr Sverige)
https://blog.google/products/search/ai-mode-agentic-personalized
Scales benchmark
https://scale.com/leaderboard/multichallenge
Fler kul Photoshop-edits frÄn James Fridman
https://www.boredpanda.com/photoshop-guy-james-fridman-best-all-time/
https://www.instagram.com/fjamie013/
Sebastien Bubecks matematiska bevis
https://threadreaderapp.com/thread/1958198661139009862.html
Ladda ner Cursor för AI-kodning.
https://cursor.com/
Sedan sist vi hördes
Annika BÀckström hörde av sig efter mitt förra nyhetsbrev om AI-video och upplyste mig om att Midjourneys videogenererare ocksÄ klarar first frame last frame. Det sÄg riktigt bra ut! Jag hade missat det eftersom jag har slutat betala för deras tjÀnster. Det blev för dyrt och jag behöver vÀlja nÄgra tjÀnster jag betalar för varje mÄnad.
Sedan förra veckan har ocksĂ„ min favoritvideotjĂ€nst MiniMax adderat first fram last frame. Och det har kommit tvĂ„ nya videomodeller som verkar bra. Som vanligt Ă€r mitt tips nĂ€r det gĂ€ller att ha koll pĂ„ vad som Ă€r âbĂ€stâ att göra en research den dagen.
Ett stÀlle att börja kan vara min lista pÄ AI-verktyg som betalande prenumeranter har tillgÄng till. https://dettaforandrarjuallt.substack.com/p/ai-verktyg
Ăr du en insiktsdelare?
KÀnner du nÄgon som Àr intresserad av hur de kan anvÀnda GPT5 bÀttre? Eller kanske nÄgon som vill förstÄ varför GPT5 beter sig annorlunda? Vem tÀnkte du pÄ? Skicka vidare!
SjÀlv vill jag tipsa om ett nytt nyhetsbrev: AI Experiment av Emelie FÄgelstedt
Emelie gör alltid roliga experiment sÄ jag kommer följa vad hon gör med nyfikenhet!
Kom ihÄg att om ni gillar vad jag gör, sprid det vidare till fler. Och tack till er som ocksÄ vÀljer att betala för nyhetsbrevet! Det gör att jag kan Àgna mer tid Ät att analysera och högre budget för att testa nya tjÀnster Ät er.
Den 18 september kl 12 kör vi en nÀtverkstrÀff online för betalande prenumeranter igen. Jag gör en dragning och sÄ utbyter vi erfarenheter och stÀller frÄgor till varandra.
FortsÀtt utforska sÄ ses vi nÀsta vecka!
Tomas Seo
Har du fÄtt dagens nyhetsbrev utan att vara prenumerant?
Gillade du det hÀr och vill ha mer sÄ Àr det bara att skriva upp sig hÀr
(du vÀljer sjÀlv om du vill betala):





