Codex på 30 minuter, mini-kurs av Birgir Birgisson

Modul 01

Codex som super-app.

Codex är ett rent gränssnitt för AI-agenter som kan styra hela datorn. Det ser ut som en chat, men under huven är det något mer.

Två saker gör Codex annorlunda än en vanlig AI-chat. Det första är att filerna lever på din dator, inte i molnet. Det andra är att agenten kan göra nästan vilket kunskapsarbete som helst, från att skapa Excel-ark till att bygga en mobilapp eller styra din webbläsare.

Det här är listan på vad du kan be Codex göra direkt i appen. Den är inte komplett, men den ger dig kalibrering på vad det är för verktyg.

Motion graphics-videor och korta animerade klipp
Landningssidor där genererade bilder placeras direkt på sidan
Mer komplexa spel och 3D-simuleringar
Mobilappar med frontend, backend och proffsig design
Desktop-appar efter bara några prompts
Excel-ark, Word-dokument och presentationer med diagram, ofta efter att agenten gjort research själv
Styra din dator och webbläsare, klicka, scrolla, fylla i formulär

Nyckelinsikt

Skillnaden mot ChatGPT och Claude, filerna lever på din dator. Det betyder att allt agenten skapar går att öppna i Finder, dela vidare, versionhantera, eller mata in i andra verktyg utan omväg via molnet.

Tre saker att hålla i huvudet

01

Lokala filer

Allt agenten skapar lever på din maskin. Du kan när som helst klicka "öppna i Finder" och se exakt var.

02

Bredd över djup

Codex är inte specialiserat på en sak. Det är ett gränssnitt för en agent som kan göra nästan vad som helst på en dator.

03

Multi-tasking

Du kan starta flera chattar samtidigt och låta agenter jobba parallellt med olika uppgifter i bakgrunden.

Modul 02

Full filåtkomst.

Agenten har tillgång till hela din dator. Det är kraftfullt, men du måste jobba i projekt för att det inte ska bli kaos.

När du chattar utan projekt sparas filerna ändå någonstans, men de hamnar inte naturligt i en mapp du kan hitta tillbaka till. Lösningen är enkel. Skapa en projektmapp i Documents, knyt en chat till mappen, och då hamnar allt agenten skapar i den mappen automatiskt.

Två sätt att starta en chat

Metod	Vad du får	När det funkar
Ny chat utan projekt	Lös chat i sidopanelen, ingen mappkoppling.	Snabba experiment, engångsfrågor, slit-och-släng.
Chat i projekt	Filer agenten skapar hamnar i projektmappen på din dator.	All seriös produktion. Allt du vill kunna komma tillbaka till.

Skapa ett projekt rätt

01

Lägg projekten i Documents

Använd en konsekvent plats. Du kommer ha många projekt över tid, lägg dem alla på samma ställe.

02

Klicka "Start at existing folder"

Peka ut Documents, skapa en undermapp för projektet. Namnet på mappen blir projektets namn i Codex.

03

Skapa chatten inuti projektet

Nu sparas allt nytt material agenten producerar i projektmappen. Du kan också öppna mappen i Finder direkt från Codex.

04

@-mention dokument från mappen

I nya prompts kan du skriva @filnamn för att referera vilken fil som helst i projektmappen, och agenten plockar upp innehållet.

Konkret exempel

Innan

60 kvitto-bilder i en Downloads-mapp

Du har dragit kvittobilder under hela kvartalet. Ingen kategorisering, ingen sammanställning.

Efter

Excel-arbetsbok med dashboard

Agenten OCR-ar varje kvitto, klassificerar transaktioner, sammanställer i flikar (dashboard, kategorier, betalningssätt) och visualiserar trender. Filen ligger i projektmappen.

Tumregel

Om en chat är värd att komma tillbaka till imorgon, lägg den i ett projekt. Lös chat = bara för "fundera högt"-frågor.

Modul 03

Persistent minne.

Codex har två sorters minne. Ett du sköter själv och ett som sköter sig självt. Att veta skillnaden gör att du slutar trampa fel.

Typ	Var den bor	Vad du gör med den
Manuellt minne	`agents.md` i projektroten.	Be agenten "kom ihåg X". Du får och bör redigera filen själv.
Auto-minne	`codex/memories`-mappen.	Lämna i fred. Agenten håller den uppdaterad åt dig.

Hur du sparar manuellt minne

01

Iterera till du är nöjd

Be agenten göra något, justera tills resultatet sitter där du vill ha det. Utan ett bra resultat finns det inget värt att komma ihåg.

02

Be agenten "kom ihåg"

Säg explicit. "Från och med nu, när jag ber om en landningssida och inte specificerar styling, använd den här formaten." Var konkret om i vilken kontext det ska gälla.

03

Verifiera att den uppdaterar agents.md

Agenten skriver till agents.md. Öppna filen och läs vad som lades till. Det är ditt levande styrdokument, så det ska kännas rätt.

Auto-minnet, det andra

Var några veckor kan du öppna codex/memories och bara läsa. Det ger dig en sammanfattning av allt agenten har observerat om hur du jobbar. Användbart om du ska hjälpa någon annan bygga liknande arbetsflöden.

Regel

Rör inte filerna i codex/memories manuellt. Agenten har en skill som håller dem aktuella, och den blir bättre över tid. Manuella ändringar bryter logiken.

När bör jag rensa agents.md?

När en regel inte längre stämmer. Om du ändrar smak på landningssidor, tar bort gamla regler och låter den nya regeln stå själv. Om filen blir lång och spretig, be agenten "konsolidera agents.md, ta bort dubletter".

Vad är bra kandidater för manuellt minne?

Återkommande stilval (typografi, layoutpreferenser), beslutsregler ("om uppgiften gäller X, gör först Y"), namnkonventioner, och hur du vill att utdata struktureras. Allt som annars kommer behöva upprepas i prompt efter prompt.

Modul 04

Anslut allt med plugins.

Plugins är installerbara paket som kopplar Codex-agenten till externa verktyg. Gmail, Notion, Slack, plus över 100 till. Du aktiverar med två klick.

Plugins ger agenten ny funktionalitet. Lägg till Gmail-pluginen, så kan agenten läsa och svara på dina mejl. Lägg till Notion-pluginen, så kan den hitta dokument du har skrivit och bygga vidare på dem. Tanken är enkel, du kopplar agenten till de verktyg du redan använder.

Hur du faktiskt använder dem

Gå till plugins-fliken, två klick för att lägga till en plugin
I prompten skriver du @ för att se en lista över alla plugins du har
Skicka, agenten använder pluginen för att hämta data eller utföra något i tjänsten
Du kan ha flera plugins parallellt i en och samma prompt

Tre konkreta uppgifter

01

Brand deals från Gmail

"Gå igenom @gmail de senaste två veckorna, hitta alla brands som erbjudit betald promotion, gör research, lägg i tabell." Agenten producerar en markdown-tabell med anteckningar.

02

Manus från Notion

"Titta på @notion, hitta mina långa manus, skriv ett nytt manus i samma röst om ämne X." Agenten matchar din egen ton.

03

Svar via Slack eller mejl

När agenten kan läsa kan den också skriva. Be den föreslå svar eller skicka direkt, du behåller kontrollen genom att granska först.

Tips

Lär in @-syntaxen tidigt. Den är snabbare än att klicka i menyer, och du ser direkt vilka kopplingar du har tillgång till.

Modul 05

Återanvändbara skills.

En skill är ett återanvändbart recept, en SOP din agent följer varje gång du anropar den. Du sparar timmar på att inte behöva skriva samma instruktioner igen.

Skills är instruktionsfiler som agenten plockar upp när du kör en specifik uppgift. De ligger under plugins/skills i Codex. Du anropar dem med ett snedstreck, /brand-deal-researcher, istället för att skriva ut hela arbetsflödet i prompten varje gång.

Plugins versus skills

Aspekt	Plugins	Skills
Vad det är	Anslutning till en extern tjänst (Gmail, Notion, Slack).	Återanvändbar instruktionsfil för en specifik uppgift.
Anrop	`@gmail`	`/brand-deal-researcher`
När du skapar en	Sällan, du installerar bara.	Ofta. Varje gång ett arbetsflöde sätter sig och du vill kunna upprepa det.

Två sätt att skapa en skill

01

Prompt to skill

"Skapa en skill som heter X som gör Y." Snabbt, men resultatet blir generiskt eftersom du beskriver i abstrakt.

02

Manuellt arbetsflöde, sen reverse-engineer

Be agenten göra uppgiften. Iterera tills du är nöjd. Säg sedan, "jag är nöjd, gör om detta till en skill." Mycket bättre resultat.

Hemligheten

Det andra sättet vinner alltid. Agenten är bra på att läsa av vad ni precis gjorde tillsammans och destillera det till ett bra recept. Den är dålig på att gissa vad du vill ha innan ni har gjort det en gång.

Iterera skill över tid

01

Använd skillen

Anropa via slash. Se hur resultatet blir.

02

Notera vad som överraskade positivt

Bra formatering, en oväntad detalj, ett trick som funkade. Det är gulkort, värt att låsa in.

03

Säg åt agenten att uppdatera skillen

"Jag älskade att du la dem i containers den här gången, uppdatera skillen så att du alltid gör så." Den uppdaterar sin egen instruktionsfil.

Mental modell

Varje gång du använder en skill är en chans att göra den bättre. Behandla den som ett levande dokument, inte ett färdigt protokoll.

Modul 06

Bilder med GPT image-2.

Bästa bildmodellen i världen är inbyggd i Codex som en skill. Du behöver inte aktivera något, du behöver bara använda den.

När du ber Codex skapa bilder plockar den automatiskt upp den inbyggda image gen-skillen. Bilderna landar i projektmappen, precis som alla andra filer agenten producerar.

GPT image-2 är default, du behöver inte specificera modell
Bilderna sparas direkt i projektmappen så du kan dra in dem i andra dokument
Du kan klistra in en referensbild och be agenten skapa varianter, byta personer eller miljöer, eller göra produktbilder
Specifik med detaljer i prompten, antal personer, nationaliteter, miljö, kläder, ljus, allt det funkar

Konkret exempel

Prompt

"Skapa fem produktbilder av min stickade tröja"

Bifoga en bild på tröjan. Specificera, "tre bilder med en person, en bild med tre personer, en bild med fem personer. Olika nationaliteter."

Resultat

Fem bilder i projektmappen

Agenten kör skillen, genererar bilderna i tur och ordning, lägger dem i projektmappen som lokala filer. Klara för upload till webshop, presentation, eller vidarebearbetning.

Att veta

De inbyggda skillsen finns under skills-fliken. Du behöver inte aktivera dem, men det är värt att titta vad som finns där, det hjälper dig veta vad agenten kan utan att du ber den specifikt.

Modul 07

Dator- och browserkontroll.

Agenten kan styra ditt tangentbord, din mus och din skärm. Det öppnar upp allt grafiskt arbete som annars hade kostat tid att klicka igenom.

Det här är två separata plugins. @computer use styr hela datorn. @browser use styr bara webbläsaren, vilket är snabbare och mer pålitligt när det räcker.

Plugin	Vad den styr	Bra för
`@computer use`	Hela datorn. Vilken app som helst, inte bara webben.	Skapa Canva-presentation, jobba i Final Cut, drag-och-släpp i Finder.
`@browser use`	Endast webbläsaren.	Testa appar du själv har byggt, fylla i webbformulär, scrapa enkla sidor.

Konkret exempel, dator

"Öppna Canva, skapa en ny presentation, lägg en bild per slide, totalt fem slides." Agenten klickar sig genom Canva. Du sitter och ser musen röra sig, men du behöver inte röra något själv.

Konkret exempel, browser

01

Skapa appen

Be agenten bygga en HTML-app. Den genererar koden lokalt, sparar i projektmappen.

02

Be browser use testa den

"Testa interfacet, kontrollera att knappar och navigation fungerar, använd @browser use." Agenten öppnar webbläsaren och börjar klicka.

03

Granska rapporten

Agenten rapporterar var klick funkar, var något scrollar för subtilt för att verifieras live, vilka quiz-frågor den klarade. Du får en konkret testlogg.

Mental modell

Tänk på det här som det mänskliga gränssnittet, tangentbord, mus, skärm, som nu kan användas av agenter. Och det blir bättre exponentiellt.

Modul 08

Schemaläggning och Chronicle.

Sista kapabiliteten plus ett bonus-verktyg. Tillsammans gör de att agenten jobbar för dig även när du inte är där, och vet vad du jobbar med utan att du måste säga det.

Automations

När du har en skill du vill köra återkommande, säg det bara. "Kör detta varje fredag klockan 9, uppdatera arket." Codex sätter upp en automation. Du ser den i automations-fliken, kan redigera den där, eller stänga av.

01

Bygg en skill du litar på

Automation är bara så bra som skillen den kör. Iterera tills resultatet sitter konsekvent.

02

Be om ett schema i klartext

"Kör detta varje fredag 09:00." Eller varje timme, varje dag, varje månad. Agenten skapar automationen utan att du behöver klicka i en kalender.

03

Granska i fliken

Automations-fliken visar status, senaste körning, vilken skill som används. Du kan redigera direkt där.

Användningsfall

Veckosammanställningar (mejl, transaktioner, leads), morgonbriefingar (nyheter, kalender, agenda), månadsrapporter. Allt där värdet är repetition och regelbundenhet, inte engångsjobb.

Bonus, Chronicle

Chronicle är ett nytt forskningspreview-verktyg som du slår på i settings → personalization. När det är på spelar Codex in din skärm löpande, så agenten har kontext på vad du jobbar med utan att du behöver berätta.

Du anropar med use Chronicle i prompten, agenten plockar upp aktuella skärmbilder
Användbart när du vill ha förslag baserat på något du nyss gjorde, men inte vill beskriva det
Det är invasivt, det är hela poängen, så slå på det medvetet

När är Chronicle en bra idé?

När du jobbar i många olika appar och vill kunna fråga agenten "vad har jag missat" eller "ge mig nästa steg" utan att klistra in skärmbilder. Mindre bra om du jobbar med känslig information du inte vill att agenten ska ha löpande sikt på.

Vad är skillnaden mot vanlig screenshot?

Chronicle samlar löpande, så agenten har en historik. En enstaka skärmbild ger bara ögonblicket. Med Chronicle kan agenten resonera om sekvenser, "du höll på med X, sen bytte du till Y, här är vad som logiskt följer."

Quiz

Tre frågor som testar.

Korta frågor på de viktigaste principerna. Inga trickfrågor, bara en kontroll på att de centrala mentala modellerna sitter.

Fråga 01

Var sparas filer som Codex skapar åt dig?

Fråga 02

Vilken syntax använder du för plugins respektive skills?

Fråga 03

Vilket av de två minnena ska du normalt sett inte röra manuellt?

Resultat

3 av 3 rätt

Bra. De grundläggande mentala modellerna sitter.

Codex på 30 minuter.

Codex som super-app.

Tre saker att hålla i huvudet

Lokala filer

Bredd över djup

Multi-tasking

Full filåtkomst.

Två sätt att starta en chat

Skapa ett projekt rätt

Lägg projekten i Documents

Klicka "Start at existing folder"

Skapa chatten inuti projektet

@-mention dokument från mappen

Konkret exempel

60 kvitto-bilder i en Downloads-mapp

Excel-arbetsbok med dashboard

Persistent minne.

Hur du sparar manuellt minne

Iterera till du är nöjd

Be agenten "kom ihåg"

Verifiera att den uppdaterar agents.md

Auto-minnet, det andra

Anslut allt med plugins.

Hur du faktiskt använder dem

Tre konkreta uppgifter

Brand deals från Gmail

Manus från Notion

Svar via Slack eller mejl

Återanvändbara skills.

Plugins versus skills

Två sätt att skapa en skill

Prompt to skill

Manuellt arbetsflöde, sen reverse-engineer

Iterera skill över tid

Använd skillen

Notera vad som överraskade positivt

Säg åt agenten att uppdatera skillen

Bilder med GPT image-2.

Konkret exempel

"Skapa fem produktbilder av min stickade tröja"

Fem bilder i projektmappen

Dator- och browserkontroll.

Konkret exempel, dator

Konkret exempel, browser

Skapa appen

Be browser use testa den

Granska rapporten

Schemaläggning och Chronicle.

Automations

Bygg en skill du litar på

Be om ett schema i klartext

Granska i fliken

Bonus, Chronicle

Tre frågor som testar.

Var sparas filer som Codex skapar åt dig?

Vilken syntax använder du för plugins respektive skills?

Vilket av de två minnena ska du normalt sett inte röra manuellt?

3 av 3 rätt

Bra jobbat. Du tog dig igenom hela mini-kursen.

Vill du tänka mer kring AI-agenter, etik och Claude?