En sak som jag bara måste ta upp, även om det varit lite mycket “teknik” på bloggen på senaste tiden. Men, har du någonsin upplevt att en AI som ChatGPT, Copilot eller Gemini svarar klokt och nyanserat när du skriver en fråga, men när du säger samma sak via röst-chatt så får du ett betydligt mer luddigt svar? Du är inte ensam. Det är faktiskt ett av de vanligaste fenomenen hos moderna AI-tjänster, och det finns en mycket enkel förklaring till varför det blir så.
AI är nämligen inte en enda ”hjärna” som gör allt, utan olika system beroende på hur du kommunicerar med den. Som jag förstår så gäller detta alla AI modeller. När du skriver till AI i textchatten använder du en fullstor och kraftfull språkmodell, som har tid och kapacitet att resonera djupare, väga argument, analysera flera möjliga svar och ge mer precisa formuleringar. Precis som när man själv läser något på ett papper, jämfört med att få frågan kastad i ansiktet verbalt.
Textmodellen av AI kan fundera ett tag, och tar gärna en eller flera sekunder extra för att tänka klart. Detta ger ofta tydligare, mer logiska och detaljerade svar. När du använder din röst så är det oftast en snabbare och mindre modell som jobbar. Den är designad för realtid, så den prioriterar saker som att svara omedelbart, klara brus, missuppfattningar och otydlig röstinmatning, undvika kontroversiella eller svårtolkade uttalanden, hålla svaren enklare och ”snällare”.
Just därför så skiljer sig svaren avsevärt mellan dom olika modellerna och röstversionen ofta låter mer som: ”Det kan vara så här eller så där, beroende på vem man frågar…” Det blir försiktigt, generellt och ibland lite intetsägande, vilket jag personligen finner rätt så irriterande när jag gjort mina tester med dom olika modellerna. Men det är en oerhört snabb process och genererar därför inte samma svar som du skulle fått genom att skriva frågan, eftersom röst kräver helt andra prioriteringar än text.
Det är alltså helt normalt att olika AI resonerar djupare i text och är mer försiktig och ytlig i röstläge. Det betyder inte att du är tokig när du får kontroversiella svar, men det betyder inte heller att AI:n ”motstrider sig själv”, som jag trodde till en början. Det är bara olika verktyg, byggda för olika situationer.
Det samtidigt är lätt att tro, som jag gjorde, att röstversionen använder den vanliga AI-textmodellen, och att TTS (Text To Speech) bara läser upp texten. Men så fungerar det alltså inte.
Så om du behöver hjälp av AI för att göra något viktigt, ta det via text, så att den får tid på sig att svara det bästa den kan. Använd inte röst-chatten för detta ändamål.
Ha en jättebra dag så hörs vi snart igen.

