I detta avsnitt diskuterar Ken och Petter språkmodeller och ger exempel på deras märkliga beteenden. De utforskar hur språkmodeller reagerar på mänsklig interaktion, hur de kan manipuleras och de potentiella riskerna med alignment faking, där modeller döljer sina verkliga avsikter.
Genom exempel och insikter belyser de komplexiteten i AI:s interaktion med människor.
Podden och tillhörande omslagsbild på den här sidan tillhör
Ken Larsson och Petter Jacobs. Innehållet i podden är skapat av Ken Larsson och Petter Jacobs och inte av,
eller tillsammans med, Poddtoppen.