Google har nylig annonsert at de vil gjeninnføre fysiske intervjuer etter at bruken av KI under digitale tester har gjort det vanskelig å skille ekte ferdigheter fra automatisert hjelp. Når over halvparten…
Kategori: testing og evaluering
KI-målinger forteller ikke hele historien: Etiske utfordringer havner i skyggen av ytelsesmålinger
En verden fasineret av tall De siste ukene har teknologiverdenen blitt oversvømmet av benchmark-resultater for de nyeste kunstige intelligensmodellene. Ikke før har Deepseek scoret bedre enn ChatGPT, så kommer Qwen inn og…
Fra Turing-testen til Humanity’s Last Exam: Slik evaluerer vi KI sin intelligens i en ny æra
I 1950 kom Alan Turing med en genial idé for å teste om maskiner kunne tenke som mennesker: Turing-testen. Den har vært gullstandarden i å vurdere kunstig intelligens (KI) i flere tiår….