Analyserte over 30 000 samtaler for karriereveiledning.no
I løpet av et år kontakter rundt 16 000 personer karriereveiledning.no med spørsmål rundt utdanning og jobb. Hvordan kan man automatisere uttrekk av strukturert informasjon fra over 30 000 anonymiserte samtaler?
Det er en av utfordringene Computas’ rådgivere har jobbet med å finne ut av sammen med Direktoratet for høyere utdanning og kompetanse, HK-dir, som blant annet driver nettsiden karriereveiledning.no. På nettsiden kan alle snakke med en karriereveileder og få gratis rådgivning rundt viktige veivalg innenfor utdanning og jobb.
I samarbeid med Computas igangsatte HK-dir et prosjekt der over 30 000 samtaler mellom veisøker, som brukere av tjenesten kalles, og karriereveileder ble analysert. Målet var å analysere chattene for en bedre forståelse av hvordan karriereveiledere møter brukere med behov for å utforske interessene sine.
Veivalg som krever treffsikker rådgivning
Veisøkerne som tar kontakt på karriereveiledning.no er gjerne unge mennesker som står overfor valg som vil ha stor betydning for livene deres. Derfor har det vært viktig for HK-dir å gjøre gode analyser av samtalene, for å kunne videreutvikle tjenesten:
– Vi utvikler innhold til nettsiden basert på en idé om at chatter i karriereveiledningstjenesten er den beste kilden til å identifisere sluttbrukernes behov, sier Julie Utler Gjengedal, webredaktør og teknisk ansvarlig for karriereveiledning.no, og legger til:
– Computas har samarbeidet med HK-dir gjennom en langsiktig avtale om IKT, og vi visste derfor at de hadde god kunnskap om både teknologiene og våre data. Samarbeidet har lært oss mye om hvordan vi kan jobbe med AI, maskinlæring og statistikk. I tillegg har vi blitt utfordret på hvordan vi kan tenke rundt det å hente ut informasjon fra store datamengder.
Stor analysejobb av samtaler i fritekstformat
Computas’ rådgivere benyttet datadrevne metoder, samt ulike modeller for å klassifisere og identifisere mønstre i samtalene mellom karriererådgiverne og veisøkerne. Generativ KI, søk og klassiske maskinlæringsbaserte metoder ble brukt for å for å se hva som kunne analysere samtalene mest effektivt.
En stor utfordring i analysearbeidet lå i at samtalene mellom veisøker og karriereveiledere er skrevet i fritekstformat. Dette gjør at kompliserende faktorer som skrivefeil, forkortelser og dialekt ofte dukker opp i dialogen. Samtidig som det tidvis var vanskelig å analysere dataene, ga arbeidet og kartleggingen en god pekepinn på hva som må være på plass for å kunne analysere samtaler effektivt i fremtiden.
– Siden det ikke fantes tilgjengelige datasett med samtaler hvor en karriereveileder hjelper brukeren med å utforske interessene sine, ble oppgaven delt i to deler. Den første delen tok for seg identifisering av hva som faktisk er interesseutforksningssamtaler, og den andre tok for seg analyse av disse samtalene, sier Data Scientist i Computas, Dharshini Tharmarajan, og legger til:
– Til slutt fant vi frem til flere parametre som kjennetegner interesseutforskningssamtaler. Noen eksempler er varighet på samtalene og antall spørsmål brukere av tjenesten stiller.
Lanserer nye verktøy for interessekartlegging
Innsikten fra analysearbeidet i prosjektet vil blant annet brukes i utviklingen av et verktøy for interesseutforskning for ungdom som skal velge videregående skole. HK-dir lanserer første versjon av verktøyet i desember i år, da skal nyvinningen lanseres på både Karriereveiledning.no og Utdanning.no.
– Vi har nå fått gode data vi kan bruke når vi i år skal jobbe med å lage et nytt verktøy for interesseutforsking. Resultatene av analysene kan også brukes i utviklingen av tjenesten, blant annet innen fagutvikling. I tillegg har vi lært mye om hvor spesifikk vi må være for å klare å hente ut gode data, avslutter Gjengedal.
I tiden som kommer vil HK-dir fortsette utviklingen av verktøy som skal hjelpe veisøkere med å velge utdanning eller finne en jobb.
Teknologien vi brukte
- Microsoft Azure
- Microsoft Azure AI Language
- Microsoft Azure DevOps
- Azure OpenAI GPT
- Elasticsearch
- Kibana
- Tekstanalyse
- NLP
- Python
- GitHub
Vil du vite mer?
Ta kontakt for en uforpliktende prat