Google forutser influensa. Klarte Google å forutsi statsministeren?
Tallnerd med dilla for Googlesøk
I september var det 368 800 norske googlesøk etter “FOTBALL” og 90 500 etter “HÅNDBALL”.
Som tallnerd har jeg gjort massevis av slike sammenligninger. Jeg vet derfor at det søkes dobbelt så ofte etter “NIKE” sammenlignet med “ADIDAS”. At det søkes fem ganger så ofte etter “RØDE KORS” sammenlignet med “REDD BARNA”. Tre ganger så ofte etter “FLY” sammenlignet med “TOG”. Dobbelt så ofte etter “VIN” sammenlignet med “ØL” og like ofte etter “Jan Thomas” som det søkes etter “SKAL VI DANSE” (norsk søkevolum i september 2009).
Klarte Google å forutsi statsministeren?
Med denne interessen var det klart at jeg måtte følge valget. På en eller annen måte. Via Google.
Litt inspirert av Google Flue Trends bestemte jeg meg for å følge antall googlesøk etter partiledere i perioden mars – september 2009. Jeg kunne ikke følge antall søk etter partiene fordi Høyre og Venstre har generiske partinavn.
Antall søk etter partiledere
Det første jeg fant ut var at det kun ble søkt etter Jens Stoltenberg, Siv Jensen, Erna Solberg og Kristin Halvorsen. De øvrige – Navarsete, Dahle, Waage, Høybråten og Sponheim – hadde tilnærmet 0 søk inntil Sponheim dukket opp med ubetydelige tall, i august/ september.
Antall søk etter statsministerkandidater
Da det etter hvert dukket det opp tre statsministerkandidater bestemte jeg meg for å fokusere på disse. Her er tallene jeg fant:

Tallene her hentet via søkeordverktøyet i Google AdWords.
Det er klart at slike tall ikke kan brukes til å forutsi hvem som blir statsminister. Eller – for den del – hvem som vinner valg. Men det viser oss en vinkling rundt “grad av interesse” for ting og tang det søkes etter. I dette tilfelle – politikere.
Svakheter i statistikken
Men. Det er store svakheter her. Den største svakheten er at tallene er gamle når de kan hentes frem av oss uten tilgang til Googles statistikkhimmel . Søkeordtall for en måned presenteres dessverre ikke før 10-12 dager ut i neste måned. Tallene for september kunne dermed ikke hentes ut før 11. oktober.
Den andre svakheten er at vi ikke kjenner Googles avrundingsmetoder. Enkelte tall går stadig igjen. For eksempel 4 400, 27 100, 40 500, 165 000, etc. Jeg kontaktet Google for å finne ut hvordan de avrunder. Men fikk naturligvis ikke annet svar enn at dette er hemmelig.
Derfor. Vi kan dessverre ikke bruke Google til å forutsi. Kun til å beskrive trender. I ettertid. Inntil videre. Dessverre.
/////////
Opprinelig mente Google at de, ved å følge bestemte søkeord, kunne forutse influensautbrudd 10 dager i forkant og på denne måten ligge i forkant av andre informasjonskilder: http://www.nytimes.com/2008/11/12/technology/internet/12flu.html
Hva Google mener nå vet jeg ikke, men andre mener at de kun ligger 3 dager i forkant og at varslingen dermed ikke har nevneverdig nytteverdi: http://www.nytimes.com/2009/05/01/technology/internet/01google.html
Her kan du sjekke influensatrender for en rekke land, inkludert Norge: http://www.google.org/flutrends/
2 kommentarer til "Klarte Google å forutsi statsministeren?"
En googler gjerne politikere en er uenig med, ikke de en kommer til å stemme på. Dermed er ikke søkeordstatistikk egna råmateriale for “prediction marketes”.
Så vidt jeg vet er Google Flue Trends mer avansert enn at den bare tar utgangspunkt i antall personer som søker på “flue”. Kanskje veier den f.eks. søk på “Influensa symtomer” høyere enn bare “influensa”.