Dansk version English version Norsk version Svensk version

Trafikkredittering – et uundværligt statistisk værktøj

Få et uundværligt statistisk værktøj, du ikke vidste du manglede – ved hjælp af teori, matematik og generelle overvejelser.

Trafikkredittering – eller kunsten at tilskrive de korrekte kilder til de korrekte besøgende, er en svær webanalytisk disciplin. Det gælder om, at holde tunge lige i munden når man opsætter sin analyse og læser sit webanalyse data.

Vælg de rigtige fokusområder i din online markedsføring
Faldgruberne er mange – flere domæner, underlige redirects, dynamiske sider, der omskriver brugernes data, og så videre. Ikke desto mindre, er det vigtigt at forstå sine brugeres adgang til siden. At kunne kreditere pludselige chok til besøgstallet, konverteringsraten eller bounce raten til de korrekte kilder, så man kan vælge de rigtige fokusområder til ens online markedsføringsindsats og hjemmesideoptimering.

Overordnet set kan man dele trafikkilderne op i to størrelser:

  1. direkte besøgende, eller
  2. besøgende fra henvisninger fra en ekstern instans.

Besøgende, der eksempelvis trykker på et link fra webanalytiker.dk til iihnordic.dk, vil kategoriseres som en bruger fra en henvisende trafikkilde (kategori 2). En besøgende der direkte skriver iihnordic.dk ind i adressebaren, vil være et direkte besøg (kategori 1).

Man kan selvfølgelig indvende, at afhængig af graden af teoretisk tilgang, kunne man helt undlade direkte besøg. Da alle personer ankommer på siden på baggrund af en eller anden form for henvisning – offline eller online.

NB. Denne opdeling er rent teoretisk, men vil være et godt udgangspunkt i forståelsen af hvordan webanalyse-værktøjer krediterer trafikkilder.

For at opnå en større forståelse for kilderne er de kategoriseret nedenfor:
Skærmbillede 2009-11-25 kl. 15.55.15

NB. Det er stadigvæk en ren teoretisk opdeling, og der vil i praksis være forskel i kategoriseringen af trafikkilderne på grund af tekniske barrierer.

Her er henvisningerne delt op i tre underkategorier. Besøgende fra søgemaskiner (Google, Bing, eller lignende), der endvidere er opdelt i organisk og betalt søgetrafik.

Kampagner, som er al trafik fra online eller offline kampagner. Det kan være bannerannoncering, affiliate marketing eller fra en bulletinreklame – og er altså af gode grunde en rodekasse som med fordel kan opdeles yderligere (som udgangspunkt placeres trafik fra nyhedsbrev og lignende også her).

Trafik fra eksterne kilder er nu blot al trafik fra eksterne hjemmesider og ikke-HTML-klienter (teknisk betegnelse for e-mail-klienter, software, bogmærker eller lignende).

Opdelingen kan opskrives som:

eqn9030

Hvor P betegner totale sidevisninger i en given periode (perioden er implicit givet, men vi kunne med fordel indsætte et t som fodtegn for hver komponent for at uddybe, at vi bevæger os i diskret tid – en måned eksempelvis). Identiteten må teoretisk set altid summe – hovedsagligt fordi X-komponenten decideret beregnes residualt (fint ord for tilbageblivende rest):

eqn6813

Hvor XNON derved betegner alt eksternt trafik, der ikke kunne krediteres (det indbefatter også offline indgange – besøgende der har hørt om siden andetsteds fra).

Nu har vi et teoretisk udgangspunkt, og kan bevæge os over i et mere praktisk baseret perspektiv. Lad os tage udgangspunkt i Google Analytics terminologi, og se hvorledes den passer med vores teori.

Google Analytics har som udgangspunkt en firedelt kategorisering:

1. (none) Betegner alle de besøg, der ikke entydigt kunne spores til nogle kilde
2. referral Betegner alt henvisningstrafik
3. organic Betegner besøg fra organiske søgeresultater
4. cpc Betegner besøg fra betalte søgeresultater

Altså en mere bred betegnelse af de besøgende. Organic (3) og cpc (4) betegner hhv. Sorganic og Scpc (med udgangspunkt i hvad Google Analytics kender til af søgemaskiner), referral (2) betegner XHTML og (none) (1) betegner XNON og D.

Desværre har vi teknisk set ikke mulighed for at adskille direkte besøg og besøgende fra ikke-HTML-klienter.

Teoretisk:

CodeCogsEqn

Google Analytics:

CodeCogsEqn-1

Bemærk, at vi har undladt kampagnerne (C), der betegnes som other i Google Analytics, og er defineret ud fra den manuelle kampagnesporing som Google Analytics benytter sig af. Disse falder under X-komponenten.

I figur 1 ses udviklingen i absolutte tal for en given tidsperiode (her vist med en måned som interval) for en given hjemmeside i de forskellige komponenter (weekenderne er tegnet ind):

Figur 1 – Den absolutte udvikling i komponenterne (en måned):
graf1

Her har vi altså dekomponeret de besøgende, og får umiddelbart et meget mere klart indblik i udviklingen.

Dog viser denne figur blot den kvantitative udvikling, og det kan være meget relevant at svare på mere kvalitative spørgsmål; hvorfor steg besøgstallet i en given periode?

For at kunne besvare dette, kan man benytte sig af vækstbidragsberegning.

Bidrag fra delkomponenter til samlede besøgstal udregnes således:

gif.latex

Hvor man altså tager væksten i delkomponenten (delkomponent, t+1) i forhold til det samlede besøgstal i perioden før (t). Hvis vi eksempelvis vil finde vækstbidraget fra søgetrafik i periode 2 (februar), lyder ligningen:

gif-1.latex

Den generelle månedlige vækstrate for et givent år ses i figur 2. Jeg har opdelt perioden i tre konjunkturer, som principielt findes ved at se om periodens vækstrate ligger over eller under den gennemsnitlige vækstrate for hele perioden (periodevalg afhænger af ens temperament).

Figur 2 – Vækstrater (et år):
graf2

Og for at grave dybere ned i tallene, kan man ved hjælp af vækstbidragsberegning komme frem til figur 3. Her er trenden, og den procentuelle vækstrate tegnet ind, hvilket er en god idé, da de beskriver de reelle ændringer.

Figur 3 – Vækstbidrag fra de forskellige komponenter, inkl. tendens- og vækstratekurver:
graf3

Hvor man derfor kan forklare vækstraterne ud fra den individuelle vækst i de forskellige delkomponenter.

Det er dog vigtigt at pointere, at vi her bevæger os i relative tal, og vækstbidragsberegning foregår i den anden afledet (som man kalder det), – vi kigger altså på ændringer i relative størrelser, så inden man konkluderer en masse ting, skal man altid kigge tilbage til de absolutte størrelser.

Hvorfor det også er vigtigt, når man udarbejder disse analyser, at benytte sig af nogenlunde stabile størrelser (og gerne høje niveauer), så man undgår et sløret billede, med voldsomme chok grundet små ændringer.

Det skal bemærkes, at brugen af antal sidevisninger som overordnet mål, ikke er det mest korrekte valg, men man kunne benytte sig af alle andre tænkelige mål.

Eksempelvis ville konverteringer være et mere sigende kvalitativt mål, men princippet er det samme.

Eksempel Excel-fil: Download