Liite kuvaa mittauksen kysymyspaletin, käytetyt mallit ja rekonstruktion ohjeen. Lue tämä jos haluat ymmärtää miten pää-raportin luvut on tuotettu, tai jos haluat itse ajaa audit-skriptin ja todentaa luvut suoraan raakadasta.
Liite koostuu viidestä osasta. Sivut 3-4 esittävät kysymyspaletin kategorioittain. Sivu 5 kuvaa mittauskonfiguraation. Sivu 6 näyttää näkyvyyden kategorioittain ja keskeiset termit. Sivu 7 antaa rekonstruktion ohjeen audit-skriptin ajamista varten.
Kategoriajakauma: A=5, B=7, C=7, D=10 (pää-mittari), E=7, F=6, G=8, K=1.
Mittausajo 2026-05-04 + 2026-05-07. Yksi vastaus per kysymys ja malli.
Mittauksessa käytetään mallien kevyitä variantteja, ei flagship-malleja. Valinnan taustalla on kaksi näkökulmaa.
Käyttötilanne. Kevyet mallit ovat oletuksena kuluttajakäytössä jo nyt (esim. ChatGPT:n ilmaisversio, Claude.ai:n ilmaisversio, Gemini-ilmaiskäyttäjä). Mittauksen tarkoitus on heijastaa AI-haun käytännön käyttäytymistä, ei flagship-tason laboratoriokäyttöä.
Toistettavuus. Kevyet mallit mahdollistavat säännöllisen toistettavuuden mittauskustannuksilla joiden ansiosta saman paletin voi ajaa kuukausittain ilman että kustannus räjähtää. Tämä on suoraan Geonin pitkäkestoisen mittauspalvelun edellytys.
Saman paletin ajaminen flagship-malleilla on mahdollinen erillinen lisätilaus jos asiakas haluaa nähdä kuinka tulos muuttuu. Geonin sisäiset baselinemittaukset osoittavat että kevyiden ja flagship-mallien jakaumat ovat suunnaltaan yhteneväiset, vaikka absoluuttiset luvut voivat erota.
AI-mallit ovat ulkoisten tarjoajien hallinnassa ja niiden versiot vaihtuvat tarjoajan päätöksellä, tyypillisesti alle vuoden välein. Toistomittauksessa Geoni käyttää lähintä saatavilla olevaa kevyttason mallia (esim. gpt-4o-mini korvautuu uudemmalla kevyttason mallilla kun edellinen poistuu) ja dokumentoi mallin vaihdoksen ennen toistomittausta.
Vertailussa erotetaan kaksi muutoslähdettä: kohdebrändin näkyvyyden muutos ja mallin käyttäytymisen muutos. Tarvittaessa kontrollikysymys K1 toimii indikaattorina mallin perustason vakaudelle, koska brändituntemusta mittaava K1 muuttuu vain jos malli on muuttunut radikaalisti. Mallin vaihdos ei ole täysin näkymätön muutos lukijalle, mutta dokumentointi ja K1-kontrolli mahdollistavat vaikutuksen rajoittamisen.
Geoni esittää saman 51 kysymyksen sarjan kolmelle AI-mallille (OpenAI mini-mallille, Anthropic Haikulle ja Google Gemini Flash Litelle). Jokaisesta kysymyksestä saadaan yksi vastaus per malli, eli yhteensä 153 vastausta. Mittausajo tehtiin kahtena päivänä, 2026-05-04 ja 2026-05-07.
Kaikki kolme mallia käyttävät verkkohakua osana vastauksen tuottamista. OpenAI ja Anthropic käyttävät yhden haun per vastaus. Google Gemini käyttää automaattista hakua, jolloin yhden vastauksen taustalla voi olla useita verkkohakuja. Tämä on Geminin natiivi käyttäytyminen.
Vastaukset tallennetaan sellaisenaan raakadasta-tiedostoon. Jokainen rivi sisältää kysymyksen, käytetyn mallin, mallin antaman vastauksen ja sen lähteet. Kaikki taulukot ja luvut pää-raportissa lasketaan tämän raakadan riveistä, eikä mitään välivaiheen lukua piiloteta.
Mainintojen laskenta perustuu sananrajat-hakuun "Dagmar"-merkkijonolle vastaustekstistä. Selkeät vääriin osumiin kuuluvat tapaukset (Restaurant Dagmar Bistro, bistrodagmar.fi, Dagmarinkatu) suodatetaan pois automaattisesti. Lähde-laskenta perustuu siihen, esiintyykö dagmar.fi mallin käyttämissä lähteissä.
Yhden mittausjakson tulos kuvaa AI-mallien käyttäytymistä mittauspäivinä. Sama mittaus on uusittavissa 3 tai 6 kuukauden välein vertailupisteen rakentamiseksi.
Taulukko näyttää Dagmar-mainintojen jakauman kategorioittain kategoriavertailun 126 vastauksen joukosta. Kategorioiden Dagmar-osumien summa on 33, joka vastaa pää-mittarin 33/126 = 26,2 % -lukua.
| Kategoria | Aihe | Vastauksia | Dagmar-mainintoja | Osuus |
|---|---|---|---|---|
| A | Käsitteet ja terminologia | 9 | 3 | 33,3 % |
| B | Mittaaminen ja seuranta | 15 | 3 | 20,0 % |
| C | Optimointi, lähteet ja signaalit | 15 | 2 | 13,3 % |
| D | Suomalaiset palveluntarjoajat (pää-mittari) | 30 | 12 | 40,0 % |
| E | Hankinta, hinnoittelu, ostokriteerit | 21 | 10 | 47,6 % |
| F | AI-aikakauden kysymykset | 12 | 1 | 8,3 % |
| G | Kohderyhmät, käyttötapaukset, ROI ja johto | 24 | 2 | 8,3 % |
| Yhteensä | 126 | 33 | 26,2 % | |
Vastauksia-sarake kuvaa kategorian a- ja b-tyypin kysymysten kolmen mallin yhteenlasketun vastausmäärän. Kategorioissa olevat c-tyypin määritelmäkysymykset eivät kuulu tähän laskentaan.
| Termi | Määritelmä |
|---|---|
| Yritysmainintojen tarkistus | Vastausten lukumäärä joissa Dagmar mainitaan tekstissä, jaettuna kategoriavertailun 126 vastauksen joukolla. Pää-raportin laskennan pohja 33/126 = 26,2 %. Sisältää sekä neutraalit listaukset että suositukset samalla painolla. |
| AI-mainintanäkyvyys | Pää-raportin pää-mittarin yläkäsite. Geoni laskee maininnaksi kaikki Dagmar-tunnistetut esiintymät vastauksessa, sekä neutraalit listaukset että suositukset. Maininta- ja suositus-tason laadullinen erottelu jätetään tekemättä koska luokittelu vaatisi LLM-pohjaisen subjektiivisuusarvion joka heikentäisi mittauksen toistettavuutta. Mallikohtaiset näkyvyyspisteet ja tasapainoindeksi rakentuvat tämän mittarin pohjalle. |
| Lähdetarkistus | Vastausten lukumäärä joissa dagmar.fi nousee mallin käyttämäksi lähteeksi, jaettuna kaikkien 50 mittauskysymyksen 150 vastauksen joukolla. Tukimittari 21/150 = 14,0 %. Laskenta on lähde-vastauksen tasolla. |
| Lähde-vastaus | Yksi AI-vastaus jossa dagmar.fi esiintyy ainakin yhden kerran lähdeluettelossa. Lähdetarkistuksen nimittäjä lasketaan tällä tasolla. Nykyarvo 21 lähde-vastausta. |
| Lähde-rivi | Yksittäinen dagmar.fi-linkki AI-vastauksen lähdeluettelossa. Yhdessä lähde-vastauksessa voi olla useita lähde-rivejä. Mallikohtainen jakauma OpenAI 3 / Anthropic 11 / Gemini 22 (yhteensä 36) viittaa lähde-riveihin. |
| Brändituntemus | K1-kontrollikysymyksen vastausten määrä joissa malli tunnistaa Dagmarin oikein suomalaisena mainostoimistona, jaettuna 3 mallin yli. Tukimittari 3/3. |
| Lähde-suositus-konversio | Niiden vastausten osuus, joissa dagmar.fi on lähteenä, jotka mainitsevat myös Dagmarin tekstissä. Lasketaan kategoriavertailun 126 vastauksen joukosta. Nykyarvo 17/19 = 89,5 %. |
| Suositus-lähde-konversio | Niiden Dagmar-mainintojen osuus joiden taustalla on dagmar.fi mallin käyttämänä lähteenä. Lasketaan samasta 126 vastauksen joukosta. Nykyarvo 17/33 = 51,5 %. |
| Kategorianäkyvyys | Dagmar-mainintojen osuus per kategoria saman 126 vastauksen joukolla. Yllä olevan taulukon viimeinen sarake. |
V2.6-iteraatiossa pää-mittari rakennetaan kolmesta mallikohtaisesta näkyvyyspisteestä. Tämä sivu kuvaa laskennan, mallihajonnan luokituksen, miksi markkinaosuuspainotettua aggregaattia ei käytetä ja nykyisen mittauspohjan transition-noten.
Mallikohtainen näkyvyyspiste lasketaan kunkin mallin Dagmar-osumista P71-vastausjoukon perusteella. P71-vastausjoukko = kategoriavertailun a- ja b-tyypin kysymykset ilman K1-kontrollia, 42 kysymystä per malli.
Mallihajonta lasketaan kolmen mallikohtaisen pisteen keskihajontana (populaatiokeskihajonta, jakaja N=3). Luokituksen kynnykset:
Tässä mittauksessa keskihajonta = 12,7 pistettä → mallihajonta-luokka kohtalainen. Kynnykset ovat alustavat ja voidaan tarkentaa kun tuotantoversion data tulee saataville useammasta mittauksesta.
Geoni ei raportoi markkinaosuuspainotettua aggregaattia päätuotteessa. Markkinaosuudet muuttuvat AI-mallien kilpailutilanteen mukana. Jos pääluku tukeutuu niihin, asiakas ei voi tulkita pistemäärän muutoksia toistomittauksessa: nousiko mallikohtainen näkyvyys vai siirtyikö markkinaosuus mallien välillä?
Tasapainoindeksi (1/3 painotus per malli) säilyy vakiona painotuskertoimien suhteen ja sallii kolmen mallikohtaisen aikasarjan rinnakkaisen seurannan. Toistomittauksessa raportoidaan kolme aikasarjaa erikseen, ei aggregaattia. Tämä on metodologinen valinta joka rikkoisi muuten aikasarjan vertailukelpoisuuden.
Tämä on V2.6-iteraation osa. Nykyinen mittauspohja on yhden ajon mittaus kunkin tarjoajan kevyellä mallilla:
Tämä on testivaiheen kustannustehokkuusvalinta. Tuotantotason myyntiversio toteutetaan kunkin tarjoajan oletusmallilla (loppukäyttäjälle näkyvä default ChatGPT-, Claude- ja Gemini-tuotteissa) ja kolmella ajolla per kysymys, geoni.fi:n Standardi-lupauksen mukaisesti. Pää-indeksin rakenne (P84) ei muutu mallisiirtymässä, vain numerot tarkentuvat. Mallisiirtymä ja 3-ajon nosto lukitaan erillisinä päätöksinä V2.6:n hyväksynnän jälkeen.
Pää-raportin luvut ovat jäljitettävissä raakadasta. Audit-skripti laskee ne uudelleen ja vertaa raporttiin. Asiakas tai kolmas osapuoli voi ajaa skriptin itse.
liite-raakadata.jsonl: 153 vastausta JSONL-muodossa.liite-audit-skripti.js: Node.js-skripti joka laskee päämittarit raakadasta.Skriptin pitää tulostaa täsmälleen samat luvut kuin pää-raportissa. Jos lukujen välillä on poikkeama, skripti palauttaa exit-koodin 2 ja kertoo missä poikkeama on. Ilmoita poikkeamat osoitteeseen [email protected].
Jos Node.js ei ole asennettuna, sama tarkistus on saatavilla selaimessa toimivana versiona tiedostossa liite-tarkistus.html. Avaa tiedosto selaimessa ja anna sen lukea raakadata. Tulokset näytetään välittömästi.
Skripti todentaa pää-raportin numeeriset päämittarit raakadasta. Skripti ei todenna mainintojen laadullista luokittelua eikä päätöspohjien hypoteeseja. Nämä ovat tulkintaa raakavastauksia vasten ja niiden todentaminen vaatii vastausten lukemista raakadasta tai tiedoston liite-tarkistus.html käyttöä selaimessa.