Sigurno ste više puta do sada videli ankete na raznim Web sajtovima. Neke od anketa imaju vrlo zanimljiva pitanja i interesantno je pogledati kako su drugi glasali, a takođe i kako su komentarisali pitanja (ako je omogućeno i komentarisanje), kao i raspodelu odgovora po ponuđenim opcijama. Ponekad su ova pitanja čista zabava, ali često su postavljena sa namerom da se ispita javno mnenje ili u svrhu marketinga. U jednom periodu se smatralo da je postojanje anketa na Web sajtu dobar mamac za posećenost sajta, zajedno sa drugim karakteristikama i tehnikama kao što su: linkovi sa drugih sajtova, zanimljiv sadržaj koji se često ažurira i dodaje i slično.
Ankete su svakako dobra zanimacija. Ali kako verovati rezultatima, da li su oni verodostojni, reprezentativni i da li posetioci iskreno odgovaraju, da li je uzorak reprezentativan i kako obezbediti da anketari i anketirani ne varaju?
Ako pretpostavimo da onaj ko postavlja anketu na svoj sajt želi što verodostojnije rezultate na reprezenativnom uzorku, onda on mora ozbiljno da se potrudi. Odmah je jasno da je reprezentativnost ograničena na uzorak posetilaca dotičnog sajta, a ne na generalnu populaciju.
Drugi element je: kako obezbediti da ovi posetioci glasaju iskreno, da ne glasaju više puta i da ne narušavaju anketu na druge načine. Metode koje se koriste su obično pomoću:
• Kukija ili „kolačića" (engl. cookie)
• IP adresa
• Kombinacija kukija i IP adrese
• Korisničko ime i lozinka
• Prilagođeni (kastomizovani) link
• Verovatno postoje i brojne druge
Postavljanje kukija deluje kao zanimljiv i dobar način da se spreči višestruko glasanje istog posetioca. Kada pristupite web sajtu i glasate, server će vam poslati kuki (kolačić :-), koji će biti smešten na Vaš računar i odbijaće novo glasanje za neki određeni period ili do kraja te ankete. To su dobre strane za verodostojnost rezultata glasanja. Loša strana je što jedino vi možete glasati sa tog računara, pa ako, recimo, više članova porodice želi da glasa u dotičnoj anketi, onda neće moći. Naravno, ako imate više Web čitača tj. browser-a, onda možete glasati po jednom iz svakog u zadatom vremenskom periodu.
Ipak, ovo je lako prevazići. Svaki Web čitač omogućava brisanje kukija, pa ćete time doći do mogućnosti da glasate onoliko puta koliko imate strpljenja da brišete kukije. Samim tim to glasanje i nije previše pošteno niti reprezentativno. Organizator ankete će dobiti rezultate koji nemaju puno veze sa stvarnošću, pogotovo ako neko ima jak interes da lažira rezultate.
Ako se ograničenje broja glasanja odnosi na IP adresu, onda je uobičajeno pravilo „jedno glasanje sa jedne IP adrese u zadatom vremenskom periodu". Na prvi pogled deluje kao fer način, ali ima barem dva bitna nedostatka. Prvi je da mnoge firme imaju jednu javnu IP adresa, preko koje se „vidi" sa Interneta, a iza NAT-a se nalazi mnogo više računara. U tom slučaju će samo jedan moći da glasa, a ostali će biti onemogućeni.
Ograničavanje broja glasanja preko IP adrese može se prevazići korištenjem raznih proksija ili anonimizatora koji će vas predstaviti kao sasvim drugog posetioca kada promenite konekciju odnosno poksi koji koristite. Jedan od poznatih anonimizatora je Tor. Svaki put kada želite da glasate, možete koristiti „novi indentitet" i glasati sa druge adrese, onoliko puta koliko ima proksija na raspolaganju ili dok vam ne dosadi.
Ako Web sajt koristi kombinaciju kukija i IP adrese, onda će onaj ko želi da naruši ili lažira glasanje iskoristiti kombinaciju gornjih metoda.
Često se koristi metod da korisnik ima svoje korisničko ime i lozinku i samo ako je prijavljen na sistem, onda može da glasa. To je relativno dobar način da se spreči višestruko glasanje istog korisnika. Nedostatak tog sistema je često prisutna zabrinutost za privatnost pa korisnici, koji se mogu lako identifikovati, ne žele da glasaju ili glasaju sa dozom samocenzure. Time je i reprezentativnost uzorka glasača ozbiljno dovedena u pitanje.
Ozbiljne ankete koriste često posebno prilagođene (kastomizovane) linkove, koji se šalju mailom ili na drugi način onima koji se anketiraju. Korištenjem takvog linka se može glasati ili odgovoriti na anketu samo jednom. Ovaj metod se najčešće koristi za ozbiljnije ankete sa dosta pitanja i često omogućava da se anketa zapamti i nastavi od određene tačke u vreme kada odgovara učesniku ankete.
I ovaj metod često pati od lošeg odziva usled zabrinutosti za privatnost i slično. Anketari često angažuju posrednike, ako bi se obezbedila neka vrsta anonimnosti, a naručiocu ankete se šalju samo zbirni podaci ili podaci očišćeni od bilo kakvih ličnih detalja.
Ako anketa uopšte ne beleži glasanje nekom od gornjih metoda, onda je vrlo podložna mahinacijama i, samim tim, rezultati su vrlo nepouzdani.
Da bi se stimulisao što veći broj učesnika ankete, ponekad se onemogući gledanje rezultata dok se ne glasa, pa radoznalost pobedi i mnogi glasaju da bi, u suštini, na kraju virnuli u rezultate. Ozbiljnije ankete ponekad nude anketiranim da će, kao nagradu za učešće, dobiti finalne zbirne rezultate ankete ili da će biti u slučajnom izboru za neku vrednu nagradu tipa televizora, mobilnog telefona, računara i slično. Ima i slučajeva da neki sajtovi nude i novac za učešće u anketi, ali takve stvari su najčešće sumnjive. Mogu se naći i tekstovi koji govore da su takve šeme vodile u ozbiljnije prevare na Internetu, pa ih se treba čuvati.Sve u svemu, možemo zaključiti da su uobičajene Internet ankete prilično nepouzdane i lako je narušiti i lažirati njihove rezultate, ukoliko neko od posetilaca ima interes da to uradi iz bilo kojih razloga.
Za ozbiljnije ankete i merodavnije rezultate se koriste posebni mehanizmi. Međutim, ti mehanizmi često destimulišu mnoge da u anketama učestvuju, što opet narušava reporezentativnost. Anketari moraju da se dovijaju na razne načine da učešće u anketama učine stimulativnim i privlačnim.
Neke zemlje su uvele sisteme elektronskog glasanja na izborima, ali to je posebna tema o kojoj ću možda govoriti na nekom od budućih blogova.
Na sličnu temu sam ranije pisao na mom blogu u tekstu pod naslovom "Should We Believe Internet Polls?" Na tom blogu je trenutno aktivna anketa „Who will win NIST SHA-3 Competition?". Obzirom na specifično pitanje iz ankete, ne verujem da će biti puno zainteresovanih da naruše rezultate višestrukim glasanjem ili korištenjem gorepomenutih načina. :)
Nekoliko anketa koje sam do sada postavljao na mom sajtu i njihove rezultate možete videti ovde. Svestan sa (ne)reprezentativnosti njihovih rezultata.
Preporučujem da pogledate i ovaj tekst Victoria Secret competition gets hacked.
Napomena: Obzirom da B92 blog čita dosta ljudi koji se ozbiljno bave Web programiranjem, Internetom i sličnim oblastima, siguran sam da će oni svojim komentarima dati puno više detalja i objašnjenja na temu pouzdanosti rezultata Internet anketa. Ovaj tekst je, ipak, samo opis nekoliko najosnovnijih problema i dilema na datu temu.