PODATKI, KI SO OBRNILI SVET NA GLAVO

HANNES GRASSEGGER & MIKAEL KROGERUS (Jan 28 - 2017)

Psiholog Michal Kosinski je razvil metodo, s katero lahko do potankosti analizira ljudi na podlagi njihovih aktivnosti na Facebooku. Ali je podobno orodje pomagalo Donaldu Trumpu do zmage? 

Starejša različica tega članka je bila objavljena decembra v časniku Das Magazin iz Zuricha.
Novembra 2016 je Michal Kosinski imel predavanje na Švicarskem zveznem inštitutu za tehnologijo (ETH) o nevarnostih velikih podatkov in digitalni revoluciji. 34-letni raziskovalec je vodilni strokovnjak na področju psihometrije, podveji psihologije, ki temelji na zbirkah podatkov. Jutro pred predavanjem je bil priča senzacionalni novici, da je bil Donald J. Trump izvoljen za predsednika ZDA, kljub nasprotnim predvidevanjem vseh vodilnih statistikov.

Kosinski je slutil, da bi lahko rezultati volitev bili povezani z njegovim raziskovalnim delom. Istega dne je Alexander James Ashburner Nix, predsednik takrat praktično neznanega podjetja iz Londona, Cambridge Analytica, v sporočilu za javnost izjavil: »Navdušeni smo, da je naš revolucionaren pristop h komunikaciji na podlagi velikih podatkov igral tako pomembno vlogo pri izvolitvi predsednika Trumpa«. Izkazalo se je, da je isto podjetje sodelovalo tudi pri spletni kampanji za Brexit.

Kako nevarni so veliki podatki?

Veliki podatki (Big data) so digitalne sledi vseh naših dejanj na spletu, pa tudi v resničnem življenju. Digitalno sled pusti vsak nakup s kreditno kartico, iskanje v Googlu, vse lokacije na katerih se nahajamo s telefonom v žepu, še posebej pa naši »všečki« na Facebooku. 

Dolgo časa ni bilo jasno, kako bi se dalo te podatke uporabljati, razen seveda pri prikazovanju ciljanih oglasov. Vloga velikih podatkov pri Trumpovi spletni kampanji je jasno pokazala, da je uporabna vrednost le-teh bistveno večja.
Če želimo bolje razumeti rezultate volitev, ter kako bi lahko politična komunikacija potekala v prihodnosti, moramo začeti z incidentom, ki se je leta 2014 pripetil v centru za psihometrijo na univerzi Cambridge.

Psihometrija se osredotoča na določanje psiholoških lastnosti posameznika, oziroma njegove osebnosti. V 80. letih sta dve ekipi psihologov razvili model, ki je posameznike ocenil na podlagi petih faktorjev osebnosti, tako imenovanih »velikih pet«: odprtost (kako odprti ste do novih izkušenj?), vestnost (kako veliki perfekcionist ste?), ekstravertnost (kako družabni ste?), sprejemljivost (kako obzirni ste do drugih in kako z njimi sodelujete?) ter nevroticizem (kako dobro obvladujete svoja čustva?). Na podlagi teh faktorjev lahko razmeroma natančno ocenimo osebo, njene potrebe in strahove, ter predvidimo, kako se bo obnašala. Dolgo časa je bila glavna ovira pri tem pristopu zbiranje podatkov, saj je bilo potrebno izpolniti zapleten vprašalnik in odgovoriti na zelo osebna vprašanja. Nato so se pojavili internet, Facebook in Kosinski.

Michal Kosinski je bil študent univerze v Varšavi, ko je bil leta 2008 sprejet na doktorski študij na centru za psihometrijo v Cambridgeu. Tam je pričel sodelovati s kolegom Davidom Stillwellom, ki je kakšno leto prej, ko je bil Facebook še v povojih, izdelal aplikacijo MyPersonality. Ta je uporabnikom Facebooka omogočila, da odgovorijo na vrsto psihometričnih vprašanj. Na podlagi odgovorov so prejeli »osebnostni profil«, ter se odločili, ali želijo podatke s svojega profila deliti z raziskovalci.

Kosinski je pričakoval, da bo vprašalnik izpolnilo nekaj kolegov z univerze, toda kmalu je nastala največja zbirka podatkov na svetu, ki je združevala psihometrične rezultate in profile na Facebooku. V naslednjih letih je Kosinski s sodelavci razvil preprost pristop. Rezultate so primerjali z ostalimi podatki, ki so jih pridobili od sodelujočih: kaj so na Facebooku »všečkali«, delili ali objavili, ter njihov spol, starost ter kraj bivanje. To je raziskovalcem omogočilo, da so potegnili vzporednice med zbranimi podatki.

Izkazalo se je, da je mogoče na podlagi preprosti dejanj na spletu izvleči presenetljivo zanesljive sklepe. Tako je na primer večja verjetnost, da so moški, ki so »všečkali« proizvajalca kozmetike MAC, istospolno usmerjeni, medtem ko so tisti, ki so »všečkali« Wu-Tang Clan najverjetneje heteroseksualci. Podobno so sledilci Lady Gaga najverjetneje ekstrovertirani, tisti ki so »všečkali« filozofske vsebine, pa bolj introvertirani. Posamezni podatki seveda ne morejo voditi do zanesljivih predvidevanj, kombinacije tisočih pa omogočajo zelo zanesljive zaključke.

Kosinski je s svojo ekipo neutrudno izboljševal svoje modele. Tako je kosinski leta 2012 dokazal, da lahko na podlagi povprečno 68 »všečkov« uporabnika predvidi njihovo barvo kože (s 95% natančnostjo), njihovo spolno usmerjenost (z 88% natančnostjo), ter njihovo pripadnost demokratom ali republikancem (85%). Toda to še ni vse. Prav tako je mogoče določiti povprečno inteligenco, versko pripadnost, ter uporabo alkohola, cigaret in prepovedanih drog. Iz podatkov je bilo mogoče celo sklepati, ali so starši uporabnika ločeni.

Moč modelov je potrjevalo tudi to, kako dobro so lahko predvideli odgovore posameznika. Kosinski je lahko kmalu ocenil osebo bolje kot povprečen sodelavec na podlagi desetih »všečkov«. 70 »všečkov« je bilo dovolj, da je o njih izvedel več kot njihovi prijatelji, 150 »všečkov« je o posamezniku povedalo več, kot so vedeli njihovi starši, 300 celo več, kot je vedel njihov partner. Več »všečkov« bi lahko celo preseglo lastno zavedanje o sebi. Istega dne ko je Kosinski objavil svoje izsledke, je prejel dva telefonska klica. Grožnjo s tožbo in ponudbo za delo, obe s strani Facebooka.

Le nekaj tednov kasneje je privzeta nastavitev za »všečke« na Facebooku postala zasebna. Pred tem je privzeta natavitev omogočala komurkoli, da je videl vaše »všečke«. Toda to ni nobena ovira za zbiralce podatkov, saj veliko aplikacij in spletnih kvizov zahteva dostop do osebnih podatkov, še preden lahko dostopamo do njihovih vsebin.

Metoda ni omejena samo na »všečke«, saj lahko Kosinski s svojo ekipo določi vrednosti velikih pet že na podlagi tega, koliko profilnih slik ima oseba na Facebooku, ali števila prijateljev (kar je indikator ekstrovertiranosti). 

O sebi razkrijemo veliko tudi, ko nismo na internetu. Lokacijski podatki na našem telefonu na primer povedo, kako hitro se gibamo in kako daleč potujemo (kar je povezano s čustveno nestabilnostjo). Kosinski pove, da je naš mobilni telefon obsežen psihološki vprašalnik, ki ga nenehno izpolnjujemo, tako zavestno kot nezavedno.

Predvsem pa, in to je ključnega pomena, metoda deluje tudi v obratni smeri. Ne le, da je mogoče na podlagi podatkov izdelati psihološke profile, ampak je mogoče tudi poiskati specifične profile, kot so anksiozni očetje, jezni introvertiranci, in celo neodločeni volilci. Kosinski je v bistvu ustvaril neke vrste iskalnik za ljudi. Zavedel se je potenciala, pa tudi inherentne nevarnosti svojega dela.
Zanj je internet predstavljal začetek nove dobe, ki presega omejitve fizičnega sveta. Podatke je mogoče kopirati, deliti, in omogočiti vsem, da imajo koristi od tega. Toda Kosinski se je vprašal, kaj bi se zgodilo, če bi njegov iskalnik zlorabili za manipuliranje z ljudmi? Svojim raziskavam je začel dodajati opozorila, da ta pristop lako predstavlja »nevarnost za posameznika, njegovo svobodo ali celo življenje«. Toda zdelo se je, da nihče ni razumel, kaj je s tem mislil.

V začetku leta 2014 je Kosinskega kontaktiral Aleksandr Kogan, asistent na oddelku za psihologijo. V imenu podjetja, ki ga zanima metoda Kosinskega, je zaprosil za dostop do baze podatkov aplikacije MyPersonality. Zaradi zaveze molčečnosti ni mogel razkriti, za kakšen namen bi bili podatki uporabljeni

Sprva je Kosinski želel ponudbo sprejeti, saj bi inštitut prejel precejšnjo vsoto denarja, vendar je okleval. Kogan je končno razkril ime družbe, SCL oziroma Laboratoriji za strateško komuniciranje. Kosinski je na spletu odkril da gre za »vodilno agencijo za upravljanje volitev«. SCL ponuja marketinške storitve, ki temeljijo na psihološkem modeliranju, fokusirane predvsem na vplivanje na volitve.

SCL je matično podjetje, pod okriljem katerega deluje cela skupina hčerinskih družb. Natančno lastništvo podjetja je težko določiti zaradi zapletene korporacijske strukture. S skupino povezana podjetja so bila vpletena v volitve od Ukrajine do Nigerije, sodelovala pri zatiranju uporov v Nepalu, ter lobirala za NATO v vzhodni Evropi in Afganistanu. Leta 2013 so ustanovili novo podjetje, ki je sodelovalo pri ameriških volitvah: Cambridge Analytica.

Kosinski o vsem tem ni vedel nič, vendar je imel slab občutek. Ob nadaljnjem preiskovanju je odkril, da je Kogan na skrivaj ustanovil podjetje, ki je sodelovalo s SCL. Novinarji časnikov The Guardian in Das Magazin so kasneje odkrili, da je prav Kogan obvestil SCL o metodi Kosinskega.

Kosinski je posumil, da bi Koganovo podjetje lahko kopiralo njegovo metodo, ter jo prodalo kot svojo, zato je nemudoma prekinil stike s Koganom ter o tem obvestil direktorja inštituta. Aleksander Kogan se je nato preselil v Singapur, se poročil ter spremenil priimek v Spectre. Kosinski je doktoriral, sprejel ponudbo za delo z univerze Stanford, ter se preselil v ZDA.
 

Gospod Brexit

Po kakšnem letu zatišja je novembra 2015 vodstvo radikalne kampanje za izstop iz EU »Leave.EU« sporočilo, da so za podporo pri svoji spletni kampanji najeli podjetje Cambridge Analytica. Kosinski je prejel veliko e-poštnih sporočil z vprašanji, ali s podjetjem sodeluje. To je bilo prvič, da je slišal za njih, po ogledu njihove spletne strani pa je bil zgrožen nad možnostjo, da so uporabili njegovo metodologijo za doseganje političnih ciljev.

Nato je 19. septembra 2016, nekaj več kot mesec pred volitvami za predsednika ZDA, potekal vrh Concordia Summit, miniaturna različica Svetovnega gospodarskega foruma. Prisotni so bili vsi ključni odločevalci s celega sveta, ko je bil na oder povabljen Alexander Nix, izvršni direktor podjetja Cambridge Analytica, nov Trumpov svetovalec za digitalno strategijo. Nekaj tednov prej je Trump skrivnostno tvitnil »kmalu me boste klicali Gospod Brexit«. Politični analitiki so dejansko opazili številne podobnosti med agendo Trumpa in desničarskim gibanjem za Brexit, vendar skoraj nihče ni opazil, da za obojim stoji podjetje Cambridge Analytica.

Do tega trenutka je bil za Trumpovo digitalno kampanjo zadolžen Brad Parscale, tržnik in propadli ustanovitelj start-upa, ki je za Trumpa izdelal osnovno spletno stran za 1500 dolarjev. 70-letni Trump ni digitalno podkovan, na svoji pisalni mizi nima niti računalnika. Njegova osebna asistentka je celo razkrila, da ne uporablja elektronske pošte. Ona ga je tudi prepričala, naj začne uporabljati pametni telefon, s katerega sedaj neprestano tvita.
Na drugi strani je kampanja Hillary Clinton v veliki meri slonela na spletni komunikaciji s člani Demokratske stranke, sodelovala je tudi z vrhunskimi analitiki velikih podatkov iz BlueLabs, ter Googlom in podjetjem DreamWorks. Washingtonski establišment je zato vihal nosove nad Trumpovim sodelovanjem s Cambridge Analytico, tujim podjetjem, ki ne razume njihove države in njenih ljudi.

»V čast mi je, da lahko danes govorim o moči velikih podatkov in psihometrike pri volilnem procesu,« je začel svoj govor Alexander Nix. »Še pred 18 meseci je bil Senator Cruz eden izmed najmanj priljubljenih kandidatov, zanj je slišalo manj kot 40% volilcev«. Skoraj dve leti pred sodelovanjem s Trumpom je namreč Cambridge Analytica vključila v volilno kampanjo kot svetovalec za republikanska kandidata Bena Carsona in Teda Cruza. Cruza, in kasneje Trumpa je financiral skrivnostni ameriški milijarder Robert Mercer, za katerega poročajo, da je največji investitor v podjetje Cambridge Analytica.

Nix nato označi idejo, da bi morale vse ženske prejemati enaka sporočila na podlagi spola, ali Afroameričani na podlagi rase, za »res smešno«. Medtem ko so druge kampanje temeljile na demografskih razlikah, je kampanja pod vodsvom Cambridge Analytice temeljila na psihometričnem profiliranju volilcev.

Nix razloži, da njihov model, ki temelji na velikih pet osebnostnih značilnostih, omogoča predvidevanje osebnosti vseh volilcev v ZDA. Njihov uspeh je kombinacija treh elementov: vedenjske znanosti na podlagi velikih pet, analize velikih podatkov, ter targetiranega oglaševanja. Nix odkrito razloži, da Cambridge Analytica najprej kupi osebne podatke iz različnih virov, kot so zemljiške knjige, registri vozil, kartice ugodnosti, naročnine na revije, članstva v verskih skupnostih, ipd. Pri tem sodelujejo z globalnimi posredniki podatkov, kot so Acxiom in Experian. V ZDA so skoraj vsi osebni podatki naprodaj, če želite izvedeti, kje živijo ženske judovskega porekla, lahko te podatke preprosto kupite, vključno z njihovimi telefonskimi številkami. Camridge Analytica nato združi prejete podatke z registrom volilcev republikanske stranke ter spletnimi podatki, ter na podlagi tega izračuna njihove osebnostne profile. Digitalni odtisi tako nenadoma postanejo resnični ljudje s svojimi potrebami, interesi, celo naslovi.

Metodologija je zelo podobna tisti, ki jo je razvil Michal Kosinski. Cambdrige Analytica prav tako uporablja spletne kvize, ter podatke s Facebooka, s temi podatki pa naredi natančno to, o čemer je opozarjal Kosinski. Nix se pohvali da so tako »profilirali osebnost vseh odraslih prebivalcev ZDA, 220 milijonov ljudi«. Kako torej Cambridge Analytica targetira posameznike s primernimi političnimi sporočili?
Nix to pokaže na primeru vprašanja pravice do nošenja orožja. Visoko nevrotičnim in vestnim posameznikom predstavi fotografijo vlomilca, ko vstopa skozi okno. Posameznikom, ki so bolj zaprti, s tradicionalnimi navadami in družinskimi vrednotami, servira fotografijo očeta in sina, ki ob sončnem zahodu skupaj streljata na race. 
Kako prepričati podpornike Clintonove, da ne oddajo svojega glasu Trumpova nedoslednost, muhavost in posledični niz nasprotujočih si stališč so se izkazali za njegovo največjo prednost: drugačno sporočilo za vsakega volilca. Matematik Cathy O’Neil je že avgusta 2016 zapisal, da Trump deluje kot idealno oportunističen algoritem, ki sledi reakcijam občinstva. 

Na dan tretjega soočenja med Trumpom in Clintonov, je Trumpova ekipka testirala 175000 različnih variacij oglasov za njegova stališča, predvsem preko Facebooka. Sporočila so se večinoma razlikovala le v mikroskopskih podrobnostih: različni naslovi, barve, citati, fotografije in videi. S tako natančnim psihološkim profiliranjem je lahko dosegel tudi najmanjše skupine, prebivalce določenih vasi, stanovanjskih naselij in celo posameznike.

Tako je na primer v soseski Miamija, Little Haiti, Trumpova kampanja lansirala novice o neuspehih Clintonove fundacije po potresu v Haitiju, da ne bi volili za Hillary Clinton. Eden od glavnih ciljev kampanje je bil, da bi potencialne volilce Clintonove (neopredeljeni) 
levičarji, Afroameričani, in mlade ženske) odvrnili od glasovanja za njo. S targetiranimi oglasi na Facebooku so naprimer Afroameričanom prikazovali posnetke, v katerih Clintonova označuje črnske moške za nevarne kriminalce.

Nix zaključi svoje predavanje na Concordia Summit s trditvijo, da je tradicionalno oglaševanje mrtvo, in pove da njegovi otroci »ne bodo nikoli razumeli koncepta množičnega komuniciranja«. 
Kako natančno je Trumpova digitalna ekipa targetirala ameriško populacijo je težko določiti, saj se niso osredotočali na tradicionalne televizijske kanale, ampak predvsem na socialna omrežja. Medtem ko je bila ekipa Clintonove na podlagi demografskih projekcij prepričana, da je v vodstvu, je Trumpova digitalna kampanja, ki je bila bazirana v San Antoniu podvojila svoje kapacitete. Ekipa Cambridge Analytice, ki je štela le okoli ducat oseb, je od Trumpa v Juliju 2016 prejela 100000 USD, Avgusta 250000, Septembra pa 5 milijonov. Po izjavah Nixa je njegovo podjetje tekom kampanje zaslužilo več kot 15 milijonov dolarjev.
V Trumpovem predvolilnem štabu so julija 2016 začeli uporabljati aplikacijo, s katero so lahko določili politična stališča in tipe osebnosti prebivalcev posamezne hiše. Tako so med kampanjo od vrat do vrat pozvonili le pri tistih hišah, kater je aplikacija ocenila dovzetne za Trumpova sporočila. Imeli so pripravljene smernice za pogovor, prilagojene osebnostnemu tipu prebivalcev. Odzive volilcev so nato vnesli v aplikacijo, ter sproti izboljševali natančnost aplikacije.

To seveda ni nič novega, saj so se podobnih metod posluževali tudi demokrati, vendar ni nobenih dokazov, da so pri tem uporabljali psihometrično profiliranje. Camridge Analytica je populacijo ZDA razdelila na 32 tipov osebnosti, ter se osredotočila le na 17 ključnih zveznih držav. Pri tem so na primer odkrili, da je preferenca do ameriških avtomobilov odličen pokazatelj, da gre za potencialnega Trumpovega volilca. Takšne ugotovitve so med drugim pokazale, katera Trumpova sporočila najbolje delujejo, in kje. Na podlagi analize podatkov so se tako v zadnjih tednih kampanje osredotočili na zvezni državi Michigan in Wisconsin. Kandidat je tako postal sredstvo za implementacijo modela velikih podatkov.
Kaj sledi?

Toda v kolikšni meri so psihometrične metode vplivale na izid volitev? Na to vprašanje Cambridge Analytica ni podala nobenega konkretnega dokaza o učinkovitosti kampanje. Najverjetneje je, da na to vprašanje ni mogoče odgovoriti. Vendar pa obstajajo številni indici, kot so presenetljiv vzpon Teda Cruza med primarnimi volitvami, povečano število volilcev na podeželju, ter padec števila Afroameriških glasov na predčasnih volitvah. 
Na učinkovitost oglaševanja na podlagi osebnosti kaže tudi to, da je bila Trumpova kampanja v primerjavi s Clintonovo bila bistveno cenejša, in bistveno bolj osredotočena na socialna omrežja, kot na televizijske oglase. Facebook se je izkazal za najboljšo platformo za predvolilno kampanjo, kar so potrdili tako Nix kot številni Trumpovi sodelavci. Ironično je, da je Trump, ki se pogosto pritožuje nad znanstvenimi raziskavami med svojo kampanjo izbral zelo znanstven pristop. 

Drugi veliki zmagovalec je Cambridge Analytica. Njen član uprave Steve Bannon, nekdanj izvršni direktor desničarskega spletne portala z novicami Breitbart News, je bil imenovan za Trumpovega višjega svetovalca in glavnega stratega. Medtem co Camridge Analytica ne želi komentirati domnevnih pogovorov z britansko premierko Thereso May, Alexander Nix trdi, da vzpostavlja bazo klientov po celem svetu, ter da je med drugimi prejel povpraševanja iz Švice, Nemčije in Avstralije. Za njim je tudi uspešna turneja po konferencah v Evropi, kjer je prestavil svoje uspehe v ZDA. Na jesenskih parlamentarnih volitvah v Nemčiji se bo pokazalo, kako se bodo odrezale populistične stranke.

Kosinski razvoj dogodkov podrobno spremlja iz svoje pisarne na univerzi v Stanfordu. S sodelavko Sandro Matz je izvedel številne analize, katerih rezultate bo kmalu objavil. Prvi rezultati so zaskrbljujoči, saj raziskave kažejo na učinkovitost osebnega targetiranja oglasov. Izdelki in oglasna sporočila, ki so prilagojena potrošnikovim osebnostnim karakteristikam lahko pritegnejo do 63% več klikov in 1400 več pogovorov na Facebooku. Na učinkovitost in prilagodljivost osebnega targetiranja kaže tudi to, da je z eno samo stranjo na Facebooku, ki promovira izdelke ali blagovne znamke mogoče natančno targetirati veliko število potrošnikov.

V izjavi po objavi tega članka v nemščini je predstavnik Cambridge Analytice v izjavi za javnost povedal: »Cambridge Analytica ne uporablja podatkov s Facebooka. Prav tako nismo imeli nobenega kontakta z Dr. Michalom Kosinskim. Pri svojih raziskavah ne uporabljamo podizvajalcev. Prav tako ne uporabljamo enake metodologije. Psihometričnih raziskav je bilo zelo malo. Cambridge Analytica ni sodelovala pri prizadevanjih za odvračanje Američanov od sodelovanja na predsedniških volitvah. Naši napori so bili usmerjeni le k povečanju števila volilcev na volitvah«.

Zdi se, da je svet obrnjen na glavo. Velika Britanija zapušča EU, Donald Trump je predsednik ZDA. In Kosinski ponovno prejema obtožujočo e-pošto, na katero odgovarja: »To ni moja krivda. Jaz nisem izdelal bombe. Samo pokazal sem, da obstaja«.

Vir: https://motherboard.vice.com/en_us/article/how-our-likes-helped-trump-win
vir fotografij: www.johnholcroft.com

Na vrh članka