11.12.2013, 09:30

VANA KULD: “Ma teadsin, kus Osama bin Laden end varjab!”

Kalev Leetarule omistati „Foreign Policy Magazine's Top 100 Global Thinkers“ auhind.
Seoses sellega taasavaldame 2011. aasta septembris ilmunud intervjuu.

Eesti päritolu Illinoisi ülikooli teadur Kalev Leetaru (29) otsib — ja leiab — 100 miljoni meediaartikli seast viiteid kaalukatele tulevikusündmustele.

Toivo Tänavsuu

Toivo.Tanavsuu@ekspress.ee

Infokaevur: Kalev Leetaru töölaual on kõik vajalik, et sukelduda digitaalse informatsiooni ookeani. (erakogu)

Paari nädala eest levis meedias uudis USA Illinoisi ülikooli teadlasterühma avastusest. Tohutut infohulka arvuti abil analüüsides jõudsid teadlased põnevate tulemusteni: meediapildi baasilt oli võimalik Egiptuse ja Liibüa rahutusi ning sealsete diktaatorite kukutamist mitu kuud ette ennustada ning isegi esiterrorist Osama bin Ladeni asukoht oli enam-vähem selge ammu enne, kui USA eriüksused ta tabasid. Ühtäkki paljude huviorbiiti tõusnud uurimisgruppi juhib Eesti juurtega Kalev Leetaru. Tema vanavanemad põgenesid Eestist Teise maailmasõja alguses, vanaema Ilse Leetaru oli tuntud kunstikollektsionäär.

Krapsaka olemise ja tempoka jutuga Kalev Leetaru andis Ekspressile intervjuu skaibi teel.

Kes olid sinu vanavanemad?

Vanaisa Edmund oli arst, ta pidas New Yorgis erapraksist. Vanaema Ilse oli kunstnik, kes tegi mõned näitused ka Eestis. Nad elasid New Yorgis, aga mina kasvasin Texases Houstonis. Eesti keelt ma rohkem ei räägi kui “tere, kuidas käsi käib”, aga tore on taas Eestiga kontakti saada!

Mulle anti ökonoomikas kodutöö: analüüsida arvuti arengut viimastel kümnenditel ja kirjeldada selle põhjal, milline arvuti 2031. aastal välja näeb. Saad sa mind aidata?

(Naerdes) Huvitav küsimus. Tänapäeval on ahjud ja külmkapid internetiga ning kui tahad ehitada endale tõeliselt lahedat maja, ühendad selle internetti. Ja mida see kõik tähendab? Vanasti läksid arvuti taha, et sellega tööd teha. Nüüd on arvutid meie ümber ja taskus, isegi autod tõmbavad infot netist alla. Ühe klikiga on meil digitaalkujul kogu maailm taskus.

Kuhu hullumeelselt kiire tehnoloogiline revolutsioon välja viib?

Minu vanematest on mälestusena jäänud vaid mõned fotod, sest siis oli nende tegemine kallis lõbu. Nüüd pannakse iga päev üle miljardi pildi Facebooki. Meie silme all käib ühiskonna otsesalvestus.

Lasin 100 miljonit artiklit läbi superarvuti, korjates välja 10 miljardit isikut ning üle 100 triljoni seose. Uurisin seda kõike, nagu valgustaks taskulambiga pimedat tuba: millised mustrid välja joonistuvad?

Esimene avastus oli, et maailma ja eri riikide kohta käivate uudiste toon muutub ajas.

Seda vist nimetatakse andmekaeveks?

Just. Varem kaevati numbrilises infos majandusotsuste tegemiseks. Kuhu liiguvad turud, milliseid aktsiaid osta või müüa? Mina olen aga esimeste seas, kes avastas, et samamoodi võib analüüsida ka uudiste ja sotsiaalmeedia tooni.

Näiteks tegin valiku kõigist 30 aasta jooksul eri keeltes ilmunud raadio- ja telesaadetest, ajalehtedest ja ajakirjadest, otsides märksõnu Egiptuse kohta. Oli see kas või vietnamikeelne raadiosaade — ma tõlkisin ta inglise keelde. Siis võrdlesin Egiptusest rääkivate uudiste tooni viimasel 30 aastal ja viimasel 5 kuul enne rahutuste puhkemist. Üsna selgelt tuli välja, et toon muutus negatiivseks vahetult enne mäsu puhkemist.

Sa nägid tänavarahutusi oma graafikutes ette?

Egiptuses polnud nii, et ühel hommikul ärkasid inimesed üles ja otsustasid laamendama hakata. Globaalsest uudistoonist võib välja lugeda, et pilved hakkasid Egiptuse kohal tumenema juba kümme aastat tagasi. Kirikupommitamine viimasel vana-aastaõhtul andis sellele pöördumatu kursi. Egiptlased, kes olid vabaduse ja demokraatia oma turvalisuse nimel ohverdanud, tundsid ühtäkki, et neil pole enam turvaline. Ja maailm tajus — valikut pole, nüüd läheb madinaks.

Ma ei väida, et olen leiutanud kristallkuuli, mis lahendab kõik maailma probleemid. Tahan öelda, et suures info-ookeanis, kuhu me iga päev upume, peitub veepinna all haarav maailm, millele me pole veel mõelnudki. Mida kõike saab sellise lähenemisega ette näha, ei tea ma veel isegi.

Aga kuidas sul küll õnnestus määrata 200ruutkilomeetrise täpsusega Osama bin Ladeni asukoht?

Võtsin kogu bin Ladeni teemalise meediakajastuse kümne aasta jooksul ning korjasin välja kõik asukohaviited: linnade, tänavate, jõgede ja mägede nimed. Neid kaardile kandes oli päris hästi näha, kuhu enamik teid enne tema tabamist viisid — umbes 200ruutkilomeetrisele alale Loode-Pakistanis, kus ta ka kinni nabiti.

Muidugi ei näidanud arvuti mulle konkreetset linna ega tänavat, kuid andis vihje, mida oleks saanud kasutada.

Küsimusele, miks selline meetod toimis, ei oska ma isegi veel vastata. Ühtede arvates said ajakirjanikud bin Ladeni asukohast vihjeid ning keskendusid sellele piirkonnale. Teiste arvates valis bin Laden teadlikult rahvastatud paiga, eeldades, et sealt niikuinii teda otsima ei tulda.

Geokodeerimine polnud arvuti jaoks lihtne. Uudises võib küll olla juttu näiteks Kairost, kuid analüüsima peab ka ülejäänud teksti, teadmaks, millisest Kairost käib jutt — maailmas on neid vist 36.

Tooni saab kindlaks teha märksõnade järgi. Inimesed on koostanud ja arvutile selgeks õpetanud positiivsete ja negatiivsete sõnade kogumikud. Näiteks “suurepärane”, “hea” ja “lahe” on ju positiivsed sõna, “hirmus” ning “jube” aga negatiivsed. Päris täiuslikud arvutid siiski pole, näiteks sarkasmi ja peent huumorit nad ära ei tunne.

Kust pärineb sinu analüüsitud meediaarhiiv?

Kasutan Briti luure andmebaase infoga alates 1979. aastast. Nad jälgivad Teisest maailmasõjast saati peaaegu kõiki planeedi raadioid, telejaamu, ajakirju ja ajalehti. Iga päev võetakse esinduslik valim kogu meediakajastusest ja tõlgitakse inglise keelde. Samuti kasutan ma tervet New York Timesi arhiivi ajavahemikust 1945–2005 ning Google Newsi viimase kuue aasta arhiivi. Sellest on tööks enam kui küll.

Kui palju su töö luureasutuste tähelepanu köitis?

Tagasiside on võimas! Tundub, et see töö mõjutab paljude elu, pannes nad uutmoodi mõtlema.

Ka eriteenistustele peaks see korda minema. On päris selge, et uudistest võib leida midagi, mida me päris täpselt veel ei mõista. Ma töötan paljuski katse-eksituse meetodil, üritades aru saada, mille otsa olen sattunud ja mida sellega reaalselt teha saaks. Ma alles avastan maailma.

Seni oli ennustustes toetutud teistele indikaatoritele. Arvatud, et riigipöörded toimuvad majanduse langemisel. Aga Egiptuses on majandus viimastel aastatel kenasti kasvanud.

Nii et olulisim on tegelikult hoopisõigete küsimuste esitamine?

Kõigele ma ilmselt uudistest vastuseid ei saa. Näiteks kas mu naaber on homme kodus või kes ülejärgmisel nädalal toidupoodi läheb. Küll aga saan vaadata suuri sotsiaalseid seaduspärasid — kuhu maailm suundub.

Palju on räägitud ulmekirjanik Isaac Asimovi psühhoajaloost — kuidas ennustada matemaatiliste valemitega suure rahvahulga käitumist. Kui ma võtan aluseks pärisuudised ning lisan veel sotsiaalmeedia, siis kes teab, mida selle kõigega saab ette näha.

Mida sa näed, kuhu maailm suundub?

Uudised on viimase 30 aasta jooksul muutunud aina negatiivsemaks. Ma ei tea, kas selle põhjus on meedia skandaalijanu või ongi maailm muutunud selliseks. Kuhu me nii läheme? Ma loodan, et mitte sinna, kuhu oleme suundumas. Üks on kindel: Saudi Araabiasse rahutused ei levi, seal jääb olukord stabiilseks.

Kas sul oleks võimalik 2001. aasta septembrile eelnenud uudistele toetudes ette näha terroriakte Ameerikas?

Ma tahaksin seda uurida küll. Luure toona raporteeris, et risk tõuseb, kuid poliitikud ei reageerinud. Nad arvasid, et Ameerikat pole keegi Ameerikas rünnanud ega ründa ka tulevikus.

Mu kolleegid palusid küsida, et kui sa juba tulevikku tead, siis äkki ütled, kus on Gaddafi, kas ja millal eurotsoon kokku kukub ning kas Venemaa ründab Eestit sõjaliselt või mitte?

Praegu töötan selle nimel, et teha infotöötlus kiiremaks. Egiptuse ja bin Ladeni uudiste uurimine võttis mitu kuud. Tulevikus võiks teha avaliku veebilehe, kus saaks reaalajas tuleviku kohta vastuseid anda.

Mis edasi saab? Millal euro kukub? Kas Venemaa ründab Eestit või Gruusiat? See oleks uurimiseks täiesti prototüüp-töö, sest ma ei tea, mida leiaksin.

Lahkud ülikoolist, lood oma firma ja teenid ennustamisega palju raha — kas sa sellele pole mõelnud?

Elame-näeme (naerab). Praegu on paljud uksed lahti.

Sa pole kunagi Eestis käinud. Milline mulje sul Eestist on?

Olen siin Ameerikas paari Eesti high-tech inimesega kohtunud. Paistab, et Eestist on kujunemas omalaadne Euroopa tehnoloogiakeskus ja see on vapustav!

Jah, peaksid oma uurimisrühmaga Eestisse kolima! Ja pere kaasa võtma.

(Naerab kõva häälega) Peret mul veel ei ole, olen abielus oma tööga. Aga ühel päeval … ühel päeval …

Arvutigeenius juba poisipõlves

■Arvutitega hakkas Kalev Leetaru toimetama varases nooruses. Keskkooli ajal käis ta praktikal USA superarvutirakenduste keskuses (National Center of Supercomputing Applications), kust sai 1993. aastal alguse veebibrauser Mosaic ja kogu moodne veeb. Kalev töötas end seal kiiresti üles veebialaste projektidega (VIAS, Editable Web Browser, Invisibase jt), hiljem sukeldus virtuaalreaalsuse maailma.

■Kui Kalev käis 8. klassis, kinkis geoloogist isa Hannes talle roboti, mille kasutajaliidese poiss ise ümber programmeeris. Sealt sai 1995. aastal alguse isa ja poja esimene ühine äri, mis tegeles toona uudsete interaktiivsete veebilehtedega.

■Kogu tema praegune töö on seotud suurte andmehulkade digiteerimise, analüüsi ja kasutamisega. Olgu luubi all siis pool miljonit Enroni e-maili enne kurikuulsa firma krahhi, USA ülikoolide poolt viimasel poolel sajandil väljastatud diplomid või massiivsed meediaarhiivid. Muuhulgas on ta uurinud sotsiaalmeedia mõju New York Timesi ja Wall Street Journali artiklitele USA viimaste presidendivalimiste eel, samuti seda, millises valguses räägitakse maailmas kliimamuutustest. Ühe oma teadustööna digiteeris Kalev Illinoisi ülikooli hoonetega seotud arhiivi — umbes 80 000 lehekülge teksti ja 100 000 fotot.

■Üks tema kõmulisematest avastustest uurimuses “Airbrushing History” tõi päevavalgele selle, kuidas Valge Maja muutis salaja oma veebilehel Iraagi sõjaga seotud dokumente, vähendades nende usaldusväärsust.

■Kalev on hinnatud esineja kodanikuajakirjanduse ja meediaanalüüsi teemadel. Tema nimel on kolm patenti ja veel umbes 50 leiutist (invention discosure). Hetkel kaardistab ta kõiki viimaste aastakümnete uudistest nähtuvaid seoseid — neid on seal arvuliselt kümneid triljoneid.

Kommenteeri Loe kommentaare