Kahtlemata võib meist kujuteldamatult erinevate võõrolendite keel olla äärmiselt raskesti mõistetav, kuid Elliott eeldab, et mingi meilegi hoomatav grammatiline struktuur võib selles ometi peituda. Ellioti kirjutatud tarkvara edulootused rajanevad asjaolul, et kõigis keeltes, kui eriskummalised nad ka ei oleks, peaks leiduma korduvusi ja reeglipärasusi, mida saab statistiliste võtetega analüüsida.


“Keel peab olema kuidagiviisi strukutureeritud,” ütles Elliott ajakirjale New Scientist. “Muidu oleks ta ebatõhus ja kohmakas.”


Varem on teadlased leidnud võtteid, millega nullidest ja ühtedest koosnevat andmejada uurides aru saada, kas arukad kosmoseolendid on meile infot saatnud pildi, heli või teksti kujul. Elliott on nüüd siis sama rada pidi veidi edasi läinud ja välja mõeldnud, kuidas eristada tekstilisest infost sõnu ja lauseid.


Tema programm kõrvutab võõrolendite keelt 60 maailma keelega, mille süntaksi kohta ta on internetist kogutud näidismaterjali põhjal koostanud andmebaasi. Võrdlus peaks näitama, kas tundmatu keel on mõne tuntuga struktuurilt lähedane.


Kõik inimkeeled sisaldavad erilisi sõnu, mis liigendavad pikema tekstijada lühemateks fraasijuppideks, et jutt oleks paremini haaratav või mõistetav. Eelmises lauses täidavad seda rolli näiteks “mis” ja “et”. Elliott väidab, et üheski maailma keeles ei ole kahe seesuguse fraasieraldaja vahel rohkem kui üheksa muud sõna. See piirang paistab olevat vastavuses inimese vastuvõtuvõimega: rohkem ei suuda aju korraga keelelist infot haarata.


Kui aga meie kauged suhtluspartnerid peaksid oma kõnes kasutama enamast kui üheksast sõnast koosnevaid fraase, tuleks Elliotti arvates järeldada, et nad on meist infotöötlussuutlikkuse alal üle.


Briti teadlane loodab, et tema programm oskab võhivõõrkeelsest tekstist välja noppida ka eri sõnaliike ning osutada meile, millised võiksid seal olla nimi-, tegu- või omadussõnad. Näiteks omadussõnu võib üles leida selle põhjal, et nad kipuvad olema nimisõnade läheduses.


Elliott möönab, et sisulist tõlget tema programmilt oodata ei maksa. Selleks oleks tõenäoliselt ikka vaja midagi sõnaraamatulaadset.