Kursus eespool õppiv Toomas Roosma on ka rohkem tekstirobotitest lugenud kui ta sõber: „Minu bakalaureusetöö teema on aidanud mind kurssi viia: uurisin närvivõrkude käitumist ehk olen pidanud närvivõrkudest lugema rohkem kui keskmine informaatikatudeng,“ räägib ta.

Tekstirobotid on tudengitel aga üsna laialdaselt kasutuses ja kuigi usaldusväärseks allikaks ei pea uut masinat ei õppejõud ega õpilased, on selle oskuslikust kasutamisest abi mõlemal. Vaid napi pooleaastase kasutamise järel hakkavad edumeelsed juba aimama, kuidas tehisintellekt võib muuta kogu haridussüsteemi.

Kiire areng – mis sügisel saab, ei tea veel keegi

Hiljuti koostati Tartu Ülikoolis juhend, kuidas kasutada tekstiroboteid õppetöös. Juhend tuleb aga juba sügisel küllap ringi teha, sest tekstirobotite maailm areneb väga kiirelt ja ka praegune juhend ei kaardista kõike.

„Arutasime suunise tegemise ajal, et peame olema valmis seda sügisel täiendama. Loodame, et sügiseks on selgem, kuidas saame ülikooliliikmetele võimaldada lihtsamat ligipääsu tasulistele versioonidele ning kui hästi töötab tarkvara, mis roboti ja inimese teksti eristab. Samuti ei puuduta suunis pildilist ja helilist materjali,“ selgitab juhendi tegemisel osalenud Tartu Ülikooli õppeprorektor Aune Valk.

ÜLIKOOLI SUUR VÕIMALUS: Tartu Ülikooli õppeprorektor Aune Valk kõneleb, et ülikooli kohustus on juhendada tudengeid tekstiroboteid ja muid digivahendeid oma erialases töös kasutama.

Juhendi järele oli ilmselge vajadus, sest kui mingi tehnoloogia on olemas ja vabalt või väikse tasu eest kättesaadav, siis võib kindel olla, et seda ka kasutatakse. Valk on veendunud, et tekstirobotites on peidus palju võimalusi: ülikooli suur võimalus ja kohustus on juhendada tudengeid tekstiroboteid ja muid digivahendeid oma erialases töös kasutama.

„Just ülikoolidel on oskused ja teadmised ning ühtlasi kohustus hinnata tehisintellekti ohte ja leida viise, kuidas kasutada ära sellega kaasnevaid uusi võimalusi. Meie kohus on valmistada oma tudengeid ette maailmaks, mille loomulikuks osaks tehisintellekt kahtlemata saab – seetõttu pole mõeldav, et keelame selle kasutamise õppetöös ära. Kui tänavatele ilmusid esimesed autod, tuli õppida nendega sõitma ja nendega koos tänaval liiklema, selle asemel, et neid ära keelata. Õppima pidid ka need, kes ise eales autorooli ei istunud. Samamoodi peame kõik õppima tehisintellektiga vastutustundlikult koos elama.“

Pea nõu nagu kaaslasega arutades

Valk võtab juhendi mitmeleheküljelise teksti kokku lihtsamalt punktidega:

  • õppejõud võib oma aines seada kasutusele piirangud;

  • kui kasutad, siis kasuta eesmärgipäraselt, motiveeritud mahus, suhtu kriitiliselt, kirjelda ja viita;

  • pea nõu nagu kaaslasega arutades, tekstirobot on kui kõrvaline abi;

  • tekstiroboti loodud teksti esitamine enda nime all on akadeemiline petturlus.

    Kes tahab terviklikku juhendit lugeda, saab seda teha siit!

Enamiku õppejõudude ja tudengite tagasiside põhjal on juhend vajalik ja abiks – nii tudengid kui õppejõud kinnitavadki, et robotid on töös juba niikuinii, konkreetne juhend aitab selgust luua. „On ka neid, kes on väga kriitilised nii tekstirobotite kasutamise kui nende väljundite kvaliteedi suhtes,“ selgitab Valk, kelle sõnul sündis ülikooli juhend töögrupi koostöös ning konkreetselt mõnda juba olemasolevat juhendit aluseks ei võetud.

HARJUDA TULEB KÕIGIL: harjusime autoga, harjume ka robotitega.

Katsetamisel on tehnilised vahendid, et teha vahet õppuri ja tekstiroboti loodul. „Turnitini plagiaadituvastustarkvaral on olemas eraldi tööriist, mis suudab tuvastada tehisintellektiga loodud teksti. Oleme seda testinud ning ingliskeelsete tekstide puhul tuvastab Turnitin tehisintellektiga loodud teksti väga hästi. Tõlgete puhul sõltub tuvastuse efektiivsus sellest, kui keeruka tekstiga on tegemist. Kuna nii juturobotid kui ka plagiaadituvastussüsteemid pidevalt arenevad, siis on keerukas öelda, mis saab tulevikus,“ nendib Valk.

Ülikoolis on võimalus vähendada tekstirobotite abil n-ö akadeemilist „lihttööd“ – saada materjalist kiirem ülevaade; lühendada, korrigeerida teksti, tõlkida. Õppeprorektor Aune Valgu sõnul tunnetab ta pikaajalist ohtu, kui tehisintellektil tekib teadvus ja soov ise otsustada – see on debatt, mida eestlastest on kõige tõsisemalt vedanud Jaan Tallinn.

„Praegune tekstirobot, mille kohta me suunise tegime, raputab ülikooliharidust. See nõuab paljudelt inimestelt uuel viisil mõtlemist ja tegutsemist ning oma senise tegevuse ümber hindamist ja võib seega olla ebamugav, aga suurt ohtu ma selles ei näe,“ arvab Valk.

Ilusasti vormistatud viide – aga täielik jamps

Tartu Ülikooli kommunikatsiooni- ja infoteaduste õppejõud Krista Lepik on katsetanud tehisintellekti õpilastele antud koolitöödes, andnud ülesande koostada juturoboti tasuta versiooni abil referaat. Õpilased aga tõdesid, et roboti väidete kontrollimine on raskemgi kui ise usaldusväärsest andmebaasist info kokku kogumine. Juba etteantud justkui asjaliku teksti seest vigade leidmine on raske. Ideede kogumiseks on masin aga hea.

„Näiteks üks tudeng mainis, et on tehisintellektilt saanud ideid, milliseid vastusevariante enda loodavasse küsimustikku lisada. Või siis teine on kasutanud seda mõne keerulise tekstijupi tõlkimisel. Samuti programmeerimise õppimisel vigade otsimiseks – seda mainis õige mitu üliõpilast,“ selgitas Lepik.

Aga tõesel ja vääral on ka õppejõul raske vahet teha. Kuigi robot koostab imeliselt korrektsed viited – täpselt sellised nagu teaduspublikatsioonides nõutakse –, võib nii mõndagi „teadustööd“ igaveseks otsima jääda, seda polegi olemas.

KATSETAB ÕPPETÖÖS: Tartu Ülikooli kommunikatsiooni- ja infoteaduste õppejõud Krista Lepik.

„Kui tolle kodutöö, kus lasin tehisintellekti kasutada, töid kontrollisin, siis mul kuluski teatud osa ajast sellele, et kontrollida: kas need viited, mida tudengid esitasid, olid päris või hallutsineeritud. Tekstirobot oskab näiteks APA viiteid väga ilusti vormistada – see on ju täiesti tehniline oskus, teostatav. Aga sama hästi oskab tekstirobot n-ö sirge näoga hallutsineerida – ilusasti vormistatud viide, aga täielik jamps, sellist teost pole kunagi ilmunud,“ räägib Lepik.

Viidete kontrollimiseks on Lepiku sõnul lihtsaim viis kasutada Google Scholarit; Tartu Ülikoolil nagu ka teistel Eesti ülikoolidel on juurdepääsud kallitele ning väga headele teadusinfobaasidele, mille kasutamist ka tudengitele õpetatakse – sealt saab juba põhjalikumalt kaevata.

Lepik soovitab olla väga kriitiline ka tekstiroboti kokkukirjutatu suhtes, sest oma olemuselt on see keelemudelitele tuginev tekstigeneraator - ja Lepiku kogemuse põhjal võib ka konkreetset teksti ette andes masinast tulla muude allikate baasilt genereeritud teksti. „Eriti kui küsid täiendavaid küsimusi ja tekstirobot „unustab“ ära, mis oli algallikas, ja hakkab muude allikate pealt „udutama“,“ teab Lepik.

Kuidas luua võrdväärsed võimalused?

See, kas tudengite hulgas võib tekkida tulevikus vahe, kes saab lubada endale tasulisi versioone, kes peab vabavaraga läbi ajama, oleneb tehisintellektiga seotud firmade hinnapoliitikast.

„Praegu on mingi hulk päringuid OpenAI-s tasuta, kusagilt väljundi mahu pealt tuleb aga hakata maksma. Või vastupidi ka: Bing Chat AI annab mulle 20 prompti päevas tasuta. Seda on ju täitsa omajagu – kui kodutöö tähtaeg on näiteks kümme päeva ette teada, siis selle aja peale saab 200 prompti hea planeerimise korral sisestada. Pole ju paha? Ja ma näen ikka tudengite pealt, et aja planeerimise oskus tahab vahel harjutamist – äkki on see omamoodi hea, kui selline hinnapoliitika õpetabki paremini oma aega planeerima?“ arutleb Lepik.

MÕTTEAINE NII ÕPPEJÕUDUDELE KUI KA TUDENGEILE: Huvitav, kas tuleb tagasi pöörduda paberil ja pastakal eksamite juurde, et oleks selge, et õpitööd ei tee ära robot?

„Mingi vahe on juba praegu: kes on ikka fänn ja tahab katsetada, siis raha, mille ta muidu kulutaks Steamis arvutimängudele või pubis õllele, võib ta päris kergelt tehisintellekti alla magama panna. Ning inimesed võivad olla väga leidlikud. Sellest räägitakse algoritmipädevuse uuringutes, kuidas näiteks noored kasutavad erinevaid väikeseid nõkse, et Google nende järel nii palju ei nuhiks ja neid filtrimulli ei sulgeks – kasutavad erinevaid päringuid, veebibrauseri inkognito varianti jms. Ma arvan, et kui tekiks selline olukord, kus peaks tõesti maksma hakkama, siis leitaks ka need võimalused üles: teed endale eri keskkondadesse kontosid, kohandad natuke oma käitumist vastavalt erinevatele hinnastuspoliitikatele. Ja see on ka tegelikult oluline oskus, kuidas viisakalt legaalseid vahendeid kasutades infotööstuse gigantide keskel odavamalt hakkama saada.“

Lepiku sõnul on tema roll ja vastutus infoteaduste õppejõuna arutada oma eriala tudengitega, kuidas tekstirobotid infootsingut muudavad, millega tuleb ettevaatlik olla (nagu ka praegu Google’i puhul) ja kus on võimalikud kallutatused, milles puudub piisav läbipaistvus. Kui ei ole ka kirjalikud kodutööd, siis seminarides käsitletakse teemat kindlasti üheskoos, see on juba väga loov protsess, ja võimalik, et isegi vaid mõne tunni küsimus enne seminari. Milline on meie arusaam tehisintellektist sügiseks, seda ei või ette teada.“

„Ilmselt me ei hoomagi, milleni tehisintellekti kasutuselevõtt võib viia või kui suurt osa meie elust see juba hõlmab.“

Ave Kadakas, Tartu Ülikooli tudeng.

Ave Kadakas õpib Tartu Ülikooli ühiskonnateaduste instituudis infokorraldust ning tema esimene kokkupuude tekstirobotiga oli seoses õpingutega käesoleval kevadsemestril, kui ta jõudis ChatGPTni, ja ta kasutab seda vahel praegugi.

„Tekstide kirjutamise puhul kipub olema nii, et konkreetse idee puudumisel on alustamine kõige raskem. Väsinud peaga hilisõhtul koolitööd tehes on olnud tekstirobot abiks näiteks referaadi teemapunktide ideede genereerimisel. See on natuke nagu õngitsemine – viskad õnge välja, vaatad, mis otsa jääb, ja sealt edasi otsustad, mida saagiga edasi teha,“ räägib Kadakas. Talle on robot olnud abiks ka mõne keerulisema võõrkeelse tekstilõigu tõlkimisel ja lihtsalt huvi pärast on ta katsetanud tekstiroboti tekstide ümbersõnastusoskust ja analüüsinud, milline on seejuures sisuline kadu.

Tasuta ChatGPT versioon on Kadakale küll vahel sobivaid allikaid leidnud, kuid enamasti mitte. „Praegu ma ei pea ChatGPTd veel kuigi usaldusväärseks abiliseks ja eelistan seda kasutada pigem ideeotsakeste leidmiseks.“

Kadakas arvab, et tekstirobotitele ja laiemalt tehisintellektile on mõistlik läheneda tasakaalukalt ja rahulikult.

„Kuna seda džinni ei ole enam võimalik pudelisse tagasi panna, siis on ehk mõttekas suunata oma energia tehisintellekti heade kasutusvõimaluste ja võimalike ohtude tundmaõppimisele, olla teadlik tarbija. Samuti võiks ühiskond olla hästi informeeritud sellest, kuidas me tegelikult juba kas erinevaid tekstiroboteid või üldse tehisintellekti kasutame ning millele igaüks oma nutikäitumise juures peaks tähelepanu pöörama,“ mõtiskleb Kadakas. „Ilmselt ei hoomagi me n-ö mitteekspertidena, milleni tehisintellekti kasutuselevõtt võib viia või kui suurt osa meie elust see juba hõlmab.“

LÄHENEDA TASAKAALUKALT JA RAHULIKULT: tekstiroboteid ei ole võimalik enam pudelisse tagasi panna.

Mis tekstiroboti kõhus toimub?

Meelis Kull, Tartu Ülikooli andmeõppe õppejõud, aitab mõista, kuidas tekstirobot töötab. Selleks, et saada vastust, tuleb sisestada prompt ehk viibe, lähtetekst. Kuna masinal on kindel arv mõttesamme, siis võiks ju arvata, et mida täpsem viibe, seda parem vastus.

„Keerulisemate ülesannete puhul on prompti põhjalikkusest olulisemgi see, et masina vastus oleks pikem ja detailsem. Kui promptis nõuda, et masin esitaks oma lahenduse sammhaaval, siis on lõppvastus sagedamini õige kui lühivastuse nõudmisel. Paraku üldist ja ainuõiget retsepti ideaalse prompti kirjutamiseks pole ning kindlasti tasub ise katsetada erinevate promptidega,“ kirjeldab Kull.

Ka on oluline teada, et tekstirobot juba väljastatud teksti tagasi võtta ei saa ning juba rappajooksnud jutt kipub seepärast sinna rappa jäämagi. Mõnikord aitab selle vastu palve oma eelnev jutt üle kontrollida, mispeale võib robot mõnikord oma vea ka avastada ning esitada seejärel korrektse vastuse.

PÖÖRDUB KA ISE TEKSTIROBOTI POOLE: Tartu Ülikooli andmeõppe õppejõud Meelis Kull.

Küllap on keerukam aga mõista tekstiroboti 96 kihti ja nende töötamist vastuse genereerimisel.

„ChatGPT viimase mudeli (GPT-4) ehitust on OpenAI täielikult salajas hoidnud, aga algsel mudelil (GPT-3.5) on 96 kihti ning igas kihis omakorda 96 alamosa, mida nimetatakse ka peadeks. Kokku võiks siis öelda, et sel mudelil on 96 x 96 ehk 9216 pead. Iga pea teeb isemoodi arvutust, saades ette eelmise kihi andmed ja andes oma tulemuse järgmisele kihile. Ühe kihi 96 pead teevad oma arvutusi üksteisest sõltumatult. Kuigi iga pea poolt tehtav arvutus on üpris lihtne ja kiire, siis kõigi nende tuhandete peade peale kokku saab mudel sooritada keerulisi ja nutikaid mõttekäikusid. Samas seab kihiline arhitektuur ka omad piirangud – kui 96 mõttesammust ei piisa järgmise tekstijupi kvaliteetseks ennustamiseks, siis võib mudel kergesti teha valesid ennustusi ja väljastada väärinfot.“

MÕTTESAMMUD: Robotile tasub ette anda rohkelt mõttesamme – nii on võimalik tõesemat infot saada.

Kulli sõnul saab õppetöös juturoboteid kasutada, küsides selgitusi ebaselgeks jäänud õppematerjali kohta, paludes näiteks mõnda definitsiooni seletada või tuua täiendavaid näiteid. „Teiseks võib paluda robotil võtta kokku näiteks mõne lisamaterjali pika teksti mõtte lühemalt, et õppimisel aega kokku hoida. Kolmandaks võib tudeng paluda juturobotil mingi materjali kohta kontrollküsimusi koostada ning tudengi vastuste õigsust kontrollida. Neljandaks on palju võimalusi saada abi teksti kirjutamise protsessis. Näiteks võib küsida ideid, millest kirjutada, või paluda teksti selgemaks ja arusaadavamaks ümber sõnastada. Selle kõige juures tuleb muidugi silmas pidada, et juturobot võib olla liiga enesekindel ja samas ikkagi eksida ja väärinfot jagada.“

„Alguses ei tulnud selle pealegi, mida kõike võib küsida.“

Meelis Kull, Tartu Ülikooli andmeõppe õppejõud

Õppejõud räägib, et pöördub ka ise juturoboti poole, millal ta vaid tunneb, et tahaks kelleltki nõu küsida või saada informatsiooni, mida on interneti otsingumootoriga raske või aeganõudev leida. „Algul ei tulnud tihti selle pealegi, mida kõike võiks juturobotilt küsida või paluda, samamoodi nagu kunagi ammu ei taibanud küsimuse tekkimise korral guugeldada. Nüüd olen üpris harjunud ja kasutan seda näiteks info otsingul, mõistetele selgituste saamiseks, lihtsamate probleemide lahendamiseks, programmeerimise abivahendina ning abilisena ettekannete koostamisel ja teksti viimistlemisel.“

KUI MÕISTUS OTSAS: Küsi nõu robotilt.

Eksamid suuliselt? Mida hinnata?

Nii õppejõudude kui õpilaste jutust kumab läbi küsimus, kas ja kuidas muutub hindamiste kord: kas peaks hinne kujunema hoopis digivahendi vabalt – paberi ja pliiatsiga eksamiruumis või suuliselt vastates?

„Arvan, et hetkel on väga vara öelda, mida tulevik toob,“ sõnab Tartu Ülikooli õppeprorektor Aune Valk ning selgitab, et kindlasti ei muutu ainult hindamine, vaid muutub ka osa ainete sisu. „Kõike, mida seni õpetasime, pole mõtet sellisena õpetada. Suulist eksamit saab teha aine lõpus väikese osalejate arvuga ainetes, aga kindlasti pole see lahendus igal pool.“

Tema sõnul on ülikoolis paarikümne aasta tagusega võrreldes juba muutunud see, et palju tehakse jooksvaid hindamisi (sh kodutööde) grupitööde vormis, mille eesmärk on pidevat õppimist toetada, hindamine ei toimu vaid ühe kõikehõlmava eksami kujul.

„Üks suund on teha ka ülesandeid, kus tekstiroboti kasutamine on lubatud või suisa kohustuslik ja kus tuleb demonstreerida oskusi, mida robotil (veel) pole,“ pakub ta lahenduse.

Vaidlevad tudengid: mida arvavad tehisarust informaatikaõppurid?

Tartu Ülikooli informaatika üliõpilased – Toomas Roosma 3. kursuselt ja Karl Martin Voovere 2. kursuselt – räägivad, kuidas nad tekstirobotit õppetöös kasutanud on, milles masin kasulik on olnud ja kui usaldusväärne on ta abimehena.

Kuidas esimese tekstirobotini jõudsid? Milliseid oled kasutanud?

Toomas: Esimest korda puutusin tekstirobotitega kokku umbes aasta tagasi, keeletehnoloogia aines. Seal alustati lihtsate statistilistel näitajatel põhinevate mudelitega ja tutvustati LLMi (large language model) tööpõhimõtteid. Täpsemalt BERTi ja GPT-4-estoniani (GPT-3-l põhinev eesti keelele peenhäälestatud) mudel. Kui aasta tagasi kasutasin, ei olnud nad võimelised eesti keeles rohkemaks kui väga üldise (vigase) teksti genereerimine.

Tänasel päeval kuumaks teemaks olevast ChatGPTst kuulsin mullu novembris, kui uurimisrühmas, kellega bakatööd tegin, oldi elevil, et mudel suudab nii inglise kui ka eesti keeles adekvaatselt vastata väga spetsiifilistele küsimustele. Tookord kasutades ei olnud ma väga veendunud tema töökindluses, sest faktidega kippus eksima ning jutt tundus väga ümmargune. Nüüd on see kordades paremaks läinud, fakte teab paremini (kuigi spetsiifika nagu näiteks Eesti ajalugu on jätkuvalt mudelitele arusaamatu, faktiviga ajab teist taga).

Praegu kasutan GPT3.5 ja GPT4 (ChatGPT erinevad versioonid) sõltuvalt sellest, kas on vaja kiiret või täpsemat vastust. Ühtlasi koodi kirjutamiseks on hea abiline GitHub Copilot, mis „loeb mõtteid“ ehk varem kirjutatud koodi põhjal pakub, mida järgmisena lisada soovin.

TOOMAS JA TEHISINTELLEKT: Toomas Roosma on Tartu Ülikooli informaatika 3. kursuse tudeng. Toomas asus ChatGPTd kasutama eelmise aasta lõpus ning on leidnud sellele praktilist rakendust isegi endale ideaalse reisi planeerimiseks.

Karl Martin: Esimest korda tutvustas mulle GPT varajast versiooni minust aasta vanemal kursusel õppiv keskkooliaegne klassivend. Oli vist 2020. aasta sügis ja et GPT2ga polnud võimalik interakteeruda nagu kolmanda ja hilisemate versioonidega praegu, teoreetiline kirjeldus LLMide funktsionaalsusest tundus kõigest ägeda lubadusena. Alates sellest ajast olen aeg-ajalt OpenAI tegemistel silma peal hoidnud, kuid päris esimest korda logisin chat.openai.com leheküljele käesoleva aasta märtsis.

Kuidas tehisaru kasulik on olnud? Oskate ehk kirjeldada mõnda konkreetset juhtumit, kus robot näiteks andis motivatsiooni või inspiratsiooni mingi ülesande või tööga tegelema hakata, suunas mõne huvitava materjali kätte…

Toomas: Tehisintellekt on olnud kasulik:

valge lehe hirmust üle saamiseks. Kui anda kirjutatava teksti üldsõnaline teema ette, siis sissejuhatava tekstiga saab ChatGPT hakkama. Näiteks on see kasulik mõttepunktide genereerimisel, mida saan siis ise edasi mõelda. Sellisel viisil loodud tekstid ei sära originaalsusega, kuid kui piisavalt kaua edasi töödelda, saab hea tulemuse. Seevastu ei soovita kasutada spetsiifilisest teemast kirjutamiseks, sest ChatGPT oskab toota targana näivat faktiliselt ebakorrektset teksti.

programmeerimisel, kui ei ole kindel, milliseid abivahendeid kasutades on kõige mõistlikum ülesannet lahendada. See tähendab, et selle asemel et guugeldada, milline tehnoloogia on kõige mõistlikum X ülesande lahendamiseks, saan küsida ChatGPT-lt, mis on selle lahendamiseks parim viis. Õigesti sõnastades annab ChatGPT nimekirja erinevatest lahendusideedest, mille kohta on mul võimalik spetsiifilisemalt uurida. Suur eelis guugeldamise ees on see, et ei pea otsima neid variante reklaamide vahelt ja nõustuma saja erineva küpsisega.

Reisi planeerimine (GPT-4-le on võimalik anda ligipääs lehekülgedele, nagu Expedia, Kayak). Kirjeldasin, millist reisi soovin, kuhu piirkonda, mis kuupäevadel, mis eelarvega (mida täpsem, seda parem), ning GPT-4 sooritas päringuid eelmainitud lehekülgedele ning pakkus, kus ja millal ööbida, kuhu täpselt lennata jne. Kuna see oli rohkem katsetusena, kas see on võimalik, siis ei teinud kogu eeltööd ise, et leida, kas tõesti masin leidis parima reisikava. Kuid GPT poolt tehtu oli väga veenev.

KARL MARTIN JA TEHISINTELLEKT: Karl Martin Voovere on Tartu Ülikooli informaatika 2. kursuse tudeng, kes on tekstirobotit kasutanud alates selle aasta märtsist. Ta katsetab selle piire, on palunud anekdoote rääkida ja vastanud meilidele.

Karl Martin: Olen ChatGPTd kasutanud eri viisidel.

Võiks öelda, et omaette mõttetrenniks on, mida GPTga teha ei saa. Nii olen lasknud sel kirjutada anekdoote, modifitseeritud lühikesi stseene oma lemmikfilmidest, küsimusi mälumängule, vastanud meilidele ning kontrollinud, kas vahest on veel mõningaid aspekte, kuidas enda kodutööd saaksin lahendada.

Tegu on ühe imelise tööriistaga, kuid et iga vastus ei pruugi olla tõene, käsitlen seda pigem mugava ja käepärase otsingumootori kui üheselt tõese allikana. Teisalt tuleb tunnistada, et lapsepõlves nähtud telesarja tõttu, kus kõrvaltegelasena säras rääkiv auto, tabas mind teatav nostalgia, kui liidestasin ChatGPT kõnetuvastusega ning veetsin ühel õhtupoolikul pisut aega masinaga kõneledes. Robotlik intonatsioon küll domineeris, kuid eritletud mõtted jätsid mulje, nagu viibiks ruumis erudeeritud inimene.

Kõige raskem on küllap aru saada, kas see, mida ta ütleb, on tõene. Kuidas te ise selle välja selgitate? Hakkate guugeldama muid algallikaid?

Toomas: Enim kasutan ChatGPTd programmeerimisel, eriti just minu jaoks tüütutel ülesannetel ehk andmete visualiseerimiseks. Visualiseerimine on suhteliselt turvaline koht, kus ChatGPTd usaldada, sest pärast jooksutamist on kohe näha, kas kood töötab, nagu vaja.

Koodi jaoks, mis läheb korduvalt kasutamisele, loen alati mõttega üle ning kontrollin, kas kood ikka töötab nii, nagu mõtlesin. Kui olen kasutanud ChatGPT abi enda jaoks kaugema valdkonna, näiteks statistika jaoks, siis loen ChatGPT pakutud kokkuvõtte läbi, seejärel guugeldan ChatGPT väljundi peamisi mõtteid. Muidugi viib selline guugeldamine tihti foorumi lehekülgedele nagu https://math.stackexchange.com/, https://stackoverflow.com/ jne. Need on leheküljed, kus saab küsida küsimusi, ning asjatundjad (või vähem teadjad) inimesed vastavad.

Kui enne ChatGPT avalikustamist pidi kas küsima sealt foorumist ja lootma, et keegi vastab piisavalt kiiresti, või guugeldades sellele piisavalt sarnase küsimuse üles leidma, siis nüüd saab sama küsimuse esitada otse ChatGPT-le ning saadav vastus on sarnase kvaliteediga. Ei ole veendumust, et on õige, kuid sama küsitavus jääb ka interneti kommentaatorite puhul.

Karl Martin: Programmeerimise [õppimisega] ning informaatikaga laiemalt käib käsikäes guugeldamine, mis arvatavasti erineb teistest erialadest oma mahu poolest. On enam kui tõenäoline, et keegi on juba sarnase probleemi või veakoodiga oma pead vaevanud, mõnes tuntumas foorumis (https://stackoverflow.com/) abi küsinud ning ka ammendava vastuse saanud.

Samamoodi on harjumuspärane internetist erinevaid õpetusi järgides erinevate programmeerimiskeelte või algoritmide õppimine. Abiks tuleb efektiivne guugeldamisoskus ehk võimalikult täpsete märksõnade valik ja küsimuse defineerimine, kuid keerulisemate probleemidega on heinakuhjast õige nõela leidmine siiski küllaltki komplitseeritud. Siin ongi ChatGPT jt suurte keelemudelite suurim kasu – ajaline kokkuhoid. Ühte kohta koondatud nõuanded, millele saab vajadusel täpsustusi küsida ning parandusi soovitada – see teeb LLMi mudelite kasutamise võrreldes tavalise otsingumootoriga tõhusamaks.

Info õigsusse tuleb täna suhtuda kriitilise meelega, kuid usun, et pikemas perspektiivis mõjutab LLMide areng info otsimist oluliselt ning see muutub veelgi inimlikumaks kui täna.

SAITE KARL MARTINILT E-KIRJA?: Selle võis valmis kirjutada hoopis robot.

Kas oled kasutanud ainult tasuta vabavarasid või ka mudeleid, mis kasutavad nn kitsalt etteantud tekste?

Toomas: Olen kasutanud ChatGPT 3.5 (tasuta) ja 4 (tasuline). Teadustöid pole ette andnud täies mahus, sest hetkel on GPT 3.5 maksimaalne sisendi piirang umbes kolm lehekülge (4000 token’it, ehk 3000 ingliskeelset sõna või 1000 eestikeelset sõna). GPT4 sisendpiirang on kaks korda suurem ehk ingliskeelsed teadusartiklid mahuvad peaaegu tervikuna sisse, kuid eesti keel on selliseks kasutuseks liiga piiratud. Kuna minu „teadustöö“ on väga spetsiifilise närvivõrkude alamhulga töötamise kohta, siis mina pole suutnud lasta ChatGPT-l kokkuvõtteid kirjutada. Tekstimudelid üldiselt ei ole järelduste loomiseks treenitud, vaid teksti genereerimiseks.

Keeletehnoloogia raames sai mõnele (BERT) mudelile tehtud lisatreenimist ning tammsaarelikku teksti genereerima pandud. Tulemus oli… vahelduva kvaliteediga. Sõnastus ning keelendid olid justkui õiged, kuid sisu oli puudu.

Olen kasutanud uue (programmeerimis)raamistiku õppimiseks. Üks OpenAI keelemudelite probleemidest seisneb selles, et nende teadmised on piiratud aastaga 2021, seega pole nad kursis viimaste raamistikega, mis programmeerijatele loodud on. Olen kopeerinud raamistiku dokumentatsiooni ChatGPT-le ning palunud tal kirjutada mulle tutorial’i. Muidugi on internetis palju erinevaid õpetusi (tutorial’e), kuid need on üldised. ChatGPT-le saan seevastu öelda, et mul on Windowsi arvuti ning eelistan kasutada seda-seda-seda. ChatGPT suudab genereerida juhendi, kuidas uus raamistik tööle saada ning esimesed sammud teha.

Mida tekstirobotid sinu jaoks tähendavad? Kas see on vahend suure hulga nüri töö eemaldamiseks inimeste töölaualt või kujutavad need endast ohtu?

Toomas: Minu jaoks on tekstirobotid kui Google 2.0. See tähendab – nagu suvaline interneti otsing. Seda tuleb õppida kasutama, nagu ka guugeldama peab õppima. Kuid seevastu ei ole (veel) ChatGPT-s makstud sisu, reklaame, küpsiseid ega kõike muud tüütut. Kogu infosse, mida tekstirobot toodab, suhtun sama suure skeptilisusega kui infosse, mida internetist loen.

„Ei ole minul sisemist kindlust, millisel määral ChatGPT kasutamine loeb akadeemilise petturlusena, seega pigem olen ettevaatlik, kui kasutan liigselt.“

Toomas Roosma, Tartu Ülikooli tudeng.

Minu jaoks tähendab see võimalust delegeerida programmeerimise tüütud osad abilisele.

Kuid suur erinevus programmeerija ning muu töötaja vahel on guugeldamise kogus. Programmeerijad õpivad väga kiiresti ära, et ratast pole mõtet leiutada ning pigem tuleb õppida ratas internetist üles leidma, ehk guugeldama. Praegu alles õpin, kuidas keelemudelitelt „õigesti“ küsida, et saada vastus, mis mind kõige rohkem aitab.

Üks põhjustest, miks seda rohkem ei kasuta, on välja kujunemata eetikareeglid. Ei ole minul sisemist kindlust, millisel määral ChatGPT kasutamine loeb akadeemilise petturlusena, seega pigem olen ettevaatlik, kui kasutan liigselt. Ülikoolidel on ka väga umbsõnaliselt sõnastatud reeglid, mis võrdsustavad kogu ChatGPT-lt saadud info isikliku suhtluse kaudu saadud infoga, ehk tegu ongi justkui virtuaalse sõbraga.

Karl Martin: OpenAI tegevjuht Sam Altman kommenteeris hiljuti, et isegi kui kõik pikaajalised lootused realiseeruvad, on lähiajal maadvõttev ChatGPT jt LLM-tehnoloogiate põhjustatav elevus väga raskesti kontrollitav, mistõttu on spekulatsioonimerre uppumine praegu üpris lihtne.

Ons midagi seoses tekstirobotitega veel hingel?

Toomas: Hingel on hariduse tulevik. Mis saab kogu sellest põhimõttest, et hariduse rõhk on osata infot otsida ning tuupimine on halb, mida on räägitud viimased umbes kümme aastat? ChatGPT võimaliku kasutamise tõttu ei saa õpetajad veenduda selles, et kodutööd on õpilaste endi tehtud, seega on neil loogiline tuua hindamise lõviosa tagasi klassiruumidesse, kontrolltöödesse ja eksamitesse.

Kui seda teha aga mitteläbimõeldult või kiirustades, tasandab see kogu arengu selles valdkonnas ning oleme tagasi väga faktiteadmise-kesksel teadmiste kontrollimisel. Kuigi oleks just vaja kontrollida kriitilise mõtlemise oskust. Ning kardetavasti õpetajad peavad kiirustama, sest ChatGPT kasutamise oskus areneb noortes kiiresti, nagu ka guugeldamise oskus 20+ aastat tagasi.

Peamine põhjus, miks algul tundub, et ChatGPT on mõttetu, on kasutaja oskamatus õigesti küsimusi sõnastada. Täpselt nagu guugeldades, tuleb võimalikult täpselt kirjeldada, mida soovid. Kui guugeldamise kunst on võimalikult väheste sõnadega mõte kirja saada, siis LLMi tööpõhimõtte tõttu tuleb oma küsimust ChatGPT-le kirjeldada just võimalikult pikalt ning detailselt.

Karl Martin: Näib, et keelemudelid mõjutavad (ulatuslikult) tulevikus mitmeid valdkondi, kuid mis positsiooni võtab riik nende suhtes hariduse pakkumisel, teeb murelikuks. Arvestades, et mudelite teadmised-oskused on juba võrreldavad meie keskkoolilõpetajate omandatuga ning kasvavad väga tõenäoliselt veelgi, on nende laialdane väärkasutamine praeguses koolisüsteemis enam kui tõenäoline.

ChatGPT-laadsed tehnoloogiad pakuvad võimalust kodutöö olematu vaevaga tehtud saada, kuid õpiprotsess, mis seejuures läbikäimata jääb, ning lihtsaimat valikut kasutav käitumisharjumus mõjuvad pikas perspektiivis kahtlemata laastavalt õpilase konkurentsivõimele. Arvatavasti tõstatub seetõttu diskussioon LLM-tehnoloogia keelustamisest koolitöös, aga kas selle eiramine ikka parandaks õpilaste digipädevust ja konkurentsivõimet laiemas mõttes? Ootan selleteemalist sisulist diskussiooni haridus- ja teadusministeeriumist ning ka laiemat ühiskondlikku selgitustööd, mis on LLM-tehnoloogia eripäradeks ning mis ohud sellega kaasneda võivad.

Omal ajal sai Google’i otsingumootorist sünonüüm internetist info otsimisel, mis püsib ühiskonnas tänini „guugeldamise“ kaudu. Sestap on ehk huvitav küsida, mis termin läheb käibele tehisintellektilt info küsimise kohta.

Tehisaru on kui isiklik tuutor

Mari-Liis Allikivi, doktorant Tartu Ülikooli arvutiteaduse instituudi masinõppe uurimisrühmas

Mari-Liis Allikivi

Kuna minu eriala on masinõpe, olin suurte keelemudelite arengu ja edulooga kursis ning tuttav erinevate muljetavaldavate näidetega. Kui OpenAI 2022. aasta novembris ChatGPT avalikustas ning seda ise katsetada sain, jõudis arusaam sellest, kui võimsad need mudelid on, päriselt kohale. Praegu kasutan igapäevaselt OpenAI kõige uuemat, GTP-4 mudelit, mis on tasuline.

Minu lemmik kasutusviis keelemudelitele on mõelda neist kui isiklikust assistendist või tuutorist. Olukorras, kus ma pean tegema midagi täiesti esimest korda või aru saama materjalist, mis pole minu taustteadmistele sobival kujul, saan pöörduda mudeli poole, et saada täpselt nii üldine või spetsiifiline selgitus, kui mul vaja on. Väga paljud probleemid, mille puhul pidi varem veetma tunde või isegi päevi, käies läbi erinevaid infoallikaid, millest ükski pole täpselt sobiv ja siis sealt enda probleemile vastust otsida, on nüüd lahendatavad minutitega. Selline isiklik tuutor aitab hoida fookust lahendataval probleemil ning takistusi kiiremini ületada.

Nende mudelite kasutamisel peab arvestama, et vastused ei ole garanteeritult tõesed. Üks variant, eriti kui ma otsin mudeli abil infot, mille korrektsuses ma pean olema veendunud, on tõesti internetiotsingu abil väidetele kinnitust saada. Kuid asjade puhul, kus saan vale vastuse riski lubada, tavaliselt guugeldama ei hakka. Kui oled nt ChatGPT-d või muud analoogset mudelit mõni aeg kasutanud ning endale tuttavate valdkondade abil saanud tunnetuse, kui tihti ja millistes olukordades on vastused valed, siis tekib sisetunne, millal mudelit võib enam-vähem usaldada ja milliste ülesannetega see pigem hakkama ei saa. Muidugi võib see tunne ka petlik olla. Kuna väljund on alati väga viisakas ja informatiivne, siis võib eriti endale võõraste valdkondade kallal tööd tehes hakata mudelit liigselt usaldama. Aga vähemalt assistendi/tuutorina mudelit kasutades on töö efektiivsuse kasv seda riski väärt, vähemalt minule isiklikult.

„Valdkonna plahvatuslik edasiminek on olnud peadpööritav ka valdkonna enda inimestele.“

Ma olen olnud arvutiteadusega seotud alates 2010. aastast. Paljusid probleeme, mida me kõigest kümme aastat tagasi püüdsime lahendada ja mis näisid pea et lahendamatud, suudab nüüd lahendada üks keelemudel. Valdkonna plahvatuslik edasiminek on olnud peadpööritav ka valdkonna enda inimestele. Arengud on nii kiired, et ka ekspertidel on väga raske ennast kõige uuega kursis hoida.

Positiivse nurga alt vaadates leidub meeletult palju kasulikke rakendusi, mis kindlasti kas eemaldavad nüri tööd, või vähemalt teevad inimeste tööd efektiivsemaks. Minu lemmik rakendusvaldkond on vaieldamatult haridus. Jah, esmapilgul võib tunduda, et kui keelemudel kõik kodutööd ära lahendab, siis on tegemist pigem probleemiga. Kuid tegelikult on tohutu potentsiaal keelemudeli kasutamises õpilase isikliku tuutorina, kes suudab just konkreetset õpilast assisteerida talle sobilikul viisil, muutes õppimise loodetavasti palju sujuvamaks ja meeldivamaks. Selgus loob motivatsiooni – mida kergemini mõistavad õpilased materjali, seda motiveeritumad on nad teemaga edasi tegelema. Tuleb harjuda, kohaneda ja leida viise keelemudelite parimaks rakenduseks hariduses. Positiivseid näiteid leiab kindlasti ka teistest valdkondadest.

Ohtudest rääkides peab tõepoolest tõdema, et kogu teemat ümbritseb üsna suur ärevus, sest teadmatust on palju. Kindlasti on juba teadaolevaid ohte seoses andmekaitse, võltsinformatsiooni leviku jt probleemidega, mille mõningaseks haldamiseks on võimalik, kuid kindlasti mitte lihtne panna paika regulatsioone. Ning siis on teine, eksistentsiaalse ohu võimalikkuse üle käiv diskussioon. Et kas me suudame lähemal (või kaugemal) ajal jõuda üldise tehisintellektini ning kas selle üle on inimestel võimalik kontroll säilitada. Oma ala ekspertide arvamused on ühest äärmusest teise ning ongi väga raske konkreetset seisukohta võtta. Olukord on kiiresti muutuv, segadust ja teadmatust on omajagu ning ennustusi teha on keeruline.

Minu arvates peaksime leidma tehisintellektile võimalikult palju positiivseid rakendusi, kaardistama ja läbi mõtlema, mis vajab reguleerimist, mis mitte, ning hoidma näppu pulsil arengutel, et aru saada, kuhu ja kui kiiresti valdkond edasi liigub.

Robot ei suuda loetelu koostada

Krista Lepik, Tartu Ülikooli kommunikatsiooni- ja infoteaduste õppejõud
Deep Dreamsiga tehtud Art Deco versioon Krista Lepikust ja Krista Lepik ise.

Tegin just väikese katse: on üks väga hea erialane e-raamat, mis on avatud juurdepääsuga ja kõigile tasuta kätte saada. Ütlesin OpenAI InstructGPT tekstirobotile, et kirjutagu sellel ja sellel veebiaadressil oleva raamatu kohta kümne lause pikkune kokkuvõte. Tekstirobot tegi selle kokkuvõtte tõesti loetud sekunditega valmis.

Üldpilt on hea (tõenäoliselt tehisintellekt võtab midagi tolle e-raamatu metaandmetest või sagedamini esinevatest sõnadest ja argumentatsioonidest), aga sinna üldpilti tulevad pisikesed pudrutamised, mis asja kahtlaseks ajavad. Näiteks: „It examines major issues such as the rise of digital media, the prevalence of fake news, the development of sophisticated algorithms, and the rise of digital literacy initiatives in the public sphere.“ Viimane „suuremat sorti probleem“, mis siin loetelus on, ei ole tegelikult ju probleem, eks ole. Vaadake, loetelu koostamine on väga konkreetset läbimõtlemist eeldav tegevus: kui tahta head loetelu koostada, siis peab olema selle kohta teadmine, et mis ja miks loetellu sobib.

Tehisintellekt ei anna mulle siin vajalikku läbipaistvust. Või siis: „They argue that the digitalization of media and information literacy can no longer be ignored and must be taken seriously if we are to successfully navigate the digital landscape.“ Erialainimesena ma küsiks kohe, mis asi on „digitalization of media and information literacy“? Me ei räägi nii, sa ei saa mingit pädevust digitaliseerida. Ja kui esitada selline suur väide, nagu tekstirobot siin teeb, siis sellele peaks raamatus vihjeid leiduma – aga (meedia- ja infopädevuse) digitaliseerimisest pole selles raamatus juttu. Üldjoontes ei ole see kümne lause pikkune kokkuvõte paha, aga mind teevad esmajärjekorras murelikuks need kohad, kus tekstirobot tuleb mingi pudrutusega välja – ma tahaks siis teksti kontrollida, aga ei saa, sest seda konkreetset tekstikohta (et võttis nt leheküljelt 54) lihtsalt ei ole.

Tudeng võib seda kümnelauselist kokkuvõtet aga vaadata, mõelda, et käib küll (seal on palju põhjusi, miks „käib küll“), ja esitabki need mõtted. Kui õppejõud on ajahädas ja loeb pealiskaudselt, siis võibki selline töö läbi minna – ja kui see läheb alguses mingil väikese kodutöö tasandil, siis suurema rühmatöö tasandil, lõpuks lõputöö tasandil läbi – see on väga ohtlik…

Teine variant: lasin sama promptiga kokkuvõtte koostada OpenAI ChatGPT-l.

Jällegi väga ilus kokkuvõte, kuid minu jaoks liiga kirjeldav. Ma ei taha teada saada, millest raamatus on juttu (seda saab sisukorda lugedes teha), vaid ma tahan, et ChatGPT ütleks mulle kõige olulisemad mõtted raamatuga seoses. Küsingi niipidi: „Mis on selle raamatu kümme kõige olulisemat ideed?“ Saan kümme head mõtet, kuid need on küllaltki üldised. Milles siin probleem on (selle üle arutasime just hiljuti tudengitega): selleks et mingist materjalist saadud relevantsust hinnata, on erinevaid viise, kusjuures me ei tohi mitte mingi hinna eest muu hulgas alahinnata subjektiivset relevantsust ja olukorraga seotud relevantsust.

Kui väga hea promptiga saaks selle olukorraga seotud relevantsuse isegi kätte, siis see, kuidas ma subjektiivselt hindan, kas info on relevantne ja kas ta mulle sobib – selles osas tekstirobot mind aidata ei saa. Need olulisemad punktid, mille ma siit raamatust just lugedes enda jaoks välja noppisin, on palju konkreetsemad ja nendega kaasneb terve hulk teadmisi, mille lugemise käigus omandasin – ehk siis see info, mille ise välja noppisin, on oluliselt rikkalikum ja see on seotud nüüd juba mu teadmistega.

Või siis oleks mingit ajukiipi või värki vaja, mis seoks tekstiroboti meie olemasolevate teadmistega ja lingiks siis raamatust võetud mõtted nendega – aga kas me päriselt ikka tahaks seda?

Mõistan, et seesinane arutelu (just relevantsuse käsitlustest) võib tunduda natuke teoreetiline ja keeruline, kui igapäevaselt sama ala uurimisega ei tegele, aga eks see ongi minu kui infoteadlase asi taolistele asjadele tähelepanu pöörata.

Iva on aga just selles, et ainuükski süsteem ei saa meile ette öelda, mis on relevantne info – otsimootoriga saame küll leida päringutingimustele vastavat infot, kuid seal on omad kallutatused ja lõpuks otsustab kasutaja selle üle, mis on talle hea ja kasulik info.