Kuidas Tartu Ülikool tehisaruga koostööd alustas ja kuhu tehisintellekti kasutamine õppetöös viia võib, kirjutab Ester Vaitmaa.
Kaks endist klassivenda, kolmanda kursuse informaatikatudeng Toomas ja teise kursuse noormees Karl Martin saavad tavaliselt kokku, et kahekesi joosta – ja seal, mööda Emajõe kallast kaugusse kadudes asuvad nad kirglikult vaidlema, kas tekstirobotitest on rohkem rõõmu või muret. „Karl Martin tuleb oma lennukate ideedega tekstiroboti kasutamisest ja mina vaidlen vastu – sa ei taha võtta neid riske!“
Kursus eespool õppiv Toomas Roosma on ka rohkem tekstirobotitest lugenud kui ta sõber: „Minu bakalaureusetöö teema on aidanud mind kurssi viia: uurisin närvivõrkude käitumist ehk olen pidanud närvivõrkudest lugema rohkem kui keskmine informaatikatudeng,“ räägib ta.
Tekstirobotid on tudengitel aga üsna laialdaselt kasutuses ja kuigi usaldusväärseks allikaks ei pea uut masinat ei õppejõud ega õpilased, on selle oskuslikust kasutamisest abi mõlemal. Vaid napi pooleaastase kasutamise järel hakkavad edumeelsed juba aimama, kuidas tehisintellekt võib muuta kogu haridussüsteemi.
Kiire areng – mis sügisel saab, ei tea veel keegi
Hiljuti koostati Tartu Ülikoolis juhend, kuidas kasutada tekstiroboteid õppetöös. Juhend tuleb aga juba sügisel küllap ringi teha, sest tekstirobotite maailm areneb väga kiirelt ja ka praegune juhend ei kaardista kõike.
„Arutasime suunise tegemise ajal, et peame olema valmis seda sügisel täiendama. Loodame, et sügiseks on selgem, kuidas saame ülikooliliikmetele võimaldada lihtsamat ligipääsu tasulistele versioonidele ning kui hästi töötab tarkvara, mis roboti ja inimese teksti eristab. Samuti ei puuduta suunis pildilist ja helilist materjali,“ selgitab juhendi tegemisel osalenud Tartu Ülikooli õppeprorektor Aune Valk.
Juhendi järele oli ilmselge vajadus, sest kui mingi tehnoloogia on olemas ja vabalt või väikse tasu eest kättesaadav, siis võib kindel olla, et seda ka kasutatakse. Valk on veendunud, et tekstirobotites on peidus palju võimalusi: ülikooli suur võimalus ja kohustus on juhendada tudengeid tekstiroboteid ja muid digivahendeid oma erialases töös kasutama.
„Just ülikoolidel on oskused ja teadmised ning ühtlasi kohustus hinnata tehisintellekti ohte ja leida viise, kuidas kasutada ära sellega kaasnevaid uusi võimalusi. Meie kohus on valmistada oma tudengeid ette maailmaks, mille loomulikuks osaks tehisintellekt kahtlemata saab – seetõttu pole mõeldav, et keelame selle kasutamise õppetöös ära. Kui tänavatele ilmusid esimesed autod, tuli õppida nendega sõitma ja nendega koos tänaval liiklema, selle asemel, et neid ära keelata. Õppima pidid ka need, kes ise eales autorooli ei istunud. Samamoodi peame kõik õppima tehisintellektiga vastutustundlikult koos elama.“
Pea nõu nagu kaaslasega arutades
Valk võtab juhendi mitmeleheküljelise teksti kokku lihtsamalt punktidega:
õppejõud võib oma aines seada kasutusele piirangud;
kui kasutad, siis kasuta eesmärgipäraselt, motiveeritud mahus, suhtu kriitiliselt, kirjelda ja viita;
pea nõu nagu kaaslasega arutades, tekstirobot on kui kõrvaline abi;
tekstiroboti loodud teksti esitamine enda nime all on akadeemiline petturlus.
Kes tahab terviklikku juhendit lugeda, saab seda teha siit!
Enamiku õppejõudude ja tudengite tagasiside põhjal on juhend vajalik ja abiks – nii tudengid kui õppejõud kinnitavadki, et robotid on töös juba niikuinii, konkreetne juhend aitab selgust luua. „On ka neid, kes on väga kriitilised nii tekstirobotite kasutamise kui nende väljundite kvaliteedi suhtes,“ selgitab Valk, kelle sõnul sündis ülikooli juhend töögrupi koostöös ning konkreetselt mõnda juba olemasolevat juhendit aluseks ei võetud.
Katsetamisel on tehnilised vahendid, et teha vahet õppuri ja tekstiroboti loodul. „Turnitini plagiaadituvastustarkvaral on olemas eraldi tööriist, mis suudab tuvastada tehisintellektiga loodud teksti. Oleme seda testinud ning ingliskeelsete tekstide puhul tuvastab Turnitin tehisintellektiga loodud teksti väga hästi. Tõlgete puhul sõltub tuvastuse efektiivsus sellest, kui keeruka tekstiga on tegemist. Kuna nii juturobotid kui ka plagiaadituvastussüsteemid pidevalt arenevad, siis on keerukas öelda, mis saab tulevikus,“ nendib Valk.
Ülikoolis on võimalus vähendada tekstirobotite abil n-ö akadeemilist „lihttööd“ – saada materjalist kiirem ülevaade; lühendada, korrigeerida teksti, tõlkida. Õppeprorektor Aune Valgu sõnul tunnetab ta pikaajalist ohtu, kui tehisintellektil tekib teadvus ja soov ise otsustada – see on debatt, mida eestlastest on kõige tõsisemalt vedanud Jaan Tallinn.
„Praegune tekstirobot, mille kohta me suunise tegime, raputab ülikooliharidust. See nõuab paljudelt inimestelt uuel viisil mõtlemist ja tegutsemist ning oma senise tegevuse ümber hindamist ja võib seega olla ebamugav, aga suurt ohtu ma selles ei näe,“ arvab Valk.
Ilusasti vormistatud viide – aga täielik jamps
Tartu Ülikooli kommunikatsiooni- ja infoteaduste õppejõud Krista Lepik on katsetanud tehisintellekti õpilastele antud koolitöödes, andnud ülesande koostada juturoboti tasuta versiooni abil referaat. Õpilased aga tõdesid, et roboti väidete kontrollimine on raskemgi kui ise usaldusväärsest andmebaasist info kokku kogumine. Juba etteantud justkui asjaliku teksti seest vigade leidmine on raske. Ideede kogumiseks on masin aga hea.
„Näiteks üks tudeng mainis, et on tehisintellektilt saanud ideid, milliseid vastusevariante enda loodavasse küsimustikku lisada. Või siis teine on kasutanud seda mõne keerulise tekstijupi tõlkimisel. Samuti programmeerimise õppimisel vigade otsimiseks – seda mainis õige mitu üliõpilast,“ selgitas Lepik.
Aga tõesel ja vääral on ka õppejõul raske vahet teha. Kuigi robot koostab imeliselt korrektsed viited – täpselt sellised nagu teaduspublikatsioonides nõutakse –, võib nii mõndagi „teadustööd“ igaveseks otsima jääda, seda polegi olemas.
„Kui tolle kodutöö, kus lasin tehisintellekti kasutada, töid kontrollisin, siis mul kuluski teatud osa ajast sellele, et kontrollida: kas need viited, mida tudengid esitasid, olid päris või hallutsineeritud. Tekstirobot oskab näiteks APA viiteid väga ilusti vormistada – see on ju täiesti tehniline oskus, teostatav. Aga sama hästi oskab tekstirobot n-ö sirge näoga hallutsineerida – ilusasti vormistatud viide, aga täielik jamps, sellist teost pole kunagi ilmunud,“ räägib Lepik.
Viidete kontrollimiseks on Lepiku sõnul lihtsaim viis kasutada Google Scholarit; Tartu Ülikoolil nagu ka teistel Eesti ülikoolidel on juurdepääsud kallitele ning väga headele teadusinfobaasidele, mille kasutamist ka tudengitele õpetatakse – sealt saab juba põhjalikumalt kaevata.
Lepik soovitab olla väga kriitiline ka tekstiroboti kokkukirjutatu suhtes, sest oma olemuselt on see keelemudelitele tuginev tekstigeneraator - ja Lepiku kogemuse põhjal võib ka konkreetset teksti ette andes masinast tulla muude allikate baasilt genereeritud teksti. „Eriti kui küsid täiendavaid küsimusi ja tekstirobot „unustab“ ära, mis oli algallikas, ja hakkab muude allikate pealt „udutama“,“ teab Lepik.
Kuidas luua võrdväärsed võimalused?
See, kas tudengite hulgas võib tekkida tulevikus vahe, kes saab lubada endale tasulisi versioone, kes peab vabavaraga läbi ajama, oleneb tehisintellektiga seotud firmade hinnapoliitikast.
„Praegu on mingi hulk päringuid OpenAI-s tasuta, kusagilt väljundi mahu pealt tuleb aga hakata maksma. Või vastupidi ka: Bing Chat AI annab mulle 20 prompti päevas tasuta. Seda on ju täitsa omajagu – kui kodutöö tähtaeg on näiteks kümme päeva ette teada, siis selle aja peale saab 200 prompti hea planeerimise korral sisestada. Pole ju paha? Ja ma näen ikka tudengite pealt, et aja planeerimise oskus tahab vahel harjutamist – äkki on see omamoodi hea, kui selline hinnapoliitika õpetabki paremini oma aega planeerima?“ arutleb Lepik.
„Mingi vahe on juba praegu: kes on ikka fänn ja tahab katsetada, siis raha, mille ta muidu kulutaks Steamis arvutimängudele või pubis õllele, võib ta päris kergelt tehisintellekti alla magama panna. Ning inimesed võivad olla väga leidlikud. Sellest räägitakse algoritmipädevuse uuringutes, kuidas näiteks noored kasutavad erinevaid väikeseid nõkse, et Google nende järel nii palju ei nuhiks ja neid filtrimulli ei sulgeks – kasutavad erinevaid päringuid, veebibrauseri inkognito varianti jms. Ma arvan, et kui tekiks selline olukord, kus peaks tõesti maksma hakkama, siis leitaks ka need võimalused üles: teed endale eri keskkondadesse kontosid, kohandad natuke oma käitumist vastavalt erinevatele hinnastuspoliitikatele. Ja see on ka tegelikult oluline oskus, kuidas viisakalt legaalseid vahendeid kasutades infotööstuse gigantide keskel odavamalt hakkama saada.“
Lepiku sõnul on tema roll ja vastutus infoteaduste õppejõuna arutada oma eriala tudengitega, kuidas tekstirobotid infootsingut muudavad, millega tuleb ettevaatlik olla (nagu ka praegu Google’i puhul) ja kus on võimalikud kallutatused, milles puudub piisav läbipaistvus. Kui ei ole ka kirjalikud kodutööd, siis seminarides käsitletakse teemat kindlasti üheskoos, see on juba väga loov protsess, ja võimalik, et isegi vaid mõne tunni küsimus enne seminari. Milline on meie arusaam tehisintellektist sügiseks, seda ei või ette teada.“
„Ilmselt me ei hoomagi, milleni tehisintellekti kasutuselevõtt võib viia või kui suurt osa meie elust see juba hõlmab.“
Ave Kadakas õpib Tartu Ülikooli ühiskonnateaduste instituudis infokorraldust ning tema esimene kokkupuude tekstirobotiga oli seoses õpingutega käesoleval kevadsemestril, kui ta jõudis ChatGPTni, ja ta kasutab seda vahel praegugi.
„Tekstide kirjutamise puhul kipub olema nii, et konkreetse idee puudumisel on alustamine kõige raskem. Väsinud peaga hilisõhtul koolitööd tehes on olnud tekstirobot abiks näiteks referaadi teemapunktide ideede genereerimisel. See on natuke nagu õngitsemine – viskad õnge välja, vaatad, mis otsa jääb, ja sealt edasi otsustad, mida saagiga edasi teha,“ räägib Kadakas. Talle on robot olnud abiks ka mõne keerulisema võõrkeelse tekstilõigu tõlkimisel ja lihtsalt huvi pärast on ta katsetanud tekstiroboti tekstide ümbersõnastusoskust ja analüüsinud, milline on seejuures sisuline kadu.
Tasuta ChatGPT versioon on Kadakale küll vahel sobivaid allikaid leidnud, kuid enamasti mitte. „Praegu ma ei pea ChatGPTd veel kuigi usaldusväärseks abiliseks ja eelistan seda kasutada pigem ideeotsakeste leidmiseks.“
Kadakas arvab, et tekstirobotitele ja laiemalt tehisintellektile on mõistlik läheneda tasakaalukalt ja rahulikult.
„Kuna seda džinni ei ole enam võimalik pudelisse tagasi panna, siis on ehk mõttekas suunata oma energia tehisintellekti heade kasutusvõimaluste ja võimalike ohtude tundmaõppimisele, olla teadlik tarbija. Samuti võiks ühiskond olla hästi informeeritud sellest, kuidas me tegelikult juba kas erinevaid tekstiroboteid või üldse tehisintellekti kasutame ning millele igaüks oma nutikäitumise juures peaks tähelepanu pöörama,“ mõtiskleb Kadakas. „Ilmselt ei hoomagi me n-ö mitteekspertidena, milleni tehisintellekti kasutuselevõtt võib viia või kui suurt osa meie elust see juba hõlmab.“
Mis tekstiroboti kõhus toimub?
Meelis Kull, Tartu Ülikooli andmeõppe õppejõud, aitab mõista, kuidas tekstirobot töötab. Selleks, et saada vastust, tuleb sisestada prompt ehk viibe, lähtetekst. Kuna masinal on kindel arv mõttesamme, siis võiks ju arvata, et mida täpsem viibe, seda parem vastus.
„Keerulisemate ülesannete puhul on prompti põhjalikkusest olulisemgi see, et masina vastus oleks pikem ja detailsem. Kui promptis nõuda, et masin esitaks oma lahenduse sammhaaval, siis on lõppvastus sagedamini õige kui lühivastuse nõudmisel. Paraku üldist ja ainuõiget retsepti ideaalse prompti kirjutamiseks pole ning kindlasti tasub ise katsetada erinevate promptidega,“ kirjeldab Kull.
Ka on oluline teada, et tekstirobot juba väljastatud teksti tagasi võtta ei saa ning juba rappajooksnud jutt kipub seepärast sinna rappa jäämagi. Mõnikord aitab selle vastu palve oma eelnev jutt üle kontrollida, mispeale võib robot mõnikord oma vea ka avastada ning esitada seejärel korrektse vastuse.
Küllap on keerukam aga mõista tekstiroboti 96 kihti ja nende töötamist vastuse genereerimisel.
„ChatGPT viimase mudeli (GPT-4) ehitust on OpenAI täielikult salajas hoidnud, aga algsel mudelil (GPT-3.5) on 96 kihti ning igas kihis omakorda 96 alamosa, mida nimetatakse ka peadeks. Kokku võiks siis öelda, et sel mudelil on 96 x 96 ehk 9216 pead. Iga pea teeb isemoodi arvutust, saades ette eelmise kihi andmed ja andes oma tulemuse järgmisele kihile. Ühe kihi 96 pead teevad oma arvutusi üksteisest sõltumatult. Kuigi iga pea poolt tehtav arvutus on üpris lihtne ja kiire, siis kõigi nende tuhandete peade peale kokku saab mudel sooritada keerulisi ja nutikaid mõttekäikusid. Samas seab kihiline arhitektuur ka omad piirangud – kui 96 mõttesammust ei piisa järgmise tekstijupi kvaliteetseks ennustamiseks, siis võib mudel kergesti teha valesid ennustusi ja väljastada väärinfot.“
Kulli sõnul saab õppetöös juturoboteid kasutada, küsides selgitusi ebaselgeks jäänud õppematerjali kohta, paludes näiteks mõnda definitsiooni seletada või tuua täiendavaid näiteid. „Teiseks võib paluda robotil võtta kokku näiteks mõne lisamaterjali pika teksti mõtte lühemalt, et õppimisel aega kokku hoida. Kolmandaks võib tudeng paluda juturobotil mingi materjali kohta kontrollküsimusi koostada ning tudengi vastuste õigsust kontrollida. Neljandaks on palju võimalusi saada abi teksti kirjutamise protsessis. Näiteks võib küsida ideid, millest kirjutada, või paluda teksti selgemaks ja arusaadavamaks ümber sõnastada. Selle kõige juures tuleb muidugi silmas pidada, et juturobot võib olla liiga enesekindel ja samas ikkagi eksida ja väärinfot jagada.“
„Alguses ei tulnud selle pealegi, mida kõike võib küsida.“
Õppejõud räägib, et pöördub ka ise juturoboti poole, millal ta vaid tunneb, et tahaks kelleltki nõu küsida või saada informatsiooni, mida on interneti otsingumootoriga raske või aeganõudev leida. „Algul ei tulnud tihti selle pealegi, mida kõike võiks juturobotilt küsida või paluda, samamoodi nagu kunagi ammu ei taibanud küsimuse tekkimise korral guugeldada. Nüüd olen üpris harjunud ja kasutan seda näiteks info otsingul, mõistetele selgituste saamiseks, lihtsamate probleemide lahendamiseks, programmeerimise abivahendina ning abilisena ettekannete koostamisel ja teksti viimistlemisel.“
Eksamid suuliselt? Mida hinnata?
Nii õppejõudude kui õpilaste jutust kumab läbi küsimus, kas ja kuidas muutub hindamiste kord: kas peaks hinne kujunema hoopis digivahendi vabalt – paberi ja pliiatsiga eksamiruumis või suuliselt vastates?
„Arvan, et hetkel on väga vara öelda, mida tulevik toob,“ sõnab Tartu Ülikooli õppeprorektor Aune Valk ning selgitab, et kindlasti ei muutu ainult hindamine, vaid muutub ka osa ainete sisu. „Kõike, mida seni õpetasime, pole mõtet sellisena õpetada. Suulist eksamit saab teha aine lõpus väikese osalejate arvuga ainetes, aga kindlasti pole see lahendus igal pool.“
Tema sõnul on ülikoolis paarikümne aasta tagusega võrreldes juba muutunud see, et palju tehakse jooksvaid hindamisi (sh kodutööde) grupitööde vormis, mille eesmärk on pidevat õppimist toetada, hindamine ei toimu vaid ühe kõikehõlmava eksami kujul.
„Üks suund on teha ka ülesandeid, kus tekstiroboti kasutamine on lubatud või suisa kohustuslik ja kus tuleb demonstreerida oskusi, mida robotil (veel) pole,“ pakub ta lahenduse.
Vaidlevad tudengid: mida arvavad tehisarust informaatikaõppurid?
Tartu Ülikooli informaatika üliõpilased – Toomas Roosma 3. kursuselt ja Karl Martin Voovere 2. kursuselt – räägivad, kuidas nad tekstirobotit õppetöös kasutanud on, milles masin kasulik on olnud ja kui usaldusväärne on ta abimehena.
Kuidas esimese tekstirobotini jõudsid? Milliseid oled kasutanud?
Toomas: Esimest korda puutusin tekstirobotitega kokku umbes aasta tagasi, keeletehnoloogia aines. Seal alustati lihtsate statistilistel näitajatel põhinevate mudelitega ja tutvustati LLMi (large language model) tööpõhimõtteid. Täpsemalt BERTi ja GPT-4-estoniani (GPT-3-l põhinev eesti keelele peenhäälestatud) mudel. Kui aasta tagasi kasutasin, ei olnud nad võimelised eesti keeles rohkemaks kui väga üldise (vigase) teksti genereerimine.
Tänasel päeval kuumaks teemaks olevast ChatGPTst kuulsin mullu novembris, kui uurimisrühmas, kellega bakatööd tegin, oldi elevil, et mudel suudab nii inglise kui ka eesti keeles adekvaatselt vastata väga spetsiifilistele küsimustele. Tookord kasutades ei olnud ma väga veendunud tema töökindluses, sest faktidega kippus eksima ning jutt tundus väga ümmargune. Nüüd on see kordades paremaks läinud, fakte teab paremini (kuigi spetsiifika nagu näiteks Eesti ajalugu on jätkuvalt mudelitele arusaamatu, faktiviga ajab teist taga).
Praegu kasutan GPT3.5 ja GPT4 (ChatGPT erinevad versioonid) sõltuvalt sellest, kas on vaja kiiret või täpsemat vastust. Ühtlasi koodi kirjutamiseks on hea abiline GitHub Copilot, mis „loeb mõtteid“ ehk varem kirjutatud koodi põhjal pakub, mida järgmisena lisada soovin.
Karl Martin: Esimest korda tutvustas mulle GPT varajast versiooni minust aasta vanemal kursusel õppiv keskkooliaegne klassivend. Oli vist 2020. aasta sügis ja et GPT2ga polnud võimalik interakteeruda nagu kolmanda ja hilisemate versioonidega praegu, teoreetiline kirjeldus LLMide funktsionaalsusest tundus kõigest ägeda lubadusena. Alates sellest ajast olen aeg-ajalt OpenAI tegemistel silma peal hoidnud, kuid päris esimest korda logisin chat.openai.com leheküljele käesoleva aasta märtsis.
Kuidas tehisaru kasulik on olnud? Oskate ehk kirjeldada mõnda konkreetset juhtumit, kus robot näiteks andis motivatsiooni või inspiratsiooni mingi ülesande või tööga tegelema hakata, suunas mõne huvitava materjali kätte…
Toomas: Tehisintellekt on olnud kasulik:
● valge lehe hirmust üle saamiseks. Kui anda kirjutatava teksti üldsõnaline teema ette, siis sissejuhatava tekstiga saab ChatGPT hakkama. Näiteks on see kasulik mõttepunktide genereerimisel, mida saan siis ise edasi mõelda. Sellisel viisil loodud tekstid ei sära originaalsusega, kuid kui piisavalt kaua edasi töödelda, saab hea tulemuse. Seevastu ei soovita kasutada spetsiifilisest teemast kirjutamiseks, sest ChatGPT oskab toota targana näivat faktiliselt ebakorrektset teksti.
● programmeerimisel, kui ei ole kindel, milliseid abivahendeid kasutades on kõige mõistlikum ülesannet lahendada. See tähendab, et selle asemel et guugeldada, milline tehnoloogia on kõige mõistlikum X ülesande lahendamiseks, saan küsida ChatGPT-lt, mis on selle lahendamiseks parim viis. Õigesti sõnastades annab ChatGPT nimekirja erinevatest lahendusideedest, mille kohta on mul võimalik spetsiifilisemalt uurida. Suur eelis guugeldamise ees on see, et ei pea otsima neid variante reklaamide vahelt ja nõustuma saja erineva küpsisega.
● Reisi planeerimine (GPT-4-le on võimalik anda ligipääs lehekülgedele, nagu Expedia, Kayak). Kirjeldasin, millist reisi soovin, kuhu piirkonda, mis kuupäevadel, mis eelarvega (mida täpsem, seda parem), ning GPT-4 sooritas päringuid eelmainitud lehekülgedele ning pakkus, kus ja millal ööbida, kuhu täpselt lennata jne. Kuna see oli rohkem katsetusena, kas see on võimalik, siis ei teinud kogu eeltööd ise, et leida, kas tõesti masin leidis parima reisikava. Kuid GPT poolt tehtu oli väga veenev.
Karl Martin: Olen ChatGPTd kasutanud eri viisidel.
Võiks öelda, et omaette mõttetrenniks on, mida GPTga teha ei saa. Nii olen lasknud sel kirjutada anekdoote, modifitseeritud lühikesi stseene oma lemmikfilmidest, küsimusi mälumängule, vastanud meilidele ning kontrollinud, kas vahest on veel mõningaid aspekte, kuidas enda kodutööd saaksin lahendada.
Tegu on ühe imelise tööriistaga, kuid et iga vastus ei pruugi olla tõene, käsitlen seda pigem mugava ja käepärase otsingumootori kui üheselt tõese allikana. Teisalt tuleb tunnistada, et lapsepõlves nähtud telesarja tõttu, kus kõrvaltegelasena säras rääkiv auto, tabas mind teatav nostalgia, kui liidestasin ChatGPT kõnetuvastusega ning veetsin ühel õhtupoolikul pisut aega masinaga kõneledes. Robotlik intonatsioon küll domineeris, kuid eritletud mõtted jätsid mulje, nagu viibiks ruumis erudeeritud inimene.
Kõige raskem on küllap aru saada, kas see, mida ta ütleb, on tõene. Kuidas te ise selle välja selgitate? Hakkate guugeldama muid algallikaid?
Toomas: Enim kasutan ChatGPTd programmeerimisel, eriti just minu jaoks tüütutel ülesannetel ehk andmete visualiseerimiseks. Visualiseerimine on suhteliselt turvaline koht, kus ChatGPTd usaldada, sest pärast jooksutamist on kohe näha, kas kood töötab, nagu vaja.
Koodi jaoks, mis läheb korduvalt kasutamisele, loen alati mõttega üle ning kontrollin, kas kood ikka töötab nii, nagu mõtlesin. Kui olen kasutanud ChatGPT abi enda jaoks kaugema valdkonna, näiteks statistika jaoks, siis loen ChatGPT pakutud kokkuvõtte läbi, seejärel guugeldan ChatGPT väljundi peamisi mõtteid. Muidugi viib selline guugeldamine tihti foorumi lehekülgedele nagu https://math.stackexchange.com/, https://stackoverflow.com/ jne. Need on leheküljed, kus saab küsida küsimusi, ning asjatundjad (või vähem teadjad) inimesed vastavad.
Kui enne ChatGPT avalikustamist pidi kas küsima sealt foorumist ja lootma, et keegi vastab piisavalt kiiresti, või guugeldades sellele piisavalt sarnase küsimuse üles leidma, siis nüüd saab sama küsimuse esitada otse ChatGPT-le ning saadav vastus on sarnase kvaliteediga. Ei ole veendumust, et on õige, kuid sama küsitavus jääb ka interneti kommentaatorite puhul.
Karl Martin: Programmeerimise [õppimisega] ning informaatikaga laiemalt käib käsikäes guugeldamine, mis arvatavasti erineb teistest erialadest oma mahu poolest. On enam kui tõenäoline, et keegi on juba sarnase probleemi või veakoodiga oma pead vaevanud, mõnes tuntumas foorumis (https://stackoverflow.com/) abi küsinud ning ka ammendava vastuse saanud.
Samamoodi on harjumuspärane internetist erinevaid õpetusi järgides erinevate programmeerimiskeelte või algoritmide õppimine. Abiks tuleb efektiivne guugeldamisoskus ehk võimalikult täpsete märksõnade valik ja küsimuse defineerimine, kuid keerulisemate probleemidega on heinakuhjast õige nõela leidmine siiski küllaltki komplitseeritud. Siin ongi ChatGPT jt suurte keelemudelite suurim kasu – ajaline kokkuhoid. Ühte kohta koondatud nõuanded, millele saab vajadusel täpsustusi küsida ning parandusi soovitada – see teeb LLMi mudelite kasutamise võrreldes tavalise otsingumootoriga tõhusamaks.
Info õigsusse tuleb täna suhtuda kriitilise meelega, kuid usun, et pikemas perspektiivis mõjutab LLMide areng info otsimist oluliselt ning see muutub veelgi inimlikumaks kui täna.
Kas oled kasutanud ainult tasuta vabavarasid või ka mudeleid, mis kasutavad nn kitsalt etteantud tekste?
Toomas: Olen kasutanud ChatGPT 3.5 (tasuta) ja 4 (tasuline). Teadustöid pole ette andnud täies mahus, sest hetkel on GPT 3.5 maksimaalne sisendi piirang umbes kolm lehekülge (4000 token’it, ehk 3000 ingliskeelset sõna või 1000 eestikeelset sõna). GPT4 sisendpiirang on kaks korda suurem ehk ingliskeelsed teadusartiklid mahuvad peaaegu tervikuna sisse, kuid eesti keel on selliseks kasutuseks liiga piiratud. Kuna minu „teadustöö“ on väga spetsiifilise närvivõrkude alamhulga töötamise kohta, siis mina pole suutnud lasta ChatGPT-l kokkuvõtteid kirjutada. Tekstimudelid üldiselt ei ole järelduste loomiseks treenitud, vaid teksti genereerimiseks.
Keeletehnoloogia raames sai mõnele (BERT) mudelile tehtud lisatreenimist ning tammsaarelikku teksti genereerima pandud. Tulemus oli… vahelduva kvaliteediga. Sõnastus ning keelendid olid justkui õiged, kuid sisu oli puudu.
Olen kasutanud uue (programmeerimis)raamistiku õppimiseks. Üks OpenAI keelemudelite probleemidest seisneb selles, et nende teadmised on piiratud aastaga 2021, seega pole nad kursis viimaste raamistikega, mis programmeerijatele loodud on. Olen kopeerinud raamistiku dokumentatsiooni ChatGPT-le ning palunud tal kirjutada mulle tutorial’i. Muidugi on internetis palju erinevaid õpetusi (tutorial’e), kuid need on üldised. ChatGPT-le saan seevastu öelda, et mul on Windowsi arvuti ning eelistan kasutada seda-seda-seda. ChatGPT suudab genereerida juhendi, kuidas uus raamistik tööle saada ning esimesed sammud teha.
Mida tekstirobotid sinu jaoks tähendavad? Kas see on vahend suure hulga nüri töö eemaldamiseks inimeste töölaualt või kujutavad need endast ohtu?
Toomas: Minu jaoks on tekstirobotid kui Google 2.0. See tähendab – nagu suvaline interneti otsing. Seda tuleb õppida kasutama, nagu ka guugeldama peab õppima. Kuid seevastu ei ole (veel) ChatGPT-s makstud sisu, reklaame, küpsiseid ega kõike muud tüütut. Kogu infosse, mida tekstirobot toodab, suhtun sama suure skeptilisusega kui infosse, mida internetist loen.
„Ei ole minul sisemist kindlust, millisel määral ChatGPT kasutamine loeb akadeemilise petturlusena, seega pigem olen ettevaatlik, kui kasutan liigselt.“
Minu jaoks tähendab see võimalust delegeerida programmeerimise tüütud osad abilisele.
Kuid suur erinevus programmeerija ning muu töötaja vahel on guugeldamise kogus. Programmeerijad õpivad väga kiiresti ära, et ratast pole mõtet leiutada ning pigem tuleb õppida ratas internetist üles leidma, ehk guugeldama. Praegu alles õpin, kuidas keelemudelitelt „õigesti“ küsida, et saada vastus, mis mind kõige rohkem aitab.
Üks põhjustest, miks seda rohkem ei kasuta, on välja kujunemata eetikareeglid. Ei ole minul sisemist kindlust, millisel määral ChatGPT kasutamine loeb akadeemilise petturlusena, seega pigem olen ettevaatlik, kui kasutan liigselt. Ülikoolidel on ka väga umbsõnaliselt sõnastatud reeglid, mis võrdsustavad kogu ChatGPT-lt saadud info isikliku suhtluse kaudu saadud infoga, ehk tegu ongi justkui virtuaalse sõbraga.
Karl Martin: OpenAI tegevjuht Sam Altman kommenteeris hiljuti, et isegi kui kõik pikaajalised lootused realiseeruvad, on lähiajal maadvõttev ChatGPT jt LLM-tehnoloogiate põhjustatav elevus väga raskesti kontrollitav, mistõttu on spekulatsioonimerre uppumine praegu üpris lihtne.
Ons midagi seoses tekstirobotitega veel hingel?
Toomas: Hingel on hariduse tulevik. Mis saab kogu sellest põhimõttest, et hariduse rõhk on osata infot otsida ning tuupimine on halb, mida on räägitud viimased umbes kümme aastat? ChatGPT võimaliku kasutamise tõttu ei saa õpetajad veenduda selles, et kodutööd on õpilaste endi tehtud, seega on neil loogiline tuua hindamise lõviosa tagasi klassiruumidesse, kontrolltöödesse ja eksamitesse.
Kui seda teha aga mitteläbimõeldult või kiirustades, tasandab see kogu arengu selles valdkonnas ning oleme tagasi väga faktiteadmise-kesksel teadmiste kontrollimisel. Kuigi oleks just vaja kontrollida kriitilise mõtlemise oskust. Ning kardetavasti õpetajad peavad kiirustama, sest ChatGPT kasutamise oskus areneb noortes kiiresti, nagu ka guugeldamise oskus 20+ aastat tagasi.
Peamine põhjus, miks algul tundub, et ChatGPT on mõttetu, on kasutaja oskamatus õigesti küsimusi sõnastada. Täpselt nagu guugeldades, tuleb võimalikult täpselt kirjeldada, mida soovid. Kui guugeldamise kunst on võimalikult väheste sõnadega mõte kirja saada, siis LLMi tööpõhimõtte tõttu tuleb oma küsimust ChatGPT-le kirjeldada just võimalikult pikalt ning detailselt.
Karl Martin: Näib, et keelemudelid mõjutavad (ulatuslikult) tulevikus mitmeid valdkondi, kuid mis positsiooni võtab riik nende suhtes hariduse pakkumisel, teeb murelikuks. Arvestades, et mudelite teadmised-oskused on juba võrreldavad meie keskkoolilõpetajate omandatuga ning kasvavad väga tõenäoliselt veelgi, on nende laialdane väärkasutamine praeguses koolisüsteemis enam kui tõenäoline.
ChatGPT-laadsed tehnoloogiad pakuvad võimalust kodutöö olematu vaevaga tehtud saada, kuid õpiprotsess, mis seejuures läbikäimata jääb, ning lihtsaimat valikut kasutav käitumisharjumus mõjuvad pikas perspektiivis kahtlemata laastavalt õpilase konkurentsivõimele. Arvatavasti tõstatub seetõttu diskussioon LLM-tehnoloogia keelustamisest koolitöös, aga kas selle eiramine ikka parandaks õpilaste digipädevust ja konkurentsivõimet laiemas mõttes? Ootan selleteemalist sisulist diskussiooni haridus- ja teadusministeeriumist ning ka laiemat ühiskondlikku selgitustööd, mis on LLM-tehnoloogia eripäradeks ning mis ohud sellega kaasneda võivad.
Omal ajal sai Google’i otsingumootorist sünonüüm internetist info otsimisel, mis püsib ühiskonnas tänini „guugeldamise“ kaudu. Sestap on ehk huvitav küsida, mis termin läheb käibele tehisintellektilt info küsimise kohta.