Kui ma ühel kolmapäeva varahommikul kell 6.45 end Terevisiooni saates AI tuvastamisest rääkimas avastasin, ei osanud arvatagi, et sellest saab alguse masse kõitev diskussioon teemal, et kas meie inimeseks olemist hakkab tulevikus määrama see, kui pikka mõttekriipsu me oma tekstidesse lisame. Just see väike nipp jäi paljudele kõrvu, kui ma rääkisin, et tegelikult on AI loomingut inimloomigust üha raskem eristada ning meile on jäänud kätte vaid mõned õblukesed õlekõrred - näiteks kasvõi see, et ChatGPT’le meeldib mõttekriipsuna kasutada pikka em-kriipsu (em-dash).

Seega - kuidas siis lugu on - kas mõttekriips reedab usaldusväärselt, kas teksti on loonud inimene või AI? 

Ega siis midagi, käärime käised ülesse ja kaevame end “AI detektiivide” maailma sisse ja uurime, kuidas AI tuvastusega lugu on.

Tuvastamishullus

Mingis mõttes on soov AI’d tuvastada täiesti inimlik — tahaks ju teada, kas teisel pool teksti on päris inimene või mitte. Meid ju huvitab, kes siis ikkagi kirjutab. Mitte ainult uudishimust, vaid ka usalduse pärast. Kui tegu on (üli)õpilase tööga, siis tahame teada, kas see on ikka autori enda väljendus ja tugineb tema enda teadmistel või on selle kokku luuletanud masin. Kui uudisartikli või arvamuslooga, siis kas see on tulnud inimese mõttelennust või mingilt anonüümses pilves elavalt statistiliste algoritmide kogult.

Ja see teadmise janu on tekitanud omakorda terve tööstusharu. AI-detektorid, sisuanalüüsijad, spetsiaalsed teenused, mis lubavad tuvastada, kas teksti on kirjutanud ChatGPT, Claude või miski muu AI. Osad neist näevad väga usaldusväärsed välja — pane tekst sisse ja saad kena protsenditabeli, mis ütleb, kui “AI-sarnane” su lõputöö on. 

Aga kui veidi sügavamale vaadata, siis pilt läheb väga häguseks. Midagi ei ole teha - tõde ja usaldusväärsust jääb väga napiks.

Peaaegu kõik need tööriistad eksivad — ja mitte vähe. Nad annavad valepositiivseid (ehk ütlevad, et tekst on AI kirjutatud, kuigi pole) ja valenegatiivseid (ehk ei tuvasta AI-teksti ära). 

Oma silm on kuningas ehk siis otsustasin erinevaid tööriistu katsetada ja tulemus ei ole eriti julgustav. Mitmed paljukiidetud tööriistad nagu GPTZero, Originality.ai, JustDone jt ajavad pehmelt öeldes pada. 

Näiteks - sisestasin ChatGPT poolt geneeritud (esmase versiooni) selle artikli avapeatükist nii GPTZero’sse kui ka Originality.ai’sse ja mõlemad vastasid täiesti veendunult, et tegu on inimloominguga. 

GPTZero

“We are highly confident this text is entirely human”. Sorry sõbrad - aga teid tõmmati praegu haledalt haneks.

Originality.ai 

99% inimese kirjutatud! Ei, sõbrad - kahjuks ei ole.

Justdone

Aga ma proovisin teistpidi ka. Võtsin lõigu, mille kirjutasin ise ja söötsin sisse JustDone detektorile. See on selline tavaline mõtisklus sellest, kuidas me enne AI ajastut kirjutamisega hakkama saime. Panin selle JustDone'i detektorisse. Tulemus? “78% AI content.” 

Kuule - täitsa ausalt — kirjutasin selle ise siinsamas sinu input-väljal, mitte mudeliga. Aga näe - "Oled AI!", ütlevad AI-andurid. 

Kui aga AI suudab kirjutada nagu inimene, ja inimene kõlab nagu AI, siis kas me üleüldse saame enam küsida, kes kirjutas — või peaksime hoopis küsima, miks kirjutati?

Mõttekriips kui signatuur

Alguses kõlas see mulle rohkem naljana. Klassikaliine poolirooniline märkus, mille paned postituse lõppu — “NB! kui näed mõttekriipsu, siis loed ilmselt AI teksti”.

Aga siis hakkasid inimesed mu postituse all kaasa noogutama. Mitte ainult noogutama, vaid jagama omaenda kogemusi, kahtlusi, tähelepanekuid. Tuleb välja, et mõttekriips — see pikk, enesekindel (AI poolt automaatselt lisatud) märk — on saanud omamoodi signaaliks. Mitte ainult keeleline valik, vaid… potentsiaalselt reaalne jälg AI sekkumisest loomingusse.

Ja tuleb välja, et selline arvamus ei ole täiesti põhjendamatu. Tegime Kristiinaga ChatGPT Deep Researchi kasutades põhjaliku analüüsi — vaatasime, kuidas erinevad vestlusrobotid (ChatGPT, Bard/Gemini, Claude jt) kasutavad mõttekriipsu. Tulemus oli üsna selge: ChatGPT kasutab seda kõige rohkem. Ja mitte ainult meie ei märganud seda. Ka Washington Post on pühendanud terve loo sellele, kuidas pikk mõttekriips ehk em-dash on saanud “ChatGPT signatuuriks”. 

Jah, Em-dash’ist on nüüd saanud “AI red flag” — midagi, mis annab teksti päritolu kohta rohkem infot kui me võib-olla arvata tahaksime. Oo tekstis on kriips — äkki sa ikkagi ei kirjutanud ise, äkki on see tühipaljas tehisaru, stohhastiline papagoi? 

Ning kui üks kirjavahemärk jõuab kultuurikriitika veergudele, siis on selge, et ta kannab rohkem kui lihtsalt pausi — ta kannab ka kahtlust, konteksti ja kultuurilist tähendust.

Peab siiski mainima, et ChatGPT kasutab mõttekriipsu, sest inimesed kasutavad seda. Just sellistes tekstides, mida treenijad on pidanud “hea teksti näideteks": professionaalsetes esseedes, ajakirjanduses, blogipostitustes, arvamusartiklites. See ei ole mingi olemuslikult “masinlik” võte — pigem on see ikkagi inimlik. Ja seda kinnitavad ka reaktsioonid meie postitustele - kõikidele meeldib pikk kriips! 

Stiilid segunevad — ja sellega ka meie ootused

See, et mõttekriips sattus järsku kahtlusaluseks, ütleb midagi huvitavat meie enda stiilitunnetuse kohta. Me ei otsi enam lihtsalt “õiget” või “ilusat” keelt – me otsime märke. Signaale, mis annaksid meile kindluse, et loeme päris inimest. Aga mida see “päris” üldse tähendab? Kas see, et tekst pole enam perfektne? Kas peaks kasutama rohkem kõnekeelt? Midagi veelgi tooremat (wdyt)? Või teha teadlik valik ja jätta mõned asjad tekstis veidi logisema?

Facebookis jagasid inimesed enda kirjutamise/kriipsutamise harjumusi. Mõni kasutas mõttekriipsu teadlikult, mõni (nagu näiteks mina ise) polnudki varem märganud, kumb kriips ta klaviatuurilt tuleb. Mõni tunnistas, et on hakanud meelega vältima em-dash’i, sest ei taha, et tekst näeks välja nagu AI tehtud. Ja teised – noh, nemad ütlesid lihtsalt, et neile meeldib, kuidas mõttekriips “hoiab mõtte koos, aga laseb tal ka veidi hargneda”.

LinkedInis muutus arutelu veelgi tehnilisemaks ja detailsemaks. Toodi välja erinevad kriipsutüübid (em-dash, en-dash, sidekriips), stiilijuhised, formaalsuse tase. Jutt läks keeleoskusele, professionaalsusele, isegi kirjutamise esteetikale. Ja samas ei olnud keegi kindel, kust see piir jookseb – millal üks kriips on stiil, ja millal see on liiga stiilne, et olla usutav?

See kõik viitab ühele nihkele: me ei suhtu enam stiili neutraalselt. Kui varem oli hea kirjutamine midagi, mida õpetati (või vähemasti soovitati), siis nüüd on see saanud kahtlusaluseks. Kui keegi kirjutab liiga ladusalt, liiga sujuvalt – tekib küsimus: kas ta ikka kirjutab ise? Kas see tekst, mida sa ka just siin ja praegu loed on ikka inimese kirjutatud, äkki on seegi selleks liiga ladus? 

Ja mis veel huvitavam – AI ei jäljenda enam ainult meie stiili. Meie hakkame ka iseennast AI peeglist vaatama. Kasutame vähem keerukaid lausekonstruktsioone, jätame mõttekriipsu vahele, paneme teadlikult mõne kirjavea. Et näida... inimlikum? See on kummaline seis – me redigeerime oma isikupärast stiilitunnetust, et vältida muljet, et me oleme AI.

Mõnes mõttes on see üllatav, mõnes mõttes vältimatu. Niipea kui tekib masin, mis oskab hästi kirjutada, hakkab “hästi kirjutamine” kaotama oma selget tähendust. Selle asemel muutub tähtsaks miski muu – originaalsus, haavatavus, võib-olla isegi ebatäpsus. Midagi, mis annab meile signaali: siin oli inimene. Päriselt.

Aga kui ei saa tuvastada — mis siis saab?

Aga kui ikkagi selgub, et ei saa enam eristada teksti põhjal inimest AI’st — või kui saab ainult umbes — siis äkki teeme korra pausi ja küsime endalt, et mida me tegelikult teada tahame?

Meid ju ei tegelikult ei huvita, kas teksti genereeris tehisarust statistikamootor või meie inimajust näppudeni sööstvad neuroimpulsid. Meid huvitab tegelikult seal taga peituv inimene. Meid huvitab, kas see inimene on millestki aru saanud, midagi uut ja põnevat avastanud, midagi lahedat tähele pannud.

Kui keegi kirjutab esseed, siis võib-olla on tähtsam see, kas ta oskab oma väiteid kaitsta, mitte see, kas kõik laused on “tema enda kirjutatud”.

Kui mõni õppejõud tahab teada, kas tudeng teab, millest ta kirjutas, siis lihtsaim viis seda teada saada pole mitte tuvastustarkvara. See on... vestlus. Päris jutuajamine. Seal, kus inimene peab lahti rääkima, miks ta midagi väitis. See ei ole uus mõte, aga AI ajastul on see saanud uue kaalu.

Aga tööelus? Mõnes kontekstis ei loe enam, kes kirjutas. Loeb ainult see, kas tekst täidab oma eesmärki - eesmärki, mille inimene ise seadis. Kui dokument on lihtsalt info edastamise viis, siis võib-olla polegi vahet, kas selle pani kokku inimene, AI või nad koos.

Kriips ja kriitika

Kogu see jutt kriipsudest võib esmapilgul tunduda pisut naeruväärne. Nagu oleksime kõik korraga muutunud keeleinspektoriteks, kes luubiga otsivad tekstist tõendeid – kas see paus siin on inimese mõttepaus või masinlik efektiivsuse marker? 

Aga äkki peegeldab see midagi sügavamat. Me elame ajastul, kus piiritlus “mina kirjutasin” ja “see tekst lihtsalt tekkis” on muutunud häguseks. Ja selles hägususes on meil vaja mingeid pidepunkte. Isegi kui need on – kriipsud.

Mõttekriips ei ole iseenesest hea ega halb. Ta ei tõesta midagi. Aga tema ümber kerkinud arutelu näitab, et me tegelikult igatseme kindlust. Soovime mingit märki, mis ütleks: see tekst on autentne. Selle taga on keegi. Aga see “keegi” võib tänapäeval olla palju laiem mõiste kui varem. See võib olla inimene, kes lasi AI-l endale vastu vaielda ja siis koos kirjutada midagi ühist. Või tudeng, kes vormistas struktureeritud essee mustandi assistendi toel korrektsemasse keelde. Või hoopis autor, kes kirjutab 100% ise, aga laseb tekstil endal hinge tõmmata – mõttekriipsu kaudu.

Lõpuks, võib-olla on kõige mõistlikum mitte küsida: “Kas see on AI kirjutatud?”, vaid hoopis: “Kas see on mõtestatud?” Kas see viib kuhugi? Kas see käivitab mõttelennu? 

Kui vastus on jah, siis olgu see kriips või mitte – see tekst töötab.