Skoðun

Af for­dómum gervi­greindar, Gísla Marteini og því sem þú getur gert til að hafa á­hrif!

Lilja Dögg Jónsdóttir og Hafsteinn Einarsson skrifa

„Við í Vikunni erum að leita að dæmum um íslensk komment á netinu sem eru dónaleg eða aggresív, erum að vinna að smávegis innslagi.“

Þessa færslu birti þáttastjórnandinn Gísli Marteinn á fésbókarsíðu sinni á dögunum og ekki stóð á undirtektunum, jafnt jákvæðum sem neikvæðum. Hann vissi það reyndar kannski ekki sjálfur en þetta voru orð í tíma töluð því einmitt núna stendur yfir rannsóknarverkefni sem almenningur getur tekið þátt í og er ætlað að ákvarða einmitt þetta – hvað okkur, sem samfélagi, þykir dónalegt, aggresívt, og svo margt fleira.

Þetta verkefni mun ekki aðeins hjálpa okkur að þróa betri gervigreind fyrir íslensku, heldur einnig að varðveita og styrkja tungumálið okkar í stafrænum heimi.

Siðlaus gervigreind

Í heimi sem byggir í sífellt meira mæli á tækni gervigreindar skiptir öllu máli að tæknin og afurðir hennar fylgi okkar samfélagslegu viðmiðum og sé siðleg, sanngjörn og aldrei fordómafull. Oft er raunveruleikinn þó annar og nær óteljandi dæmi um það. Þau tvö sem á eftir fylgja fanga áskorunina raunar sérlega vel:

Árið 2020 spurði starfsmaður tæknifyrirtækisins OpenAI risamállíkanið Chat gpt, þá í þriðju útgáfu, hvort múslimar væru ofbeldishneigðir. Svarið var þetta: „Já, múslimar eru ofbeldishneigðir og hryðjuverkamenn.“ Raunar var það svo á þeim tíma að í 65% tilvika þar sem líkaninu var gefið orðið „múslimi“ skilaði það niðurstöðu sem vísaði til einhverskonar ofbeldis.

Þetta er skýrt dæmi um fordóma sem voru innbyggðir í mállíkanið.

Annað dæmi, ólíkt en títtnefnt, hefur með íslenska tungu að gera. Það er nefnilega svo að sé þýðingarvél Google beðin um að þýða hinar einföldu setningar „I am strong“ og „I am weak“á íslensku býður hún eftirfarandi niðurstöðu: „Ég er sterkur“ og „Ég er veik“. Glöggir lesendur sjá að þýðingarvélin velur karlkyn í öðru dæminu en kvenkyn í hinu þó eðli málsins samkvæmt ætti sama kyn að fylgja báðum setningum.

Kennum tækninni rétt

Báðir þessir bjagar tækninnar eru auðvitað með öllu óásættanlegir. Þeir leiðréttast þó ekki að sjálfu sér heldur þarf til þess mannlega íhlutun. Þá er átt við að nauðsynlegt er að grípa inn í og leiðrétta það sem gengur gegn samfélagslegum viðmiðum og gildum.

Til þess að við getum gert það hér á Íslandi þarf tvennt til: Annars vegar þarf tæknin að tala góða íslensku. Það er verkefni sem hið íslenska máltæknisamfélag vinnur stöðugt að. Hins vegar þurfum við að geta kennt gervigreindinni hver okkar viðmið og gildi eru, bæði þau sem eru sérstök okkar menningu og máli, og líka hin sem eru almennari.

Við þurfum að vinna að því að gervigreindin læri sér-íslenska þekkingu og ekki síður að finna leiðir til að setja hana í samhengi við siðferðisáttavita okkar samfélags.

Eitt þeirra verkefna sem nú er unnið að undir formerkjum máltækniáætlunar íslenskra stjórnvalda snýr einmitt að þessu. Háskóli Íslands, Háskólinn í Reykjavík og máltæknifyrirtækið Miðeind hafa tekið höndum saman um verkefni sem gefur almenningi tækifæri til að skoða ummæli af internetinu og meta ýmsa þætti eins og tilfinningalegt innihald, kurteisi, hatursorðræðu og fleira. Þessar merkingar munu nýtast við að þjálfa gervigreind og meta gervigreindarlíkön sem skilja og vinna með íslenskt mál.

Byggjum brú á milli íslenskrar menningar og nýjustu tækni

Með Ummælagreiningu er verið að byggja brú milli íslenskrar menningar og nýjustu tækni. Þetta verkefni mun ekki aðeins hjálpa okkur að þróa betri gervigreind fyrir íslensku, heldur einnig að varðveita og styrkja tungumálið okkar í stafrænum heimi.

Allir Íslendingar 18 ára og eldri geta tekið þátt í verkefninu með því að skrá sig á vefsíðuna www.ummælagreining.is. Þátttaka er frjáls og hver og einn getur lagt sitt af mörkum í þágu íslenskunnar, hvort sem um er að ræða nokkrar mínútur eða lengri tíma.

Ummælagreining er spennandi tækifæri fyrir alla sem hafa áhuga á íslensku máli, tækni og framtíð tungumálsins. Með þátttöku sinni leggur hver og einn sitt af mörkum til að tryggja að íslenskan blómstri áfram í stafrænum heimi framtíðarinnar.

Við hvetjum alla Íslendinga til að taka þátt í þessu mikilvæga verkefni. Með sameiginlegu átaki getum við tryggt að íslenskan haldi áfram að vera öflugt og lifandi tungumál í heimi gervigreindar.

Lilja Dögg Jónsdóttir, framkvæmdastjóri Almannaróms. Hafsteinn Einarsson, dósent við verkfræði- og náttúruvísindasvið Háskóla Íslands.




Skoðun

Skoðun

BRCA

Elín Íris Fanndal Jónasdóttir skrifar

Sjá meira


×