Stafræn íslenska fær átta milljóna setninga stuðning Tryggvi Páll Tryggvason skrifar 28. apríl 2017 13:47 Brynju Baldursdóttir framkvæmdastjóra Creditinfo og Steinþór Steingrímsson Vísir/Anton Brink Creditinfo afhenti í dag Stofnun Árna Magnússonar í íslenskum fræðum gögn til uppbyggingar stafrænnar íslensku. Um er að ræða tæplega 8 milljónir setninga frá talaðri og ritaðri íslensku sem verður undirstaðan í stafrænum textagrunni sem Árnastofnun er að setja á laggirnar til stuðnings við stafrænar tæknilausnir. Þróun og notkun snjalltækja sem taka við skipunum á mæltu máli er hröð og því er mikilvægt að hægt sé að eiga samtal við tækin á íslenskri tungu. Stafræni gagnagrunnur Árnastofnunar hefur fengið heitið Risamálheild en málheildir fela í sér upplýsingar um það hvernig tiltekið tungumál gefur vísbendingar um orðaforða, málfræði og setningagerð. Jafnframt gegna þær veigamiklu hlutverki í uppbyggingu máltæknibúnaðar og þýðingarforrita sem eru grundvöllur þess að hægt sé að þróa tæknilausnir líkt og mállíkön sem eru notuð við talgreiningu og talgervingu sem byggja á íslensku. Framtíð íslenskunnar byggir meðal annars á því að hún sé gjaldgeng á sviði upplýsingatækninnar og er það meginástæða fyrir stofnun og rekstri Risamálheildarinnar. Mikil vinna er framundan við uppsetningu stafræna textagrunnsins enda fyrirhugað að Risamálheildin geymi allt að eitt þúsund milljónir orða sem verða aðgengileg til leitar ásamt því sem þau verða aðgengileg á xml-sniði til nota í máltækniverkefnum. „Risamálheildin mun byggja á safni af opinberum textum og gögnin sem Creditinfo hefur afhent Árnastofnun eru umfangsmikil og fjölbreytileg. Vonandi mun það auðvelda stofnuninni að setja Risamálheildina á laggirnar enda mikilvægt fyrir Íslendinga að geta þróað tæknilausnir á íslensku,“ segir Brynja Baldursdóttir framkvæmdastjóri Creditinfo. „Stafræn gögn, textar og hljóðupptökur, eru forsenda fyrir þróun alls máltæknibúnaðar fyrir íslensku. Gögnin eru notuð til að afla nákvæmra upplýsinga um íslenskt mál og notkun þess, tíðni orða og orðasambanda, beygingar, setningagerð o.s.frv. Gögnin frá Creditinfo eru mjög mikilvæg vegna þess að þau hafa að geyma nýja og nýlega texta af ýmsu tagi sem gefa góða mynd af því hvernig íslenskt ritmál er um þessar mundir,“ segir Steinþór Steingrímsson hjá Árnastofnun. Íslenska á tækniöld Tengdar fréttir Vandi íslenskunnar vekur heimsathygli Fjölmiðlar víða um heim hafa fjallað um þá hættu sem steðja að íslenskri tungu eftir að Vigdís Finnbogadóttur varaði við því að íslenskan hæti hlotið sömu örlög og latínan. 24. apríl 2017 11:00 Vigdís Finnbogadóttir: „Ef ekkert verður að gert lendir íslenskan í ruslinu með latínunni“ Fyrrverandi forseti Íslands hefur þungar áhyggjur af stöðu íslenskrar tungu. Íslenskt mál á undir högg að sækja í kjölfar aukinna áhrifa ensku í kjölfar alþjóðavæðingar í stafrænum heimi. Þetta segir í umfjöllun AP-fréttaveitunnar um stöðu íslenskunnar. 22. apríl 2017 17:02 Amazon vill fá íslenskan málfræðing til starfa Bandaríska stórfyrirtæki Amazon leitar nú að sérfræðingi í íslenskri málfræði til að vinna að þróun talgreiningar og máltækni fyrir stafræna aðstoðarmanninn Alexa. 27. mars 2017 11:18 Íslenska á tölvuöld: Rannsaka áhrif snjalltækja á máltöku íslenskra barna Stærsti styrkur í sögu Hugvísindasviðs fer í að „sjúkdómsgreina“ málið. 29. júní 2016 10:00 Vilja tvo milljarða fyrir framtíð íslenskunnar: „Við áttum að byrja fyrir fimm til tíu árum“ Vænta má þess innan tíðar að hægt verði að stýra tækjum með röddinni einni saman. Mikilvægt er að íslenska tungan verði með í þeirri þróun. 18. janúar 2017 16:15 Íslenska á tölvuöld: Ekki einfalt mál fyrir Google að bjarga íslenskunni Guðmundur Hafsteinsson framkvæmdastjóra vöruþróunar hjá Google Assistant hélt erindi á vegum Samtaka atvinnulífsins. Í máli Guðmundar mátti glögglega greina þær áskoranir sem íslenska tungan stendur frammi fyrir þegar kemur að máltækni. 8. mars 2017 10:30 Mest lesið Konan í Bríetartúni komin á götuna Innlent „Hún gat ekki gefið neinar skýringar á þessu, hvorki mér né lögreglunni“ Innlent Hasar við Bríetartún 20: Verið að bera konuna út Innlent Óboðlegt að vera „friðardúfur“ í kosningabaráttu og horfa síðan þögul á „hryllingsmynd í beinni“ Innlent „Því miður er þetta þrautalending“ Innlent „Þetta er salami-leiðin“ Innlent „Ástandið er að versna“ Erlent Lítur það grafalvarlegum augum ef ráðherra fari ekki að lögum Innlent Fækkar herforingjum um fimmtung Erlent Reikningum Flokks fólksins lokað um stund Innlent Fleiri fréttir Líflátshótanir í kjölfar veðmála og óttaslegin eftir útburð Þrír fluttir á sjúkrahús eftir umferðarslys við Smáralind Ekki talin yfirvofandi hætta en maðurinn geti orðið hættulegur Núverandi fyrirkomulag „virðist hylma yfir ábyrgð og gagnsæi“ Ítarleg skýrsla á borði ráðherra Inga skipar konu í stað karls í stjórn HMS Óboðlegt að vera „friðardúfur“ í kosningabaráttu og horfa síðan þögul á „hryllingsmynd í beinni“ Líkur á nýju gosi munu aukast þegar líða fer á haustið „Því miður er þetta þrautalending“ Reikningum Flokks fólksins lokað um stund „Hún gat ekki gefið neinar skýringar á þessu, hvorki mér né lögreglunni“ Konan í Bríetartúni komin á götuna Hækkandi matarverð hringir bjöllum hjá ráðherra Viðvörunarbjöllur óma vegna verðhækkana Lítur það grafalvarlegum augum ef ráðherra fari ekki að lögum Treystir Ingu til að leggja mat á hæfi stjórnarmanna og að lögum sé fylgt Konungshjónin tóku á móti Höllu og Birni Hasar við Bríetartún 20: Verið að bera konuna út „Þetta er salami-leiðin“ Gunnlaugur Claessen er látinn Bætir í vind og úrkomu í kvöld Byssum stolið úr bílskúr í Kópavogi Ekki standi til að sækja strandveiðiheimildir í aflamarkskerfið Ný stjórn Ungra umhverfissinna kjörin Skjálfti 4,8 að stærð í Bárðarbungu Konan „terroríseri“ alla í hryllingshúsinu Mannréttindastofnun Íslands tekin til starfa Segist „eiginlega sammála“ ákvörðun Amgen Vaknaði eldsnemma til að hefja veiðar þrátt fyrir slæma veðurspá „Engin örugg skref, bara eitt illa unnið pennastrik“ Sjá meira
Creditinfo afhenti í dag Stofnun Árna Magnússonar í íslenskum fræðum gögn til uppbyggingar stafrænnar íslensku. Um er að ræða tæplega 8 milljónir setninga frá talaðri og ritaðri íslensku sem verður undirstaðan í stafrænum textagrunni sem Árnastofnun er að setja á laggirnar til stuðnings við stafrænar tæknilausnir. Þróun og notkun snjalltækja sem taka við skipunum á mæltu máli er hröð og því er mikilvægt að hægt sé að eiga samtal við tækin á íslenskri tungu. Stafræni gagnagrunnur Árnastofnunar hefur fengið heitið Risamálheild en málheildir fela í sér upplýsingar um það hvernig tiltekið tungumál gefur vísbendingar um orðaforða, málfræði og setningagerð. Jafnframt gegna þær veigamiklu hlutverki í uppbyggingu máltæknibúnaðar og þýðingarforrita sem eru grundvöllur þess að hægt sé að þróa tæknilausnir líkt og mállíkön sem eru notuð við talgreiningu og talgervingu sem byggja á íslensku. Framtíð íslenskunnar byggir meðal annars á því að hún sé gjaldgeng á sviði upplýsingatækninnar og er það meginástæða fyrir stofnun og rekstri Risamálheildarinnar. Mikil vinna er framundan við uppsetningu stafræna textagrunnsins enda fyrirhugað að Risamálheildin geymi allt að eitt þúsund milljónir orða sem verða aðgengileg til leitar ásamt því sem þau verða aðgengileg á xml-sniði til nota í máltækniverkefnum. „Risamálheildin mun byggja á safni af opinberum textum og gögnin sem Creditinfo hefur afhent Árnastofnun eru umfangsmikil og fjölbreytileg. Vonandi mun það auðvelda stofnuninni að setja Risamálheildina á laggirnar enda mikilvægt fyrir Íslendinga að geta þróað tæknilausnir á íslensku,“ segir Brynja Baldursdóttir framkvæmdastjóri Creditinfo. „Stafræn gögn, textar og hljóðupptökur, eru forsenda fyrir þróun alls máltæknibúnaðar fyrir íslensku. Gögnin eru notuð til að afla nákvæmra upplýsinga um íslenskt mál og notkun þess, tíðni orða og orðasambanda, beygingar, setningagerð o.s.frv. Gögnin frá Creditinfo eru mjög mikilvæg vegna þess að þau hafa að geyma nýja og nýlega texta af ýmsu tagi sem gefa góða mynd af því hvernig íslenskt ritmál er um þessar mundir,“ segir Steinþór Steingrímsson hjá Árnastofnun.
Íslenska á tækniöld Tengdar fréttir Vandi íslenskunnar vekur heimsathygli Fjölmiðlar víða um heim hafa fjallað um þá hættu sem steðja að íslenskri tungu eftir að Vigdís Finnbogadóttur varaði við því að íslenskan hæti hlotið sömu örlög og latínan. 24. apríl 2017 11:00 Vigdís Finnbogadóttir: „Ef ekkert verður að gert lendir íslenskan í ruslinu með latínunni“ Fyrrverandi forseti Íslands hefur þungar áhyggjur af stöðu íslenskrar tungu. Íslenskt mál á undir högg að sækja í kjölfar aukinna áhrifa ensku í kjölfar alþjóðavæðingar í stafrænum heimi. Þetta segir í umfjöllun AP-fréttaveitunnar um stöðu íslenskunnar. 22. apríl 2017 17:02 Amazon vill fá íslenskan málfræðing til starfa Bandaríska stórfyrirtæki Amazon leitar nú að sérfræðingi í íslenskri málfræði til að vinna að þróun talgreiningar og máltækni fyrir stafræna aðstoðarmanninn Alexa. 27. mars 2017 11:18 Íslenska á tölvuöld: Rannsaka áhrif snjalltækja á máltöku íslenskra barna Stærsti styrkur í sögu Hugvísindasviðs fer í að „sjúkdómsgreina“ málið. 29. júní 2016 10:00 Vilja tvo milljarða fyrir framtíð íslenskunnar: „Við áttum að byrja fyrir fimm til tíu árum“ Vænta má þess innan tíðar að hægt verði að stýra tækjum með röddinni einni saman. Mikilvægt er að íslenska tungan verði með í þeirri þróun. 18. janúar 2017 16:15 Íslenska á tölvuöld: Ekki einfalt mál fyrir Google að bjarga íslenskunni Guðmundur Hafsteinsson framkvæmdastjóra vöruþróunar hjá Google Assistant hélt erindi á vegum Samtaka atvinnulífsins. Í máli Guðmundar mátti glögglega greina þær áskoranir sem íslenska tungan stendur frammi fyrir þegar kemur að máltækni. 8. mars 2017 10:30 Mest lesið Konan í Bríetartúni komin á götuna Innlent „Hún gat ekki gefið neinar skýringar á þessu, hvorki mér né lögreglunni“ Innlent Hasar við Bríetartún 20: Verið að bera konuna út Innlent Óboðlegt að vera „friðardúfur“ í kosningabaráttu og horfa síðan þögul á „hryllingsmynd í beinni“ Innlent „Því miður er þetta þrautalending“ Innlent „Þetta er salami-leiðin“ Innlent „Ástandið er að versna“ Erlent Lítur það grafalvarlegum augum ef ráðherra fari ekki að lögum Innlent Fækkar herforingjum um fimmtung Erlent Reikningum Flokks fólksins lokað um stund Innlent Fleiri fréttir Líflátshótanir í kjölfar veðmála og óttaslegin eftir útburð Þrír fluttir á sjúkrahús eftir umferðarslys við Smáralind Ekki talin yfirvofandi hætta en maðurinn geti orðið hættulegur Núverandi fyrirkomulag „virðist hylma yfir ábyrgð og gagnsæi“ Ítarleg skýrsla á borði ráðherra Inga skipar konu í stað karls í stjórn HMS Óboðlegt að vera „friðardúfur“ í kosningabaráttu og horfa síðan þögul á „hryllingsmynd í beinni“ Líkur á nýju gosi munu aukast þegar líða fer á haustið „Því miður er þetta þrautalending“ Reikningum Flokks fólksins lokað um stund „Hún gat ekki gefið neinar skýringar á þessu, hvorki mér né lögreglunni“ Konan í Bríetartúni komin á götuna Hækkandi matarverð hringir bjöllum hjá ráðherra Viðvörunarbjöllur óma vegna verðhækkana Lítur það grafalvarlegum augum ef ráðherra fari ekki að lögum Treystir Ingu til að leggja mat á hæfi stjórnarmanna og að lögum sé fylgt Konungshjónin tóku á móti Höllu og Birni Hasar við Bríetartún 20: Verið að bera konuna út „Þetta er salami-leiðin“ Gunnlaugur Claessen er látinn Bætir í vind og úrkomu í kvöld Byssum stolið úr bílskúr í Kópavogi Ekki standi til að sækja strandveiðiheimildir í aflamarkskerfið Ný stjórn Ungra umhverfissinna kjörin Skjálfti 4,8 að stærð í Bárðarbungu Konan „terroríseri“ alla í hryllingshúsinu Mannréttindastofnun Íslands tekin til starfa Segist „eiginlega sammála“ ákvörðun Amgen Vaknaði eldsnemma til að hefja veiðar þrátt fyrir slæma veðurspá „Engin örugg skref, bara eitt illa unnið pennastrik“ Sjá meira
Vandi íslenskunnar vekur heimsathygli Fjölmiðlar víða um heim hafa fjallað um þá hættu sem steðja að íslenskri tungu eftir að Vigdís Finnbogadóttur varaði við því að íslenskan hæti hlotið sömu örlög og latínan. 24. apríl 2017 11:00
Vigdís Finnbogadóttir: „Ef ekkert verður að gert lendir íslenskan í ruslinu með latínunni“ Fyrrverandi forseti Íslands hefur þungar áhyggjur af stöðu íslenskrar tungu. Íslenskt mál á undir högg að sækja í kjölfar aukinna áhrifa ensku í kjölfar alþjóðavæðingar í stafrænum heimi. Þetta segir í umfjöllun AP-fréttaveitunnar um stöðu íslenskunnar. 22. apríl 2017 17:02
Amazon vill fá íslenskan málfræðing til starfa Bandaríska stórfyrirtæki Amazon leitar nú að sérfræðingi í íslenskri málfræði til að vinna að þróun talgreiningar og máltækni fyrir stafræna aðstoðarmanninn Alexa. 27. mars 2017 11:18
Íslenska á tölvuöld: Rannsaka áhrif snjalltækja á máltöku íslenskra barna Stærsti styrkur í sögu Hugvísindasviðs fer í að „sjúkdómsgreina“ málið. 29. júní 2016 10:00
Vilja tvo milljarða fyrir framtíð íslenskunnar: „Við áttum að byrja fyrir fimm til tíu árum“ Vænta má þess innan tíðar að hægt verði að stýra tækjum með röddinni einni saman. Mikilvægt er að íslenska tungan verði með í þeirri þróun. 18. janúar 2017 16:15
Íslenska á tölvuöld: Ekki einfalt mál fyrir Google að bjarga íslenskunni Guðmundur Hafsteinsson framkvæmdastjóra vöruþróunar hjá Google Assistant hélt erindi á vegum Samtaka atvinnulífsins. Í máli Guðmundar mátti glögglega greina þær áskoranir sem íslenska tungan stendur frammi fyrir þegar kemur að máltækni. 8. mars 2017 10:30
Óboðlegt að vera „friðardúfur“ í kosningabaráttu og horfa síðan þögul á „hryllingsmynd í beinni“ Innlent
Óboðlegt að vera „friðardúfur“ í kosningabaráttu og horfa síðan þögul á „hryllingsmynd í beinni“ Innlent