Newyddion S4C

AI: Galw am 'well cydweithio' er mwyn gwneud y mwyaf o ddeallusrwydd artiffisial yn y Gymraeg

Newyddion S4C 30/08/2023

AI: Galw am 'well cydweithio' er mwyn gwneud y mwyaf o ddeallusrwydd artiffisial yn y Gymraeg

Mae datblygwyr technoleg yn galw am well cydweithio yng Nghymru er mwyn gwneud y mwyaf o'r cyfleoedd y gallai deallusrwydd artiffisial ei gynnig i'r Gymraeg.

Mae gallu’r sgwrsfot ChatGPT i gyfathrebu yn y Gymraeg yn dangos fod yr iaith yn “rhan o’r chwyldro AI”, yn ôl ymchwilwyr. 

Ond os yw’r “potensial enfawr” i gael ei wireddu, medden nhw, mae angen yr hawl i ddefnyddio'r deunydd Cymraeg sydd ar hyn o bryd o dan hawlfraint, i hyfforddi cyfrifiaduron.

Mae Llywodraeth Cymru'n dweud y bydd eu strategaeth Technoleg yn y Gymraeg yn cael ei hadnewyddu'n fuan. 

Un busnes sydd eisoes yn defnyddio deallusrwydd artiffisial i gynnig gwasanaeth dwyieithog ydy cwmni Haia o Ynys Môn. 

Mae’r cwmni’n trefnu digwyddiadau ar y we ac yn defnyddio meddalwedd cyfieithu ar y pryd i alluogi pobl i siarad yn Gymraeg neu Saesneg gydag isdeitlau. 

Ond yn ôl un o’i sylfaenwyr, Tom Burke, gallai eu gwasanaeth fod yn well petai ragor o ddata Cymraeg ar gael. 

“Un o’r problemau rydan ni’n cael ydy pa mor gywir ydy’r cyfieithiad. Os ti’n cymharu efo Almaeneg neu Sbaeneg, mae’r data yn Gymraeg yn fychan.

“Yn aml, ‘da ni’n gweld gwallau yn y cyfieithiad neu’r trawsgrifiad ac un ffordd o wella hynny ydy cael defnyddio’r cyfoeth o ddata sydd yna yn Gymraeg.”

Image
Deallusrwydd artiffisial yn y Gymraeg.
Deallusrwydd artiffisial yn y Gymraeg.

Data

Mae deallusrwydd artiffisial iaith yn gweithio gyda modelau iaith gyfrifiadurol sy’n defnyddio symiau enfawr o ddata fel gwefannau, llyfrau ac erthyglau i ddarogan pa eiriau sy’n tueddu i ddilyn ei gilydd. 

Gallai data Cymraeg hefyd gynnwys rhaglenni radio a theledu.

“Petaem ni’n medru cael gafael ar y data yna, ei ddefnyddio i hyfforddi’r modelau iaith, yna buasai’r modelau iaith Cymraeg yn dod yn fwy cywir,” medd Mr Burke.

“Yn y tymor hir bydd hynny’n galluogi cwmnïau newydd i ffurfio, galluogi arloesi a gallai Cymru ddod yn ganolbwynt ar gyfer technolegau iaith.”

Un o’r sefydliadau sy’n helpu i hyfforddi a gwerthuso modelau iaith mawr yng Nghymru yw Canolfan Bedwyr ym Mhrifysgol Bangor.

Lansiodd yr Uned Technolegau Iaith yno brototeip sgwrsfot Cymraeg, Macsen, wyth mlynedd yn ôl gan ddefnyddio technolegau lleferydd-i-destun a chynhyrchu iaith naturiol.

Maen nhw bellach yn ei redeg gyda ChatGPT, a ddatblygwyd gan OpenAI yn yr Unol Daleithiau.

Yn ogystal â’r potensial economaidd, mae pennaeth yr Uned, Gruffydd Prys, yn teimlo y dylai deunydd Cymraeg fod ar gael er mwyn helpu i wneud y dechnoleg yn fwy “addas ar gyfer anghenion y Gymraeg a Chymru yn gyffredinol.”

“Un o’r pethau y gallwn ei wneud i wella ansawdd deallusrwydd artiffisial yw galluogi’r data sydd allan yna i fod ar gael o dan drwyddedau caniataol fel bod y modelau’n adlewyrchu realiti Cymru ac nad ydyn nhw’n fodelau rhy Americanaidd neu ryngwladol. ”

'Sefyllfa wych'

Dywed Tom Burke fod angen i fynediad at y data ddigwydd yn fuan.

“Mae angen iddo ddigwydd yn eithaf cyflym. "Da ni eisoes wedi colli 12 mis o amser arloesi a’r hyn fydd yn digwydd yn y pen draw yw y byddwn ni ar ei hôl hi ac a’r pwynt y gallwn ni ddechrau ei ddefnyddio, bydd gweddill y byd wedi ei ddatblygu hefyd.”

“Mae gennym ni’r sefyllfa wych hon, mae gennym ni’r wlad ddwyieithog hon. Mae gennym ni brifysgol wych fel Bangor yn gweithio ar y dechnoleg hon. Mae angen i ni wneud hyn nawr fel y gall cwmnïau ddechrau ei ddefnyddio a mynd allan yno.”

Dywedodd Y Gweinidog sy'n gyfrifol am y Gymraeg yn Llywodraeth Cymru, Jeremy Miles AS, bod deallusrwydd artiffisial yn y Gymraeg "wir yn bwysig".

"Mae'n rhan bwysig o'r strategaeth Technoleg yn y Gymraeg sydd gyda ni eisoes. Ni ar fin adnewyddu honno ar gyfer y cyfnod nesaf.

"Dros y blynyddoedd diwethaf ni wedi gwario £2m ar sicrhau bod y Gymraeg reit yng nghanol yr agenda hon ac mae'n parhau'n flaenoriaeth bwysig i ni yn y dyfodol."

Llun: Dominic Lipinski/PA Wire.

Newyddion diweddaraf

Mae'r wefan hon yn defnyddio cwcis i sicrhau eich bod chi'n cael y profiad gorau ar ein gwefan.