‘Sioc a siom’ bod llyfrau awduron o Gymru wedi eu bwydo i beiriant AI
Mae yna bryderon gan awduron o Gymru bod eu llyfrau Cymraeg a Saesneg ymhlith nifer sydd wedi eu bwydo mewn i beiriant AI un o gwmnïau mwya’r byd.
Mae dogfennau llys a gyhoeddwyd yn yr Unol Daleithiau ar 19 Mawrth yn cynnwys negeseuon gan staff cwmni Meta yn dweud eu bod nhw wedi cael caniatâd i ddefnyddio llyfrgell ar-lein LibGen.
Mae’r ohebiaeth yn dweud mai’r nod oedd hyfforddi un o’u peiriannau AI, Llama 3.
Dywedodd cwmni Meta eu bod yn anghytuno â'r honiadau yn eu herbyn a'u bod yn bwriadu parhau i amddiffyn eu hunain a'u peiriannau AI.
Mae LibGen yn ystorfa ar-lein sy’n rhoi mynediad at lyfrau a phapurau academaidd heb dalu amdanyn nhw, ac mae wedi wynebu achosion cyfreithiol o’r herwydd.
Ymhlith y llyfrau sydd wedi eu cynnwys yn LibGen mae gwaith awduron Cymraeg a Saesneg o Gymru gan gynnwys Manon Steffan Ros, Caryl Lewis, Sian Northey, Menna Elfyn a Meleri Wyn James.
Cafodd y rhestr lawn o gynnwys LibGen ei gyhoeddi gan gylchgrawn The Atlantic fel rhan o ymchwiliad i ddefnydd o lyfrau “pirated” i hyfforddi AI - mae modd ei weld yma.
Dywedodd Meleri Wyn James, sy’n gyn enillydd y Fedal Ryddiaith a’n olygydd creadigol i wasg y Lolfa, ei fod yn “sioc a siom” deall y gallai un o’i llyfrau fod wedi ei ddefnyddio i “fwydo systemau AI”.
Roedd ei llyfr Cymraeg o 2023, Gwenynen Bigog, yn un o’r rheini oedd ar restr LibGen.
“Mae hynny wedi cael ei wneud heb fy nghaniatâd a heb fy nghydnabod i fel awdur,” meddai.
“Nid dyma’r tro cynta’ i hyn ddigwydd i lyfrau Cymraeg ac ydw, rwy’n flin am y peth.
"Dydy’r rhan fwyaf o awduron ddim yn ennill arian mawr o ysgrifennu llyfrau. Mae’n rhywbeth dwi’n ei wneud am fy mod i’n caru ysgrifennu ac yn caru llyfrau.
“Yn anffodus, fe allai syniadau creadigol, crefft a dychymyg yr awduron hyn gael eu defnyddio i lunio straeon newydd gan AI a hynny eto heb gydnabyddiaeth na thâl.”
‘Cyflog teg’
Daeth e-byst mewnol Meta i’r amlwg fel rhan o achos cyfreithiol yn UDA yn erbyn y cwmni gan sawl awdur sy’n honni bod y cwmni wedi torri eu hawlfraint.
Nid yw Facebook wedi ymateb yn gyhoeddus gan ddweud na fydd yn gwneud hynny gydag achosion llys byw. Dyw hi ddim yn glir faint o’r wybodaeth ar LibGen a gafodd ei ddefnyddio i hyfforddi'r AI.
Ond dywedodd yr awdures Zoë Brigley wrth Newyddion S4C ei bod wedi sylwi ac yn anhapus bod “bron bob un” o’i gweithiau ar rest ymchwiliad The Atlantic i LibGen a Meta.
Yn wreiddiol o Gaerffili ac yn olygydd Poetry Wales, mae hi bellach yn dysgu ym Mhrifysgol Ohio State.
“Rwy’n flin iawn yn ei gylch, ac rwy’n ei weld o safbwynt awdur a hefyd rhywun sydd â swyddi amrywiol yn y diwydiant cyhoeddi Cymraeg,” meddai.
“Mae nid yn unig yn ddrwg i lenorion Cymreig, ond yn ddrwg i gyhoeddiadau Cymreig hefyd.
“Mae’n anodd gwneud bywoliaeth o ysgrifennu, ac mae’r sefyllfa i’r diwydiant cyhoeddi yn un anodd iawn.”
Dywedodd y dylid “talu cyflog teg i awduron am ddefnyddio eu gwaith i hyfforddi AI”.
“Mae yna bryderon hefyd - ar ôl cael eu hyfforddi ar waith awduron am ddim - y gallai modelau AI ddod yn nes at allu ysgrifennu pastiche fyddai yn argyhoeddi pobl o'r un ysgrifenwyr hynny,” meddai.
“Mae yna straeon am lyfrau a gynhyrchwyd gan AI yn cael eu cyhoeddi yn enwau awduron i wneud arian i rywun arall.
“Rhaid i ni aros i weld a fydd gan AI y gallu i ysgrifennu gyda’r un galon ac ysbryd â'r gwaith gwreiddiol.
“Mae'n ymddangos yn annhebygol i mi, ond pa bynnag ffordd yr edrychwch arno, mae’n cam-fanteisio ar waith awduron.”
‘O’r blaen’
Dywedodd Lefi Gruffudd, golygydd cyffredinol gwasg Y Lolfa, nad dyma’r tro cyntaf i bryderon godi am gwmnïoedd mawr yn defnyddio eu cynnwys heb ganiatâd.
“Rydyn ni’n 100% bod angen diogelu hawlfraint awduron ac yn grac iawn bod hyn yn digwydd,” meddai.
“Rydyn ni wedi bod trwy hyn o’r blaen pan oedd Google yn sganio llyfrau a’r cynnwys yna yn ymddangos ar-lein.
“Rydyn ni’n pryderu yn ei gylch ac am edrych i mewn i’r peth.”
Dywedodd llefarydd ar ran cwmni Meta: "Mae Meta wedi datblygu LLMs ffynhonnell agored GenAI trawsnewidiol sy'n pweru arloesedd, cynhyrchiant a chreadigrwydd anhygoel i unigolion a chwmnïau. Mae defnydd teg o ddeunyddiau hawlfraint yn hanfodol i hyn.
"Rydym yn anghytuno gyda honiad y sawl sy’n dwyn yr achos yn ein herbyn ac mae'r cofnod llawn yn adrodd stori wahanol.
"Byddwn yn parhau i amddiffyn ein hunain yn gryf ac i amddiffyn datblygiad GenAI er budd pawb."