Amgueddfa Blog: Holiaduron y gorffennol a’r presennol

Winter 2020. Nearly a year into the pandemic which rocked everyone's life. In the middle of a second raft of restrictions – all normal activities, group meetings, trips to see family, shopping even, put on hold for an indeterminate time – life was stagnating somewhat.

One of the many wonderful things about living in this part of Wales – as well as the space, the quiet, the beauty (with a view of the Preseli Hills), learning Welsh and interacting with the Welsh community – was the National Wool Museum, only a few miles down the road. With added leisure time now I was retired, I could indulge my obsession with all things sheep and wool-related. I became a craft volunteer at the museum, meeting with a group of spinners every week to spin, learning new things, meeting the wide range of visitors and joining in museum events. The museum and cafe staff were always friendly and welcoming, willing to indulge and encourage my attempts at Welsh. It felt like a second home. The pandemic put an end to that.

How exciting it was, then, when I saw the museum adverting for volunteers to transcribe answers to questionnaires, some filled out fifty years ago. I consider myself privileged to have been accepted to join the 'team'. Transcribing from handwritten documents – in Welsh- has been quite a challenge, but an enjoyable one. My dictionary and Google Translate have helped me check if what I am transcribing makes sense and there is a great sense of achievement when a seemingly unreadable word suddenly fits the sentence. I am learning many words that Welsh speakers may or may not know but are new to me. Do people here still know the meaning of 'sucan'? Whilst its English equivalent, given as 'gruel', conjures up the privations of poor orphans such as Oliver Twist, the Welsh sucan appears to have been somewhat of a treat at harvest time. I haven't found anyone around here yet who has heard of a room called a 'rhwmbwrdd' (is it a dining room?)

Many documents reply in a basic manner to questions about daily meals and work routines, with a noticeable lack of variation in diet (mostly 'cawl', a broth kept on the go, added to and reheated for several days' meals) and basics such as family clothing paid for by selling hand-knitted socks or eggs, but some have more detail. I am learning about which wood is most suitable for different parts of a cart (ash for the axle, oak for the wheel spokes), how neighbours helped each other with workload rather than giving presents and other customs that have died out or changed since the early 20th century. I have spoke to local people, some of whom know nothing of 'Calennig', and others who explain it as a custom for children akin to Halloween, but at the turn of the century (in the Preseli area at least) it was the old women, widowed or unmarried, who went round the village collecting small presents of money at New Year. Is there anyone now who knows that children would roam the fields in early spring trying to get a sight of the first lamb, called 'Dafad Las' (blue sheep) for which they would be rewarded with the sum of three pence? In the Welsh way, many people were referred to by their name followed by the name of their house or farm, which means it is possible to locate the properties mentioned by an internet search. It is interesting to note that several of these houses are now pictured as ruins or are listed as holiday accommodation.

It has been – it is – a lovely way to stay connected to Wales, past and present, as well as helping with my Welsh learning and giving me a chance to contribute to the work of the museum and preserve Welsh memories.

When the collection of questionnaires was first assessed it became clear that there were too many documents for volunteers to transcribe during the length of the project. We considered simply digitising the remaining documents and adding them to the Museum’s Collections Online website, but we really wanted the content of the questionnaires to be searchable. We therefore concluded that a blended solution where we supplemented the work of volunteer transcribers with an automated solution might be the best way forward.

After discussions with our software developers, we decided to look at the Google Cloud Vision API as a possible solution to automating the transcription of the documents. This is a powerful machine learning tool that, among other things, can read printed and hand-written text, and create a metadata set that is indexed and therefore searchable by members of the public. It also records the properties of the document and assesses the nature of the text transcribed.

Proposed Workflow

Currently our object records are stored in our Collections databases and our images are stored in our Digital Asset Management System (DAMs). Images and object records are automatically extracted into a middleware product called the CIIM, designed by Knowledge Integration. Within the CIIM the object records are linked to their images and pushed through to Collections Online.

We needed to create a workflow pipeline that allowed us to identify the required images in our DAMs (iBase), push them through to Google Cloud Vision in the correct order and then store the enhanced media records in the CIIM so that the marked-up document and the transcription metadata can be displayed alongside the image online.

Software developments

None of the developers we work with had any experience of using Google Vision in this way so there was a certain amount of experimentation required to refine the workflow.

We soon discovered that to access the required functionality we needed to upgrade to the latest version of the CIIM middleware and expand our metadata framework, with new corresponding lookup fields within iBase.

Currently, all images are stored within the DAMs on one level, with no hierarchical relationships that allow us to define relationships such as a book and its pages.  In addition to this we have only ever been able to identify the ‘main image’ for groups of images, with no functionality in place to sequence multiple pages. We therefore needed to develop a new framework dedicated to pages or ‘connected items’ as we have termed them. When the software developments are complete, we will be able to link pages via the accession number and store a dedicated set of metadata specifically for the connected items.

Results

The workflow is now in place to automatically select images from the DAMs and push them through Google Cloud Vision and back into the middleware.

We have put tags in place to identify which items should be sent to Google Cloud Vision and in what order they should be sequenced, allowing us to test the pipeline and confirm ‘proof of concept’.

CIIM pushes these marked images through Google Vision in batches. We have clearly defined limits on amounts to push through (both in the CIIM and our Google Cloud Vision settings) that prevent us exceeding the free service offered by Google.

This data is then modelled and published on the CIIM User Interface.

Initial results for the transcribed documents are mixed. The documents contain both typed and handwritten text in both Welsh and English, and some contain small sketches. Google Vision coped well with printed text in both languages, reasonably well with English handwritten but less well with Welsh handwritten.

Google Cloud Vision created metadata for both the text and the document itself, and this latter mark-up metadata was enormous, with thousands of lines of code. When displaying this within the CIIM middleware we need to decide how much of the metadata should be made available within the record itself, and where to store the rest.

Volunteer transcribers

Whilst all the software development work was going on a group of volunteer transcribers started working through batches of documents and producing transcriptions in Word document format. It is not possible to edit the Google Cloud Vision documents so the work the volunteers are doing cannot be integrated into the enhanced metadata.

Instead, we are pasting the transcriptions directly into our back-end CMS in the ‘Description’ field. This text is then pulled through directly into Collections Online where it can be displayed alongside the document images.

Next steps

The next phase of the project will be to display the Google Cloud Vision enhancements through Collections Online so that the text can be searched using our standard search interface. We also need to ensure that both the volunteer transcriptions and the automated transcriptions can be viewed and searched in the same way.

We will deliver zoom images using IIPImage, a server system for web-based streamed viewing and zooming of high-resolution images. These images will be IIIF compliant, the universal image standard, allowing us to utilise one of the many available IIIF web viewers to display the Google Cloud Vision enhancements through Collections Online. In addition, we are keen to see if Google Cloud Vision’s transcriptions improve over time. We are experimenting with specifying the language of the document by turning on ‘languageHints’ rather than just enabling auto-language detection. Will this improve the results for the Welsh handwritten material? We are also keen to see if pushing thousands of Welsh documents through the Machine Learning interface has any effect on the quality of the transcription. We plan to re-run the first 100 documents through Google Vision again at the end of the project to compare the quality of the transcription and identify if there are any noticeable improvements.

Long term this could be a hugely important development allowing us to digitise thousands of pages of documents held within our collections and automatically transcribe and make the text searchable in both Welsh and English.

Dros yr wyth mis diwethaf, rydw i wedi bod yn casglu gwybodaeth am yr holiaduron a anfonwyd gan Sain Ffagan Amgueddfa Werin Cymru mewn amryw ddegawdau yn ystod yr ugeinfed ganrif.

Mae'r holiaduron yn canolbwyntio ar gofnodi bywyd bob dydd yng Nghymru a chasglu gwybodaeth gan y cyfranwyr am wahanol bynciau yn ymwneud â bywyd cymdeithasol a diwylliannol y Cymry. Maen nhw'n rhoi cipolwg hynod ddiddorol i ni ar sut oedd pobl yn gweld y byd o'u cwmpas a'r hyn roedden nhw'n ei wneud o ddydd i ddydd, yn ogystal â disgrifio eitemau yn eu cartrefi neu offer gwaith. Yn aml iawn mae'r ymatebion yn cynnwys gwybodaeth leol fanwl iawn. Mae'r holiaduron cynharaf yn y casgliad o 1937. Mae llawer o'r cyfranwyr wedi cynnwys darluniau o'r eitemau a ddisgrifiwyd ganddynt ac maent wedi cymryd gofal ac amser i ddisgrifio'r ffordd y cawsant eu defnyddio.

Un o gyfranwyr casgliad 1937 oedd W. Beynon Davies a roddodd wybodaeth am Ddyffryn Aeron a chanolbarth Sir Aberteifi. Yn y darlun hwn, mae'n disgrifio dau wahanol fath o gert Gambo a ddefnyddiwyd yn Nyffryn Aeron, y naill ag ochrau a'r llall ag ochrau isel at ddibenion gwahanol 

Dyma G. Elfed Jones o Faesteg hefyd yn nodi llawer o ffeithiau diddorol am eitemau domestig ac yn cynnig llawer o sylwadau am ei filltir sgwâr gan gynnwys darlun o focs haearn a rhwbiadau o geiniog cwmni Crown Copper dyddiedig 1811. Roedd Islwyn Ffowc Elis, nofelydd yn ddiweddarach, yn blentyn ysgol adeg cyhoeddi'r holiaduron cyntaf, ac fe gyfrannodd ddarluniau pensil o heyrn cwicio ac eitemau eraill a ddefnyddiwyd yn ei gartref. 

Ymhlith yr holiaduron diddorol eraill mae casgliad 1957 a anfonwyd ar y cyd gan Gyngor Gwlad Môn a'r Amgueddfa Werin, fel y gelwid Sain Ffagan ar y pryd. Cafwyd rhestri manwl o ddiwrnod gwaith a phatrymau bwyta arferol gweithwyr gwledig. Ymhlith y cwestiynau oedd faint o'r gloch oedd y cyfranwyr yn codi yn y bore, faint o'r gloch oedden nhw'n bwyta'u brecwast, beth oedd eu horiau gwaith, pa fath o waith oedden nhw'n ei wneud a pha fath o brydau oedden nhw'n eu bwyta, a beth oedd yr enw ar y bwyd? Mae'n rhoi darlun unigryw i ni o ddiwrnodau llafurus a hir y gweithwyr gwledig.  Nododd Frances Grace Hughes o Lanfachreth bod ei diwrnod gwaith yn cychwyn am 5am a'i bod yn mynd i'r gwely am 9pm. Y gweision oedd y cyntaf i ddeffro, yna meistr a meistres y tŷ. Cyn brecwast, roedd y stablau a'r beudai'n cael eu glanhau. Roedd brecwast, sef bara a llaeth, am 6am y bore a thatws a chig moch i ginio am 12pm. Roedd amryw dasgau i'w cwblhau yn ystod y dydd gan gynnwys godro am 7am a 5pm, ac am 8pm roedd swper. Ar ôl swper, roedden nhw'n canu ac yn adrodd straeon neu'n paratoi prydau bwyd y diwrnod canlynol.

Ym 1958, roedd Lewis Williams oedd yn byw yn Nhreharris yn cofio traddodiadau Nadolig ei blentyndod yng Nghorris yn glir. Rhoddodd ddisgrifiad manwl o holl weithgareddau'r gymuned gan gynnwys Calennig a thraddodiad 'ciga' yn ystod gaeaf caled 1894, pan oedd ffermydd cyfagos yn rhoi cig i deuluoedd oedd yn cael trafferth cael dau ben llinyn ynghyd. 

Yn ystod y 1970au a'r 1980au, roedd yr holiaduron yn canolbwyntio ar dafodiaith ac iaith, a chadw tŷ a pharatoi bwyd. Wrth ateb cwestiynau am fwyd a choginio, gofynnwyd i'r cyfranwyr nodi'r math o ardal oedden nhw'n ateb yn ei chylch e.e. ar fferm, ardal wledig, ardal chwareli llechi neu ardal pyllau glo. Gofynnwyd i'r cyfranwyr nodi gwybodaeth am wahanol fwydydd oedd yn cael eu bwyta wrth bob pryd, ar wahanol ddiwrnodau ac mewn gwahanol dymhorau.

Dyma flas yn unig ar yr wybodaeth sydd yn y casgliad, ac mae'n ddrych ar fywyd yng Nghymru. Mae modd i chi bori drwy yr holiaduron a’r llyfrau ateb yma.

Ym mis Mawrth 2020, dechreuodd amgueddfeydd ar draws y byd gasglu straeon a gwrthrychau yn ymwneud â phandemig Covid-19. Yma yn Amgueddfa Cymru, lansiwyd holiadur digidol ym mis Mai 2020 fel cam cyntaf tuag at greu casgliad Covid cenedlaethol fyddai'n cael ei archifo yn Sain Ffagan Amgueddfa Werin Cymru. Mae'r Amgueddfa wedi defnyddio'r dull hwn o gasglu gwybodaeth trwy holiaduron ers 1937.

Buan iawn y sylweddolwyd y byddai defnyddio'r un dull o gasglu hefyd yn rhoi cyfle i ni edrych eto ar rai o'r ymatebion i'r holiaduron cynnar ac ysbrydoli mentrau casglu yng Nghymru ar ôl Covid. Er mwyn i ni allu gwneud y gwaith hwn, ymgeisiwyd am nawdd gan Gronfa Gasgliadau Esmée Fairbairn Cymdeithas yr Amgueddfeydd. Gyda'r nawdd yma roedd modd i ni ddechrau project 12 mis i ddigideiddio'r holiaduron hanesyddol ac arbrofi gyda modelau newydd o gasglu trwy ymgysylltu â chymunedau.

Dechreuwyd y project ym mis Medi 2020, ar adeg pan oedd cyfyngiadau Covid wedi dechrau llacio. Y dasg gyntaf oedd digideiddio cannoedd o dudalennau o ymatebion o'r holiaduron a llyfrau ateb hanesyddol.

Cyhoeddwyd yr holiadur cyntaf gan yr Amgueddfa ym mis Rhagfyr 1937 ac fe'i hanfonwyd at 493 o gyfranwyr ar draws Cymru. Mae'n bosibl mai project Arsylwi Eang 1937 wnaeth ysbrydoli hyn, pan gofnodwyd bywydau bob dydd pobl ar draws Prydain. Wedi'i lansio yn ystod degawd o galedi economaidd a diweithdra, roedd yr 'Holwyddoreg ar Ddiwylliant Gwerin Cymru' yn gofyn i gyfranwyr nodi gwybodaeth am bob math o bynciau gan gynnwys bywyd cartref, cyhoeddus a diwylliannol eu hardaloedd lleol. Roedd hefyd yn annog pobl i anfon ffotograffau a darluniau a dod yn gyfranwyr rheolaidd er mwyn helpu i ddatblygu casgliad a fyddai'n sail i Amgueddfa Werin Cymru yn Sain Ffagan, a sefydlwyd ym 1948. Wedi hynny, defnyddiwyd holiaduron a 'llyfrau ateb' yn rheolaidd gan yr Amgueddfa fel dull o gasglu gwybodaeth am ystod o bynciau hyd at y 1980au.

Wedi i ni ddigideiddio'r swp cyntaf o holiaduron, anfonwyd cais at gyrff gwirfoddol mewn gwahanol rannau o Gymru yn eu gwahodd i drawsgrifio'r ymatebion oedd wedi'u hysgrifennu â llaw. Erbyn hyn (mis Rhagfyr 2020) roedd Cymru mewn cyfnod clo arall, ac roedd yn teimlo fel amser da i'r Amgueddfa gynnig e-wirfoddoli yn rhan o'i rhaglen am y tro cyntaf erioed. Recriwtiwyd 11 gwirfoddolwr, bob un ohonynt yn siarad Cymraeg neu'n dysgu, am mai Cymraeg oedd iaith y deunydd gan fwyaf. Anfonwyd y delweddau digidol yn uniongyrchol at bob gwirfoddolwr i'w trawsgrifio, a ble bynnag posibl, anfonwyd deunydd oedd yn berthnasol i ardal leol y gwirfoddolwr. Roedd cyfleoedd hefyd i gwrdd dros Zoom a Teams i drafod y gwaith a rhannu profiadau. Hyd yn hyn, mae'r gwirfoddolwyr wedi cyfrannu o leiaf 180 o oriau o'u hamser ac rydym yn hynod ddiolchgar iddynt am eu cyfraniad. Yn y pen draw, bydd y deunydd a drawsgrifiwyd i'w weld ochr yn ochr â'r ymatebion holiadur trwy gronfa ddata gasgliadau'r Amgueddfa.

Cam nesaf y project fydd creu holiadur Covid newydd ar gyfer 2021. Gan fod Cymru wedi bod trwy glo bach, clo mawr a rhaglen frechu ar raddfa fawr erbyn hyn, roedden ni'n dal i deimlo fod gwybodaeth i'w gasglu oedd heb ei gynnwys yn holiadur 2020. Ond y tro hwn, roeddem am drafod â'n partneriaid cymunedol yn gyntaf a chael eu cymorth i ysgrifennu'r cwestiynau ar y cyd er mwyn sicrhau eu bod yn fwy cynhwysol. Gyda chymorth ein partneriaid ein nod yw ceisio cyrraedd cymunedau nad oedden nhw wedi gallu cymryd rhan yn holiadur 2020 o bosibl, ac y mae'r pandemig wedi cael effaith fawr arnynt.

Gyda lansiad holiadur Casglu Covid 2021 ym mis Mehefin, rydym nawr yn ceisio sicrhau y caiff cynifer o leisiau Cymru â phosibl eu clywed a'u cofnodi yn rhan o greu 'cof cenedlaethol' i Gymru. Rydym ni hefyd yn gobeithio creu cysylltiad â chymdeithasau hanes rhai o'r ardaloedd a ymatebodd i holiaduron gwreiddiol yr Amgueddfa, a'u gwahodd i ymchwilio rhai o'r straeon lleol. Trwy gynnal y project hwn, ein gobaith yw creu templed ar gyfer casglu ac ymgysylltu ar gyfer y dyfodol trwy ddysgu gwersi gan ddulliau casglu'r gorffennol er mwyn i ni allu casglu yn gyflym, yn ymatebol ac yn hyblyg yn y dyfodol.

Helo, Rhodri Edwards ydw i ac rydw i wedi bod yn e-wirfoddoli gydag Amgueddfa Cymru ers Ionawr 2021. Rydw i’n astudio Lefelau A mewn Hanes, Llenyddiaeth Saesneg a Daearyddiaeth yn Ysgol Gyfun Aberaeron. Rydw i wedi bod yn helpu’r Adran Hanes ac Archaeoleg yn Sain Ffagan Amgueddfa Werin Cymru i drawsgrifio rhai holiaduron sy’n manylu ar fywyd yng Nghymru o’r 1930au i’r 1980au. Mae pawb yn Amgueddfa Cymru wedi bod yn gymwynasgar a chyfeillgar iawn, yn enwedig fy ngoruchwyliwr Sioned Williams sydd bob amser yn ymateb yn gyflym i unrhyw ymholiadau sydd gennyf ac yn garedig yn cynnig llawer o gyngor a chefnogaeth. Rhoddodd Sioned sesiwn hyfforddi pan ddechreuais a wnaeth hi gyflwyno ni i’r gwaith gwirfoddoli, gan roi awgrymiadau defnyddiol fel defnyddio’r gair [sic] y tu ôl i unrhyw gamgymeriadau sillafu, atalnodi a gramadeg a rhoi marciau cwestiwn ar ôl unrhyw eiriau rydym yn ansicr ohonynt, felly roedd hyn yn caniatáu i ni i weithio’n effeithiol, yn annibynnol ac ar ein cyflymder ein hunain. Trwy drawsgrifio rhai o’r holiaduron, rydw i wedi dysgu llawer am hanes a threftadaeth gymdeithasol fy ardal leol megis y ffordd amaethyddol a ffermio o fyw, nodweddion ffermdy, pa fathau o fwyd byddai teuluoedd ffermio yn cynhyrchu yn aml, er enghraifft cynhyrchu llaeth fel hufen a chaws. Mae darllen am brofiadau pobl wedi dod â hanes yn fyw i mi ac mae’n ddiddorol gweld sut mae’r dafodiaith Gymraeg wedi newid ers y 1930au. Rwy’n mwynhau gwirfoddoli a gweithio gydag Amgueddfa Cymru gan fynychu cyfarfodydd Zoom a Microsoft Teams lle rwy’n gwrando ar brofiadau gwirfoddolwyr eraill am yr hyn maen nhw wedi’i ddysgu a’i ddarganfod pan maen nhw wedi bod yn trawsgrifio’r holiaduron hanesyddol. Mae cwrdd â phobl eraill sy’n gweithio ac yn gwirfoddoli i Amgueddfa Cymru, ymuno â digwyddiadau a drefnwyd yn feddylgar gan Amgueddfa Cymru fel y partïon rhithwir ar Eventbrite a derbyn pecyn gwirfoddoli wedi helpu i wneud i mi deimlo’n rhan werthfawr o Amgueddfa Cymru. Rwyf wedi datblygu fy sgiliau gwirio trwy drawsgrifio holiaduron ac rwyf wedi cael mwy o fewnwelediad i’r pwnc o Hanes sydd wedi rhoi profiad gwerthfawr imi. Diolch yn fawr iawn i bawb am eu holl gymorth a chefnogaeth, rwy’n gwerthfawrogi’r cyfle i fod yn wirfoddolwr yn Amgueddfa Cymru.