Drive-by crowdsourcing på Nationalmuseet

Drive-by crowdsourcing på Nationalmuseet

Jacob Wang er koordinator for digitale initiativer på Nationalmuseet, hvor man som – måske – det første danske museum har arbejdet med emnetags, genereret ved hjælp af kunstig intelligens.

Nationalmuseet sidder på uanede mængder af arkivmateriale, som i teorien kunne åbne veje til storstilede crowdsourcing-projekter, men har hidtil benyttet sig af en mere tilbagelænet CS-strategi baseret på brugernes eget engagement. Borgerforskning.dk talte med Jacob Riddersholm Wang, Nationalmuseets koordinator for digitiale initiativer, for at høre om tankerne bag denne strategi.

af Philip Blüdnikow

Som Danmarks største museum med afdelinger over hele landet når Nationalmuseet bredt ud til den danske befolkning, og har det som erklæret mål at belyse dansk kulturarv. Oven i købet står det skrevet i museets overordnede strategi for 2017-2020, at digitaliseringen af samlingerne skal spille en rolle i den forbindelse. Det lyder som en åben invitation til at initiere crowdsourcing-projekter, der på én og samme tid ville kunne digitalisere samlingerne og aktivere Nationalmuseets brugere i tråd med den vision, som bl.a. direktør Rane Willerslev har fremlagt i dokumentarserien Ranes museum. Alligevel har museet valgt at adoptere en mere afventende CS-strategi i forhold til andre kulturinstitutioner i Danmark.

Jacob Wang er Nationalmuseets koordinator for digitale initiativer. Han har i de senere år stået bag nogle af museets CS-initiativer som f.eks. en blog og Nationalmuseets Samlinger Online, som indeholder over en halv million billeder fra museets bugnende arkiver. Borgerforskning.dk talte med ham for at høre om, hvilke tanker der ligger bag Nationalmuseets mere tilbagelænede strategi på CS-området.

Hvordan arbejder Nationalmuseet med borgerforskning/crowdsourcing?
”Vi arbejder som sådan ikke med crowdsourcing på samme velforankrede måde, som vi f.eks. oplever det med Det Kongelige Bibliotek med ”Danmark set fra luften”-projektet, Københavns Stadsarkiv med Politiets registerblade og kbhbilleder.dk eller Rigsarkivet, som jo er generationer og utallige projekter foran os i forhold til crowdsourcing. Vi varmer dog op, og har i de senere år gennemført et par pilotprojekter inden for området.”

Blandt de pilotprojekter, som Jacob Wang omtaler, finder man opdatering af den digitale infrastruktur, arrangementer for frivillige og opgradering af hjemmesiden til at inkorporere nyttige CS-funktioner. Funktionerne på hjemmesiden talte f.eks. såkaldt geotagging, hvor man frit tillod brugerne at tilgå museets digitale samling af billeder og indtaste mere præcise informationer om, hvor et givent foto var blevet taget. Jacob Wang fortæller, at metoden var særdeles billig i drift for museet, der ikke skulle bruge tid på brugerkommunikation eller verificering af indtastningerne. Netop på grund af den mindre indsats fra museets side var der dog heller ikke så meget frivilligt engagement – ”low cost, low gain” betegner han det som.

Et andet forsøg gjaldt samspillet mellem mennesker og maskiner, der sammen blev sat til at emne-tagge museets samlinger for at skabe de metadata, der med Jacob Wangs egne ord ”gør nålene spidse i vores høstak.” Her benyttede man Googles program til billedgenkendelse ved navn Cloud Vision samt frivillige. Det var ikke helt gnidningsfrit, som når Cloud Vision insisterede på, at montre fra Nationalmuseet skulle tagges som ”baggebokse,” men ifølge Jacob Wang var erfaringerne fra forsøget stadig lærerige og brugbare:

”For nogle år siden autotaggede vi ca. 50.000 fotos fra vores samling ved brug af Google Cloud Vision API og vores erfaring er groft sagt følgende: Det er teknisk simpelt og værdimæssigt varieret, idet vi fik ca. 65% relevante tags retur. De resterende 45% giver egentlig bare støj i søgninger i vores samling. Projektet havde derfor som mål at etablere et samspil mellem automatisk tagging og manuel korrektion af de automatisk genererede tags, og vores erfaringer er, at der helt klart er noget at komme efter i anvendelse af kunstig intelligens i form af billedgenkendelse og at udfordringen fremadrettet ikke bliver at vurdere om automatisk metadataproduktion skal anvendes, men derimod hvordan – og at svaret om ”hvordan” har noget at gøre med at få skabt et stærkt samspil mellem mennesker og maskiners bidrag til forædlingen af vores kulturarv.”

Jacob Wang fortæller, at det i hele taget er en bevidst del af Nationalmuseets CS-strategi, at man lader brugeren selv komme til museet i forhold til andre institutioner, hvor man mere aktivt har været ude og opstøve frivillige:

”Da vi for nogle år siden lancerede vores crowdsourcing-pilotprojekter på Nationalmuseet var vi optaget af at prøve noget, andre institutioner på vores radar ikke allerede havde prøvet. På det tidspunkt var Rigsarkivets aktiviteter, ”Danmark set fra luften” og Politiets registerblade velkendte for os, og fælles for de projekter er, at de respektive institutioner alle anvendte ikke ubetydelige ressourcer på at engagere sig aktivt og kommunikerende med de frivillige borgere. Derfor valgte vi at prøve kræfter med ”drive-by-crowdsourcing” baseret på en nysgerrighed overfor et scenarie, hvor vi helt simpelt åbnede op for skrive-adgang til udvalgte metadata på vores tilgængeliggørelses-site for alle – egentlig bare for at se hvad der ville ske med den meget passive ”metode”. Nogle år senere kan vi konstatere, at der, uden at vi rører en finger, lander ca. 1.000 geotags og ca. 6.000 emnetags om året i vores samling. Tallene vokser naturligvis med mængden af publicerede poster,” fortæller Jacob Wang.

På trods af denne pæne succes fortæller han, at Nationalmuseet i skrivende stund ikke har noget aktivt engagement i crowdsourcing. Jacob Wang forklarer:

”Nationalmuseet er et museum – og ser derfor primært sig selv som museum. Vi er forpligtet til at indsamle, registrere, bevare, forske og formidle så der er stor bredde i vores aktiviteter. Samtidig koster udstillingsbaseret formidling enormt mange penge, og det har svækket vores ressourcer til tilgængeliggørelse som formidlingspraksis. Det tager tid at skifte kurs, når man i over 150 år har været vant til at kuratere og præsentere vores samlinger i veltilrettelagte, gennemtænkte og formfuldendte udstillinger – og ikke bare vælte rub og stub ud på gaden i sin rå form til alles frie afbenyttelse. Sidst men ikke mindst, så er min opfattelse, at vi mere eller mindre har accepteret det som en grundvilkår, at vores samlinger og arkiver er så store, at der simpelthen bare går over 100 år, før vi har behørigt styr på dem registreringsmæssigt – og med behørigt mener jeg rigtig godt! Her er jeg måske naiv, men det er mit håb at vi ved fælles hjælp, på tværs af museets formelle grænser, kan få forædlet vores samlinger til et niveau, hvor vi vil opleve langt større glæde ved og brug af den del af vores kulturarv, som Nationalmuseet varetager. Så kort sagt har vi ikke helt set lyset endnu, og er derfor ikke villige til at prioritere crowdsourcing nok til at kunne hoppe fuldt og helt med på vognen. Vi har dog en praksis-baseret måde at nærme os på – og det gør vores tilgang solid, og måske også lidt nølende. Der er ingen tekniske barrierer. Her er vi helt på omdrejningshøjde.”

På trods af denne mere tilbagelænede tilgang til crowdsourcing lægger han ikke skjul på, at der er store ændringer på vej, som for alvor vil sætte gang i CS-hjulene og måske oven i købet komme til at rykke ved Nationalmuseets gængse rolle som afsender af kulturformidling til et passivt modtagende publikum:

Er crowdsourcing noget, der vil blive vigtigere for Nationalmuseet i fremtiden, fx med tanke på direktør Rane Willerslevs idéer om mere brugerinddragelse? Har Nationalmuseet fx nye CS-projekter i støbeskeen?
”Det er klokkeklart, at vil vi for alvor skalere tempoet hvormed vores samling bliver registreret, og det vil vi, så er crowdsourcing en oplagt model. Vi har i dag alle tekniske barrierer ryddet af sporet med åbne API’er, infrastruktur, samlingssite og registreringssystemer, hvor museets egne- og borgernes registreringer holdes adskilt, så der er i høj grad linet op til, at vi for alvor moderniserer vores samlingsforvaltning gennem crowdsourcing. Jeg både tror og håber, at vi i fremtiden vil se grænserne for, hvem der arbejder aktivt med Nationalmuseets arkiver og samlinger bliver udvisket i positiv forstand. Holder vi fast i selv, med museets egne medarbejdere, at varetage berigelsen af samlingen vil vi ikke blive færdige lige foreløbig. Og det kan hverken vi eller de mange borgere med interesse for vores samling leve med. Så ja, crowdsourcing er vigtigt for Nationalmuseet i fremtiden, og der er langt færre barrierer for at lancere et solidt crowdsourcing-initiativ i dag end tidligere. Om ressourcerne og prioriteringerne vil, sker det forhåbentlig snart!”

Jacob Wang er koordinator for digitale initiativer ved Nationalmuseet. BA i Filosofi fra Odense Universitet (2004) og cand. IT fra IT-Universitetet (2007). Tidl. IT-chef ved Odense Bys Museer, initiativtager til den årlige kulturarvshackathon HACK4DK og bestyrelsesmedlem på HistoriskAtlas.dk.

Rigsarkivet

Lukket for kommentarer.