Metadataskiftet 2020-2023

KB kommer att under 2020-2023 satsa extra på att utveckla metadatahanteringen i syfte att uppnå ökat lärande, mer automation, ökad effektivitet och bättre resursutnyttjande. Målgruppen är KB:s verksamheter kring metadata men i förlängningen även den som använder våra tjänster. På den här sidan kommer man att kunna följa vad som görs.

Bakgrund

På metadataområdet sker en kraftig utveckling som en naturlig följd av samhällets och mediernas digitalisering. Med äldre beskrivningsmetoder förmår vi inte hantera det ökade medieinflödet, och inte heller möta dagens mer komplexa användarbehov. Man kan beskriva det som ett paradigmskifte, ett "metadataskifte", en förflyttning där vi i allt högre grad återanvänder metadata från producenter av insamlat material, samt utvecklar nya automatiserade metadataflöden med hjälp av till exempel artificiell intelligens (AI). Skiftet handlar också om att öppna upp bibliotekskatalogen, att göra bibliotekens data mer tillgängliga för omvärlden och därmed öka möjligheterna till samarbete mellan kunskaps- och kulturinstitutioner, med förlag och andra aktörer som t.ex. Wikimedia.

På gång nu

Vi undersöker hur förmågor som tas fram av KB-labbet kan användas som stöd för den interna hanteringen av metadata. Exempel på det är likhetssökning samt identifiering och länkning av entiteter.

Likhetssökning

kan användas för att maskinellt identifiera bilder och texter som liknar varandra. Vi har utvecklat en prototyp för att kunna visa, söka fram och göra jämförelser av motiv i bilder, hitintills testat på topografiska vykort ur KB:s samlingar. Prototypen kan än så länge bara ses internt.

Igenkänning och länkning av entiteter

Träning pågår av KB-labbets språkmodeller så att de blir ännu bättre på att känna igen entiteter i texter. Entiteter kan vara namn på personer, institutioner, verk, händelser, geografiska platser, med flera. Detta görs dels maskinellt, dels manuellt av KB:s personal i ett så kallat annoteringsverktyg.

Nästa steg blir att automatiskt länka samman dessa identifierade entiteter med system eller tjänster som t.ex. Libris eller Wikipedia.

Med hjälp av förmågor som ovan kommer vi att kunna få helt andra möjligheter att tillgängliggöra våra stora samlingar av bilder, tidningar, vardagstryck, webb, radio, tv, med mera. Metadata behöver inte finnas i början utan kan skapas i användningen eller genereras automatiskt och läggas till efteråt.

Automatiserade arbetsflöden

Vi tittar också på hur vi kan förbättra våra arbetsprocesser och funktionalitet i nuvarande system för att uppnå en effektivare och mer automatiserad metadatahantering. Målet är ett flöde där det finns stöd för maskinella kvalitetskontroller, automatiska uppdateringar av metadata, och så lite handpåläggning som möjligt. Vi har identifierat en rad åtgärder som behövs på vägen dit.

Några exempel:

  • Hitta fler externa källor för import av metadata
  • Kunna ange proveniens på elementnivå
  • Införa teknik för att slå samman metadata ("merging") i Libris istället för att som nu hela poster skrivs över
  • Att automatiska förslag ges på auktoriserade namnformer, ämnesklassningar och kopplingar mellan verk och instans

Men det handlar inte bara om teknisk utveckling. Det måste även till en höjd acceptans för metadata på en mer grundläggande nivå. Förbättringar i kvalitet ska självklart kunna göras, men efter hand vid behov, och i en takt som är möjlig.

Kungliga biblioteket logotyp

KUNGLIGA BIBLIOTEKET