Projektdirektiv – Digitalisering av kortkataloger
Bakgrund
Universitetsbiblioteket förfogar över ett antal äldre kortbundna kataloger. Sju kataloger av mycket skiftande karaktär har bedömts som särskilt intressanta för digitalisering och tillgängliggörande på webben. Katalog -1957 är den i särklass största katalogen med totalt 825 000 kort, varav ca 1/3 är handskrivna. Sedan slutet av 1970-talet katalogiserar UB digitalt, men en stor del av UB:s äldre samlingar finns inte som metadata i de modernare systemen och är i praktiken osynliga för användarna.
Under 1990-talet mikrofilmades Katalog -1957 och i början av 2000-talet tillgängliggjordes katalogen i den s.k. IPAC-lösningen. Lösningen är tillgänglig på nätet i en modell som mycket liknar den fysiska katalogen, med en integrerad beställningsfunktion. Systemet har ingen koppling till dagens Libris eller LUBcat/LUBsearch.
IPAC-systemet är under revision från leverantören, men kommer även efter uppdatering ha en begränsad funktion. Systemet kommer fortsatt ha en bristfällig integration mot Libris, ha en begränsad tillgång till integrerbar data och utvecklas för närvarande i ett fåmansföretag.
Vi bör fortsätta resan mot att integrera Katalog -57 med det moderna materialet i LUBcat och i Libris, där sök och beställning av material med olika ålder kan harmoniseras. En sådan koppling skulle också medge mer synlighet i Google och andra söksystem och därmed ge en mycket högre tillgänglighet för materialet. Det ger också större möjlighet till integrationer mot andra system. I en rapport om UB:s säkerhetsarbete framgår t.ex. behov av ett digitalt system för att bättre kontrollera äldre böcker som kan ha förkommit.
Som en del i projektet ingår även att öka vår kompetens kring textigenkänning av handskriven text, som kan vara användbart i andra projekt. Det är också intressant att tillgängliggöra de övriga sex katalogerna utanför UB.
Under 2021 genomfördes en förstudie av projektet och en pilotstudie pågår utifrån den s.k. porträttkatalogen.
Syfte
Syftet med projektet är att modernisera tillgången till våra tryckta kataloger. Detta innebär en uppdaterad, stabil lösning med integration mot de nya systemen med mål att unifiera materialet. Detta kommer öka och förenkla tillgängligheten och därmed användningen av UB:s äldre samlingar. Som en bieffekt av projektet söker vi att kompetensutveckla oss inom främst handskriftsigenkänning och dela med oss av produkter och kunskap till andra inom och utanför LU.
Mål
Leveransmål
- Ny högkvalitativ bildfångst av totalt sju kortkataloger:
– Katalog -1957
– Katalog 1958-
– Skolbokskatalogen
– Dagstidningar
– Kungliga förordningar
– Personverser
– Vardagstryck - Utveckling av visningsmodul för digitala kortkataloger, som även kan användas för visning och rättning av felaktiga metadata. Modulen ska utvecklas i samarbetet med användare/UX.
- Teckenigenkänning av både maskinskriven och handskriven text.
- Göra de aktuella katalogerna i deras helhet tillgängliga och sökbara i visningsmodulen.
- Tillgängliggöra kvalitativmetadata för så många kortförtecknade resurser som möjligt i Libris och LUBcat.
- Avveckla behovet av dagens IPAC-lösning.
- Göra lärdomar och produkter tillgängliga för kommande projekt och kollegor inom och utanför LU.
Effektmål
- Förenklad sökning och samlad tillgång till äldre och nyare material.
- Ökad tillgänglighet och användning av bibliotekets äldre material.
- En hög och uppdaterad intern kompetens om teckenigenkänning av handskriven text.
Avgränsningar
Projektet ska bara hantera de sju identifierade kortkatalogerna.
Budget
Budgeten för projektet är personalkostnader samt max 300 kkr för extern bildfångst.
Delprojekt
Projektet delas in i fem delprojekt:
- Pilotprojekt – porträttkatalogen
Porträttkatalogen är digitaliserad sedan tidigare och därför testas de olika stegen i detta pilotprojekt. Syftet är både att testa olika möjligheter som vi kommer att ha nytta av i arbetet med övriga kortkataloger, dvs transkribering, hantering av metadata, tillgängliggörande och rättning, och att göra Porträttkatalogen tillgänglig för användare.
Tidplan: prel. 2021 – dec 2022
(Reviderad Tidplan: april 2021 – dec 2023 (avhängigt övriga delprojekts tidplaner)
Bemanning: 10% projektledare, projektgrupp - Bildfångst och OCR
Detta delprojekt hanterar all form av bildfångst och OCR av maskinskriven text. I projektet ingår också upphandling och interaktion med externa leverantörer. Syftet med delprojektet är att digitalisera alla kort i katalogerna och omvandla deras maskinskrivna textinnehåll till maskinläsbart format, för att utvald metadata ska kunna indexeras.
Tidplan: prel. april – dec 2022
(reviderad Tidplan: prel. april 2022 – juni/juli 2023)
Bemanning: 10% projektledare, projektgrupp - Handskriven textigenkänning (HTR)
I delprojektet ingår att transkribera de handskrivna katalogkorten för att omvandla deras textinnehåll till maskinläsbart format, för att utvald metadata ska kunna indexeras.
Tidplan: prel. apr 2022 – apr 2023
(reviderad Tidplan: sept 2022 – dec 2023)
Bemanning: 20% projektledare, projektgrupp (10%) - Mappning och indexering
I detta delprojekt ska den transkriberade texten tolkas, för att om möjligt plocka ut rätt metadata. I arbetet kan ordlistor användas. Den metadata som identifieras med inte alltför stor andel fel indexeras i sökmotorn.
Tidplan: prel. aug 2022 – dec 2023
(reviderad Tidplan: september 2022 – juni 2024)
Bemanning: 20% projektledare, 100% IT-utvecklare under period, projektgrupp - Utveckling av visningssystem med rättningsmodul samt integrering i bibliotekssystem
I detta delprojekt ska ett IT-system utvecklas för visning av katalogkort tillsammans med identifierad och indexerad text. Delprojektet ska även utveckla en integrering i bibliotekssystem.
I detta projekt ingår också test av och start av olika typer av rättning, t.ex. av feltranskriberingar och felmappningar. Genom rättningen förbättrar vi kvaliteten hos de digitaliserade katalogposterna och därmed möjligheten att söka och använda dem.
Tidplan: prel. aug 2022– dec 2023
(reviderad Tidplan: september 2022 – juni 2024
Bemanning: 20% projektledare, 50% IT-utvecklare under period, projektgrupp
Organisation och bemanning
Till projektet knyts en styrgrupp:
Håkan Carlsson, överbibliotekarie, ordförande
Ewa Giniewska, avdelningschef UB
Jenny Hallström, avdelningschef UB
Kajsa Weber, Digital historia HT
Projektet leds av en huvudprojektledare:
Henrik Åslund
Delprojekt 1 bemannas med:
Åsa Forsberg (delprojektledare)
Maria Hedberg
Delprojekt 2 bemannas med:
Jenny Lövdahl (delprojektledare)
Håkan Håkansson
Robert Bengtsson
Kristian Knutsson
Gustav Rosengren
Åsa Forsberg
Delprojekt 3 bemannas med:
Åsa Forsberg (delprojektledare)Maria Hedberg
Åsa Sjöblom
Cecilia Roos
Delprojekt 4 bemannas med:
Maria Hedberg (delprojektledare)
Marita Blomberg
Mikael Lindgren
Jan Gustafsson
Cecilia Kaiserfeld
Frank Hansen
Delprojekt 5 bemannas med:
Stina Hallin (delprojektledare)
Erik Åberg
Jan Gustafsson
Marita Blomberg