Visa rutor

Nu är majoriteten av Tidningskatalogen synlig i Libris

Och därmed också vårt bestånd för dessa tidningar. Vi har ju redan matchat 2363 katalogposter mot befintliga poster och lagt på Universitetsbibliotekets bestånd genom att ladda upp maskinellt genererade beståndsposter. Nu har vi också laddat upp maskinellt skapade bibliografiska poster i Libris. Vi har laddat upp 337 bibliografiska poster för tidningar som saknades i Libris, och dessutom lagt på vårt bestånd.

Det innebär att större delen av det bestånd den analoga Tidningskatalogen pekar på nu är synligt och tillgängligt i Libris, och också i vår lokala katalog LUBcat.

Tidningskatalogen innehåller drygt 4089 kort, varav 469 är så kallade hänvisningskort (hänvisar till ett annat kort i samma katalog) som kan tas bort. För de cirka 3600 katalogkort som pekar på unika titlar har vi nu skapat 2973 beståndsposter, och för 337 av dessa alltså även skapat den bibliografiska posten.

Så här ser det ut

I MARC-vyn anges att posten är maskinellt skapad:

Och i beståndsposten finns en länk till en bild av själva kortet:

9 november 2023

Kommentarer

0 Kommentarer Lämna en kommentar

Nu tränar vi ground truth för en transkriberingsmodell

Vi har påbörjat arbetet med att manuellt transkribera tillräckligt många kort i Katalog -57 för att kunna träna en modell.

Vi har slumpat fram 29 kortlådor, en för varje bokstav i alfabetet utom ”S”, där vi tar två lådor. Varje låda innehåller mellan 270 och 500 kort, och vi transkriberar alla, både handskrivna och maskinskrivna.

Det är ett roligt men ganska klurigt arbete, det är inte alltid helt uppenbart hur man ska transkribera olika tecken och alfabet, och vissa handstilar är svårare än andra.

Vi hittar också en del godbitar, det känns fint att kunna ta del av en fullständig sanning.

12 september 2023

Kommentarer

0 Kommentarer Lämna en kommentar

Vi har lagt till beståndsposter i Libris

I delprojekt 4 började vi jobba med tidningskatalogen redan hösten 2022.

Vår idé var att försöka använda den OCR-skapade texten för att matcha innehållet på varje katalogkort till en tidningspost i Libris.

Efter att vi matchat så bra det gick, skulle vi lägga till s.k. beståndsposter för de tidningar i Libris som inte redan hade beståndsposter från UB. En beståndspost är en post man lägger till den bibliografiska posten. Den innehåller information om vad just vi på UB har hos oss av en viss tidning.

I mars hade vi kommit tillräckligt långt för att kunna lägga in våra första beståndsposter i Libris. Så här ser det ut i Libris:

Bibliografisk post för tidningen Aftonkuriren. Längst ner finns information om vårt bestånd.

När man klickar på ”Relaterad länk:” (som börjar med https://urn.kb.se) så kommer man till en bild av det katalogkort som vi använt för att skapa beståndsinformationen:

Bilden på katalogkortet till vänster och den transkriberade texten till höger.
7 september 2023

Kommentarer

0 Kommentarer Lämna en kommentar

Segmenteringsmodell för Katalog-57

För att tolka texten på en sida måste man först hitta den, det kallas för segmentering. Vi har tränat en modell att hitta texten på Katalog 57:s kort. Modellen ska först hitta all text och markera den med baslinjer.

Den lägger också på masker som helst ska täcka hela bokstäverna.

Till att börja med hade den svårt att hitta all text, och tolkade också fläckar och små streck i marinalen som text, men efter ganska mycket träning har vi en tillräckligt bra modell.

Nu har vi segmenterat de korten i de 29 lådor som ska transkribera manuellt för att kunna träna en transkriberingsmodell

25 augusti 2023

Kommentarer

0 Kommentarer Lämna en kommentar

Vad händer i grupp fem?

Under sommaren har arbetet legat i träda, men nu ligger vi i startgroparna att ta upp trådarna igen. Det som står på agendan är att ta fram beskrivning av ett system för att visa, rätta och beställa material katalogiserat i (pappers-)kortform. Då behöver vi identifiera vad som ska visas i ett sådant system, bestämma vilken funktionalitet som behövs, samt ta reda på vilken data som ska skickas mellan vilka andra befintliga system. Det som beslutas måste passa in i våra övriga arbetsflöden och så mycket som möjligt harmoniera med våra övriga rutiner. När väl allt tankearbete är klart och alla specifikationer utarbetade tar arbetet med att faktiskt skapa något konkret vid.

25 augusti 2023

Kommentarer

0 Kommentarer Lämna en kommentar