Nu tränar vi ground truth för en transkriberingsmodell

Vi har påbörjat arbetet med att manuellt transkribera tillräckligt många kort i Katalog -57 för att kunna träna en modell.

Vi har slumpat fram 29 kortlådor, en för varje bokstav i alfabetet utom ”S”, där vi tar två lådor. Varje låda innehåller mellan 270 och 500 kort, och vi transkriberar alla, både handskrivna och maskinskrivna.

Det är ett roligt men ganska klurigt arbete, det är inte alltid helt uppenbart hur man ska transkribera olika tecken och alfabet, och vissa handstilar är svårare än andra.

Vi hittar också en del godbitar, det känns fint att kunna ta del av en fullständig sanning.

Write a comment

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *