Attività svolte

scanner planetario

Per definire la consistenza del patrimonio l'Agenzia per l'Italia Digitale, ha effettuato numerosi sopralluoghi presso alcune biblioteche.

Per costituire la collezione da de-materializzare, l'Agenzia si è rivolta sia ad amministrazioni pubbliche, enti e associazioni, che hanno fornito numerose annate delle gazzette a titolo gratuito, sia a biblioteche pubbliche, con le quali sono stati sottoscritti accordi finalizzati al prestito dei volumi, sia a privati collezionisti, dai quali ha acquistato i numeri ancora mancanti.

L'acquisizione digitale delle immagini e la realizzazione dell'inventario del patrimonio documentale sono terminate a dicembre 2009. Per ciascuna delle 660.000 immagini acquisite digitalmente, è stato prodotto un file in formato TIFF (per la conservazione) e uno in PDF (per la consultazione); dal PDF è stato effettuato il riconoscimento del testo tramite OCR e prodotto un file TXT associato al PDF stesso (PDF searchable, per la ricerca).

L'acquisizione digitale delle gazzette più antiche, di formato A2, è stata effettuata con scanner planetari, che hanno consentito l'acquisizione dei volumi rilegati non sfascicolabili.

scanner rotativo

Per le gazzette più recenti, di formato A4, è stato generalmente possibile sfascicolare i volumi ed utilizzare scanner rotativi, tranne nei casi in cui la qualità della carta era scarsa e si è dovuto ricorrere agli scanner planetari.

L'attività di acquisizione digitale è stata condizionata dallo stato di conservazione delle gazzette e dalle caratteristiche tipografiche degli originali cartacei, che, anche se conservati presso biblioteche specializzate, hanno presentato – soprattutto per le gazzette più antiche - problematiche di deterioramento della carta e della stampa e di formati cartacei non rispondenti agli standard tipografici. Queste sono le cause per cui circa l'8% della collezione presenta una scarsa qualità delle immagini e, conseguentemente, una scadente qualità del testo riconosciuto tramite OCR, con un significativo "tasso di errori" e di parole "NON ricercabili".

Terminata la fase di acquisizione, l'Agenzia ha realizzato il database dei dati catalografici e il presente sito per la consultazione online ed il salvataggio in locale delle gazzette.

Note legali