IDM Group digitalizza l’Archivio del Corriere della Sera
Idm Group annuncia la sua partecipazione alla Ifla International Newspaper Conference 2012 che si terrà a Parigi dall’11 al 13 Aprile. La conferenza ha l’obiettivo di illustrare i migliori progetti di digitalizzazione in Europa e nel mondo, avviati da biblioteche, archivi, editoria ecc.
Idm Group, insieme ad Isako, presenterà il progetto Dacs (Digitalizzazione Archivio Corriere delle Sera). Il Dacs, avviato nel 2010 a cura della Fondazione Corriere della Sera e tutt’ora in progress, è sicuramente uno dei più imponenti ed importanti progetti realizzati nel settore dell’editoria. Tutte le pagine del Corriere della Sera e del Corriere d’Informazione (edizioni dal 1876 al 2002) dovranno essere convertite da carta e bobine microfilm ad immagini tiff, jpg e pdf. Ogni singola pagina di queste edizioni e ogni singolo articolo (12 milioni di articoli) saranno disponibili in formato elettronico.
La gestione di questo importante progetto ha due fondamentali aspetti per IDM: da un lato, se si considerano i volumi gestiti, l’attività assume un carattere ‘industriale’; dall’altro, se si considera la singolarità della tipologia documentale gestita, assume un carattere ‘specialistico’.
Ad oggi Idm – che si occupa di tutta la struttura organizzativa coinvolta nel progetto Dacs – ha un team dedicato di 40 persone, suddivise tra le sedi di Oradea (Romania) e Milano. I site manager coordinano le unità di scansione e di preprocessing, quest’ultima dedicata al miglioramento qualitativo delle immagini; esiste poi un team di supervisione e controllo che verifica la qualità delle immagini, classificandole; a seguire viene attivata una squadra specializzata nelle attività di clipping (basandosi su tecnologia Isako) per la definizione della struttura e dei contenuti degli articoli; infine, si attiva il team di verifica e validazione del testo: in modo del tutto automatico – attraverso il motore semantico fornito da Expert System – il testo viene riconosciuto dall’Ocr e ne viene verificata la qualità. Il contenuto in formato elettronico viene salvato su supporti ad hoc che la Fondazione archivia nuovamente come ‘assicurazione’ sull’imperitura conservazione del patrimonio non solo suo ma dell’Italia intera.