PEC: dg-a[at]pec.cultura.gov.it   e-mail: dg-a[at]cultura.gov.it   tel: (+39) 06 6723 6936

 

Direzione generale Archivi

Newsletter

Iscriviti alla Newsletter della Direzione generale Archivi per ricevere una sintesi delle notizie salienti pubblicate sul nostro sito.

CLICCA QUI


Notizia

Archivi | Via al progetto "Transkribus": trascrizione automatica documenti tramite intelligenza artificiale

English version below

Roma, 1 luglio 2025 Fornire ai 102 Archivi di Stato italiani e ad ogni ricercatore la possibilità di accedere in modo più semplice e rapido alla lettura di documenti trascritti automaticamente in formato digitale. È l’obiettivo del progetto di trascrizione documentale automatica mediante intelligenza artificiale, presentato oggi, al Ministero della Cultura, dal Direttore Generale Archivi, Antonio Tarasco.

Dopo un accurato studio di fattibilità, la Direzione ha avviato una collaborazione con la piattaforma Transkribus – READ COOP, sviluppata dall’Università di Innsbruck nell’ambito del progetto europeo HORIZON 2020 “READ”. La tecnologia, basata su sistemi di riconoscimento del testo manoscritto (HTR – Handwritten Text Recognition), consente la trascrizione automatica di documenti storici, trasformandoli in testi digitali accessibili, ricercabili e interpretabili da strumenti informatici. L’iniziativa intende quindi creare un ambiente di lavoro virtuale e interattivo che, oltre alla visualizzazione del documento originale, permetta una ricerca avanzata per parole chiave, temi e strutture testuali, grazie all’intelligenza artificiale addestrata su tipologie documentarie specifiche.

Il progetto prevede:

  • l’accesso alla piattaforma Transkribus per tutti gli istituti archivistici statali e per l’ICAR (Istituto Centrale per gli Archivi);
  • disponibilità 30 TB di spazio di archiviazione;
  • un percorso di formazione articolato in 12 incontri tematici rivolti ai referenti archivistici;
  • un servizio di assistenza tecnica qualificata fornito direttamente dalla società sviluppatrice del programma di I.A.

L’adozione di questa tecnologia, che non richiede competenze pregresse in ambito informatico o di machine learning, segna un’evoluzione nel concetto di digitalizzazione documentale, ponendosi anche come strumento inclusivo a favore della fruizione da parte di persone con disabilità.

Dopo la fase sperimentale avviata presso l’Archivio di Stato di Caserta grazie alla collaborazione del Dipartimento di Fisica dell’Università “Federico II” di Napoli, abbiamo deciso di estendere l’applicazione dell’intelligenza artificiale alla trascrizione dei documenti archivistici di tutti i 102 Archivi di Stato, nella convinzione che il sistema archivistico nazionale debba essere considerato nella sua unitarietà. L’adozione di tale tecnologia agevolerà certamente gli studiosi e il personale archivistico, consentendo di velocizzare la lettura e comprensione di gran parte dei documenti archivistici custoditi nei nostri Archivi. Questa tecnologia avvicina gli archivi statali italiani ai grandi archivi internazionali e rappresenta una delle prime sperimentazioni nel settore archivistico italiano”, ha dichiarato Antonio Tarasco, Direttore Generale Archivi.

Rassegna stampa:

Quotidiano Nazionale

Il Messaggero

AgCult

    

______________________________________________________________________

Archives | Start of the “Transkribus” project: automatic transcription of documents using artificial intelligence 

Rome, 1 July 2025. Providing Italy's 102 State Archives and every researcher with easier and faster access to reading documents automatically transcribed in digital format. This is the aim of the project for automatic document transcription using artificial intelligence, presented today at the Ministry of Culture by the Director General for Archives, Antonio Tarasco

After a thorough feasibility study, the Directorate started a cooperation with the Transkribus - READ COOP platform, developed by the University of Innsbruck within the HORIZON 2020 European project “READ”. The technology, based on Handwritten Text Recognition (HTR) systems, enables the automatic transcription of historical documents, transforming them into digital texts that are accessible, searchable and interpretable by IT tools. The initiative therefore aims to create a virtual and interactive working environment that, in addition to the visualisation of the original document, allows advanced search by keywords, themes and text structures, thanks to artificial intelligence trained on specific document types. 

The project includes: 

- access to the Transkribus platform for all state archival institutes and for the ICAR (Central Institute for Archives); 

-availability of 30 TB of storage space; 

-a training course consisting of 12 thematic meetings aimed at archival referents; 

-a qualified technical assistance service provided directly by the company developing the I. A. programme. A. 

The adoption of this technology, which does not require previous IT or machine learning skills, marks an evolution in the concept of document digitisation, also acting as an inclusive tool for use by people with disabilities. 

"After the experimental phase started at the State Archives of Caserta thanks to the collaboration of the Physics Department of the “Federico II” University of Naples, we decided to extend the application of artificial intelligence to the transcription of the archival documents of all 102 State Archives, in the conviction that the national archival system should be considered as a whole. The adoption of this technology will undoubtedly facilitate scholars and archival staff, making it possible to speed up the reading and comprehension of most of the archival documents held in our Archives. This technology brings Italian state archives closer to large international archives and represents one of the first experiments in the Italian archival sector," said Antonio Tarasco, Director General of Archives