Clio – Catalogazione AI di Manoscritti del Patrimonio Culturale Italiano

Sistema basato su intelligenza artificiale per la catalogazione automatica di manoscritti italiani. Analizza le immagini, estrae metadati descrittivi e genera schede XML/TEI conformi agli standard CNMD/CNMS, producendo dati interoperabili e riutilizzabili per ricerca storica, linguistica e digital humanities.

Panoramica

Data Product realizzato nell’ambito dell’evento “Ecomic: Hack the Data Culture”.

Il data product “Clio – Catalogazione AI di Manoscritti” propone un sistema automatico per la descrizione e la catalogazione di beni culturali documentali. La soluzione analizza immagini digitali di manoscritti e genera schede catalografiche strutturate, facilitando l’organizzazione, la ricerca e la valorizzazione del patrimonio documentale.

Il progetto è stato sviluppato dal team Clio, composto da Elisa Faggio – Project Manager culturale, Laís Kantor – Designer e Matteo Osio – Data Engineer, nell’ambito dell’hackathon “Ecomic: Hack the Data Culture”, svoltosi dal 9 all’11 dicembre 2025 presso il Museo Nazionale Romano – Palazzo Massimo.

La soluzione è stata realizzata nell’ambito della Sfida n.1 – “AI per la descrizione del patrimonio culturale”, dedicata allo sviluppo di strumenti intelligenti per automatizzare la descrizione e la catalogazione dei beni culturali.

Il Data Product espone una API REST che riceve immagini di manoscritti e restituisce schede in formato XML/TEI, conformi al profilo MOL-TEI e agli identificativi CNMD/CNMS del Catalogo Nazionale dei Manoscritti. I metadati estratti includono autore, titolo, datazione, lingua, provenienza, tipologia documentaria, incipit, explicit e stato di conservazione.

I dati sono archiviati in PostgreSQL ed esportabili in XML. L’applicazione è containerizzata con Docker Compose ed è stata distribuita e testata su macchina virtuale durante l’hackathon.

Use case principali: catalogazione automatica di fondi archivistici, addestramento di modelli NLP su testi storici, ricerca storica, filologica e archivistica, sviluppo di servizi digitali per il patrimonio culturale.

Target: istituti di ricerca, università, archivi di Stato, biblioteche, musei, enti culturali pubblici e privati e sviluppatori AI.

Documentazione

Scorri