
Clio – Catalogazione AI di Manoscritti del Patrimonio Culturale Italiano
Sistema basato su intelligenza artificiale per la catalogazione automatica di manoscritti italiani. Analizza le immagini, estrae metadati descrittivi e genera schede XML/TEI conformi agli standard CNMD/CNMS, producendo dati interoperabili e riutilizzabili per ricerca storica, linguistica e digital humanities.

Panoramica
Data Product realizzato nell’ambito dell’evento “Ecomic: Hack the Data Culture”.
Il data product “Clio – Catalogazione AI di Manoscritti” propone un sistema automatico per la descrizione e la catalogazione di beni culturali documentali. La soluzione analizza immagini digitali di manoscritti e genera schede catalografiche strutturate, facilitando l’organizzazione, la ricerca e la valorizzazione del patrimonio documentale.
Il progetto è stato sviluppato dal team Clio, composto da Elisa Faggio – Project Manager culturale, Laís Kantor – Designer e Matteo Osio – Data Engineer, nell’ambito dell’hackathon “Ecomic: Hack the Data Culture”, svoltosi dal 9 all’11 dicembre 2025 presso il Museo Nazionale Romano – Palazzo Massimo.
La soluzione è stata realizzata nell’ambito della Sfida n.1 – “AI per la descrizione del patrimonio culturale”, dedicata allo sviluppo di strumenti intelligenti per automatizzare la descrizione e la catalogazione dei beni culturali.
Il Data Product espone una API REST che riceve immagini di manoscritti e restituisce schede in formato XML/TEI, conformi al profilo MOL-TEI e agli identificativi CNMD/CNMS del Catalogo Nazionale dei Manoscritti. I metadati estratti includono autore, titolo, datazione, lingua, provenienza, tipologia documentaria, incipit, explicit e stato di conservazione.
I dati sono archiviati in PostgreSQL ed esportabili in XML. L’applicazione è containerizzata con Docker Compose ed è stata distribuita e testata su macchina virtuale durante l’hackathon.
Use case principali: catalogazione automatica di fondi archivistici, addestramento di modelli NLP su testi storici, ricerca storica, filologica e archivistica, sviluppo di servizi digitali per il patrimonio culturale.
Target: istituti di ricerca, università, archivi di Stato, biblioteche, musei, enti culturali pubblici e privati e sviluppatori AI.
Documentazione
I dati danno vita alle idee.
Scriviamole insieme
Con DPaaS, puoi trasformare un’idea in una soluzione innovativa concreta, grazie a un laboratorio digitale avanzato che semplifica l’elaborazione dei dati culturali, ne favorisce il riuso e accelera la diffusione di nuovi servizi.

