
Clarch Suite – Analisi AI di Manoscritti del Patrimonio Culturale Italiano
Dataset di metadati arricchiti estratti da manoscritti del patrimonio culturale italiano tramite una pipeline multimodale basata su computer vision e modelli AI vision-language. Include metadati strutturati in formato TEI XML relativi a collezioni di Modena, Cassino, Bologna, Brescia e Milano.

Panoramica
Data Product realizzato nell’ambito dell’evento “Ecomic: Hack the Data Culture”.
Il data product “Clarch Suite” fornisce metadati strutturati e arricchiti tramite intelligenza artificiale per collezioni di manoscritti del patrimonio culturale italiano. La soluzione analizza immagini di pagine manoscritte e integra le informazioni estratte nei file XML TEI originali, producendo schede catalografiche conformi agli standard archivistici italiani.
Il progetto è stato sviluppato dal team Clarch, composto da Diletta Quarticelli – Computer Science Engineer, Giulia D’Aleo – Designer e Marcello Domenis – Management Engineering, nell’ambito dell’hackathon “Ecomic: Hack the Data Culture”, svoltosi dal 9 all’11 dicembre 2025 presso il Museo Nazionale Romano – Palazzo Massimo.
La soluzione si è classificata al 3° posto nella Sfida n.1 – “AI per la descrizione del patrimonio culturale”, dedicata allo sviluppo di strumenti intelligenti per automatizzare e migliorare la descrizione dei beni culturali.
La soluzione nasce per supportare archivi, biblioteche, musei e ricercatori nella catalogazione e nell’arricchimento dei metadati dei manoscritti, facilitandone consultazione, studio e riuso in piattaforme digitali.
Il Data Product utilizza una pipeline multimodale che combina computer vision e il modello vision-language Qwen3-VL. La pipeline estrae descrizione, numero di righe, materiale, dimensioni, stato di conservazione, layout, scrittura, decorazioni, datazione, autore, incipit, explicit, nomi e tipologia d’opera.
Le collezioni elaborate comprendono manoscritti provenienti dall’Archivio di Stato di Modena, dall’Abbazia di Montecassino e dalle biblioteche di Bologna, Brescia, Milano e Pavia.
Use case principali: catalogazione automatica di manoscritti, arricchimento di metadati TEI, ricerca filologica e paleografica, addestramento di modelli AI su testi storici.
Target: archivi, biblioteche, musei, università, ricercatori e sviluppatori AI.
I dati danno vita alle idee.
Scriviamole insieme
Con DPaaS, puoi trasformare un’idea in una soluzione innovativa concreta, grazie a un laboratorio digitale avanzato che semplifica l’elaborazione dei dati culturali, ne favorisce il riuso e accelera la diffusione di nuovi servizi.

