Clarch Suite – Analisi AI di Manoscritti del Patrimonio Culturale Italiano

Dataset di metadati arricchiti estratti da manoscritti del patrimonio culturale italiano tramite una pipeline multimodale basata su computer vision e modelli AI vision-language. Include metadati strutturati in formato TEI XML relativi a collezioni di Modena, Cassino, Bologna, Brescia e Milano.

Panoramica

Data Product realizzato nell’ambito dell’evento “Ecomic: Hack the Data Culture”.

Il data product “Clarch Suite” fornisce metadati strutturati e arricchiti tramite intelligenza artificiale per collezioni di manoscritti del patrimonio culturale italiano. La soluzione analizza immagini di pagine manoscritte e integra le informazioni estratte nei file XML TEI originali, producendo schede catalografiche conformi agli standard archivistici italiani.

Il progetto è stato sviluppato dal team Clarch, composto da Diletta Quarticelli – Computer Science Engineer, Giulia D’Aleo – Designer e Marcello Domenis – Management Engineering, nell’ambito dell’hackathon “Ecomic: Hack the Data Culture”, svoltosi dal 9 all’11 dicembre 2025 presso il Museo Nazionale Romano – Palazzo Massimo.

La soluzione si è classificata al 3° posto nella Sfida n.1 – “AI per la descrizione del patrimonio culturale”, dedicata allo sviluppo di strumenti intelligenti per automatizzare e migliorare la descrizione dei beni culturali.

La soluzione nasce per supportare archivi, biblioteche, musei e ricercatori nella catalogazione e nell’arricchimento dei metadati dei manoscritti, facilitandone consultazione, studio e riuso in piattaforme digitali.

Il Data Product utilizza una pipeline multimodale che combina computer vision e il modello vision-language Qwen3-VL. La pipeline estrae descrizione, numero di righe, materiale, dimensioni, stato di conservazione, layout, scrittura, decorazioni, datazione, autore, incipit, explicit, nomi e tipologia d’opera.

Le collezioni elaborate comprendono manoscritti provenienti dall’Archivio di Stato di Modena, dall’Abbazia di Montecassino e dalle biblioteche di Bologna, Brescia, Milano e Pavia.

Use case principali: catalogazione automatica di manoscritti, arricchimento di metadati TEI, ricerca filologica e paleografica, addestramento di modelli AI su testi storici.

Target: archivi, biblioteche, musei, università, ricercatori e sviluppatori AI.

Scorri