Next Generation by Microdata

Show more

Il progetto Next Generation by Microdata ha avuto la sua genesi nel 2017. Si tratta di una delle progettualità vincitrici nell’ambito degli accordi di competitività della Regione Lombardia.

Questo sistema ha una architettura a microservizi, basati su due elementi fondanti:

  • Utilizzo di reti neurali per la classificazione di immagini e il riconoscimento di firme;
  • L’applicazione di algoritmi custom di Machine learning (SVM, Support Vector Machine) per la classificazione di documenti testuali

Grazie all’applicazione di reti neurali, il sistema è in grado di riconoscere i pattern grafici dei documenti di riconoscimento (prevalentemente), così da poterli classificare in autonomia in base alle differenti tipologie per le quali l’algoritmo è stato “istruito”.

Il Machine Learning è necessario per consentire all’algoritmo di imparare continuamente a classificare nuove tipologie di documento e nuove caratteristiche dei file che riceve in input.

Oltre alla classificazione e riconoscimento dei documenti, un elemento fondamentale di questo sistema è la capacità di estrarre in automatico i dati specifici, sulla base del tipo di lavorazione e del tipo di processo in cui il documento è coinvolto. 

L’architettura a Microservizi è fondamentale per garantire al sistema la necessaria flessibilità e customizzazione dei processi: non tutte le lavorazioni sono uguali, quindi in base alla tipologia di documenti e alla tipologia di flusso di processo si può strutturare il sistema di Next Generation abilitando i microservizi necessari e specifici.

Grazie a algoritmi di NLP (Natural Language Processing) vengono estratte le entità dai documento non-strutturati e le relazioni tra queste.  

Si tratta di un processo totalmente automatizzato, ma che non può prescindere dal presidio dell’essere umano.

Lo Human Factor diventa, in questo sistema, un elemento chiave poiché garantisce il presidio costante dell’intero processo e gestisce gli eventuali fall back del sistema di classificazione e indicizzazione automatico. Nel caso, comunque limitato, di errori del sistema, l’essere umano è in grado di intervenire e correggere l’errore, reimmettendo il documento nella coda di lavoro.

In questo modo il sistema sarà in grado, in futuro, di riconoscere in maniera migliore il documento che era stato precedentemente scartato.

    Richiedi maggiori informazioni

    Nome
    Cognome
    Email
    Azienda