OCR o Optical Character Recognition è la risposta alla domanda tanto curiosa sulla possibilità di estrarre da un’immagine digitale il testo in formato elaborabile ASCII, Unicode o addirittura sulla possibilità di estrarre e rendere elaborabile l’intera formattazione della pagina contenuta nell’immagine digitale. Il riconoscimento OCR funziona attraverso una forma di intelligenza artificiale e di evoluzione degli algoritmi in grado di riconoscere i caratteri impressi nell’immagine non modificabile e di renderli in un formato modificabile e riutilizzabile.

Lo stato dell’arte, inoltre, permette oggi di riconoscere anche la punteggiatura, i caratteri speciali, gli spazi e la fine di ogni riga: in poche parole la formattazione dell’intero testo in immagine.

Ovviamente il riconoscimento ottico OCR può avvenire in diversi modi a seconda delle necessità che implicano il processo di gestione dei documenti digitali, per cui si può accedere a:
• Un riconoscimento OCR automatico, che implica l’esecuzione del riconoscimento ogni volta che viene digitalizzato un documento. Questa scelta è consona ad un processo di gestione documentale che a monte della digitalizzazione abbia normalizzato i propri documenti.
• Un riconoscimento OCR manuale, attraverso un’applicazione aggiuntiva e eseguibile solo successivamente alla scansione attraverso l’attuazione dei comandi ad esso preposti.
• L’indicizzazione. Qui il riconoscimento OCR permette, attraverso un servizio di sistema di individuare i file nel computer (anche immagini digitali contenenti testo, appunto) tramite una ricerca di testo vera e propria.

L’ultimo punto rende con chiarezza l’importanza del riconoscimento OCR all’interno del processo digitale di gestione documentale di un’azienda. Esso, in poche parole permette l’indicizzazione dei documenti ed un facile accesso ad essi.

Approfondimenti
Riconoscimento OCR

0 commenti

Lascia un Commento

Vuoi partecipare alla discussione?
Sentitevi liberi di contribuire!

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *