In alcuni progetti di archiviazione documentale digitale, la ricerca dei documenti in archivio attraverso i metadati può non essere sufficiente. Può presentarsi la necessità di ritrovare un documento digitale a partire da una parola o da una porzione di testo all’interno del corpo del suo contenuto. Lo strumento per effettuare questo tipo di repository è la ricerca full-text.
La differenza tra la ricerca full-text e la ricerca per metadati
I metadati sono dati strutturati che rispondono a standard propri dell’archiviazione documentale digitale. Le informazioni che possono essere gestite nell’ambito dei metadati non possono descrivere il documento nei suoi dettagli. Qualora fosse necessario rintracciare i documenti in archivio attraverso keyword non prevedibili in fase d’archiviazione, la ricerca full-text è la soluzione giusta.
Non solo titoli e sommario
In alcuni casi, le query testuali possono essere effettuate su porzioni strutturate di testo, come titoli e sommari. Nel caso della ricerca full-text, la keyword inserita può essere presente in tutto il contenuto del documento, indifferentemente dalla posizione nel testo.
Il motore di ricerca: la tecnologia alla base della ricerca full-text
Il cuore della tecnologia alla base della ricerca full-text è il motore di ricerca, che indicizza automaticamente i contenuti scansionati.
La ricerca full-text in Alfresco
Alfresco, uno dei più diffusi sistemi di gestione dei contenuti, per la ricerca dei documenti a partire dal repository testuale offre la soluzione Alfresco Full Text Search.
Grazie all’utilizzo di alcuni operatori di ricerca, Alfresco Full Text Search può performare, tra le altre, le seguenti tipologie di repository:
- Ricerca per singolo termine
- Ricerca per frase
- Ricerca per termine esatto
- Ricerca per l’espansione di un termine
- Ricerca della compresenza di due keyword
- Ricerca per esclusione di una keyword
- Ricerca per campi
- Ricerca per range (massimo, minimo)
Ricerca per prossimità tra keyword