w/arc Gli operatori logici nei motori di ricerca
Introduzione
L’obiettivo della ricerca avanzata è quello di permettere un interrogazione abbastanza specifica, in modo da escludere documenti non rilevanti. Per fare questa selezione è necessario definire il maggior numero possibile di caratteristiche che il documento che stiamo cercando deve possedere, più specifica è la descrizione, meno sono i documenti che vi corrispondono, e più pertinente è il loro contenuto.
Il contenuto di un documento in rete è descritto o dalla sua collocazione in una particolare categoria di un catalogo, o dalle parole che lo compongono e lo descrivono che vengono indicizzate dai motori di ricerca. Per recuperare un documento che ci interessa si può quindi chiedere al catalogo di mostrarci tutti quelli che compaiono in una determinata categoria, oppure chiedere al motore di ricerca tutti quelli che sono associati a determinate parole.
L’uso di un catalogo è abbastanza intuitivo, e questo è uno dei suoi pregi maggiori. L’interrogazione di un motore di ricerca può risultare invece più problematica. Vediamo quali sono i passi da compiere.
Prima di tutto dobbiamo sapere cosa stiamo cercando. Gli [operatori logici](#OPERATORI LOGICI O BOOLEANI) tornano utili soprattutto quando abbiamo un’idea chiara di ciò che vogliamo, e lo possiamo quindi descrivere in modo adeguato. Chiarirsi le idee è quindi la cosa fondamentale.
I motori di ricerca associano ad ogni documento tutte le parole che contiene e delle parole aggiuntive che gli autori hanno definito come sua descrizione, ordinate in base alla loro rilevanza. Se abbiamo ben presente il contenuto del documento che stiamo cercando, sappiamo quali parole può contenere o quali lo possano descrivere. Il modo migliore di procedere è cominciare l’interrogazione con una parola o frase altamente specifica, come può essere un termine tecnico o il nome di una persona. Spesso questo è sufficiente.
Se non otteniamo alcun risultato o ne otteniamo troppo pochi, prima di cambiare parola chiave si può provare con le sue declinazioni grammaticali (maschile/femminile e singolare/plurale per i sostantivi, e i diversi tempi e modi per i verbi). A questo scopo può essere utile il segno * (asterisco).
Se i risultati sono troppi, oppure non ci vengono in mente che parole generiche, possiamo cominciare ad aggiungere parole chiave legate da AND.
Un modo alternativo per scremare i risultati è l’uso di NOT.
Se facendo così abbiamo ridotto troppo il campo della ricerca si può utilizzare OR per allargarlo leggermente. Procedendo per aggiustamenti successivi, utilizzando se necessario le parentesi, mettendo o togliendo parole chiave per mezzo di AND o ponendo alternative per mezzo di OR, si riesce in genere a ridurre i risultati ad un piccolo numero veramente rilevante.
Oltre che nel contenuto ci sono altri aspetti di un documento che possono essere descritti, ad esempio la sua fonte. Supponiamo di voler informarci sui danni prodotti dai telefoni cellulari, possiamo decidere da quale fonte preferiamo trarre l’informazione, ad esempio da un’università o da un movimento di consumatori, in questi casi “università” o “consumatori” potrebbero essere alcune parole chiave. Ad esempio:
Interrogazione | Risultati |
---|---|
“telefoni cellulari” and (danni near salute) | 25 |
“telefoni cellulari” and (danni near salute) and consumatori | 10 (connessi in alle associazioni o ai movimenti dei consumatori) |
“telefoni cellulari” and (danni near salute) and università | 4 (di provenienza istituzionale) |
Le funzioni di ricerca avanzata variano nei diversi motori di ricerca, ma quasi tutti supportano gli [operatori logici](#OPERATORI LOGICI O BOOLEANI). Per utilizzarli è spesso necessario accedere ad una specifica interfaccia per la ricerca avanzata, dove sono in genere disponibili molte altre funzioni.
Buona ricerca.
GLOSSARIO
Operatori logici e booleani
Gli operatori logici o booleani prendono il loro nome da George Boole, matematico inglese della prima metà dell’800 che formalizzo la logica binaria che sta alla base dei moderni calcolatori. I principali e più diffusi sono AND, OR, e NOT, a cui si può aggiungere negli strumenti di ricerca NEAR.
Asterisco (*)
Alcuni motori di ricerca accettano l’asterisco come sostituto di una o più lettere. L’asterisco può quindi essere usato per cercare tutte le declinazioni di una parola, come il genere ed il numero dei sostantivi o il tempo e il modo dei verbi. Ad esempio, “Cavall*” sta per cavalla, cavallo, cavalli, cavallerizzo, e per tutte le altre parole che cominciano per “caval”.
“Vend*” sta per venderò, venduto, vendessi, vendendo, vendesi, ecc. L’asterisco può essere usato anche all’interno di una parola, ad esempio quando non si è sicuri della sua ortografia (“invec*e” cerca sia “invece” che “invecie”, ma anche “invecchiate”).
Virgolette (" “)
Le virgolette alte (” “) indicano al motore di ricerca che il loro contenuto deve essere trattato come una frase, cioè come una sequenza di parole che devono comparire nel testo come un blocco unico (ad esempio “sport estremo”, ma anche “Giuseppe Verdi”). Se inseriamo una frase senza racchiuderla tra virgolette il motore di ricerca interpreta le parole come legate da OR, e quindi, invece di restringere l’ambito della ricerca, lo allarga. Nel nostro caso non troverà solo i documenti che contengono la frase “sport estremo” ma tutti quelli che contengono la parola “sport” e tutti quelli che contendono la parola “estremo”. Nel caso di nomi propri, visto che cognome e nome possono presentarsi in ordine diverso o addirittura separati da titoli (es. Carlo Dr. Grassi) si può usare anche NEAR.
[Esempio di differenza tra AND, NEAR e la ricerca per frasi](#DIFFERENZA TRA AND).
Near
Due o più parole legate da NEAR devono comparire entrambe nel testo e a distanza ravvicinata (tipicamente a distanza massima di 10 parole). E’ quindi una condizione più restrittiva della semplice AND, ma meno restrittiva della ricerca di una frase. Può essere utile per cercare nomi di persone, in cui il nome e il cognome possono essere ordinati in modo diverso e addirittura separati da titoli, e più in generale in quelle situazioni in cui si cerca termini in relazione tra loro, come un aggettivo e il suo sostantivo.
[Esempio di differenza tra AND, NEAR e la ricerca per frasi](#DIFFERENZA TRA AND).
And
Se uniamo due più parole chiave con l’operatore AND, significa che volgiamo solo i documenti che contengono tutte le parole indicate (questo E quello). Si usa AND, quindi, per restringere il campo della ricerca.
[Esempio di differenza tra AND, NEAR e la ricerca per frasi](#DIFFERENZA TRA AND).
Le parole vanno inserite in ordine di importanza, le più importanti cioè vanno per prime. Se stiamo cercando gli accordi delle canzoni di Ligabue, è meglio inserire “Ligabue AND accordi” pittosto che “accordi AND Ligabue”, visto che prima di tutto ci interessano le pagine dedicate al cantate, e tra queste, quelle che riportano gli accordi.
Not
Una parola chiave preceduta da AND NOT indica al motore di ricerca che non vogliamo i documenti che contengono quella parola. Naturalmente bisognerà indicare anche quali sono le parole che vogliamo compaiano nei nostri documenti.
L’uso di NOT è importante quando vogliamo escludere delle sottocategorie di documenti. Ad esempio facendo delle ricerche sulla composizione chimica degli oli essenziali contenuti nel basilico si pone questa interrogazione:
“oli essenziali” AND basilico
I risultati che ci interessano sono però inquinati da un grande numero di documenti che si riferiscono sì agli oli essenziali del basilico, ma dal punto di vista delle medicine alternative e del massaggio. Specificare
“oli essenziali” AND basilico AND scienza
non risolve il problema perché anche i documenti che non ci interessano potevano contenere espressioni del tipo “…la scienza riconosce molte proprietà agli oli essenziali contenuti le basilico…”. La soluzione più pratica è un’interrogazione del tipo:
“oli essenziali” AND basilico AND NOT (cura OR massaggi)
Nelle interfacce di ricerca semplice l’operatore AND NOT è in genere sostituito dal segno - (meno).
Or
Unendo due o più parole unite da OR chiediamo al motore di ricerca di darci tutti i documenti che contengono o una parola o l’altra, o anche tutte e due.
L’uso di OR, quindi, allarga il campo della ricerca. “Alberghi OR pensioni” cerca i documenti che parlano sia di alberghi che di pensioni. Nelle interfacce di ricerca semplice OR è sostituito dal segno + (più).
Parentesi
Tutti gli operatori logici possono essere inseriti in espressioni complesse del tipo
riccione AND (alberghi OR pensioni)
Le parentesi indicano che l’oggetto dell’operatore che le precede, in questo caso AND, non è la parola immediatamente seguente (alberghi) ma l’intera espressione contenuta tra le parentesi (alberghi OR pensioni). Stiamo chiedendo di darci tutti i documenti che contengono la parola “riccione” e una delle due tra “alberghi” e “pensioni” (o anche tutte e due).
Esattamente come nelle espressioni algebriche si possono aprire parentesi all’interno di altre parentesi