Logo principale
Se abbattiamo i muri, ci troveremo circondati da un giardino. Se valichiamo la siepe, una valle si aprirà. (TAO)
Torna alla pagina iniziale Aggiungi ai Preferiti Area Riservata Contatto
::: Testo | A- | A+ | A0 :::
   Pagina iniziale // Internet // Gli operatori logici nei motori di ricerca
::: Cambia visualizzazione ::: who am i? :::   

Gli operatori logici nei motori di ricerca

Un problema tipico delle ricerche in rete è la difficoltà di "centrare" il documento o la risorsa che ci interessa, e di essere quindi sommersi da un mare di risposte non significative, in mezzo alle quali annega ciò che stiamo cercando. In questa situazione possono tornare utili gli strumenti di ricerca avanzata, in particolare gli "operatori logici".

L’obiettivo della ricerca avanzata è quello di permettere un interrogazione abbastanza specifica, in modo da escludere documenti non rilevanti. Per fare questa selezione è necessario definire il maggior numero possibile di caratteristiche che il documento che stiamo cercando deve possedere, più specifica è la descrizione, meno sono i documenti che vi corrispondono, e più pertinente è il loro contenuto.

Il contenuto di un documento in rete è descritto o dalla sua collocazione in una particolare categoria di un catalogo, o dalle parole che lo compongono e lo descrivono che vengono indicizzate dai motori di ricerca. Per recuperare un documento che ci interessa si può quindi chiedere al catalogo di mostrarci tutti quelli che compaiono in una determinata categoria, oppure chiedere al motore di ricerca tutti quelli che sono associati a determinate parole.

L’uso di un catalogo è abbastanza intuitivo, e questo è uno dei suoi pregi maggiori. L’interrogazione di un motore di ricerca può risultare invece più problematica. Vediamo quali sono i passi da compiere.

Prima di tutto dobbiamo sapere cosa stiamo cercando. Gli operatori logici  tornano utili soprattutto quando abbiamo un’idea chiara di ciò che vogliamo, e lo possiamo quindi descrivere in modo adeguato. Chiarirsi le idee è quindi la cosa fondamentale.

I motori di ricerca associano ad ogni documento tutte le parole che contiene e delle parole aggiuntive che gli autori hanno definito come sua descrizione, ordinate in base alla loro rilevanza. Se abbiamo ben presente il contenuto del documento che stiamo cercando, sappiamo quali parole può contenere o quali lo possano descrivere. Il modo migliore di procedere è cominciare l’interrogazione con una parola o frase altamente specifica, come può essere un termine tecnico o il nome di una persona. Spesso questo è sufficiente.
Se non otteniamo alcun risultato o ne otteniamo troppo pochi, prima di cambiare parola chiave si può provare con le sue declinazioni grammaticali (maschile/femminile e singolare/plurale per i sostantivi, e i diversi tempi e modi per i verbi). A questo scopo può essere utile il segno * (asterisco).

Se i risultati sono troppi, oppure non ci vengono in mente che parole generiche, possiamo cominciare ad aggiungere parole chiave legate da AND.
Un modo alternativo per scremare i risultati è l’uso di NOT.
Se facendo così abbiamo ridotto troppo il campo della ricerca si può utilizzare OR per allargarlo leggermente. Procedendo per aggiustamenti successivi, utilizzando se necessario le parentesi, mettendo o togliendo parole chiave per mezzo di AND o ponendo alternative per mezzo di OR, si riesce in genere a ridurre i risultati ad un piccolo numero veramente rilevante.

Oltre che nel contenuto ci sono altri aspetti di un documento che possono essere descritti, ad esempio la sua fonte. Supponiamo di voler informarci sui danni prodotti dai telefoni cellulari, possiamo decidere da quale fonte preferiamo trarre l’informazione, ad esempio da un’università o da un movimento di consumatori, in questi casi "università" o "consumatori" potrebbero essere alcune parole chiave. Ad esempio:

Interrogazione Risultati *
"telefoni cellulari" and (danni near salute) 25
"telefoni cellulari" and (danni near salute) and consumatori 10 (connessi in alle associazioni o ai movimenti dei consumatori)
"telefoni cellulari" and (danni near salute) and università 4 (di provenienza istituzionale)

*Ricerca effettuata su altavista.it il 02-05-2000.

Le funzioni di ricerca avanzata variano nei diversi motori di ricerca, ma quasi tutti supportano gli operatori logici. Per utilizzarli è spesso necessario accedere ad una specifica interfaccia per la ricerca avanzata, dove sono in genere disponibili molte altre funzioni. Vediamo alcune particolarità di due importanti motori di ricerca, uno internazionale e uno italiano:

Altavista permettere di:
  • restringere la ricerca ad un medium specifico (mp3, immagini, testo)
  • scegliere la lingua in cui deve essere scritto il documento
  • utilizzare tutti gli operatori logici di base e molte altre possibilità
  • ordinare i risultati in base a criteri diversi
  • specificare l’intervallo temporale in cui deve ricadere il documento cercato
Arianna consente di:
  • utilizzare le estensioni linguistiche. Si possono effettuare le ricerche utilizzando non solo la parola data ma anche le sue estensioni (singolare-plurale, maschile-femminile, forme verbali etc.). Cercando "gatto" si troveranno anche i documenti relativi a "gatti" e "gatte". Cercando "vincere" si troverà anche "vinto", "vincerò", ecc.
  • limitare la ricerca a specifiche porzioni di testo. E’ possibile limitare la zona in cui effettuare le ricerche al solo titolo. Questo può tornare utile quando si utilizzino dei termini comuni per la ricerca, perché limita il numero di risposte..
  • limitare la ricerca ad un sito specificato.

Le possibilità quindi sono tante. L'unica cosa da evitare è, davanti a 37569 risultati, cominciare a sfogliarli uno per uno.

Buona ricerca.

GLOSSARIO

Operatori logici e booleani

Gli operatori logici o booleani prendono il loro nome da George Boole, matematico inglese della prima metà dell’800 che formalizzo la logica binaria che sta alla base dei moderni calcolatori. I principali e più diffusi sono AND, OR, e NOT, a cui si può aggiungere negli strumenti di ricerca NEAR.

Asterisco (*)

Alcuni motori di ricerca accettano l'asterisco come sostituto di una o più lettere.  L'asterisco può quindi essere usato per cercare tutte le declinazioni di una parola, come il genere ed il numero dei sostantivi o il tempo e il modo dei verbi. Ad esempio, "Cavall*" sta per cavalla, cavallo, cavalli, cavallerizzo, e per tutte le altre parole che cominciano per "caval". 
"Vend*" sta per venderò, venduto, vendessi, vendendo, vendesi, ecc. L'asterisco può essere usato anche all'interno di una parola, ad esempio quando non si è sicuri della sua ortografia ("invec*e" cerca sia "invece" che "invecie", ma anche "invecchiate").

Virgolette (" ")

Le virgolette alte ("   ") indicano al motore di ricerca che il loro contenuto deve essere trattato come una frase, cioè come una sequenza di parole che devono comparire nel testo come un blocco unico (ad esempio "sport estremo", ma anche "Giuseppe Verdi").  Se inseriamo una frase senza racchiuderla tra virgolette il motore di ricerca interpreta le parole come legate da OR, e quindi, invece di restringere l’ambito della ricerca, lo allarga. Nel nostro caso non troverà solo i documenti che contengono la frase "sport estremo" ma tutti quelli che contengono la parola "sport" e tutti quelli che contendono la parola "estremo". Nel caso di nomi propri, visto che cognome e nome possono presentarsi in ordine diverso o addirittura separati da titoli (es. Carlo Dr. Grassi) si può usare anche NEAR.

Esempio di differenza tra AND, NEAR e la ricerca per frasi.

Near

Due o più parole legate da NEAR devono comparire entrambe nel testo e a distanza ravvicinata (tipicamente a distanza massima di 10 parole). E’ quindi una condizione più restrittiva della semplice AND, ma meno restrittiva della ricerca di una frase. Può essere utile per cercare nomi di persone, in cui il nome e il cognome possono essere ordinati in modo diverso e addirittura separati da titoli, e più in generale in quelle situazioni in cui si cerca termini in relazione tra loro, come un aggettivo e il suo sostantivo.

Esempio di differenza tra AND, NEAR e la ricerca per frasi.

And

Se uniamo due più parole chiave con l’operatore AND, significa che volgiamo solo i documenti che contengono tutte le parole indicate (questo E quello). Si usa AND, quindi, per restringere il campo della ricerca.

Esempio di differenza tra AND, NEAR e la ricerca per frasi.

Le parole vanno inserite in ordine di importanza, le più importanti cioè vanno per prime. Se stiamo cercando gli accordi delle canzoni di Ligabue, è meglio inserire "Ligabue AND accordi" pittosto che "accordi AND Ligabue", visto che prima di tutto ci interessano le pagine dedicate al cantate, e tra queste, quelle che riportano gli accordi.

Differenza tra AND, NEAR e ricerca per frase

Supponiamo di volere informazioni sulle moto italiane:

Interrogazione Pagine trovate *
moto 37837
moto AND italiane 2009
moto NEAR italiane 70
"moto italiane" 19

*Ricerca effettuata su altavista.it il 02-05-2000.

Con la sola parola generica "moto" i risultati eccedono qualsiasi umana capacità di vaglio. Con l'operatore AND il numero dei  risultati cala, ma resta sempre alto e soprattutto poco pertinente perché contiene anche documenti che parlano di moto giapponesi e scarpe italiane. Con l'uso di NEAR facciamo centro, i risultati sono pochi, quindi controllabili uno ad uno e sono probabilmente pertinenti, visto che l'aggettivo, essendogli vicino, dovrebbe riferirsi al nome. La frase "moto italiane" come prevedibile seleziona ancora di più, ma probabilmente elimina anche documenti pertinenti, come quelli che parlano delle "moto costruite dalle case italiane".

Not

Una parola chiave preceduta da AND NOT indica al motore di ricerca che non vogliamo i documenti che contengono quella parola. Naturalmente bisognerà indicare anche quali sono le parole che vogliamo compaiano nei nostri documenti.
L’uso di NOT è importante quando vogliamo escludere delle sottocategorie di documenti. Ad esempio facendo delle ricerche sulla composizione chimica degli oli essenziali contenuti nel basilico si pone questa interrogazione:

"oli essenziali" AND basilico

I risultati che ci interessano sono però inquinati da un grande numero di documenti che si riferiscono sì agli oli essenziali del basilico, ma dal punto di vista delle medicine alternative e del massaggio. Specificare

"oli essenziali" AND basilico AND scienza

non risolve il problema perché anche i documenti che non ci interessano potevano contenere espressioni del tipo "...la scienza riconosce molte proprietà agli oli essenziali contenuti le basilico...". La soluzione più pratica è un'interrogazione del tipo:

"oli essenziali" AND basilico AND NOT (cura OR massaggi)

Nelle interfacce di ricerca semplice l'operatore AND NOT è in genere sostituito dal segno - (meno).

Or

Unendo due o più parole unite da OR chiediamo al motore di ricerca di darci tutti i documenti che contengono o una parola o l’altra, o anche tutte e due.
L’uso di OR, quindi, allarga il campo della ricerca. "Alberghi OR pensioni" cerca i documenti che parlano sia di alberghi che di pensioni. Nelle interfacce di ricerca semplice OR è sostituito dal segno + (più).

Parentesi

Tutti gli operatori logici possono essere inseriti in espressioni complesse del tipo

riccione AND (alberghi OR pensioni)

Le parentesi indicano che l’oggetto dell’operatore che le precede, in questo caso AND, non è la parola immediatamente seguente (alberghi) ma l’intera espressione contenuta tra le parentesi (alberghi OR pensioni). Stiamo chiedendo di darci tutti i documenti che contengono la parola "riccione" e una delle due tra "alberghi" e "pensioni" (o anche tutte e due).

Esattamente come nelle espressioni algebriche si possono aprire parentesi all’interno di altre parentesi

Articolo visitato 59007 volte e votato 400 volte (media: 3.9750 su 5)

Voto:
Un commento:
(facoltativo)
::: Pagina iniziale ::: Torna all'inizio della pagina ::: Stampa la pagina ::: 
Valid HTML 4.01 Transitional Valid CSS!