Review: Gli approfondimenti di Nóva
a cura di Luca Dello Iacovo I linguaggi informatici e umani convergono. Le soluzioni per migliorare la ricerca sul web sono il Graal dell'epoca della conoscenza. |
di Guido Vetere | 01 ottobre 2009
di Luca Dello Iacovo | 01 ottobre 2009
di Antonio Lieto | 01 ottobre 2009
di Luca Dello Iacovo | 01 ottobre 2009
di Luca Dello Iacovo | 01 ottobre 2009
I motori di ricerca per il Web
Motori generalisti: sono i più diffusi e utilizzati per ogni esigenza. I più importanti sono: Google, Yahoo, Bing (questi ultimi due a breve saranno una cosa sola perché le ricerce di Yahoo saranno servite da Bing), Ask
Motori verticali: sono uno sviluppo abbastanza recente, specializzati per un determinato settore con l'obiettivo di fare meglio dei generalisti per quel contesto. Ad esempio: Kayak (viaggi), Indeed (lavoro), Healthpricer (salute), Trulia (immobiliare)
Motori locali: di taglio generalista ma focalizzati su di un'area geografica specifica (tipicamente città o regione); un buon esempio è Yelp
Motori specializzati: non sono considerati motori di ricerca dall'utente ma in realtà rispondono a milioni di ricerche al giorno e lo fanno usando tecnologie sofisticate. I migliori esempi sono Amazon ed eBay
Motori Real time: sono l'ultimo sviluppo e nascono grazie al successo di Twitter ma non si limitano a cercare su questa fonte.
Mori di altro genere: sono quei motori, spesso generalisti, che cercano di applicare qualcosa di nuovo (una nuova tecnologia, una nuova interfaccia, metodi diversi di crawling... ). Si possono citare, fra i tanti, Hakia, Clusty, Kosmix ed Exalead
Le tecnologie per le imprese
Tecnologia a keyword. Le parole sono semplici sequenze di caratteri/simboli che vengono riconosciute grazie ai separatori (spazio, punteggiatura). E' possibile cercare le parole solo esattamente così come sono scritte ed è facilmente utilizzabile per diverse lingue. I maggiori player sono Ibm, Microsoft, Oracle, Google, Isys
Tecnologia statistica. Utilizza le frequenze e riconosce sequenze specifiche (e/o cooccorenze) di elementi come più importanti di altre ai fini delle rilevanza di un ricerca (normalmente si applica alle keyword ma può essere utilizzata anche in combinazione con altre tecnologie). Tra i maggiori fornitori Autonomy, Vivisimo
Tecnologia linguistica. Le parole sono riconosciute come appartenenti ad un vocabolario e viene assegnato un tipo grammaticale ("scolare" come plurale del sostantivo "scolara" è diverso da "scolare" come verbo all'infinito: per una tecnologia a keyword sono invece la stessa cosa). In alcuni casi, viene effettuata anche un'analisi logica del testo per utilizzare le informazioni riconosciute (sui soggetti, oggetti e predicati) per dare rilevanza ai risultati di una ricerca. Tra i player Exalead, Sinequa
Tecnologia semantica. Le parole sono riconosciute come concetti, individuando il giusto significato in base al contesto ("calcio" come sport è riconosciuto come diverso da "calcio" come elemento chimico o "calcio" come azione). Un testo non è più una successione di keyword o di parole (come per le altre tecnologie) ma un'insieme coeso di frasi che esprimono concetti in relazione tra loro: è la cosa più simile al processo di comprensione di una persona quando legge un testo. Tra i fornitori Expert System