Breve digressione sullo spam e sui search engine

Comunicazione, Informatica Add comments

SpamTutti voi sapete di cosa si tratta: quelle simpatiche mail che arrivano giornalmente nelle caselle di posta di tutto il mondo, pubblicizzando viagra e altri prodotti totalmente inutili. Ormai è un fenomeno talmente comune che non ci si fa più caso: paradossalmente, sarebbe impensabile immaginare la rete delle reti senza il fenomeno dello spam.
Ma di cosa si tratta realmente? Come funziona? Come difendersi?

Prima di addentrarci nell’argomento del giorno, voglio proporvi il sito che mi ha spinto a creare questo post. Lo trovai tempo fa per caso, durante una normale ricerca, e ne rimasi colpito. Se non altro perchè mi fece fare una grossa risata: cercavo un argomento preciso (vatti a ricordare quale, ma tanto non importa) e mi ritrovai in un sito… di spam!
Avete letto bene, il sito è proprio su questo. Non a caso si chiama http://www.this-is-spam.info/.
Ed è un esperimento.
Il tizio che compare nella pagina, che di primo acchitto mi ricorda la versione incazzosa di uno degli Eiffel65 (ma non diteglielo, che è un’offesa pesante), apparentemente è la mente diabolica che sta dietro tutto questo, e in homepage ci spiega nel dettaglio di cosa si tratta e le motivazioni alla base. Si può sintetizzare facilmente il tutto con una frase, che è anche il titolo del sito: “anche se spammare è bello non indicizza(r)mi per la key spammare è bello!”. Che ad una prima lettura può risultare del tutto incomprensibile, se non si conoscono certi meccanismi.
Ma ci sono io qui per aiutarvi: sostanzialmente, il signor X sta facendo una gara “al contrario” con i motori di ricerca, per vedere qual è il più efficace e per dimostrare che la qualità di tutti i concorrenti (che per il momento sono solo 3: google, yahoo e msn. I principali.) lascia decisamente a desiderare.
Il principio di base è questo: apro un sito che parla di giardinaggio e faccio una pagina che parla solo di questo argomento; i motori di ricerca, il cui funzionamento nel dettaglio verrà spiegato tra poco, indicizzano tale pagina, credendo che l’intero sito parli di giardinaggio. Ma in verità, questo può non essere vero: lo è nella stragrande maggioranza dei casi, ma a volte no. Quindi il giovine ha aperto un sito che parla di tutto e di niente, di spam quindi, e sta vedendo come si comportano i motori di ricerca in proposito. Teoricamente, un sito che promette rose e gerani, e poi parla di donne nude e aerei radiocomandati dovrebbe essere tolto dai risultati o comunque avere una bassa probabilità di trovarsi nelle prime pagine della ricerca. Eppure..

Ma per farvi comprendere fino in fondo l’esperimento, è necessario spiegare alcune cose. Cos’è lo spam. E come funzionano i motori di ricerca, o search engine.
Lo spamming viene definito da wikipedia come

“…l’invio di grandi quantità di messaggi indesiderati (generalmente commerciali). Può essere messo in atto attraverso qualunque media, ma il più usato è Internet, attraverso l’e-mail.”

Inoltre:

Quale tipo di attività costituisca spamming è materia di dibattiti, e le definizioni divergono in base allo scopo per il quale è definito, oltre che dalle diverse legislazioni.

Insomma , la questione è complicata. Pensate che una recente indagine vuole che le mail di spam abbassino la produttività delle aziende in modo sostanziale. Per non parlare degli ISP, che vedono la capacità delle proprie reti sensibilmente ridotta, proprio a causa della circolazione di questi messaggi indesiderati.
Le origini dello spam sono antiche come la stessa internet. Ma il termine ha una derivazione ben precisa: la scatoletta di carne che avete visto prima. E’ un prodotto veramente esistito in Inghilterra, decenni fa, che veniva pubblicizzato continuamente ed in ogni luogo, tanto che i Monty Phyton realizzarono uno sketch in proposito.
E proprio guardando questo video su youtube, scopro altre informazioni circa l’uso successivo della parola spam. Infatti Enxavier scrive alcune righe di commento al video, specificando la sua evoluzione nel tempo. Parla di MUD e di alcune (misteriose) People Link chatrooms. E forse dimentica Usenet, ma per stavolta lo perdoniamo. Comunque, non divaghiamo in citazioni retrò: di MUD e Usenet vi parlerò un’altra volta.
Quindi, chiarito cos’è lo spam, ci manca il punto due: i motori di ricerca.
Questi aggeggi infernali sono l’elemento chiave (insieme allo spam?) di internet. Senza di loro sarebbe impossibile sfruttare la rete nel modo in cui siamo abituati, per fare ricerche, trovare informazioni e contatti. Google è probabilmente il più famoso e deve la sua fama ad un algoritmo di indicizzazione che, per l’epoca, era rivoluzionario e maggiormente efficace. Google funziona bene perchè analizza le relazioni tra i vari siti web. Ma non fatevi scappare un secondo concetto chiave: “Google analizza“. Infatti ogni singola pagina presente sulla rete, che sia liberamente accessibile, è preda degli spiders. Sono appunto dei ragnetti che vanno in giro per il web e cercano le nuove pagine, si chiama crawling, e fanno in modo che l’archivio dei motori di ricerca sia sempre aggiornato. Per esempio ogni volta che posto un nuovo articolo qui su ilsolenu, in pochi minuti ricevo le visite di questi animaletti, ognuno appartenente ad un search engine specifico, che mi assicurano che la pagina verrà inclusa nei loro database. Me ne accorgo facilmente grazie al plugin per Wordpress Useronline, che mi dice chi è collegato in questo momento.
Ora, io vi ho raccontato la faccenda in modo banale, sicuramente semplicistico. In verità si tratta di un discorso molto più complesso, talmente articolato che ne hanno fatto una disciplina. Ed i signori che fanno questa professione sono tenuti in grande considerazione: si chiamano SEO, Search Engine Optimizers, e si occupano di fare in modo che i siti dei loro clienti o della loro azienda finiscano nelle prime posizioni nella pagina che mostra i risultati di una ricerca. Li pagano per fare questo.

Ora che avete un quadro leggermente più completo (si potrebbe parlare di questi argomenti per ore), ripensate al sito di cui vi parlavo all’inizio..

Tags: , ,


Leave a Reply

Designed by NattyWP Wordpress Themes.
Images by desEXign.