I Bot presenti sul web vengono spessi chiamati anche spiders, oppure crawlers e sono dei semplici programmini che analizzano ricorsivamente le pagine aperte sul web seguendo ogni link che trovano.
Da qui l’esigenza di trovare un meccanismo che impedisca ai robots di accedere indistintamente ad ogni server e consenta di porre delle limitazioni: questo è lo scopo principale del robots.txt.
La sintassi del file robots.txt deve essere la seguente:
User-agent: Googlebot
Disallow: /privato/
Disallow: /admin/
Allow: /privato/esempio.html
Vediamo cosa significa:
- User-agent: è il campo che continene il nome del robot che deve rispettare le restrizioni. Aggiungendo il carattere * la restrizione viene estesa a qualsiasi robot.
- Disallow è il campo che disabilita (to disallow in inglese significa appunto non permettere, disabilitare) le pagine, le directory o le cartelle del vostro sito che non volete assolutamente che vengano “viste” e quindi indicizzate dai motori di ricerca. In un unico file robot si possono aggiungere sia più righe di disallow che più righe di user agent.
- C’è anche la possibilità di aggiungere il comando Allow, che significa “permettere”. Questo comando, indica di escludere alcuni file o cartelle dalla disabilitazione, e quindi ne permette l’indicizzazione.
- Altra funzione viene svolta dallo / (slash) da aggiungere subito dopo il Disallow: questa indica di non indicizzare tutto quello che c’è dopo la barra.
Queste sono le indicazioni base da seguire per la compilazione del vostro file robots.txt
Instagram rinnova l’algoritmo: sarà possibile azzerare i contenuti suggeriti
Instagram continua a evolversi e sta per introdurre una nuova funzionalità che rivoluzionerà l’esperienza degli utenti: la possibilità di...
WordPress o WP Engine: quale direzione prenderà il futuro della piattaforma più amata del web?
Nell’universo del web design e della gestione di contenuti online, il dibattito su quale sia la migliore piattaforma di gestione dei contenuti...
WhatsApp arriva su Google Ads in Italia: come attivare l’estensione per messaggi diretti
Come avevamo anticipato in un precedente articolo, Google Ads ha finalmente reso disponibile in Italia l’integrazione con WhatsApp! Ora puoi...