I Bot presenti sul web vengono spessi chiamati anche spiders, oppure crawlers e sono dei semplici programmini che analizzano ricorsivamente le pagine aperte sul web seguendo ogni link che trovano.
Da qui l’esigenza di trovare un meccanismo che impedisca ai robots di accedere indistintamente ad ogni server e consenta di porre delle limitazioni: questo è lo scopo principale del robots.txt.
La sintassi del file robots.txt deve essere la seguente:
User-agent: Googlebot
Disallow: /privato/
Disallow: /admin/
Allow: /privato/esempio.html
Vediamo cosa significa:
- User-agent: è il campo che continene il nome del robot che deve rispettare le restrizioni. Aggiungendo il carattere * la restrizione viene estesa a qualsiasi robot.
- Disallow è il campo che disabilita (to disallow in inglese significa appunto non permettere, disabilitare) le pagine, le directory o le cartelle del vostro sito che non volete assolutamente che vengano “viste” e quindi indicizzate dai motori di ricerca. In un unico file robot si possono aggiungere sia più righe di disallow che più righe di user agent.
- C’è anche la possibilità di aggiungere il comando Allow, che significa “permettere”. Questo comando, indica di escludere alcuni file o cartelle dalla disabilitazione, e quindi ne permette l’indicizzazione.
- Altra funzione viene svolta dallo / (slash) da aggiungere subito dopo il Disallow: questa indica di non indicizzare tutto quello che c’è dopo la barra.
Queste sono le indicazioni base da seguire per la compilazione del vostro file robots.txt

La SEO si fa social: come farsi notare (senza ballare su TikTok)
Quando si parla di SEO, il primo pensiero va ai motori di ricerca come Google. Tuttavia, negli ultimi anni, anche i social media sono diventati...

Hashtag: sì o no?
L’uso degli hashtag nei social media è ormai parte integrante della comunicazione online. Li trovi ovunque: nei post, nelle storie, nei video. Ma ti...

Neuroscienze e video: come aumentare l’engagement secondo la scienza
L’engagement con i video non è solo questione di creatività o fortuna. Secondo uno studio condotto da Google in collaborazione con la società...
