La Lanterne Rouge

Warning: Geek Inside

Oups ! La boulette

- Posted in Sans catégorie by

Depuis au moins un an et demi à présent j'ai mis en place sur mon serveur Usul un aspirateur de site qui prend une "photo" de mon blog tous les jours au moyen de HTTrack, un logiciel multiplateforme dédié à ce genre d'utilisation.

Pour quelle raison me direz-vous ? Simplement parce que je suis quelqu'un de prudent (qui a dit parano ? j'ai les noms) et que je ne tiens pas à perdre le contenu de mes articles durement écrits à la suite d'un dépôt de bilan ou d'une cessation d'activité quelconque, ni non plus le thème ou la mise en page (aussi perfectibles qu'ils soient).

Toujours est-il donc, que toutes les nuits, un job cron lance la récupération des pages et les stocke sur mon serveur perso.

Oups ! La boulette

À côté de cela, dans ce qui me semblait être une situation totalement différente, je constatais parfois des difficultés à me connecter à l'interface d'admin d'Overblog depuis ma connexion ADSL. Cela touchait également l'affichage des blogs hébergés par la plateforme entraînant un délai d'affichage de plusieurs dizaines de secondes.

"Étrange", m'étais-je dit, pensant à un problème temporaire de réseau entre Overblog et mon FAI ou autre bizarrerie.

Mais le problème persistait.

Après de nombreux tests au moyen de plusieurs outils et depuis plusieurs connexions différentes (notamment tcptraceroute qui m'a été conseillé par le sysadmin de ma boite), j'en suis arrivé à la conclusion qu'il ne pouvait s'agir que d'un refus de trafic de la part des serveurs d'Overblog.

J'ai donc ouvert un ticket auprès du support pour leur demander ce qu'il en était, et si "par hasard" mon adresse IP ou la plage utilisée par mon FAI n'étaient pas bannies pour une quelconque raison.

Une heure après, un ancien camarade de promo ouvrait une discussion avec moi avec à peu près ces quelques lignes :

Salut, il parait que ton IP est bannie sur Overblog :)
Ton crawl avec HTTrack a visiblement été un peu trop agressif

Je n'avais pas réalisé avant mais il semblerait que j'ai un contact dans la société qui héberge mon blog :)

Après discussion, il s'est avéré que mon crawler HTTrack était effectivement un peu agressif et provoquait des 404 en pagailles sur un fichier JS provenant de Google Analytics, ce qui était suffisant pour considérer l'IP à l'origine des accès comme indésirable, et mon accès à l'admin d'Overblog avec :)

J'ai pu corriger mon job et exclure les fichiers incriminés, et faire débannir mon IP en quelques minutes grâce à son intervention (et je l'en remercie ici encore !).

Mais qu'est-ce qu'on se sent idiot parfois...