Script : Gérer les liens brisés d'un annuaire

  1. Scripts






Installer un script d'annuaire sur un site web est une chose facile à faire, ajouter un formulaire de soumission est également aisé. Pour autant le système est il viable dans le temps, tant au niveau du référencement des pages, que de la qualité de l'annuaire, la réponse est évidement non.

Qui dit viabilité dans le temps dit évolution et en termes d'annuaire web, il faut prendre en compte le fait que les sites web évoluent. Mieux vaut alors gérer son annuaire avec des outils plutôt qu'à la main. C'est ce que propose le script qui suit, il va permettre de conserver un annuaire avec des liens brisés en faible quantité.

Un site web évolue

Un site web n'est pas figé dans le temps, il peut changer de nom de domaine, l'hébergeur fusionne ses sociétés, le site ferme pour de multiples raisons et l'information n'est pas remontée au webmaster qui gère un annuaire.
Rien de grave, l'internaute passe par l'annuaire, clique sur l'url d'un site référéncé dans l'annuaire et tombe sur une erreur 404 (page indisponible), sur une erreur 403 (site fermé) ou une page qui est rédirigée vers la nouvelle adresse. Dans le cas du moteur de recherche qui parcourt les pages pour indexation, si celui-ci tombe sur un site en erreur, la page qui faisait le lien est mal vue, si il tombe sur une page de redirection, selon le type de redirection permanente (entête 301) ou temporaire (entête 302), le moteur jugera différement la qualité du site cible. Pour un annuaire de qualité, une gestion des liens brisés est donc importante.

Gérer les liens brisés

Le principe de fonctionnement est simple, il s'agit d'aller lire l'entête http retournée par le site de l'annuaire et de lire le code retourné, si c'est un code 200, tout va bien, si c'est un code 404 ou 403, il y a quelque chose à faire...

Etant donné que le webmaster a des outils à sa disposition, il va profiter d'une visite d'un internaute sur l'annuaire pour analyser les entêtes. En fonction de l'entête récupérée, le script peut envoyer à une adresse mail les références du site visitée, son url, son identifiant, l'entête HTTP retournée.

Comme le webmaster est en plus organisé, l'adresse mail peut en plus être paramétree pour filtrer les mails de vérifications recus et faire le tri entre les mails d'erreur à lire et les mails de bon fonctionnement à archiver uniquement.

Voici donc le script PHP utilisé sur notre annuaire thématique:

function my_headers($url, $idx)
{
$url_info=parse_url($url);
$port = isset($url_info['port']) ? $url_info['port'] : 80;
@$fp=fsockopen($url_info['host'], $port, $errno, $errstr, 30);

if($fp)
{
$head = "HEAD ".@$url_info['path']."?".@$url_info['query']." HTTP/1.0\r\nHost: ".@$url_info['host']."\r\n\r\n";
fputs($fp, $head);
while(!feof($fp))
{
if($header=trim(fgets($fp, 1024)))
{
$headers[] = $header;
}
}
$tab=(explode(" ",$headers[0]));
$code = $tab[1];
$titre_mail="Vérification ".$code; // preparation du mail avec le code retour
}
else
{
$code = "invalide"; // cas ou il n'y pas d'entete retournee !
$titre_mail="Invalidation";
}

$email="votre@webmail";
$t = "Bonjour,\n\n";
$t .= "Le site ".$url." numéro ".$idx." a renvoye le code ".$code;
@mail($email,$titre_mail." de liens sur mon site",$t,"From: votre@webmail");
}


Version Imprimable

Les scripts PHP - WAP - Protection de fichier - Compteur

Beaucoup de sites sur le Net proposent des scripts en PHP, celà va du script de portail, à la gestion d'annuaire ou au script de paiement sécurisé.

Les scripts proposés ici sont plutôt des astuces de programmation et dans le cadre de ce script utilisé pour Phortail

Ces scripts là sont donc en ligne et utilisés

Du web sur mobile

Un site tel que phortail avec son script mi base de données, mi texte est désormais developpé en version wap, disons exactement pour version téléphone mobile et smartphne (iphone, blackberry). Vous trouverez ici des articles permettant de passer du web au web mobile avec notamment ce script permettant de redimensionner ses photos à la volée pour le web mobile.

Visiteurs connectés

Ce script permet d'afficher en Live, le nombre d'internautes connéctés au site, et ce sans base de données.
Voir le script Visiteurs connectés et la carte de provenance des internautes.

Protection des fichiers

Depuis des sites exterieurs au votre il est possible de venir lire et d'utiliser des fichiers (gif, jpeg, swf, mid, mp3 ...) sans passer par votre site.

Ces liens externes et directs sur vos fichiers consomment de la bande passante sans que vous voyez le moindre visiteur.

Une parade peut-être mise en place pour proteger les fichiers.

Les deux derniers articles sont été mis à jour et complétés sur Gestion de projets sous le titre protection des fichiers

Script anti aspirateur

Une fois le site web réalisé, il n'est pas tout de le mettre en ligne, ensuite il faut aussi surveiller les visites.

Face à une montée anormale du traffic, que peut faire le webmaster, soucieux de sa bande passante et des hits serveurs généré.

Retrouvez celà dans notre article sur le script anti aspirateur.

Une page dynamique

Pouvoir afficher la Blague du jour ou le script du mois sur une page, en utilisant les variables php disponibles peut-être réalisé simplement.

Explications avec le script de contenu de page aléatoire.

Optimiser le code source PHP / HTML

Peu d'outils web permettent cette option de manière intrinsèque et pourtant il est possible voire conseillé d'optimiser son code source, pour permettre à ses pages d'êtres chargées plus rapidement, et de diminuer ainsi la bande passante.

C'est ce que propose cet article pour diminuer la bande passante.

Gestion des liens de qualité

• Nous savons que pour un référencement dans les moteurs de recherche, notamment Google, il est important d'avoir un lien qui soit de qualité, il est facile de faire de la sorte en HTML, en PHP, le soucis de la statistique fait que le webmaster privilégie le suivi du lien sortant plutôt que la qualité.

Le script proposé permet de concilier un lien de qualité et statistiques

Le pendant du lien étant l'url, voyez comment avoir des url de qualité


Tutoriels Webmaster

Référencement :

Depuis l'arrivée de l'intelligence artificielle dans nos vies, bien des domaines sur internet se posent des questions, les webmaster sont ainsi concernés, se demandant si l'indexation de leur site par GPTBot est profitable.

https://phortail.org/quizz/moderne/


Référencement :

Comment analyser les pages de la search console qui sont répertoriées par Google comme explorées mais non indexées. Faut-il demander leur indexation ou n'y aurait-il pas quelque chose de mieux à faire.


Référencement :

Comment Google Analytics et la Search console Google fonctionnent. Quelle est la différence entre ces outils ? Est ce qu'ils interagissent entre eux ?


Scripts :

Internet a deux caractéristiques principales : Cela bouge beaucoup et cela bouge vite. Le webmaster se doit d'être actif, voire réactif, et de disposer de l'information rapidement. Un simple script en python peut l'aider.


Scripts :

Comment contrôler visuellement que l'affichage de différentes pages web se fait correctement avec les différentes configurations de navigateur, et résolution d'affichage. Le Webdriver de Sélénium permet via un script d'automatiser la capture de telles pages, pour contrôler en un coup d'oeil le résultat.


Conception :

Optimiser un site web avec du responsive design est un pas de plus fait vers l'utilisateur final
Pour autant, si une page du site a un poids de plusieurs méga, l'utilisateur risque, s'il est sur un téléphone mobile, de partir avant que la page ne soit complétement chargée.


Outils :

Comment gérer les erreurs 404 not found sur le fichier browserconfig.xml, alors que celui ci est demandé par le navigateur.


Scripts :

Les feuilles de style d'un site web permettent d'adapter l'affichage à la taille de l'écran. Voyons comment faire pour un site qui s'affiche aussi bien sur un ordinateur, une tablette qu'un téléphone intelligent (smartphone).


Pages webmaster
Actu Webmaster

Thèmes Phortail