je ne suis pas sûr si les robots internet deviennent plus intelligents mais ils semblent trouver plus de routes autour de phpbb causant des problèmes de contenu dupliqué
Voici l’une des 20 000+ pages qui se terminent par /viewtopic.php ? t=99146&start=45 évidemment si vous supprimez la section « &start=45 » la page se charge toujours, ce qui signifie du contenu dupliqué par les robots de recherche Google, etc.
Il y a aussi des URL comme /viewtopic.php? f=28&t=81538, /viewforum.php? f=25&start=73, /viewtopic.php? t=46351&p=414785
Ce n’est qu’un petit montant car il montre que mon forum a presque 2 millions de pages affichées dans Google qui ont du contenu dupliqué
Tout d’abord, phpBB utilise l’URL canonique dans la balise de tête, donc tout doublon doit être listé avec « Page alternative avec la balise canonique appropriée ». Ceci va principalement être rempli par
viewtopic,php? p=123456. C’est sur le lien de titre pour les publications et certains autres endroits, la plupart sont cachés des bots mais pas le lien de titre.
start=15 ou n’importe quel nombre n’est pas une page en double, même le titre est différent avec la page 2 ou n’importe quelle page qui est ajoutée. Je ne vois pas cela être répertorié comme Google en doublon.
& est utilisé dans les attributs href, etc. Vérifiez toutes les modifications/extensions que vous avez en place et utilisez-les dans le contexte approprié.
Le paramètre
f a été supprimé de phpBB. Exécutez cette requête SQL pour le supprimer des publications dans la base de données. La recherche fonctionne indépendamment de http/https/www/non-www etc.
Code : Tout sélectionner
UPDATE phpbb_posts SET post_text = REGEXP_REPLACE (
post_text,
'(http|https)://(www\\.)?rdomaine\\.fr/dossier/viewtopic\\.php\\?f\\=([0-9]+)\\&\\;',
'https://www.domaine.fr/dossier/viewtopic.php?'
);
- Sur la troisième ligne, modifiez domaine\\.fr, si le TLD est quelque chose comme .co.fr, alors c’est domaine\\.co\\.fr
Modifiez ou supprimez le répertoire de votre forum dossier/ selon vos besoins.
- Sur la quatrième ligne, modifiez 'https://www.domaine.fr/dossier/viewtopic.php?' comme requis, c’est un remplacement donc si par exemple vous n’utilisez pas www, supprimez-le.
Ajoutez ceci en haut de votre fichier .htaccess après
RewriteEngine on Il redirigera 301 toute demande avec le paramètre f
Code : Tout sélectionner
RewriteCond %{QUERY_STRING} ^f=[^&]*&(.*)$ [NC]
RewriteRule ^viewtopic\.php$ viewtopic.php?%1 [L,R=301]