Documentation – Redirect Match

Redirect Match te permet de créer un plan de redirections en quelques minutes : tu donnes la liste des pages qui renvoient une erreur (404) et la liste des pages valides (200), et l’outil propose la meilleure correspondance pour chaque page cassée.

Objectif : accélérer la création de redirections, tout en conservant une validation humaine avant mise en production.
Pour tester l’outil Accède directement à l’application Redirect Match et lance un premier run sur un petit échantillon.
Application en ligne
Ouvrir l’application
1

Préparer tes listes

Pages en erreur (404) + pages valides (200).

2

Renseigner le dictionnaire

Plus il est complet, plus le matching est pertinent.

3

Ajuster les réglages

Traductions, parents, bonus/malus, poids sémantique.

4

Lancer le matching

Proposition de correspondance + fichier final.

5

Contrôler & livrer

Validation humaine avant mise en production.

1. À quoi sert l’outil ?

L’outil transforme un travail manuel long (retrouver “la bonne page” pour chaque page cassée) en un process rapide : il compare tes pages en erreur (404) avec tes pages valides (200) et propose la meilleure correspondance.

Gain de temps

Particulièrement utile sur des volumes importants (centaines / milliers de pages).

Validation priorisée

Le score aide à concentrer la relecture là où c’est nécessaire.

Le résultat doit toujours être relu avant mise en production : l’outil accélère la décision, il ne remplace pas la validation.

2. Démarrage rapide (3 minutes)

A. Préparer les fichiers

  • Liste des pages en erreur (404) : onglet 404 + colonne URL_404.
  • Liste des pages valides (200) : onglet 200 + colonne URL_200.

B. Importer la configuration (recommandé)

  • Dictionnaire (fortement recommandé)
  • Traductions (si le site est multilingue)
  • Parents (si tu veux des parents “propres” basés sur tes vraies catégories)

C. Tester avant un gros run

  • Teste 1 page en erreur (404)
  • Teste 1 page valide (200)
Objectif : vérifier rapidement que le dictionnaire, les traductions et la détection de référence fonctionnent avant de lancer un matching massif.

3. Configuration (ce qui fait la précision)

La configuration sert à “apprendre” à l’outil ton vocabulaire métier et à orienter les résultats. Plus ta configuration est propre, plus les correspondances seront fiables.

Après import, clique sur Mettre à jour la configuration : sans ce clic, les réglages ne sont pas appliqués.
3.1 Dictionnaire : la clé d’un matching pertinent

Le dictionnaire est un Excel qui contient ton vocabulaire métier (catégories, couleurs, matières, coupes, etc.). Plus il est complet, plus le matching sera pertinent, car l’outil “comprend” mieux les variations de termes.

Comment le remplir (simple)

  • 1 colonne = 1 type de caractéristique (ex : Couleur, Matière, Catégorie, Coupe…)
  • 1 ligne = 1 “clé” + ses synonymes au format : clé, syn1, syn2, syn3…
Exemples

Colonne Couleur
bleu, blue, navy, marine, bleu-marine
noir, black, noir-charbon

Colonne Catégorie
pantalon, pants, trouser
robe, dress

Réutilisation (très important)

  • Le dictionnaire peut être utilisé plusieurs fois : si dans 2 mois tu refais un plan de redirection pour le même site, tu repars avec une base déjà fiable.
  • Dans Historique, tu peux re-télécharger le dictionnaire d’un run précédent, l’enrichir, puis relancer.
Bon réflexe : après chaque projet, ajoute au dico les termes qui ont posé problème → ton prochain run sera nettement plus précis.
3.2 Dico dynamique : Bonus / Malus par liste (pondération)

Bonus / Malus servent à dire à l’outil ce qui compte vraiment sur ton site. Tu peux donner plus de poids à certains critères (bonus) et pénaliser ceux qui créent des confusions (malus).

Bonus (liste) augmente le score
Si ce critère matche, tu veux que ça pèse fort (ex : Catégorie / Type de produit).
Malus (liste) réduit le score
Si ce critère est incohérent ou manquant d’un côté, tu veux limiter les faux matchings.
Exemple concret
Page en erreur : /pantalon-coupe-cigarette-bleu/...

Tu peux décider :
• Bonus Catégorie : 80 (très important)
• Bonus Coupe : 40 (important)
• Bonus Couleur : 10 (moins important)

Résultat : l’outil comprend que Catégorie > Coupe > Couleur.
Recommandation : commence avec les valeurs par défaut, puis ajuste liste par liste en fonction des erreurs observées dans tes runs.
3.3 Case “cocher une liste” : ce que ça fait vraiment (préfiltre)

Point important : toutes les listes importées sont utilisées dans le matching.

La case sert à préfiltrer / enrichir les candidates : pour chaque page en erreur (404), l’outil ajoute d’office dans la liste des candidates les pages valides (200) qui partagent ce critère (ex : même langue, même catégorie, etc.), puis calcule les scores normalement par-dessus.
Utilité : accélérer et sécuriser les résultats quand certains critères structurants doivent matcher en priorité.
3.4 Traductions (si multilingue)

Les traductions servent à harmoniser les mots entre langues.

Exemples :
blue → bleu
dress → robe
women → femme

Après import, elles sont appliquées automatiquement.

3.5 Parents (URLs “pilotes” pour des parents propres)

Le fichier Parents sert à fournir une liste de pages “catégories/collections” de référence, pour obtenir une colonne parent plus logique.

Exemples :
/femme/robes/
/homme/pulls/
/collections/ete-2024/

Sans fichier Parents, le parent est déduit “techniquement” (on retire le dernier segment de l’URL). Avec Parents, le parent est basé sur tes vraies catégories.

3.6 Bonus/Malus tokens + poids sémantique

Ces réglages influencent la façon dont l’outil note les correspondances :

  • Bonus tokens : ajoute des points quand des mots identiques apparaissent des deux côtés.
  • Malus tokens : retire des points quand la candidate ajoute des mots “hors sujet”.
  • Poids sémantique : augmente ou diminue l’importance du “sens global”.
Recommandation : garde les valeurs par défaut au début, puis ajuste après observation sur 20–50 lignes.

4. Tester une URL

Cet écran sert à comprendre comment l’outil “lit” une URL avant un gros matching. C’est utile pour valider que le dictionnaire, les traductions et la détection de référence fonctionnent.

Exemple
URL test : https://www.maboutique.com/femme/robes/robe-longue-bleue-123456-01.html

Tu vérifies : version nettoyée, mots détectés (tokens), caractéristiques reconnues via dictionnaire, référence trouvée, et la version “texte” utilisée pour la sémantique.

5. Matching (lancer le traitement)

Tu charges tes deux listes, tu lances le matching, puis tu récupères le fichier final.

  • Charger la liste des pages en erreur (404)
  • Charger la liste des pages valides (200)
  • Cliquer sur Lancer le matching
  • Télécharger le fichier résultat
Besoin de tester maintenant ? Ouvrir l’application.

6. Bonnes pratiques (checklist)

  • Faire un mini test avant un gros run.
  • Enrichir le dictionnaire après chaque projet (plus tu l’enrichis, plus l’outil devient précis).
  • Mettre un bonus fort sur les critères structurants (catégorie/type).
  • Ne jamais mettre en production sans validation humaine.

7. Limites

  • L’outil ne peut pas proposer une page valide si elle n’existe pas dans ta liste (200).
  • Les pages très génériques peuvent produire des scores plus faibles.
  • Sans dictionnaire, la précision est généralement inférieure sur un site à vocabulaire spécifique.
  • Sur de gros volumes, certains calculs (notamment sémantiques) peuvent prendre plus de temps.
© Tigui Camara – Redirect Match