1. À quoi sert l’outil ?
L’outil transforme un travail manuel long (retrouver “la bonne page” pour chaque page cassée) en un process rapide : il compare tes pages en erreur (404) avec tes pages valides (200) et propose la meilleure correspondance.
Particulièrement utile sur des volumes importants (centaines / milliers de pages).
Le score aide à concentrer la relecture là où c’est nécessaire.
2. Démarrage rapide (3 minutes)
A. Préparer les fichiers
- Liste des pages en erreur (404) : onglet 404 + colonne URL_404.
- Liste des pages valides (200) : onglet 200 + colonne URL_200.
B. Importer la configuration (recommandé)
- Dictionnaire (fortement recommandé)
- Traductions (si le site est multilingue)
- Parents (si tu veux des parents “propres” basés sur tes vraies catégories)
C. Tester avant un gros run
- Teste 1 page en erreur (404)
- Teste 1 page valide (200)
3. Configuration (ce qui fait la précision)
La configuration sert à “apprendre” à l’outil ton vocabulaire métier et à orienter les résultats. Plus ta configuration est propre, plus les correspondances seront fiables.
3.1 Dictionnaire : la clé d’un matching pertinent
Le dictionnaire est un Excel qui contient ton vocabulaire métier (catégories, couleurs, matières, coupes, etc.). Plus il est complet, plus le matching sera pertinent, car l’outil “comprend” mieux les variations de termes.
Comment le remplir (simple)
- 1 colonne = 1 type de caractéristique (ex : Couleur, Matière, Catégorie, Coupe…)
- 1 ligne = 1 “clé” + ses synonymes au format : clé, syn1, syn2, syn3…
Colonne Couleur
bleu, blue, navy, marine, bleu-marine
noir, black, noir-charbon
Colonne Catégorie
pantalon, pants, trouser
robe, dress
Réutilisation (très important)
- Le dictionnaire peut être utilisé plusieurs fois : si dans 2 mois tu refais un plan de redirection pour le même site, tu repars avec une base déjà fiable.
- Dans Historique, tu peux re-télécharger le dictionnaire d’un run précédent, l’enrichir, puis relancer.
3.2 Dico dynamique : Bonus / Malus par liste (pondération)
Bonus / Malus servent à dire à l’outil ce qui compte vraiment sur ton site. Tu peux donner plus de poids à certains critères (bonus) et pénaliser ceux qui créent des confusions (malus).
Page en erreur : /pantalon-coupe-cigarette-bleu/...
Tu peux décider :
• Bonus Catégorie : 80 (très important)
• Bonus Coupe : 40 (important)
• Bonus Couleur : 10 (moins important)
Résultat : l’outil comprend que Catégorie > Coupe > Couleur.
3.3 Case “cocher une liste” : ce que ça fait vraiment (préfiltre)
Point important : toutes les listes importées sont utilisées dans le matching.
3.4 Traductions (si multilingue)
Les traductions servent à harmoniser les mots entre langues.
blue → bleu
dress → robe
women → femme
Après import, elles sont appliquées automatiquement.
3.5 Parents (URLs “pilotes” pour des parents propres)
Le fichier Parents sert à fournir une liste de pages “catégories/collections” de référence, pour obtenir une colonne parent plus logique.
/femme/robes/
/homme/pulls/
/collections/ete-2024/
Sans fichier Parents, le parent est déduit “techniquement” (on retire le dernier segment de l’URL). Avec Parents, le parent est basé sur tes vraies catégories.
3.6 Bonus/Malus tokens + poids sémantique
Ces réglages influencent la façon dont l’outil note les correspondances :
- Bonus tokens : ajoute des points quand des mots identiques apparaissent des deux côtés.
- Malus tokens : retire des points quand la candidate ajoute des mots “hors sujet”.
- Poids sémantique : augmente ou diminue l’importance du “sens global”.
4. Tester une URL
Cet écran sert à comprendre comment l’outil “lit” une URL avant un gros matching. C’est utile pour valider que le dictionnaire, les traductions et la détection de référence fonctionnent.
URL test : https://www.maboutique.com/femme/robes/robe-longue-bleue-123456-01.html
Tu vérifies : version nettoyée, mots détectés (tokens), caractéristiques reconnues via dictionnaire, référence trouvée, et la version “texte” utilisée pour la sémantique.
5. Matching (lancer le traitement)
Tu charges tes deux listes, tu lances le matching, puis tu récupères le fichier final.
- Charger la liste des pages en erreur (404)
- Charger la liste des pages valides (200)
- Cliquer sur Lancer le matching
- Télécharger le fichier résultat
6. Bonnes pratiques (checklist)
- Faire un mini test avant un gros run.
- Enrichir le dictionnaire après chaque projet (plus tu l’enrichis, plus l’outil devient précis).
- Mettre un bonus fort sur les critères structurants (catégorie/type).
- Ne jamais mettre en production sans validation humaine.
7. Limites
- L’outil ne peut pas proposer une page valide si elle n’existe pas dans ta liste (200).
- Les pages très génériques peuvent produire des scores plus faibles.
- Sans dictionnaire, la précision est généralement inférieure sur un site à vocabulaire spécifique.
- Sur de gros volumes, certains calculs (notamment sémantiques) peuvent prendre plus de temps.