Qu'est-ce qu'une regex ?
Les expressions régulières, ou regex, sont un code basé sur des signes de ponctuation pour décrire une chaîne de caractères selon des conditions spécifiques.
Par exemple, le "." recherche n'importe quel caractère. Si vous écrivez "siteweb.", le point vous amènera à "websites", "websitez", "website4", etc.
Utilisation de Regex
Les regex peuvent être utilisées dans Contentsquare pour définir des groupes de pages pour les mappings ou pour les conditions de segment.
Les regex utilisent des signes de ponctuation :
- “.” signifie que vous recherchez un caractère
- “..” signifie que vous recherchez deux caractères
- “*” signifie que vous recherchez le jeton précédent une fois, plusieurs fois ou 0 fois
- “+” signifie que vous recherchez au moins un caractère, ou plus
- “?” signifie que vous recherchez un OU deux caractères non définis, pas plus
- "/" neutralise le sens regex de toute ponctuation ci-dessus. Si vous recherchez une véritable ponctuation dans les URL, vous devez alors l'échapper. Par exemple, si vous recherchez un “?”, tapez “\?” dans votre regex.
Exemples de Regex
Typeaword.
"Typeaword" + un caractère seulement, n'importe quel caractère
Typeawordd
Typeawordd8
Typeaword..
"Typeaword" + deux caractères, n'importe lesquels
Typeawordd8
Typeaword?
Typeaword.*
"Typeaword" + n'importe quel caractère (.) 0, 1 ou plusieurs fois (*)
Typeaword1
Typeaword1111
Vous pouvez combiner des règles
Par exemple : w*\.go+gle\.com www.ggle.com trouvera :
- www.gogle.com
- www.google.com
- wwwwww.gooooooooooogle.com
Comment créer une nouvelle page basée sur les regex ?
Scénario : Définir des pages produits dans mon mapping
Si toutes mes pages produits sont structurées de cette manière :
_P + séquence de chiffres
https://www.mysite.com/fragrance-beauty/makeup_P0171900C49332
Alors, le regex à utiliser sera :
/([0-9a-zA-Z\-]*)_P([0-9]+)(.*)
Quelles sont les limitations de création de regex ?
Conditions & caractères |
Nombre supporté |
Conditions regex par groupe de pages | Jusqu'à 32 |
Caractères dans les champs de texte | Jusqu'à 255 |
Caractères spéciaux dans le champ des conditions regex |
|
Une condition est composée de : un type de condition (chemin, hôte, requête) + un opérateur (correspond à regex ou ne correspond pas à regex) + une valeur regex