Introduction aux expressions régulières |
En pratique une expression régulière prend la forme d’une chaîne qui définit un motif. Par exemple, la chaîne « dog. » correspond à toutes les chaînes de 4 caractères où les trois premiers caractères sont d, o, g et où le dernier caractère est libre. Voici un résumé de la syntaxe :
- « . » n’importe quel caractère ;
- « [ ] » tout caractère qui est dans la liste (« [abc] » correspond à « a » ou « b » ou « c ») ; on peut utiliser le caractère « - » pour omettre les caractères intermédiaires comme dans « [a-z] ». La syntaxe « [^] » permet d’identifier tous les caractères qui ne font pas partie de la liste (« [^abc] » signifie ni « a », ni « b », ni « c ») ;
- « ^ » (hors des crochets) signifie le début d’une ligne ;
- « $ » signifie la fin d’une ligne ;
- « * » ou « ? » ou « + » signifient « répéter zéro, une ou plusieurs fois », « répéter zéro ou une fois », et « répéter une ou plusieurs fois » ;
- « 1,4 » signifie « répéter entre 1 et 4 fois ».
La chaîne « [ab][abc] » correspond à toutes les chaînes de deux caractères où le premier est soit a, soit b, et où le second est soit a, soit b, soit c. La chaîne « [ab]* » correspond à toute séquence de caractères (entre 0 et l’infini) où seuls les caractères a et b sont permis.
Il est plus facile de comprendre en faisant des exercises, ce que nous vous inviterons à faire sous peu.
Vous devriez lire l’article correspondant aux expressions régulières sur Wikipédia :
https://fr.wikipedia.org/wiki/Expression_régulière
Si vous le souhaitez, on vous invite maintenant à lire le premier chapitre de Maîtrise des expressions régulières, (2e éd.), par l’auteur Jeffrey E.F.Friedl [1] et le traducteur Laurent Dami [2]. Il n’est pas nécessaire d’acheter le manuel.
Il n’est pas nécessaire d’installer « egrep » pour le moment, car nous nous familiariserons avec l’utilisation de l’outil en question lors de la prochaine activité (« laboratoire avec grep »).
[1] L’auteur du livre, Jeffrey Friedl, a un blogue dans lequel on apprend qu’il a travaillé pour Yahoo pendant de nombreuses années.
[2] Le traducteur du livre, Laurent Dami, a une page personnelle dans laquelle on découvre qu’il a d’abord été chercheur en informatique théorique avant de poursuivre une carrière dans la musique en tant que ténor.