Expressions regulieres
De Linuxmemo.
^ début de chaîne de caractères ou de ligne
Exemple : l'expression ^ATG correspond à la chaîne de caractères ATGCGT mais pas à la chaîne CCATGTT.
$ fin de chaîne de caractères ou de ligne
Exemple : l'expression ATG$ correspond à la chaîne de caractères TGCATG mais pas avec la chaîne CCATGTT.
. n'importe quel caractère (mais un caractère quand même)
Exemple : l'expression A.G correspond à ATG, AtG, A4G, mais aussi à A-G ou à A G.
[ABC] le caractère A ou B ou C (un seul caractère)
Exemple : l'expression T[ABC]G correspond à TAG, TBG ou TCG, mais pas à TG.
[A-Z] n'importe quelle lettre majuscule
Exemple : l'expression C[A-Z]T correspond à CAT, CBT, CCT...
[a-z] n'importe quelle lettre minuscule [0-9] n'importe quel chiffre [A-Za-z0-9] n'importe quel caractère alphanumérique [^AB] n'importe quel caractère sauf A et B
Exemple : l'expression CG[^AB]T correspond à CG9T, CGCT... mais pas à CGAT ni à CGBT.
\ caractère d'échappement (pour protéger certains caractères)
Exemple : l'expression \+ désigne le caractère + sans autre signification particulière. L'expression A\.G correspond à A.G et non pas à A suivi de n'importe quel caractère, suivi de G.
- 0 à n fois le caractère précédent ou l'expression entre parenthèses précédente
Exemple : l'expression A(CG)*T correspond à AT, ACGT, ACGCGT...
+ 1 à n fois le caractère précédent ou l'expression entre parenthèses précédente
Exemple : l'expression A(CG)+T correspond à ACGT, ACGCGT... mais pas à AT.
? 0 à 1 fois le caractère précédent ou l'expression entre parenthèses précédente
Exemple : l'expression A(CG)?T correspond à AT ou ACGT.
{n} n fois le caractère précédent ou l'expression entre parenthèses précédente {n,m} n à m fois le caractère précédent ou l'expression entre parenthèses précédente {n,} au moins n fois le caractère précédent ou l'expression entre parenthèses précédente {,m} au plus m fois le caractère précédent ou l'expression entre parenthèses précédente (CG|TT) chaînes de caractères CG ou TT