正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本

普通字符

  • 字母、数字、标点符号、键盘特殊符号等

定义字符集

  1. [a-z] 匹配 26 个字母之一
  2. [aeiou] 匹配 aeiou 这 5 个字符其中的某一个字符
  3. [a-zA-Z] 匹配 26 个(大小写)字母中的某一个字母
  4. [a-zA-Z0-9_-] 匹配(大小写)字母、数字、下划线、中横线 的某一个字符
  5. [0-9] 匹配 0 到 9 之间任意一个数字
  6. [9-3] [z-a] 不能从大往小写,有语法错误

shiy 特别字符集

  1. $ 匹配输入字符串的结尾位置(regexBuddy中待测试文本中多行算作一行)
  2. ^ (托字符) 匹配字符串的开始位置(托字符)
  3. ( ) 匹配一个子表达式的开始和结束位置,模式单元
  4. * 匹配其前面那个单元出现 0 次或以上(任意次数)
  5. + 匹配其前面那个单元出现 1 次或以上
  6. ? 匹配其前面那个单元出现 0 次或 1 次
  7. .点 匹配除换行符 \n 之外的任何单字符 .*
  8. \ 这个符号是用来转义的
  9. | 指明两项之间的一个选择

组合字符集

  1. \d 匹配数字 0 到 9 之一,与[0-9]效果一样
  2. \D 匹配非数字[^0-9]之一
  3. \w 匹配(大小写)字母、数字、下划线其中一个,与[a-zA-Z0-9_]效果相同
  4. \W 匹配非字母、数字、下划线之一
  5. \s 匹配一个空格
  6. \S 匹配一个非空格
  7. \b 匹配单词的开始或结束

限制字符集

  1. {m} 匹配其前一单元严格出现 m 次
  2. {m,} 匹配其前一单元出现至少m次,至多不限制,{0,}相等于*,{1,}相等于+
  3. {m,n} 匹配其前一单元出现至少 m,至多 n 次
  4. [^lsjd] 匹配非 lsjd 之中的字符
  5. [^a-f] 匹配非 a 到 f 之间的一个字符
  6. [^定义字符集] 不给匹配定义字符集里边的信息

模式修正符

  1. g 全文查找出现的所有 正在模式内容 (全局匹配) (php 中可以使用 preg_match_all()函数限制全局匹配)
  2. i 忽略大小写
  3. m 将匹配内容视为多行
  4. /u 表示按 unicode(utf-8)匹配(主要针对多字节比如汉字)
  5. /s 表示将字符串视为单行来匹配

贪婪模式转非贪婪模式

通过在 *、+ 或 ? 限定符之后放置?,该表达式从"贪心"表达式转换为"非贪心"表达式或者最小匹配