正则表达式

正则表达式

Posted by orgaworl on September 9, 2024

限定符

  • 限定符

    • ?

      • d?
        d出现0或1次
    • *

      • d*
        d出现0或多于1次
    • +

      • d+
        d出现多于1次
    • {n}

      • d{n}
        d出现n次
      • d{n1,n2}
        d出现n次
      • d{n1,}
        d出现n1次以上
    • ()

      • (d1d2) +其他限定符
    • (d1|d2)

      • 匹配d1或d2
    • [abc]

      • [a-zA-Z0-9]
    • [^abc]
      不在[]中的字符

      元字符

  • 元字符

    • \d 数字字符
    • \w 单词字符(英文/数字/下划线)
    • \s 空白符(tab/换行)
    • \D 非数字字符
    • \W 非单词字符
    • \S 非空白字符
    • . 任意字符but换行符
    • ^ 行首
      • ^d
    • $行尾
      • d$

贪婪 or 懒惰

  • 贪婪与懒惰
    • 贪婪-结果尽可能多
    • 懒惰-结果尽可能少/短
      • .*?
        • 使.*匹配到的串尽可能短

编程语言中使用正则表达式

  • python re模块

    • rob=re.compile(r'')

    • robMach=rob.search(content)
      robMach[0]为字符串

    • strMach=rob.findall(content)
      直接返回字符串列表