首页 » 编程开发 » 常用的几个正则表达式(备用)

常用的几个正则表达式(备用)

 
  • 匹配空白行的正则表达式:\N\S*\R
    注:可以用来删除空白行

  • 匹配首尾空白字符的正则表达式:^\s|\s$
    注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式

  • 匹配Email地址的正则表达式:\w+([-+.]\w+)@\w+([-.]\w+).\w+([-.]\w+)*

  • 匹配网址URL的正则表达式
    网上流传着多种匹配URL的正则表达式版本,但我经过试验,最好用的还是从stackoverflow上查到的:

(https?|ftp|file)://[-A-Za-z0-9+&@#/%?=~|!:,.;]+[-A-Za-z0-9+&@#/%=~|]

IP地址、前后有汉字、带参数的,都是OK的。

  • 匹配国内电话号码:\d{3}-\d{8}|\d{4}-\d{7}
  • 匹配中国邮政编码:[1-9]\d{5}(?!\d)
    注:中国邮政编码为6位数字

  • 匹配身份证:\d{15}|\d{18}
    注:中国的身份证为15位或18位

  • 匹配ip地址:\d+.\d+.\d+.\d+
    注:提取ip地址时有用

  • 匹配正整数 ^[1-9]\d*$


去除html相关标签

先看图感受一下:


  • <[^>]*> //匹配所有的标签

  • <script[^>]?>.? //匹配所有脚本

  • <img[^>]*> //匹配所有图片
  • <(?!br).*?> //匹配去除Br之外的所有的标签。。(可以用在 去除所有标签,只剩br),同理br可换为其他任意标签

  • <table[^>]?>.?

    //匹配table里面的所有内容

  • <(?!img|br|p|/p).*?> //匹配所有标签,只剩img,br,p

原文链接:常用的几个正则表达式(备用),转载请注明来源!

3