SQL中的正则表达式(REGEXP)-白红宇

SQL中的正则表达式(REGEXP)

阅读量：5920 次

发布时间：2019-06-19

本文共 2628 字，大约阅读时间需要 8 分钟。

SQL的查询语句中，有时会需要引进正则表达式为其复杂搜索指定模式。下面给出一些Regexp在MYSQL语句中应用（非全部）：

1） ^

匹配字符串的开始部分。

mysql> SELECT 'fo/nfo' REGEXP '^fo$';                   -> 0

mysql> SELECT 'fofo' REGEXP '^fo';                      -> 1

2） $

匹配字符串的结束部分。

mysql> SELECT 'fo/no' REGEXP '^fo/no$';                 -> 1

mysql> SELECT 'fo/no' REGEXP '^fo$';                    -> 0

3） .

匹配任何字符（包括回车和新行）。

mysql> SELECT 'fofo' REGEXP '^f.*$';                    -> 1

mysql> SELECT 'fo/r/nfo' REGEXP '^f.*$';                -> 1

4） [:character_class:]

在括号表达式中（使用[和]），[:character_class:]表示与术语类的所有字符匹配的字符类。标准的类名称是：

alnum

文字数字字符

alpha

文字字符

blank

空白字符

cntrl

控制字符

digit

数字字符

graph

图形字符

lower

小写文字字符

print

图形或空格字符

punct

标点字符

space

空格、制表符、新行、和回车

upper

大写文字字符

xdigit

十六进制数字字符

它们代表在ctype(3)手册页面中定义的字符类。特定地区可能会提供其他类名。字符类不得用作范围的端点。

mysql>
SELECT 'justalnums' REGEXP '[[:alnum:]]+'; -> 1

mysql>
SELECT '!!' REGEXP '[[:alnum:]]+'; -> 0

5） [[:<:]], [[:>:]]

这些标记表示word边界。它们分别与word的开始和结束匹配。word是一系列字字符，其前面和后面均没有字字符。字字符是alnum类中的字母数字字符或下划线(_)。
mysql> SELECT 'a word a' REGEXP '[[:<:]]word[[:>:]]';   -> 1
mysql> SELECT 'a xword a' REGEXP '[[:<:]]word[[:>:]]';  -> 0
要想在正则表达式中使用特殊字符的文字实例，应在其前面加上2个反斜杠“/”字符。MySQL解析程序负责解释其中一个，正则表达式库负责解释另一个。例如，要想与包含特殊字符“+”的字符串“1+2”匹配，在下面的正则表达式中，只有最后一个是正确的：
mysql> SELECT '1+2' REGEXP '1+2';                       -> 0
mysql> SELECT '1+2' REGEXP '1/+2';                      -> 0
mysql> SELECT '1+2' REGEXP '1//+2';                     -> 1

其他的有关Regexp的语法，可直接参考下表：

字符含意

/
做为转意，即通常在"/"后面的字符不按原来意义解释，如/b/匹配字符"b"，当b前面加了反斜杆后//b/，转意为匹配一个单词的边界。
-或-
对正则表达式功能字符的还原，如"*"匹配它前面元字符0次或多次，/a*/将匹配a,aa,aaa，加了"/"后，/a/*/将只匹配"a*"。

^ 匹配一个输入或一行的开头，/^a/匹配"an A"，而不匹配"An a"

$ 匹配一个输入或一行的结尾，/a$/匹配"An a"，而不匹配"an A"

* 匹配前面元字符0次或多次，/ba*/将匹配b,ba,baa,baaa

+ 匹配前面元字符1次或多次，/ba*/将匹配ba,baa,baaa

? 匹配前面元字符0次或1次，/ba*/将匹配b,ba

(x) 匹配x保存x在名为$1...$9的变量中

x|y 匹配x或y

{n} 精确匹配n次

{n,} 匹配n次以上

{n,m} 匹配n-m次

[xyz] 字符集(character set)，匹配这个集合中的任一一个字符(或元字符)

[^xyz] 不匹配这个集合中的任何一个字符

[/b] 匹配一个退格符

/b 匹配一个单词的边界

/B 匹配一个单词的非边界

/cX 这儿，X是一个控制符，//cM/匹配Ctrl-M

/d 匹配一个字数字符，//d/ = /[0-9]/

/D 匹配一个非字数字符，//D/ = /[^0-9]/

/n 匹配一个换行符

/r 匹配一个回车符

/s 匹配一个空白字符，包括/n,/r,/f,/t,/v等

/S 匹配一个非空白字符，等于/[^/n/f/r/t/v]/

/t 匹配一个制表符

/v 匹配一个重直制表符

/w 匹配一个可以组成单词的字符(alphanumeric，这是我的意译，含数字)，包括下划线，如[/w]匹配"$5.98"中的5，等于[a-zA-Z0-9]

/W 匹配一个不可以组成单词的字符，如[/W]匹配"$5.98"中的$，等于[^a-zA-Z0-9]。

附：

preg，代表“Perl的正则表达式（Perl Regular Expressions）”。
ereg，代表“扩展的正则表达式(Extended Regular Expressions)”。
这两组函数的主要区别有：
1.preg_replace()里面的正则可以写成型如："/..../"而ereg_replace()里面的正则需写成型如".....";
2.在逆向引用用preg_replace()可使用0-99个，而ereg_replace()最多为9个
3.preg_replace()能操作数组，而ereg_replace()不可以
4.ereg默认使用贪婪模式,并且不能修改
5.preg 的速度比 ereg 要快很多

转载于:https://blog.51cto.com/liyongjiang/1073976

你可能感兴趣的文章

读框架笔记（一）

查看>>

Lync 小技巧-55-Lync 客户端正常显示手机号码

查看>>

ubuntu 解决更新时出现unable to locate package

查看>>

修改tomcat 8080 端口

查看>>

Android：UI控件DrawerLayout、Fragment、SlidingLayout、侧滑菜单

Java程序员从笨鸟到菜鸟之（八十八）跟我学jquery（四）JQuery框架操作元素的属性与样式...

mongodb mongod's arguments

查看>>

mysql group_concat的长度问题

查看>>

面对SOPA神马的，我们也许神马也做不了，但也许我们还是能做点神马？

查看>>

System Center 2012R2之SCOM监控SCVMM服务器

查看>>

Juniper ScreenOS防火墙查看某个IP或某个Port或某个Mac会话数

hostname和/etc/hosts的区别

查看>>

c++函数的返回值

查看>>

在AIX5上安装ORACLE10G R2的步骤

查看>>

alnum	文字数字字符
alpha	文字字符
blank	空白字符
cntrl	控制字符
digit	数字字符
graph	图形字符
lower	小写文字字符
print	图形或空格字符
punct	标点字符
space	空格、制表符、新行、和回车
upper	大写文字字符
xdigit	十六进制数字字符

字符	含意
/	做为转意，即通常在"/"后面的字符不按原来意义解释，如/b/匹配字符"b"，当b前面加了反斜杆后//b/，转意为匹配一个单词的边界。 -或- 对正则表达式功能字符的还原，如""匹配它前面元字符0次或多次，/a/将匹配a,aa,aaa，加了"/"后，/a//将只匹配"a"。
^	匹配一个输入或一行的开头，/^a/匹配"an A"，而不匹配"An a"
$	匹配一个输入或一行的结尾，/a$/匹配"An a"，而不匹配"an A"
*	匹配前面元字符0次或多次，/ba*/将匹配b,ba,baa,baaa
+	匹配前面元字符1次或多次，/ba*/将匹配ba,baa,baaa
?	匹配前面元字符0次或1次，/ba*/将匹配b,ba
(x)	匹配x保存x在名为$1...$9的变量中
x\|y	匹配x或y
{n}	精确匹配n次
{n,}	匹配n次以上
{n,m}	匹配n-m次
[xyz]	字符集(character set)，匹配这个集合中的任一一个字符(或元字符)
[^xyz]	不匹配这个集合中的任何一个字符
[/b]	匹配一个退格符
/b	匹配一个单词的边界
/B	匹配一个单词的非边界
/cX	这儿，X是一个控制符，//cM/匹配Ctrl-M
/d	匹配一个字数字符，//d/ = /[0-9]/
/D	匹配一个非字数字符，//D/ = /[^0-9]/
/n	匹配一个换行符
/r	匹配一个回车符
/s	匹配一个空白字符，包括/n,/r,/f,/t,/v等
/S	匹配一个非空白字符，等于/[^/n/f/r/t/v]/
/t	匹配一个制表符
/v	匹配一个重直制表符
/w	匹配一个可以组成单词的字符(alphanumeric，这是我的意译，含数字)，包括下划线，如[/w]匹配"$5.98"中的5，等于[a-zA-Z0-9]
/W	匹配一个不可以组成单词的字符，如[/W]匹配"$5.98"中的$，等于[^a-zA-Z0-9]。