python如何实现识别字符串为AAAB型_Python

2条回答

送你小红花

2楼 · 2020-09-18 10:25

匹配包含换行符（回车）的任意字符串的正则表达式

正则表达式Java

匹配包含换行符（回车）的任意字符串的正则表达式

1)[\s\S]

2)Pattern.DOTALL \s

匹配字符串的过程中经常会用到能够匹配包含换行符（回车）的任意字符串的正则表达式，即：[\s\S]*

Java代码收藏代码

Stringregex="[\\s\\S]*?";

但是一般都会匹配形如：A任意字符B这样的模式

这时需要这样使用：正则表达式A[\s\S]*?正则表达式B

例如：

Java代码收藏代码

Stringregex="";

======================

Pattern.DOTALL

今天也碰到了这个问题，困扰我很久，最后得知，在默认的情况下，字符‘.’不包括换行符。但是可以更改此设置，让字符‘.’表示所以字符：比如：

Patternp=Pattern.compile("regex",Pattern.DOTALL);

p.matcher(content).matches();

设置了Pattern.DOTALL后，就可以了

========================

([\s\S]*)

同时，也可以用“([\d\D]*)”、“([\w\W]*)”来表示。

在文本文件里,这个表达式可以匹配所有的英文

/[-~]/

这个表达式可以匹配所有的非英文(比如中文)

/[^-~]/

/是VI里用的.你在editplus或程序里不需要/

=================

错误的写法

[.\r]

===============

http://www.jb51.net/article/36172.htm

php正则表达式使用的详细介绍

作者：字体：[增加减小]类型：转载时间：2013-04-27我要评论

本篇文章介绍了，php正则表达式使用的详细说明。需要的朋友参考下

前言

正则表达式是烦琐的，但是强大的，学会之后的应用会让你除了提高效率外，会给你带来绝对的成就感。只要认真去阅读这些资料，加上应用的时候进行一定的参考，掌握正则表达式不是问题。

1.引子

　　目前，正则表达式已经在很多软件中得到广泛的应用，包括*nix（Linux,Unix等），HP等操作系统，PHP，C#，Java等开发环境，以及很多的应用软件中，都可以看到正则表达式的影子。

　　正则表达式的使用，可以通过简单的办法来实现强大的功能。为了简单有效而又不失强大，造成了正则表达式代码的难度较大，学习起来也不是很容易，所以需要付出一些努力才行，入门之后参照一定的参考，使用起来还是比较简单有效的。

例子：^.+@.+\\..+$

　　这样的代码曾经多次把我自己给吓退过。可能很多人也是被这样的代码给吓跑的吧。继续阅读本文将让你也可以自由应用这样的代码。

　　注意：这里的第7部分跟前面的内容看起来似乎有些重复，目的是把前面表格里的部分重新描述了一次，目的是让这些内容更容易理解。

2.正则表达历史

　　正则表达式的“祖先”可以一直上溯至对人类神经系统如何工作的早期研究。WarrenMcCulloch和WalterPitts这两位神经生理学家研究出一种数学方式来描述这些神经网络。

　　1956年,一位叫StephenKleene的数学家在McCulloch和Pitts早期工作的基础上，发表了一篇标题为“神经网事件的表示法”的论文，引入了正则表达式的概念。正则表达式就是用来描述他称为“正则集的代数”的表达式，因此采用“正则表达式”这个术语。

　　随后，发现可以将这一工作应用于使用KenThompson的计算搜索算法的一些早期研究，KenThompson是Unix的主要发明人。正则表达式的第一个实用应用程序就是Unix中的qed编辑器。

　　如他们所说，剩下的就是众所周知的历史了。从那时起直至现在正则表达式都是基于文本的编辑器和搜索工具中的一个重要部分。

3.正则表达式定义

　　正则表达式(regularexpression)描述了一种字符串匹配的模式，可以用来检查一个串是否含有某种子串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等。

列目录时，　dir*.txt或ls*.txt中的*.txt就不是一个正则表达式,因为这里*与正则式的*的含义是不同的。

　　正则表达式是由普通字符（例如字符a到z）以及特殊字符（称为元字符）组成的文字模式。正则表达式作为一个模板，将某个字符模式与所搜索的字符串进行匹配。

3.1字符

1、普通字符：

由所有那些未显式指定为元字符的打印和非打印字符组成。这包括所有的大写和小写字母字符，所有数字，所有标点符号以及一些符号。

2、非打印字符：

字符含义

\cx 匹配由x指明的控制字符。例如，\cM匹配一个Control-M或回车符。x的值必须为A-Z或a-z之一。否则，将c视为一个原义的'c'字符。

\f 匹配一个换页符。等价于\x0c和\cL。

匹配一个换行符。等价于\x0a和\cJ。

\r 匹配一个回车符。等价于\x0d和\cM。

\s 匹配任何空白字符，包括空格、制表符、换页符等等。等价于[\f\r\t\v]。

\S 匹配任何非空白字符。等价于[^\f\r\t\v]。

\t 匹配一个制表符。等价于\x09和\cI。

\v 匹配一个垂直制表符。等价于\x0b和\cK。

3、元字符（特殊字符）：

　　所谓元字符（特殊字符），就是一些有特殊含义的字符，如上面说的"*.txt"中的*，简单的说就是表示任何字符串的意思。如果要查找文件名中有＊的文件，则需要对＊进行转义，即在其前加一个\。ls\*.txt。正则表达式有以下特殊字符。

要在正则表达式模式中包含元字符以使其不具有特殊含义，您必须使用反斜杠(\)转义字符。例如，下面的正则表达式与顺序依次为字母A、字母B、星号和字母C的模式匹配：

/AB\*C/;

元字符说明

$ 匹配输入字符串的结尾位置。如果设置了RegExp对象的Multiline属性，则$也匹配''或'\r'。要匹配$字符本身，请使用\$。

() 标记一个子表达式的开始和结束位置。子表达式可以获取供以后使用。要匹配这些字符，请使用$和$。

* 匹配前面的子表达式零次或多次。要匹配*字符，请使用\*。

+ 匹配前面的子表达式一次或多次。要匹配+字符，请使用\+。

. 匹配除换行符之外的任何单字符。要匹配.，请使用\。

[ 标记一个中括号表达式的开始。要匹配[，请使用\[。

? 匹配前面的子表达式零次或一次，或指明一个非贪婪限定符。要匹配?字符，请使用\?。

\ 将下一个字符标记为或特殊字符、或原义字符、或向后引用、或八进制转义符。例如，'n'匹配字符'n'。''匹配换行符。序列'\\'匹配"\"，而'\('则匹配"("。

^ 匹配输入字符串的开始位置，除非在方括号表达式中使用，此时它表示不接受该字符集合。要匹配^字符本身，请使用\^。

{ 标记限定符表达式的开始。要匹配{，请使用\{。

| 指明两项之间的一个选择。要匹配|，请使用\|。

　　构造正则表达式的方法和创建数学表达式的方法一样。也就是用多种元字符与操作符将小的表达式结合在一起来创建更大的表达式。正则表达式的组件可以是单个的字符、字符集合、字符范围、字符间的选择或者所有这些组件的任意组合。

4、限定符：

限定符用来指定正则表达式的一个给定组件必须要出现多少次才能满足匹配。有*或+或?或{n}或{n,}或{n,m}共6种。

*、+和?限定符都是贪婪的，因为它们会尽可能多的匹配文字，只有在它们的后面加上一个?就可以实现非贪婪或最小匹配。

　　正则表达式的限定符有：

字符描述

* 匹配前面的子表达式零次或多次。例如，zo*能匹配"z"以及"zoo"。*等价于{0,}。

+ 匹配前面的子表达式一次或多次。例如，'zo+'能匹配"zo"以及"zoo"，但不能匹配"z"。+等价于{1,}。

? 匹配前面的子表达式零次或一次。例如，"do(es)?"可以匹配"do"或"does"中的"do"。?等价于{0,1}。

{n} n是一个非负整数。匹配确定的n次。例如，'o{2}'不能匹配"Bob"中的'o'，但是能匹配"food"中的两个o。

{n,} n是一个非负整数。至少匹配n次。例如，'o{2,}'不能匹配"Bob"中的'o'，但能匹配"foooood"中的所有o。'o{1,}'等价于'o+'。'o{0,}'则等价于'o*'。

{n,m} m和n均为非负整数，其中n<=m。最少匹配n次且最多匹配m次。例如，"o{1,3}"将匹配"fooooood"中的前三个o。'o{0,1}'等价于'o?'。请注意在逗号和两个数之间不能有空格。　

5、定界符：边界

用来描述字符串或单词的边界，^和$分别指字符串的开始与结束，\b描述单词的前或后边界，\B表示非单词边界。不能对定位符使用限定符。

3.2字符类[]

可以使用字符类指定字符列表以匹配正则表达式中的一个位置。使用方括号（[和]）定义字符类。例如，下面的正则表达式定义了匹配bag、beg、big、bog或bug的字符类：

/b[aeiou]g/

1、字符类中的转义序列：

通常在正则表达式中具有特殊含义的大多数元字符和元序列在字符类中“不具有”那些特殊含义。例如，在正则表达式中星号用于表示重复，但是出现在字符类中时则不具有此含义。下列字符类匹配星号本身以及列出的任何其它字符：

/[abc*123]/

但是，下表中列出的三个字符功能与元字符相同，在字符类中具有特殊含义：

] ：定义字符类的结尾。

- ：定义字符范围

\ ：定义元序列并撤销元字符的特殊含义。

对于要识别为字面字符（无特殊元字符含义）的任何字符，必须在该字符前面加反斜杠转义字符。例如，下面的正则表达式包含匹配四个符号（$、\、]或-）中任意一个符号的字符类。

/[$\\\]\-]/

2、字符类中字符的范围：

使用连字符指定字符的范围，例如A-Z、a-z或0-9。这些字符必须在字符类中构成有效的范围。例如，下面的字符类匹配a-z范围内的任何一个字符或任何数字：

/[a-z0-9]/

您还可以使用\xnnASCII字符代码通过ASCII值指定范围。例如，下面的字符类匹配扩展ASCII字符集中的任意字符（如é和ê）：

/[\x80-\x9A]/

3、反转的字符类：

如果在字符类的开头使用尖号(^)字符，则将反转该集合的意义，即未列出的任何字符都认为匹配。下面的字符类匹配除小写字母(a-z)或数字以外的任何字符：

/[^a-z0-9]/

必须在字符类的“开头”键入尖号(^)字符以表示反转。否则，您只是将尖号字符添加到字符类的字符中。例如，下面的字符类匹配许多符号字符中的任意一个，其中包括尖号：

/[!.,#+*%$&^]/

3.3分组和选择

　　用圆括号将所有选择项括起来，相邻的选择项之间用|分隔。但用圆括号会有一个副作用，是相关的匹配会被缓存，此时可用?:放在第一个选项前来消除这种副作用。

　　其中?:是非捕获元之一，还有两个非捕获元是?=和?!，这两个还有更多的含义，前者为正向预查，在任何开始匹配圆括号内的正则表达式模式的位置来匹配搜索字符串，后者为负向预查，在任何开始不匹配该正则表达式模式的位置来匹配搜索字符串。

例如：/(very)+/可以匹配verygoogd或者veryverygood

1、后向引用（逆向引用）：

　　如果在模式中定义标准括号组，则之后可以在正则表达式中引用它。这称为“逆向引用”，并且此类型的组称为“捕获组”。

对一个正则表达式模式或部分模式两边添加圆括号将导致相关匹配存储到一个临时缓冲区中，所捕获的每个子匹配都按照在正则表达式模式中从左至右所遇到的内容存储。存储子匹配的缓冲区编号从1开始，连续编号直至最大99个子表达式。每个缓冲区都可以使用''访问，其中n为一个标识特定缓冲区的一位或两位十进制数。

　　例如，在下面的正则表达式中，序列\1匹配在捕获括号组中匹配的任意子字符串：

/(\d+)-by-\1/; //匹配字符串：48-by-48

可以通过键入\1,\2,...,\99在正则表达式中指定最多99个此类逆向引用。

可以使用非捕获元字符'?:','?=',or'?!'来忽略对相关匹配的保存。

2、使用非捕获组和向前查找组：

非捕获组是只用于分组的组，它不会被“收集”，也不会匹配有限的逆向引用。可以使用(?:和?!)来定义非捕获组，如下所示：

/(?:com|org|net);

例如，注意在捕获组和非捕获组中加入(com|org)的区别（使用php来演示）:

捕获组）：

复制代码代码如下:

$pattern='/(\w+)@(\w+).(com|org)/';

$str="bob@example.com";

preg_match($pattern,$str,$match);

print_r($match);

Array

(

[0]=>bob@example.com

[1]=>bob

[2]=>example

[3]=>com

)

非捕获组）：

复制代码代码如下:

$pattern='/(\w+)@(\w+).(?:com|org)/';

$str="bob@example.com";

preg_match($pattern,$str,$match);

print_r($match);

Array

(

[0]=>bob@example.com

[1]=>bob

[2]=>example

)

一类特殊的非捕获组是“向前查找组”，它包括两种类型：“正向前查找组”和“负向前查找组”。使用(?=和?!)定义正向前查找组，它指定组中的子模式位置必须匹配。但是，匹配正向前查找组的字符串部分可能匹配正则表达式中的剩余模式。例如，由于(?=e)在下列代码中是正向前查找组，它匹配的字符e可以被正则表达式的后续部分匹配，在本例中为捕获组\w*)：

复制代码代码如下:

$pattern='/sh(?=e)(\w*)/i';

$str="Shellysellsseashellsbytheseashore";

preg_match($pattern,$str,$match);

print_r($match);

Array

(

[0]=>Shelly

[1]=>elly

)

使用(?!和)定义负向前查找组，它指定该组中的子模式位置必须不匹配。例如：

模式：$pattern='/sh(?!e)(\w*)/i';

Array

(

[0]=>shore

[1]=>ore

)

3.2模式修正标志符

此外还有：

U:表示PCRE_UNGREEDY，表示非贪婪，相当于perl/python语言的.*?，在匹配过程中，对于.*正则，一有匹配立即执行，而不是等.*消费了所有字符再一一回退。

PHP正则表达式模式后面通常带有/i,/is,/s,/isU等参数，那么这都是些什么东西呢？下面我们一起来看看：

模式修正符--解说正则表达式模式中使用的修正符

说明

　　下面列出了当前在PCRE中可能使用的修正符。括号中是这些修正符的内部PCRE名。修正符中的空格和换行被忽略，其它字符会导致错误。

i(PCRE_CASELESS)

　　如果设定此修正符，模式中的字符将同时匹配大小写字母。

m（PCRE_MULTILINE）

　　默认情况下，PCRE将目标字符串作为单一的一“行”字符所组成的（甚至其中包含有换行符也是如此）。“行起始”元字符（^）仅仅匹配字符串的起始，“行结束”元字符（$）仅仅匹配字符串的结束，或者最后一个字符是换行符时其前面（除非设定了D修正符）。这和Perl是一样的。

　　当设定了此修正符，“行起始”和“行结束”除了匹配整个字符串开头和结束外，还分别匹配其中的换行符的之后和之前。这和Perl的/m修正符是等效的。如果目标字符串中没有“”字符或者模式中没有^或$，则设定此修正符没有任何效果。

s（PCRE_DOTALL）

　　如果设定了此修正符，模式中的圆点元字符（.）匹配所有的字符，包括换行符。没有此设定的话，则不包括换行符。这和Perl的/s修正符是等效的。排除字符类例如[^a]总是匹配换行符的，无论是否设定了此修正符。

x（PCRE_EXTENDED）

　　如果设定了此修正符，模式中的空白字符除了被转义的或在字符类中的以外完全被忽略，在未转义的字符类之外的#以及下一个换行符之间的所有字符，包括两头，也都被忽略。这和Perl的/x修正符是等效的，使得可以在复杂的模式中加入注释。然而注意，这仅适用于数据字符。空白字符可能永远不会出现于模式中的特殊字符序列，例如引入条件子模式的序列(?(中间。

　　如果设定了此修正符，preg_replace()在替换字符串中对逆向引用作正常的替换，将其作为PHP代码求值，并用其结果来替换所搜索的字符串。

　　只有preg_replace()使用此修正符，其它PCRE函数将忽略之。

　　注:本修正符在PHP3中不可用。

A（PCRE_ANCHORED）

　　如果设定了此修正符，模式被强制为“anchored”，即强制仅从目标字符串的开头开始匹配。此效果也可以通过适当的模式本身来实现（在Perl中实现的唯一方法）。

D（PCRE_DOLLAR_ENDONLY）

　　如果设定了此修正符，模式中的美元元字符仅匹配目标字符串的结尾。没有此选项时，如果　　最后一个字符是换行符的话，美元符号也会匹配此字符之前（但不会匹配任何其它换行符之前）。如果设定了m修正符则忽略此选项。Perl中没有与其等价的修正符。

　　当一个模式将被使用若干次时，为加速匹配起见值得先对其进行分析。如果设定了此修正符则会进行额外的分析。目前，分析一个模式仅对没有单一固定起始字符的non-anchored模式有用。

U（PCRE_UNGREEDY）

　　本修正符反转了匹配数量的值使其不是默认的重复，而变成在后面跟上“?”才变得重复。这和Perl不兼容。也可以通过在模式之中设定(?U)修正符或者在数量符之后跟一个问号（如.*?）来启用此选项。

例如：

复制代码代码如下:

$str='src="http://www.test.cn/1.mp3"type="application/x-mplayer2"test,3333';

echopreg_replace('/src="(.*)"/','--',$str);

echo'
';

echopreg_replace('/src="(.*)"/U','--',$str);

echo'
';

echopreg_replace('/src="(.*?)"/','--',$str);//等效preg_replace('|src="(.*)"|U','--',$str);

结果：

--test,3333

--type="application/x-mplayer2"test,3333

从这里我们就可以看出，第一个执行结果一直匹配到最后一个满足条件的字符，专业一点就叫贪婪匹配，

第二个执行结果只匹配第一个满足条件的字符，叫非贪婪匹配。

X（PCRE_EXTRA）

　　此修

Anonyem

3楼 · 2020-09-21 14:50

文章目录

简介正则表达式语法模块内容正则表达式对象（正则对象）匹配对象正则表达式例子检查对子模拟scanf()search()vs.match()建立一个电话本文字整理找到所有副词找到所有副词和位置原始字符记法写一个词法分析器

简介

这个模块提供了与Perl语言类似的正则表达式匹配操作。

要搜索的样式和字符串可以是Unicode字符串(str)以及8位字节串(bytes)。但是，Unicode字符串与8位字节串不能混用：也就是说，你不能用一个字节串样式去匹配Unicode字符串，反之亦然；类似地，当进行替换操作时，替换字符串必须与所用的样式和搜索字符串都为相同类型。

正则表达式使用反斜框字符('\')来提示特殊形式或是允许使用特殊字符而又不启用它们的特殊含义。这会与Python在字符串字面值中出于相同目的而使用的相同字符发生冲突；例如，为了匹配一个反斜杠字面值，样式字符串就需要写成'\\\\'，因为正则表达式必须写成\\，而每个反斜杠在普通的Python字符串字面值内又必须写成\\。

解决办法是对于正则表达式样式使用Python的原始字符串表示法；在带有'r'前缀的字符串字面值中，反斜杠不必做任何特殊处理。因此r``表示包含``\和n两个字符的字符串，而则表示只包含一个换行符的字符串。样式在Python代码中通常都会使用这种原始字符串表示法来表示。

绝大部分正则表达式操作都提供为模块函数和方法，这些函数是一个捷径，不需要先编译一个正则对象，但是损失了一些优化参数。

参见:第三方模块regex,提供了与标准库re模块兼容的API接口，同时还提供了额外的功能和更全面的Unicode支持。

正则表达式语法

一个正则表达式（或RE）指定了一集与之匹配的字符串；模块内的函数可以让你检查某个字符串是否跟给定的正则表达式匹配（或者一个正则表达式是否匹配到一个字符串，这两种说法含义相同）。

正则表达式可以拼接；如果A和B都是正则表达式，那么AB也是正则表达式。通常，如果字符串p匹配A并且另一个字符串q匹配B,那么pq可以匹配AB。除非A或者B包含低优先级操作，A和B存在边界条件，或者命名组引用。所以，复杂表达式可以很容易的从这里描述的简单源语表达式构建。

以下是正则表达式格式的简要说明。更详细的信息和演示，参考RegularExpressionHOWTO。

正则表达式可以包含普通或者特殊字符。绝大部分普通字符，比如A，a，或者0，都是最简单的正则表达式。它们就匹配自身。你可以拼接普通字符，所以last匹配字符串'last'。（在这一节的其他部分，我们将用thisspecialstyle这种方式表示正则表达式，通常不带引号，要匹配的字符串用'insinglequotes'，单引号形式。）

有些字符，比如|或者(，属于特殊字符。特殊字符既可以表示它的普通含义，也可以影响它旁边的正则表达式的解释。

重复修饰符(*,+,?,{m,n},等)不能直接嵌套。这样避免了非贪婪后缀?修饰符和其他实现中的修饰符产生的多义性。要应用一个内层重复嵌套，可以使用括号。比如，表达式(?:a{6})*匹配6个'a'字符重复任意次数。

特殊字符：

.(点)在默认模式，匹配除了换行的任意字符。如果指定了标签DOTALL，它将匹配包括换行符的任意字符。

^(插入符号)匹配字符串的开头，并且在MULTILINE模式也匹配换行后的首个符号。

$匹配字符串尾或者换行符的前一个字符，在MULTILINE模式匹配换行符的前一个字符。foo匹配'foo'和'foobar',但正则foo$只匹配'foo'。更有趣的是，在foo1foo2搜索foo.$，通常匹配'foo2'，但在MULTILINE模式，可以匹配到'foo1'；在foo搜索$会找到两个空串：一个在换行前，一个在字符串最后。

*对它前面的正则式匹配0到任意次重复，尽量多的匹配字符串。ab*会匹配'a'，'ab'，或者'a'后面跟随任意个'b'。

+对它前面的正则式匹配1到任意次重复。ab+会匹配'a'后面跟随1个以上到任意个'b'，它不会匹配'a'。

?对它前面的正则式匹配0到1次重复。ab?会匹配'a'或者'ab'。

*?,+?,??

*,+，和?修饰符都是贪婪的；它们在字符串进行尽可能多的匹配。有时候并不需要这种行为。如果正则式<.*>希望找到b，它将会匹配整个字符串，而不仅是。在修饰符之后添加?将使样式以非贪婪方式或者:dfn:最小方式进行匹配；尽量少的字符将会被匹配。使用正则式<.*?>将会仅仅匹配。

{m}对其之前的正则式指定匹配m个重复；少于m的话就会导致匹配失败。比如，a{6}将匹配6个'a',但是不能是5个。

{m,n}对正则式进行m到n次匹配，在m和n之间取尽量多。比如，a{3,5}将匹配3到5个'a'。忽略m意为指定下界为0，忽略n指定上界为无限次。比如a{4,}b将匹配'aaaab'或者1000个'a'尾随一个'b'，但不能匹配'aaab'。逗号不能省略，否则无法辨别修饰符应该忽略哪个边界。

{m,n}?前一个修饰符的非贪婪模式，只匹配尽量少的字符次数。比如，对于'aaaaaa'，a{3,5}匹配5个'a'，而a{3,5}?只匹配3个'a'。

\转义特殊字符（允许你匹配*,?,或者此类其他），或者表示一个特殊序列；特殊序列之后进行讨论。

如果你没有使用原始字符串（r'raw'）来表达样式，要牢记Python也使用反斜杠作为转义序列；如果转义序列不被Python的分析器识别，反斜杠和字符才能出现在字符串中。如果Python可以识别这个序列，那么反斜杠就应该重复两次。这将导致理解障碍，所以高度推荐，就算是最简单的表达式，也要使用原始字符串。

[]用于表示一个字符集合。在一个集合中：

字符可以单独列出，比如[amk]匹配'a'，'m'，或者'k'。可以表示字符范围，通过用-将两个字符连起来。比如[a-z]将匹配任何小写ASCII字符，[0-5][0-9]将匹配从00到59的两位数字，[0-9A-Fa-f]将匹配任何十六进制数位。如果-进行了转义（比如[a\-z]）或者它的位置在首位或者末尾（如[-a]或[a-]），它就只表示普通字符-。特殊字符在集合中，失去它的特殊含义。比如[(+*)]只会匹配这几个文法字符(,+,*,or)。字符类如\w或者\S(如下定义)在集合内可以接受，它们可以匹配的字符由ASCII或者LOCALE模式决定。不在集合范围内的字符可以通过取反来进行匹配。如果集合首字符是^，所有不在集合内的字符将会被匹配，比如[^5]将匹配除过5的所有字符，[^^]将匹配所有字符，除了'^'。^如果不在集合首位，就没有特殊含义。在集合内要匹配一个字符']'，有两种方法，要么就在它之前加上反斜杠，要么就把它放到集合首位。比如，[()[\]{}]和[]()[{}]都可以匹配括号。UnicodeTechnicalStandard里的嵌套集合和集合操作支持可能在未来添加。这将会改变语法，所以为了帮助这个改变，一个FutureWarning将会在有多义的情况里被raise，包含以下几种情况，集合由[开始，或者包含下列字符序列--,&&,~~,和||。为了避免警告，需要将它们用反斜杠转义。