消除正则表达式中的循环

消除循环是如何提高正则表达式的匹配效率的呢？那就是传统型NFA引擎赋予我们对表达式的“控制权”，通过尽可能设置匹配过程中的“控制权”，来提高正则的效率。循环：(ako|luv)*之类问题中星号代表的意义。而消除循环的意思就是要避免无休止的匹配！
来看一个匹配双引号字符串的正则表达式例子"[^\\"](\\.[^\\"]*)*"，这个例子的优点很明显：

匹配速度快：若不能匹配，该表达式不会进行无休止匹配，引擎会迅速发现它，并终止匹配；若能匹配成功，也不会进入无休止的匹配状态。

但缺点也很明显：

可读性差：这是最大的问题，表达式"([^\\"]|\\.)*"在逻辑上与其相同，并且更容易看懂，为了消除循环提高效率，在此牺牲了可读性！
可维护性差：不仅牺牲了可读性，也牺牲了可维护性，而可维护性更加复杂，因为任何改动都必须保持对两个[^\\"]相同。

是否需要消除正则表达式中的循环，取决于自己是关注正则表达式的可读性和可维护性，还是更关注正则表达式的匹配高效性！那么如何消除循环？可以从以下两方面考虑：

使用占有优先量词避免无休止匹配来消除循环

我们知道表达式"([^\\"]+|\\.)*"中的两个量词+*会造成无休止的匹配，那么我们便可以通过将其中一个修改为占有优先量词来消除循环，或者修改两个！但是只修改[]+与修改[]+和()*是有很大区别的，当修改()*时，占有优先会抛弃括号内的所有备选状态，其中包括了[]+和多选分支结构本身的备选状态，所以修改后者时，表达式的匹配效率会更高。

使用固化分组避免无休止匹配来消除循环

消除正则表达式中的循环 ​

使用占有优先量词避免无休止匹配来消除循环 ​

使用固化分组避免无休止匹配来消除循环 ​

消除正则表达式中的循环

使用占有优先量词避免无休止匹配来消除循环

使用固化分组避免无休止匹配来消除循环