正则表达式

yoyoshadow

2017-03-16

关注关注

在js中，string作为一个很重要的对象，它的使用方法也很多。或者说伴随着他的一些方法和函数也很多。在这里主要说明正则表达式。以及一些中级的操作技巧。

正则表达式的定义：

正则表达式是一种方法。是一种定义字符模式的方法。简单点而言就是当要检索某个文本时，可以使用一种模式来描述要检索的内容。

有了它之后，我们就可以更简单的去拆分，查找，替换字符串中与模式字符匹配的字符。

需要说明的是，RegExp是js中的内置对象，就像String和Array。而在js中正则表达式的使用正好就是通过这个对象来使用的。

RegExp对象的创建：

var myRegExp = /\b'|'\b/;

其中的/和/代表着正则表达式的开始和结束。就像引号表示字符串的开始和结束一样。

2：

var myRegExp = new RegExp ("\\b'|'\\b ")

这是两种指定正则表达式的方法，第一种方法在js中更加简洁高效。在日常的编程中一般使用第一种。

接下来是正则表达式的一些简单的用法：

在String对象中，很多方法都把正则表达式当做参数，但是RegExp作为一个对象有它自己的方法和属性。

在js中RegExp通常被split();match();replace();search();作为参数。下面的例子是用replace方法和正则表达式实现的一个简单的文本替换。

var myString = 'Paul,Puala,Pauline,paul,Paul';
var myRegExp = /Paul/;
myString = myString.replace(myRegExp,'Ringo');
console.log(myString);

上述的程序是把Paul换成Ringo，replace()方法接受两个参数第一个是RegExp参数用来查找和替换的模式，另一个是替换的文本。

注意：此时的运行结果是：Ringo,Puala,Pauline,paul,Paul

这是因为：RegExp默认仅查找与模式匹配的第一个子字符。找到即停止。这一特性非常重要。

因为这里想要达到的目的是全局查找，全局匹配。全局替换。所以就来说明一下RegExp这个对象。

语法：

/pattern/attributes

new RegExp(pattern, attributes);

pattern参数是一个字符串，指定了正则表达式的模式或其他正则表达式；

attributes是一个可选的字符：包含属性"g"、"i"和"m"，分别用于指定全局匹配、区分大小写的匹配和多行匹配。

正则表达式的元字符（拥有特殊含义的字符）：

.查找单个字符，除了换行和行结束符。

\w查找单词字符。

\W查找非单词字符。

\d查找数字。

\D查找非数字字符。

\s查找空白字符。

\S查找非空白字符。

\b匹配单词边界。

\B匹配非单词边界。

\0查找NUL字符。

\n查找换行符。

\f查找换页符。

\r查找回车符。

\t查找制表符。

\v查找垂直制表符。

\xxx查找以八进制数xxx规定的字符。

\xdd查找以十六进制数dd规定的字符。

\uxxxx查找以十六进制数xxxx规定的Unicode字符。

需要注意的是大小写。因为大小写字符的含义大相径庭！！！

下面是正则表达式的量词：

n+匹配任何包含至少一个n的字符串。

n*匹配任何包含零个或多个n的字符串。

n?匹配任何包含零个或一个n的字符串。

n{X}匹配包含X个n的序列的字符串。

n{X,Y}匹配包含X至Y个n的序列的字符串。

n{X,}匹配包含至少X个n的序列的字符串。

n$匹配任何结尾为n的字符串。

^n匹配任何开头为n的字符串。

?=n匹配任何其后紧接指定字符串n的字符串。

?!n匹配任何其后没有紧接指定字符串n的字符串。

在日常使用中有下面的一些重复字符：

{n}表示前一项出现n次

{n,}前一项出现n次或者n次以上。

{n,m}前一项至少出现n次，最多出现m次

？前一项出现0次或者1次

+前一项出现1次或者多次

×前一项出现0次或者多次

还有一些方括号（用于查找某个范围内的字符）：

[abc]查找方括号之间的任何字符。

[^abc]查找任何不在方括号之间的字符。

[0-9]查找任何从0至9的数字。

[a-z]查找任何从小写a到小写z的字符。

[A-Z]查找任何从大写A到大写Z的字符。

[A-z]查找任何从大写A到小写z的字符。

[adgk]查找给定集合内的任何字符。

[^adgk]查找给定集合外的任何字符。

(red|blue|green)查找任何指定的选项。

还有一些常用的位置字符：

^模式必须位于字符串的开头，如果是多行字符串，模式就位于一行的开头，对于多行文本（既包含回车符的字符串），在定义正则表达式的时候，需要用/myregex/m设置多行标记。

$模式必须位于字符串的结束位置，如果是多行字符串，模式就位于一行的结束位置，对于多行文本（即包含回车符的字符串，）在定义正则表达式的时候，需要使用/myregex/m设置多行标记。

\b匹配单词分界位置。即单词字符与非单词字符之间的位置

\B匹配非单词分界位置。

RegExp对象的方法

RegExp对象有3个方法：test()、exec()以及compile()。

test()方法检索字符串中的指定值。返回值是true或false。

exec()方法检索字符串中的指定值。返回值是被找到的值。如果没有发现匹配，则返回null。

compile()方法用于改变RegExp。

compile()既可以改变检索模式，也可以添加或删除第二个参数。

RegExp对象属性

globalRegExp对象是否具有标志g。

ignoreCaseRegExp对象是否具有标志i。

lastIndex一个整数，标示开始下一次匹配的字符位置。

multilineRegExp对象是否具有标志m。

source正则表达式的源文本。

支持正则表达式的String对象的方法

search检索与正则表达式相匹配的值。

match找到一个或多个正则表达式的匹配。

replace替换与正则表达式匹配的子串。

split把字符串分割为字符串数组。

正则表达式字符串函数 paul 字符

yoyoshadow

0 关注 0 粉丝 0 动态

关注关注

Python 正则表达式

正则表达式是一个特殊的字符序列，它能帮助你方便的检查一个字符串是否与某种模式匹配。re 模块使 Python 语言拥有全部的正则表达式功能。re 模块也提供了与这些方法功能完全一致的函数，这些函数使用一个模式字符串做为它们的第一个参数。该对象拥有一系列方法

liusarazhang 2020-06-14

shell模糊匹配与正则详解

正则可以实现一些简单的功能，并用在脚本中，如检测ip地址是否符合规范，检测文件名是否符合规范等等。正则表达式主要是用来描述一个句法规则的模式。其实说的通俗一点，就是利用字符和元字符的组合，对一些符合既定句法的模式进行模糊匹配。它的主要功能是文本查询和字符串

wangzhaotongalex 2020-10-20

Shell—正则表达式（grep命令、sed工具）

正则表达式对于系统管理员来说是非常重要的，熟练运用正则表达式可使工作变得更加简单、方便。简单来说，是一种匹配字符串的方法，通过一些特殊符号，实现快速查找、删除、替换某个特定字符串。正则表达式对于系统管理员来说是非常重要的，系统运行过程中会产生大量的信息，这

rechanel 2020-11-16

【教程】图文解读正则表达式的使用技巧

一个好的正则表达式看起来像魔法，但请记住：任何足够先进的技术都无法与魔法区分开来。所以，就让我们揭开正则表达式的神秘面纱！如果你理解正则表达式，它会突然变成一个超快速和强大的工具……让我们从基础开始。它们的用途是什么？正则表达式通常用于 grep 等工具中

cshanzhizi 2020-10-16

如何掌握正则表达式这一开发利器，看这篇就够了

正则表达式具有伟大技术发明的一切特点，它简单、优美、功能强大、妙用无穷。对于很多实际工作来讲，正则表达式简直是灵丹妙药，能够成百倍地提高开发效率和程序质量。表示数字、大小写字母和下划线。表示空白符，包括空格、水平制表符、垂直制表符、换行符、回车符、换页符。

luofuIT成长记录 2020-09-22

如何使用Grep命令查找多个字符串

大家好，我是良许!今天向大家介绍一个非常有用的技巧，那就是使用 grep 命令查找多个字符串。简单介绍一下，grep 命令可以理解为是一个功能强大的命令行工具，可以用它在一个或多个输入文件中搜索与正则表达式相匹配的文本，然后再将每个匹配的文本用标准输出的

taomengxing 2020-09-07

C# 正则表达式

.Net 框架提供了允许这种匹配的正则表达式引擎。模式由一个或多个字符、运算符和结构组成。正则表达式中的反斜杠字符（\）指示其后跟的字符是特殊字符，或应按原义解释该字符。与报警符 \u0007 匹配。" + ‘\u0007‘ 中的 "

MaggieRose 2020-08-19