正規表現Tips その1
\d
0〜9の数字を表す正規表現です。
\D
数字以外を表す正規表現です。
正規表現では小文字が大文字になると反対の意味を持ちます。
\s
空白文字を表す正規表現です。空白文字とは…半角スペース、タブ文字のことです。
\S
空白文字以外を表す正規表現です。
正規表現では小文字が大文字になると反対の意味を持ちます。
\w
英数字と「_」(アンダーバー)を表す正規表現です。つまり「ABCDEFGHIJKLMNOPQRSTUVWXYZ01234567890_」です。
\W
\w以外を表す正規表現です。
正規表現では小文字が大文字になると反対の意味を持ちます。
\n
改行文字を表します。LFと呼ばれる改行です。UNIX系マシンの標準的な改行コードです。
\r
改行文字を表します。CRと呼ばれる改行です。Apple系マシンの標準的な改行コードです。
Windows系マシンはCR+LFが改行コードとなります。2文字で1つの改行です。
\t
タブ文字を表します。
タブとは適当な間隔を空けてくれる文字です。タブを1文字入れると、たいていは半角スペース4文字分か8文字分の間隔があきます。
^
行頭を表します。
空行を表すには「^\n」(行頭が改行である)と書きます。
$
行末を表します。
「$」を置換対象にすると行末に文字を追加できます。
*
直前にある文字の0回以上のマッチを表します。
「A*」はAがない、またはある、場合に一致します。Aがたくさん続いている場合も一致します。
+
直前にある文字の1回以上のマッチを表します。
「A+」は、Aが1つ、またはそれ以上続いている場合に一致します。
?
直前にある文字の0回または1回の出現を表します。
「A?」は、Aがない、または1つある場合に一致します。
{n}
直前にある文字のちょうどn回に一致します。
つまりA{2}はAA、A{4}はAAAAに一致です。
\d(数字を表す正規表現)と組み合わせると数字の桁数が指定できます。
{n,}
直前にある文字のn回以上に一致します。
つまりA{2,}はAA,AAA,AAAA...(2文字以上ならいくらでも)に一致です。
{n,m}
直前にある文字のn回以上、m回以下に一致します。
つまりA{2,4}はAA,AAA,AAAAに一致です。
\d(数字を表す正規表現)と組み合わせると数字の桁数が指定できます。
空行を検索する(1行空いている行)正規表現もあります。
|