|
想使用正則表達式來獲取一段文本中的任意字符。于是很隨意得就寫出如下匹配規(guī)則:
(.*) 結果運行之后才發(fā)現,無法獲得換行之后的文本。
查了一下手冊,發(fā)現正則表達式中,.(點符號)匹配的是除了換行符\n以外的所有字符。同時,手冊上還有一句話:要匹配包括 '\n'在內的任何字符,請使用像'[.\n]'的模式。
于是將正則表達式的匹配規(guī)則修改如下: ([.\n]*),當然,如果程序中直接寫到話,需要改為([.\\n]*) 結果再次運行程序,發(fā)現什么內容也取不到了。
又將其修改為如下規(guī)則: ([.|\n]*)以及([\n.]*)結果還是不行,什么內容都取不到。
但是查出了一個解決辦法,經過一試,果然可以匹配包括換行符在內的任意字符,以下為正確的正則表達式匹配規(guī)則: ([\s\S]*) 同時,也可以用“([\d\D]*)”、“([\w\W]*)” 來表示。
在文本文件里, 這個表達式可以匹配所有的英文:[ -~]
這個表達式可以匹配所有的非英文(比如中文): [^ -~]
|