使用RegularExpressions去除HTML標(biāo)簽的字符串網(wǎng)友要求做一個(gè)文章摘要,由于文章包含有Html標(biāo)簽,在截取文章頭200個(gè)字符串時(shí),得到的字符串將是一些意想不到的結(jié)果。因此讓Insus.NET為他解決去除html標(biāo)簽,然后再從去除Html標(biāo)簽之后的結(jié)果截取200個(gè)字符串。 實(shí)現(xiàn)這個(gè)功能,可以使用RegularExpressions正則表達(dá)式: . 匹配除 "\n" 之外的任何單個(gè)字符。 * 匹配前面的子表達(dá)式零次或多次。 匹配前面的子表達(dá)式零次或一次。 因此只要把文章的"<.*?>"替換為String.Empty即可。
接下來,Insus.NET寫一個(gè)函數(shù),在寫函數(shù)之前,先引用一個(gè)命名空間: using System.Text.RegularExpressions;
函數(shù): public static string RemoveHtmlTag(string articleString) { return Regex.Replace(articleString, "<.*?>", string.Empty); } |
|
|