使用RegularExpressions去除HTML標(biāo)簽的字符串

悟靜 2012-09-22

展開全文

使用RegularExpressions去除HTML標(biāo)簽的字符串

網(wǎng)友要求做一個(gè)文章摘要，由于文章包含有Html標(biāo)簽，在截取文章頭200個(gè)字符串時(shí)，得到的字符串將是一些意想不到的結(jié)果。因此讓Insus.NET為他解決去除html標(biāo)簽，然后再從去除Html標(biāo)簽之后的結(jié)果截取200個(gè)字符串。

實(shí)現(xiàn)這個(gè)功能，可以使用RegularExpressions正則表達(dá)式：

. 匹配除 "\n" 之外的任何單個(gè)字符。

* 匹配前面的子表達(dá)式零次或多次。

匹配前面的子表達(dá)式零次或一次。

因此只要把文章的"<.*?>"替換為String.Empty即可。

接下來，Insus.NET寫一個(gè)函數(shù)，在寫函數(shù)之前，先引用一個(gè)命名空間：

using System.Text.RegularExpressions;

函數(shù)：

public static string RemoveHtmlTag(string articleString)
    {
        return Regex.Replace(articleString, "<.*?>", string.Empty);
    }

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：悟靜 > 《.net和asp.net》

舉報(bào)/認(rèn)領(lǐng)