小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

Native-XML 數(shù)據(jù)庫:一個(gè)關(guān)于數(shù)據(jù)的壞主意? - CSDN 新聞

 accesine 2005-10-10
Native-XML 數(shù)據(jù)庫:一個(gè)關(guān)于數(shù)據(jù)的壞主意?
專欄作家 Kevin Williams 從正反兩面討論了使用 Native-XML 數(shù)據(jù)庫存儲(chǔ)結(jié)構(gòu)化信息。他概述了使用結(jié)構(gòu)化數(shù)據(jù)的常見需求,并討論了 Native-XML 數(shù)據(jù)庫在滿足這些需求方面做的如何。

該專欄文章討論了所謂的 Native-XML 數(shù)據(jù)庫。我經(jīng)常聽到的關(guān)于 XML 數(shù)據(jù)的問題之一是“我們真的需要 Native-XML 數(shù)據(jù)庫嗎?”在這篇專欄文章里,我的任務(wù)是分析何時(shí)把結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)到這些專門的數(shù)據(jù)庫里是有意義的。

到底什么是 Native-XML 數(shù)據(jù)庫?
毫無特別,Native-XML 數(shù)據(jù)庫是以 XML 格式存儲(chǔ)信息的數(shù)據(jù)庫。同樣,這些數(shù)據(jù)庫創(chuàng)建一些索引,并將這些索引與 XML 文檔一起存到資源庫中,以支持快速搜索資源庫來查找包特定信息的文檔。就在作者寫本文的同時(shí),有數(shù)家公司在競爭這一市場,其中包括 Ixiasoft(它們的產(chǎn)品是 TextML)、Software AG(Tamino)以及 XYZFind。但是這時(shí)還不能拋棄關(guān)系數(shù)據(jù)庫!讓我們看看這些工具的長處和短處。

結(jié)構(gòu)化數(shù)據(jù)資源庫應(yīng)該做什么?
當(dāng)使用結(jié)構(gòu)化數(shù)據(jù)工作時(shí),(粗略地講)需要執(zhí)行四種不同功能:向資源庫添加結(jié)構(gòu)化信息、從資源庫檢索信息、在資源庫中搜索信息以及從資源庫聚合信息。在這些功能方面,Native-XML 數(shù)據(jù)庫做的怎么樣呢?

用于數(shù)據(jù)的 Native-XML 數(shù)據(jù)庫?
簡而言之,Native-XML 數(shù)據(jù)庫和其它工具一樣有長處和短處:

  • 如果已經(jīng)以 XML 格式存儲(chǔ)信息,則 Native-XML 數(shù)據(jù)庫有利于文檔存儲(chǔ)和檢索
  • 以方便實(shí)用的格式檢索文檔
  • 大多都具有高質(zhì)量的全文搜索引擎
  • 當(dāng)對(duì)文檔進(jìn)行索引,以便于搜索時(shí)可能變得很復(fù)雜
  • 不能提供好的聚合功能

存儲(chǔ)
在資源庫中存儲(chǔ)信息很簡單。如果希望存儲(chǔ)的信息已經(jīng)是 XML 格式,那么可以直接把它添加進(jìn)資源庫。這也許聽起來不錯(cuò)。畢竟在不斷創(chuàng)新的 Web 服務(wù)世界中,將要到來的多數(shù)信息將使用嵌入在 SOAP 消息中的 XML 片段格式。然而,把 XML 文檔分解并保存到關(guān)系數(shù)據(jù)庫一點(diǎn)也不困難;當(dāng)開始查看希望支持的其它功能時(shí),這種作法會(huì)有一些好處。同樣許多本 Native-XML 數(shù)據(jù)庫供應(yīng)商所鼓吹的一個(gè)好處是 Native-XML 數(shù)據(jù)庫能夠存儲(chǔ)和查詢異種的文檔結(jié)構(gòu)。再說,對(duì)于結(jié)構(gòu)化數(shù)據(jù)問題在于:您真的希望信息的結(jié)構(gòu)千變?nèi)f化嗎?對(duì)于使用 XML 文檔時(shí)具有的這種優(yōu)勢(shì),當(dāng)使用結(jié)構(gòu)化數(shù)據(jù)時(shí)就算不上是一種優(yōu)勢(shì)了。

檢索
初看上去,從 Native-XML 數(shù)據(jù)庫檢索信息似乎也是一個(gè)好處:以信息的原始 XML 格式檢索它,而不需任何附加的編碼,并且可以使信息以一定的樣式顯示。然而,結(jié)構(gòu)化數(shù)據(jù)檢索的性質(zhì)使得這種明顯的優(yōu)勢(shì)實(shí)際上變成了劣勢(shì)。如果信息更新量巨大(例如,接收單個(gè)數(shù)兆字節(jié)大小 XML 文檔的股票系統(tǒng)的夜間更新),一些 Native-XML 平臺(tái)需要從數(shù)據(jù)庫返回整個(gè)文檔 ― 即使您只對(duì)文檔的很小一部分感興趣(譬如某個(gè)特定股票的變化過程)。 其它 Native-XML 平臺(tái)在將 XML 文檔保存到資源庫之前進(jìn)行分解,但是如果具有復(fù)雜的文檔結(jié)構(gòu)(正如許多結(jié)構(gòu)化 XML 文檔傾向于具有這種結(jié)構(gòu))時(shí),這樣做就顯得有點(diǎn)笨拙。無論如何,許多關(guān)系數(shù)據(jù)庫供應(yīng)商目前正在實(shí)現(xiàn)瘦 XML 序列化器包裝器以便支持在需要時(shí)從關(guān)系數(shù)據(jù)生成 XML 文檔。這使得程序員可以容易地獲得完成特定任務(wù)所恰好需要的信息,這些信息具有某種格式,這種格式具有所需樣式、或者可以發(fā)送給其它能識(shí)別 XML 的目標(biāo)。

搜索
搜索 Native-XML 數(shù)據(jù)庫有兩種常規(guī)解決方法可用,選取哪種取決于數(shù)據(jù)庫供應(yīng)商。一些 Native-XML 數(shù)據(jù)庫需要選擇哪些元素或?qū)傩杂糜谒饕?,如同在關(guān)系數(shù)據(jù)庫里選擇哪些列用于索引。然后,這個(gè)信息被用于建立索引,以便搜索機(jī)制能用來快速定位相匹配的文檔。在文檔被添加到資源庫時(shí),其它 Native-XML 數(shù)據(jù)庫就是對(duì)文檔內(nèi)的所有信息建索引,可以想象這將導(dǎo)致存儲(chǔ)空間需求飛速上升(想象一下在關(guān)系數(shù)據(jù)庫中對(duì)所有列建索引?。S捎谶@些數(shù)據(jù)庫以文檔為中心的性質(zhì),搜索將返回一組 XML 文檔;然后如有必要,調(diào)用程序還得對(duì)這些文檔做進(jìn)一步處理。 很遺憾的是,這意味著更復(fù)雜的搜索,是很不方便的。例如,要找出那個(gè)對(duì)某一特定部分提交最高訂單的顧客,以為在中間環(huán)節(jié)要處理很多事情。在指向關(guān)系方面 Native-XML 數(shù)據(jù)庫做的也不好。結(jié)果是,如果數(shù)據(jù)結(jié)構(gòu)不是純粹層次結(jié)構(gòu)的,則對(duì)您而言,Native-XML 數(shù)據(jù)庫就不是恰當(dāng)?shù)慕鉀Q方案。大多數(shù) Native-XML 數(shù)據(jù)庫具有這一功效強(qiáng)大的特性 ― 執(zhí)行完善的全文搜索的能力,包括整個(gè)同義字支持、字根(匹配一個(gè)字的所有形式:現(xiàn)在時(shí)、過去時(shí)和進(jìn)行時(shí))以及相近搜索(DTD NEAR XML Schema)。此外,在使用傳統(tǒng)文檔時(shí),這些特性是不可缺少的,其中上下文在含意上起著重要的作用,而當(dāng)使用結(jié)構(gòu)化數(shù)據(jù)時(shí),就遠(yuǎn)沒有那么重要了。

聚合
使用關(guān)系數(shù)據(jù)工作時(shí),聚合是所需要的最重要功能之一,事實(shí)上它處于聯(lián)機(jī)分析處理的核心(OLAP)。Native-XML 數(shù)據(jù)庫在執(zhí)行聚合任務(wù)方面表現(xiàn)得特別差。因?yàn)樾畔⒁幢槐3衷谖臋n這一層,要么一般被分割成節(jié)點(diǎn),所以把信息匯集起來以及集中處理它(求和、平均數(shù)等等)就很困難,此外,還必須在中間環(huán)節(jié)增加附加代碼。如果結(jié)構(gòu)化數(shù)據(jù)應(yīng)用程序需要任何一種分析處理 ― 我打賭它會(huì)需要 ― Native-XML 數(shù)據(jù)庫將會(huì)使您失望。

結(jié)束語
該專欄文章對(duì) Native-XML 數(shù)據(jù)庫及其能力評(píng)價(jià)不高。盡管那些數(shù)據(jù)庫在觀念上很適合面向文檔信息(非結(jié)構(gòu)化或半結(jié)構(gòu)化的數(shù)據(jù))管理,但對(duì)于結(jié)構(gòu)化數(shù)據(jù)的使用,它們沒有什么意義。如果需要結(jié)構(gòu)化信息作為 XML 來訪問,則利用關(guān)系數(shù)據(jù)庫供應(yīng)商所提供的 XML 支持,這樣情況會(huì)好一些。

參考資料

關(guān)于作者
Kevin Williams 是 Equient(Veridian 專門從事信息管理系統(tǒng)的 XML 設(shè)計(jì)的一個(gè)部門)的首席 XML 設(shè)計(jì)師。他還與他人合著了幾本關(guān)于 XML 的書籍(由 Wrox Press 出版)。在他的網(wǎng)站 www.上時(shí)不時(shí)地可以找到一些 XML 想法、技巧、竅門和極自負(fù)的激昂演說?,F(xiàn)在這些已經(jīng)完成了百分之十左右!您可以通過 kevin@與他聯(lián)系。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多