|
級別: 中級
Hany Saleeb, 技術顧問, Freelance
2005 年 12 月 08 日
XML 用戶一個常見的問題是如何將 XML 映射到數(shù)據(jù)庫。本文討論基于表的映射和對象-關系映射。這兩種映射常常作為在 XML 文檔和數(shù)據(jù)庫特別是關系數(shù)據(jù)庫之間轉(zhuǎn)換數(shù)據(jù)的軟件的基礎。在這個領域,一個重要的特點是映射是雙向的,就是說可以把數(shù)據(jù)從 XML 文檔轉(zhuǎn)化到數(shù)據(jù)庫,也可以從數(shù)據(jù)庫轉(zhuǎn)化到 XML 文檔。
即使數(shù)據(jù)庫沒有自稱支持 XML 特性,也可以在關系數(shù)據(jù)庫中存儲和檢索 XML 文檔。這樣做需要小心地使用 Java™ 編程語言(數(shù)據(jù)庫不一定兼容 Java Database Connectivity 或 JDBC),還需要一個框架來連接關系數(shù)據(jù)庫和 XML 文檔流。
將 XML 映射到數(shù)據(jù)庫有兩種常見的方法:基于表的映射和對象-關系(或基于對象的)映射。這兩種方法都是雙向的,因此可用于存儲和檢索 XML 文檔。
基于表的映射
基于表的映射 將文檔看作一個表或者一組表。清單 1 和 2 顯示了這兩種情況下的文檔結(jié)構。
清單 1. 表映射的選項(單表)
<Table ABC>
<Row1>
<Column_a>123-45-7890</Column_a>
<Column_b>Johnson, Eric</Column_b>
<Column_c> Pharmaceutical </Column_c>
</Row1>
<Row2>
<Column_a>999-00-1010</Column_a>
<Column_b>Mitchell, Bruce</Column_b>
<Column_c> Industrial </Column_c>
</Row2>
</Table ABC>
|
清單 2. 表映射的選項(多表)
<Tables>
<Table_1>
<Row1>
<Column_a>123-45-7890</Column_a>
<Column_b> Johnson, Eric </Column_b>
<Column_c>Company A</Column_c>
</Row1>
<Row2>
<Column_a>999-00-1010</Column_a>
<Column_b> Mitchell, Bruce </Column_b>
<Column_c> Company B</Column_c>
</Row2>
</Table_1>
<Table_2>
<Row1>
<Column_a>Company A</Column_a>
<Column_b>Pharmaceutical</Column_b>
</Row1>
<Row2>
<Column_a>Company B</Column_a>
<Column_b>Industrial</Column_b>
</Row2>
</Table_2>
</Tables>
|
這種映射最明顯的優(yōu)點是簡單。因為結(jié)構與關系數(shù)據(jù)庫的表及結(jié)果集匹配,根據(jù)這種映射編寫代碼很容易。代碼執(zhí)行快、伸縮性好,對某些應用很合適,比如每次一個表在數(shù)據(jù)庫之間傳遞數(shù)據(jù)。
但是,基于表的映射也有一些不足之處。它只能用于非常小的 XML 文檔子集。此外,它沒有保留物理結(jié)構(即字符和實體引用、字符編碼或獨立的聲明)、文檔信息(即文檔類型聲明或 DTD)、注釋和處理指令。
對象-關系映射
基于表的映射只能用于有限的 XML 文檔,因此多數(shù)支持 XML 的關系數(shù)據(jù)庫、大部分支持 XML 的對象服務器以及一些中間件工具使用更加復雜的映射,稱為對象-關系映射。這種映射方法將 XML 文檔建模為針對文檔數(shù)據(jù)的一棵對象樹,然后將這些對象映射到數(shù)據(jù)庫。
比如 清單 3 所示的 XML 文檔。
清單 3. XML 格式的單個銷售訂單
<SalesOrder>
<Number>1234</Number>
<Customer>Gallagher Industries</Customer>
<Date>29.10.00</Date>
<Item Number="1">
<Part>A-10</Part>
<Quantity>12</Quantity>
<Price>10.95</Price>
</Item>
<Item Number="2">
<Part>B-43</Part>
<Quantity>600</Quantity>
<Price>3.99</Price>
</Item>
</SalesOrder>
|
該文檔映射為 清單 4 所示的對象。
清單 4. 層次化 XML 表示的單個銷售訂單
object SalesOrder {
number = 1234;
customer = "Gallagher Industries";
date = 29.10.00;
items = {ptrs to Item objects};
} / / / object Item { object Item {
number = 1; number = 2;
part = "A-10"; part = "B-43";
quantity = 12; quantity = 600;
price = 10.95; price = 3.99;
} }
|
該方法是層次化的,對數(shù)據(jù)映射來說很直觀。數(shù)據(jù)庫對象帶來了一些優(yōu)點,其中包括:
- 數(shù)據(jù)庫獨立性:數(shù)據(jù)庫對象從根本上是獨立于數(shù)據(jù)庫創(chuàng)建的,不依賴于特定底層數(shù)據(jù)特性來提供其功能。這種獨立性使您可以使用數(shù)據(jù)庫對象迅速將應用程序構建從一種數(shù)據(jù)庫平臺轉(zhuǎn)移到另一種數(shù)據(jù)庫平臺,提供了很大的可伸縮性。
- 自動化的連接處理:自動化連接處理能夠連接、斷開和管理系統(tǒng)資源。對客戶機對象的抽象可以提供更好的控制和性能。
- 聲明性的引用完整性:通過直接在數(shù)據(jù)庫對象中嵌入訪問邏輯,可以獲得和使用存儲過程訪問數(shù)據(jù)庫同樣的好處,而且不依賴于特定平臺。引用完整性成了數(shù)據(jù)庫獨立性,數(shù)據(jù)庫對象之間的復雜關系成了可移植性。比如,可以在數(shù)據(jù)庫對象中集成業(yè)務規(guī)則,讓訪問該對象的所有應用程序都保證遵守這些規(guī)則。
- 多層驗證:可以在對象或者其父對象上執(zhí)行檢查。這樣就可以規(guī)范和驗證訪問、權限以及數(shù)據(jù)完整性。
- 避免內(nèi)嵌 SQL:使用數(shù)據(jù)庫對象可以使應用程序避免內(nèi)嵌 SQL 及其維護的困難和系統(tǒng)依賴性。如果應用程序只與其他 Java 對象交互,系統(tǒng)的設計就可以是完全面向?qū)ο蟮摹?
- 安全:可以確保與數(shù)據(jù)庫對象的任何交互的安全,并容易地保證數(shù)據(jù)安全。
映射方法論
實現(xiàn)對象-關系映射需要兩步。首先將 XML 模式(這里使用 DTD)映射到對象模式,然后將對象模式映射到數(shù)據(jù)庫模式。也可以將這兩種映射合并成一個 DTD 到數(shù)據(jù)庫的映射,現(xiàn)在多數(shù)軟件都是這樣做的。
表 1 中的例子顯示的簡單元素類型 B、D 和 E 被映射到字符串,而復雜元素類型 A 和 C 被映射到類。在對象-關系映射的第一部分,A 和 C 的模型和屬性被映射到類 A 和 C 的屬性。A 的 C 的內(nèi)容模型中對 B、D 和 E 的引用被映射為字符串。
表 1. 對象關系映射,第 1 部分
| DTD |
類 |
| <!ELEMENT A (B, C)> <!ELEMENT B (#PCDATA)> <!ELEMENT C (D, E)> |
class A { String b; C c; } |
| <!ELEMENT D (#PCDATA)> <!ELEMENT E (#PCDATA)> |
class C {String d; String e; } |
對象-關系映射的第二部分(參見表 2)中,類映射到表,標量屬性映射到列,指針/引用屬性映射到主鍵/外鍵關系。A 的內(nèi)容模型中對 C 的引用被映射到 pointer/reference 類型的屬性,指向類 C 的對象,因為元素類型 C 被映射到類 C。
表 2. 對象關系映射,第 2 部分
| 類 |
表 |
| class A {String b; C c; } |
Table A: Column b Column c_fk |
| class C {String d; String e; } |
Table C: Column d Column e Column c_pk |
結(jié)束語
兩種映射都是對 XML 文檔中的數(shù)據(jù) 而不是對文檔本身建模。因此映射更適合于以數(shù)據(jù)為中心的文檔而不是以文檔為中心的文檔。雖然對象-關系映射是采用面向?qū)ο蟮募夹g,但是也不夠理想?;诒淼挠成涓静荒芴幚砘旌蟽?nèi)容,而從性能的角度看對象-關系映射可能效率很低。使用哪種方法都行,但是必須記住這些警告。
參考資料
學習
討論
關于作者
 |
|

|
 |
Hany Saleeb 曾經(jīng)在多家技術、金融和衛(wèi)生保健企業(yè)中工作過。 他的專長是和 J2EE、XML 以及數(shù)據(jù)庫有關的應用軟件和 n 層系統(tǒng)設計。他擁有計算機科學博士學位,主攻數(shù)據(jù)挖掘和信息檢索。
|
|