|
如何用C#編寫文本編輯器【2005-8-24版】 南京千里獨(dú)行2005版權(quán)所有,不限轉(zhuǎn)載,請保留版權(quán)聲明 作者Blog:http://blog.csdn.net/yyf9989/ 摘要 本文探討了使用C#從底層開發(fā)一個(gè)帶格式的文本編輯器的任務(wù),深入探討了其中的文檔對象模型的設(shè)計(jì),圖形化用戶界面的處理和用戶操作的響應(yīng),說明了其中的某些技術(shù)問題和解決之道。 前言 小弟從大學(xué)里開始接觸編程也有6年了,工作4年也是干編程的活,見過不少程序,自己也編過不少,在學(xué)校編程自己覺得是搞藝術(shù)品,其實(shí)玩一些游戲,比如文明法老王星際等從某些角度看也是搞藝術(shù)品,看著自己苦心經(jīng)營的建筑物和人員由少變多,由簡單變復(fù)雜,心中有些成就感。編程也一樣,程序從幾十行寫到上萬行,功能由HellowWord到相當(dāng)復(fù)雜而強(qiáng)大,心中也有不少成就感。 畢業(yè)后工作,才漸漸感悟軟件開發(fā)本質(zhì)上是做一個(gè)工具,這個(gè)工具給別人或者自己用。有了工具,很多問題就迎刃可解了。如此開來偶們程序員和石匠鐵匠木匠是同一類人了。不過沒什么,程序員本來就沒高人一等,人在社會,認(rèn)認(rèn)真真的工作就行了。 問題 廢話不多說了,現(xiàn)在談?wù)剺?biāo)題提出的問題,如何用C#編寫文本編輯器。本人有幸開發(fā)過一個(gè)比較復(fù)雜的文本編輯器,因此也算有點(diǎn)經(jīng)驗(yàn)吧,在此來分享一下。這里所指的文本編輯器不是簡單的像Windows自帶的單行或多行文本編輯框,而是類似于Word的文本編輯器。 粗看起來,一個(gè)編輯器有什么好難的,其實(shí)很難的,因?yàn)槲覀冋J(rèn)為容易的事對計(jì)算機(jī)來說確實(shí)天大的問題。比如大家經(jīng)常上網(wǎng),可以發(fā)現(xiàn)最近幾年很多網(wǎng)站登錄時(shí)除了輸入用戶名和密碼后還要輸入所謂的驗(yàn)證碼,而驗(yàn)證碼則在輸入框旁邊歪歪扭扭的畫了出來,就像小學(xué)一年紀(jì)的學(xué)生在一張臟紙上寫的一樣,這樣做只是為了防止程序來模擬登錄,因?yàn)橥嵬崤づさ奈淖秩祟惪梢院苋菀椎谋嬲J(rèn),而計(jì)算機(jī)則很不容易辨認(rèn)。 一個(gè)文本編輯器主要處理的問題有
一個(gè)完整的功能不弱的文本編輯器結(jié)構(gòu)是很復(fù)雜的,涉及到的問題非常廣泛,沒有數(shù)萬行的代碼是搞不定的,這些問題在本文是不可能一一列出來并進(jìn)行討論,在此只好挑一些重點(diǎn)來說說。 文檔對象模型 在實(shí)際開發(fā)時(shí)不必挨個(gè)解決問題,我是首先確定文檔對象樹的結(jié)構(gòu),這里使用了文檔對象模型的概念,其實(shí)我們已經(jīng)碰到很多種文檔對象模型,最多的莫過于HTML文檔對象模型,我們用JavaScript來控制HTML頁面內(nèi)容時(shí)就是使用HTML文檔對象模型,此外還有XML文檔對象模型,VBA操作的是Word或Excel文檔對象模型。使用文檔對象模型,可將文檔中所有的內(nèi)容和內(nèi)存中的某個(gè)對象聯(lián)系起來,當(dāng)應(yīng)用程序修改了內(nèi)存的對象的數(shù)據(jù),則相應(yīng)的文檔內(nèi)容就修改了。刪除了內(nèi)存中的對象也就刪除了相應(yīng)的文檔內(nèi)容。一些文檔對象模型的思想可以參考http://www.。 文檔對象模型中有很常見的是對象的繼承和重載。大家可以看看.NET類庫的System.XML名稱空間下定義的XML文檔對象模型,你可以發(fā)現(xiàn)無論是XML文檔對象(XMLDocument),XML節(jié)點(diǎn)(XMLElement)還是屬性(XMLAttribute),甚至注釋(XMLComment)純文本數(shù)據(jù)(XMLText)都是從抽象類XMLNode繼承過來的。這樣設(shè)計(jì)的好處是可以很方便的遍歷XML文檔對象樹,各種對象都是從XMLNode派生的,都根據(jù)各自需要重載一些成員方法,其他程序都可把這些對象都看作XMLNode來使用,利用對象方法的重載和多態(tài)性來實(shí)現(xiàn)各自不同的處理。 基礎(chǔ)對象 在這種指導(dǎo)思想下,我也定義了一個(gè)抽象類TextElement,所有的文檔對象都是從該對象派生的。該類定義了以下虛成員
由于文檔內(nèi)容是分層次的,因此還定義一個(gè)容器類型TextContainer,該類型從TextElement派生的,其中進(jìn)行擴(kuò)展來可以保存若干個(gè)子對象,它定義了以下虛成員
在某些容器對象中存在一個(gè)特殊的子元素,該子元素為最后一個(gè)元素,并且不能刪除,比如對于段落對象,在此是一種容器對象,該對象最后一個(gè)元素為一個(gè)段落結(jié)尾標(biāo)記對象,該對象不能刪除,而在其他類型的容器對象中也可能存在類似的結(jié)尾對象,因此在TextContainer對象中就考慮這種情況,因此定義了一套虛成員來處理
TextContainer對象還重載RefreshSize方法來重新計(jì)算所有子元素的顯示大小,此外還定義了新的虛方法RefreshLine來進(jìn)行分行處理,為了方便分行處理,還定義了文檔行對象TextLine,文檔行對象用于保存文檔內(nèi)容分行信息,當(dāng)文檔分行完畢而內(nèi)容沒有發(fā)生改變時(shí)重新繪制文檔內(nèi)容時(shí)就無需重新計(jì)算要顯示的內(nèi)容的坐標(biāo),文檔行對象的成員有
為了保存分行信息,TextContainer對象還定義了一個(gè)Lines只讀屬性,該屬性返回System.Collections.ArrayList對象列表,該列表元素為屬于該容器的所有文本行對象,容器對象執(zhí)行RefreshLine進(jìn)行分行的步驟為
其實(shí)關(guān)于分行操作應(yīng)當(dāng)還有更優(yōu)化的方法,但本人能力有限,只能提出這種方法。試驗(yàn)證明,在處理小的文檔時(shí)程序運(yùn)行速度還行,但當(dāng)文檔內(nèi)容很多,有數(shù)萬個(gè)字符時(shí),分行速度就很慢,還望高手提供解決之道。 為了表示整個(gè)文檔對象,還定義了文檔對象TextDocument ,該對象在文檔對象模型中是個(gè)最大的對象,我沒有模仿其他文檔對象的模式將其從TextElement派生過來的,而是直接定義的。該對象用于從整體上操作文檔,并列出了一些操作文檔的基本操作,比如刪除,復(fù)制粘貼等。此外還提供一套方法來實(shí)現(xiàn)VBA的功能。 此外還定義了文檔內(nèi)容管理對象Content ,該對象隸屬于TextDocument對象,用于管理所有的文檔元素,它定義了屬性Elements,該屬性為一個(gè)保存了文檔所有元素對象的列表。該對象還定義了屬性SelectStart來表示插入點(diǎn)的位置,SelectLength 來表示選擇區(qū)域的長度,為0表示沒有選中任何元素,為正數(shù)則表示從插入點(diǎn)向后選中了若干個(gè)元素,為負(fù)數(shù)則表示從插入點(diǎn)向前選中了若干個(gè)元素。本對象還定義了一套處理插入點(diǎn)的函數(shù),比如向左向右移動若干個(gè)元素,向上向下移動一行。大家都知道,在文本框中可以直接用光標(biāo)鍵來移動插入點(diǎn),也可以使用光標(biāo)鍵時(shí)同時(shí)按下Shift鍵來移動插入點(diǎn)并選擇文檔內(nèi)容,用戶也可以用鼠標(biāo)點(diǎn)擊操作來移動插入點(diǎn),鼠標(biāo)點(diǎn)擊的同時(shí)按下Shift鍵也能移動插入點(diǎn)選擇文檔內(nèi)容;為此在Content對象定義了屬性AutoClearSelection,當(dāng)設(shè)置了該屬性則移動插入點(diǎn)時(shí)設(shè)置SelectLength為0,若沒有設(shè)置該屬性則移動插入點(diǎn)時(shí)設(shè)置SelectLength值,使得新插入點(diǎn)和舊插入點(diǎn)之間的元素被選中,這樣文本編輯器根據(jù)用戶是否按下Shift鍵來設(shè)置AutoClearSelection屬性就行了。用戶修改了插入點(diǎn)和選擇區(qū)域,則文本編輯器需要重新繪制用戶界面,此時(shí)需要優(yōu)化,只重新繪制選擇狀態(tài)發(fā)生改變的元素。可以證明,當(dāng)選擇的元素為連續(xù)的,則無論如何的修改選擇區(qū)域和插入點(diǎn),最多只有兩片區(qū)域中的元素的選擇狀態(tài)發(fā)生改變。因此只要獲得這兩片區(qū)域的起始位置和長度,然后重新繪制這兩個(gè)區(qū)域中的元素即可。 用戶可以對文檔進(jìn)行很多種操作,比如移動插入點(diǎn),選擇元素,設(shè)置字符的字體顏色和大小,插入文字和圖片,修改元素的設(shè)置,刪除剪切復(fù)制粘貼等等,有好幾十種操作,而且這些操作在某個(gè)時(shí)刻是不可用的,需要進(jìn)行判斷,若這些操作都在TextDocument中定義相應(yīng)的接口函數(shù),則TextDocument類代碼太多,過于臃腫,而且每新增一種操作都需要修改TextDocument,因此在此提出動作這個(gè)概念。動作就是一個(gè)實(shí)現(xiàn)某種文檔操作的類型,該類型有統(tǒng)一的接口,并使用TextDocument或其他對象提供的基本的操作來實(shí)現(xiàn)比較復(fù)雜的操作。為此定義動作基礎(chǔ)類EditorAction,該類為抽象類,它的主要接口有
各種實(shí)際的動作對象都是從EditorAction派生的,若對象有熱鍵則在初始化時(shí)設(shè)置HotKey字段,首先重載ActionName給定一個(gè)名稱,然后重載Execute來實(shí)現(xiàn)各自的動作處理過程,還可根據(jù)需要重載isEnable或TestHotKey。 在TextDocument中有個(gè)屬性Actions,該只讀屬性為包含各種動作對象的列表,當(dāng)TextDocument初始化時(shí)就初始化該動作對象列表,當(dāng)文本編輯器獲得輸入焦點(diǎn)時(shí)按下鍵盤按鍵則程序會遍歷Actions中所有的動作,進(jìn)行熱鍵判斷,若命中熱鍵則執(zhí)行該動作,其他應(yīng)用程序也可根據(jù)各個(gè)動作的isEnable屬性來設(shè)置文本編輯功能按鈕和相應(yīng)菜單的可用性。 比如定義復(fù)制動作對象EditorCopyAction,該類型從EditorAction派生的,重載ActionName使其返回"copy";重載isEnable,當(dāng)文檔有被選中的部分則返回True否則返回False,重載Execute來調(diào)用TextDocument中實(shí)現(xiàn)復(fù)制功能的函數(shù),該對象初始化的時(shí)候設(shè)置HotKey為 System.Windows.Forms.Keys.Control | System.Windows.Forms.Keys.C,這樣定義了該動作的熱鍵為Ctl+C。 這種動作處理的模式還便于程序進(jìn)行擴(kuò)展,其他應(yīng)用程序也可往動作列表中添加自定義的動作對象,這樣文本編輯器就能自動應(yīng)用該動作。應(yīng)用程序還可修改各種動作的熱鍵設(shè)置來實(shí)現(xiàn)用戶操作的個(gè)性化。 派生對象 定義了基礎(chǔ)對象后就開始派生對象了,首先定義字符對象類型TextChar,一個(gè)文檔內(nèi)容中最主要的還是字符數(shù)據(jù),在此為了實(shí)現(xiàn)方便,文檔中每一個(gè)字符都是一個(gè)字符對象,字符對象重載了RefreshSize對象RefreshSize方法,用于根據(jù)當(dāng)前繪制用的繪圖對象(System.Drawing.Graph對象)的MeasureString來計(jì)算文字大小。注意默認(rèn)情況下,該方法計(jì)算的字符串顯示寬度后回額外的附加一些空白,為了計(jì)算實(shí)際的大小則使用System.Drawing.StringFormat.GenericTypographic參數(shù)。此外還有一個(gè)比較特殊的字符-制表符。這個(gè)字符的寬度是不固定的,需要在進(jìn)行排版的時(shí)候才計(jì)算。 字符對象(TextChar)還派生RefreshView方法,該方法比較簡單,根據(jù)Left,Top值進(jìn)行坐標(biāo)轉(zhuǎn)換后算出繪制地點(diǎn),然后調(diào)用System.Drawing.Graph.DrawString方法即可。字符對象還定義了自己的成員,比如Char屬性返回對象表示的字符數(shù)據(jù),F(xiàn)ont表示繪制對象使用的字體,F(xiàn)oreColor表示繪制文本的顏色。 字符中的制表符比較特殊,因?yàn)樗膶挾仁遣欢ǖ模歉鶕?jù)它在文檔視圖中的位置而定的,因此在TextChar上在派生TextCharTab來轉(zhuǎn)變處理這種情況,它新增了RefreshTabWidth方法,來根據(jù)對象在視圖區(qū)域中的左端位置計(jì)算字符寬度。在此處我認(rèn)定一個(gè)制表符步長等于四個(gè)下畫線字符的寬度,制表符的右端坐標(biāo)必須是制表符步長的自然數(shù)倍,因此根據(jù)制表符的位置來進(jìn)行取模操作和其他操作就可以計(jì)算制表符的寬度。 為了表示段落而定義了段落對象TextParagraph,該對象不是容器對象,保存了段落對齊方式的信息,該元素的顯示樣式類似于Word中的段落符(硬回車)的樣式。 還定義了行結(jié)束對象TextLineEnd,該對象模擬了Word的分行符(軟回車)。 可以定義圖片對象,經(jīng)過對Word處理文檔的行為觀察,可以發(fā)現(xiàn)在Word文檔中插入的圖片和OLE對象特性很相似,因此為了考慮文本編輯器的可擴(kuò)展性,首先在TextElement的基礎(chǔ)派生出TextObject抽象類,該抽象類表示一個(gè)在文檔中的對象,該對象由其派生的類決定。 在TextObject對象派生出TextImage表示一個(gè)圖片對象,該對象重寫了RefreshView方法,用于在繪圖輸出對象上繪制一個(gè)圖片。還重載了FromXML和ToXML方法來和XML節(jié)點(diǎn)交換數(shù)據(jù),可以設(shè)計(jì)將圖片二進(jìn)制數(shù)據(jù)以Base64格式保存為XML節(jié)點(diǎn)下。 此外還可以根據(jù)應(yīng)用的需要從TextObject對象上派生其他的類型,比如直接讀取數(shù)據(jù)庫在界面上繪制曲線圖等等,此時(shí)文檔中的該對象可以動態(tài)的展示系統(tǒng)中最新的數(shù)據(jù)。 可以觀察到Word中的對象(包括圖片)可以改變大小,當(dāng)用鼠標(biāo)點(diǎn)擊圖片對象時(shí),圖片四個(gè)角和四個(gè)邊的中點(diǎn)上會顯示8個(gè)小點(diǎn)。這些小點(diǎn)我稱為控制點(diǎn)。用鼠標(biāo)拖拽這8個(gè)點(diǎn)可以動態(tài)的改變對象的大小。其實(shí)在很多類型的程序中可以碰到這8控制點(diǎn),例如在VS.NET的窗體設(shè)計(jì)器中,當(dāng)前的控制周圍就有這8個(gè)控制點(diǎn)。關(guān)于如何實(shí)現(xiàn)這8個(gè)控制點(diǎn)也是有一套的。 控制點(diǎn)可以分為內(nèi)控制點(diǎn)和外控制點(diǎn)兩種類型,我們對這8個(gè)點(diǎn)進(jìn)行從0到7的編號。當(dāng)鼠標(biāo)光標(biāo)移動到這8個(gè)控制點(diǎn)上方時(shí)需要設(shè)置為不同的光標(biāo)樣式。 內(nèi)控制點(diǎn) ┌─────────────────┐ │■0 1■ 2■│ │ │ │ │ │ │ │ │ │■7 3■│ │ │ │ │ │ │ │ │ │■6 5■ 4■│ └─────────────────┘ 外控制點(diǎn) ■ ■ ■ ┌────────────────┐ │0 1 2│ │ │ │ │ │ │ │ │ ■│7 3│■ │ │ │ │ │ │ │ │ │6 5 4 │ └────────────────┘ ■ ■ ■ 控制點(diǎn)上鼠標(biāo)光標(biāo)如下 西北-東南 SizeNWSE 南北 SizeNS 東北-西南 SizeNESW ■ ■ ■ ┌────────────────┐ │0 1 2│ │ │ │ │ │ │ │ │ ■│7 西-南 SizeWE 3│■ 西-南 SizeWE │ │ │ │ │ │ │ │ │6 5 4 │ └────────────────┘ ■ ■ ■ 東北-西南 SizeNESW 南北 SizeNS 西北-東南 SizeNWSE 根據(jù)上圖所示,已知主矩形,控制點(diǎn)的類型(是內(nèi)控制點(diǎn)還是外控制點(diǎn))和控制點(diǎn)的寬度可以計(jì)算出所有的控制點(diǎn)的位置。可以編一個(gè)例程,輸入3個(gè)參數(shù),主矩形區(qū)域的Rectangle結(jié)構(gòu)體,是否是內(nèi)控制點(diǎn)(不是內(nèi)控制點(diǎn)就是外控制點(diǎn))和控制點(diǎn)的寬度,該例程計(jì)算所有控制點(diǎn)的位置,然后返回一個(gè)包含8個(gè)Rectangle的數(shù)組,該數(shù)組就是0到7號的控制矩形的位置和大小。 TextObject對象顯示后就應(yīng)該知道自己在視圖區(qū)域中的位置,當(dāng)它相應(yīng)鼠標(biāo)移動消息時(shí),就可以根據(jù)鼠標(biāo)光標(biāo)位置和8個(gè)控制矩形進(jìn)行比較,若鼠標(biāo)光標(biāo)在某個(gè)控制矩形中時(shí)就要通知文本編輯器改變鼠標(biāo)光標(biāo)的樣式。 一般的控制點(diǎn)被畫成一個(gè)矩形方框,控制點(diǎn)也被畫成兩種類型,一種是填充色為深色(藍(lán)色或黑色)和白色邊框,另一種是深色邊框并填充白色。可以觀察VS.NET窗體設(shè)計(jì)器,可以在設(shè)計(jì)器中選擇多個(gè)控制,其中有一個(gè)控件的控制點(diǎn)為填充色為藍(lán)色和白色邊框的,該控制為當(dāng)前控件。而其他選擇的控件的控制點(diǎn)為藍(lán)色邊框并填充白色,這些控件為選擇控件。在文本編輯器中沒有這種情況,因此在此可以使用內(nèi)控制點(diǎn)方式,控制點(diǎn)用黑色填充,邊框白色。 當(dāng)鼠標(biāo)在控制點(diǎn)上進(jìn)行拖拽操作就應(yīng)當(dāng)可以動態(tài)的修改對象的大小,以前我是如此實(shí)現(xiàn)的
經(jīng)過一些編程實(shí)踐,發(fā)現(xiàn)該操作比較麻煩,需要編寫不少代碼,而且代碼分散在3個(gè)事件處理過程中,多了一些全局變量,很難寫出一個(gè)通用例程到處調(diào)用,經(jīng)過分析,將這種處理模式改掉了。其實(shí)一般的程序正在進(jìn)行鼠標(biāo)拖拽操作時(shí),用戶是不可能同時(shí)進(jìn)行其他操作(不如邊鼠標(biāo)拖拽邊打字),而且進(jìn)行”橡皮筋“操作時(shí)程序用戶界面無需重新繪制,這樣可以認(rèn)為進(jìn)行鼠標(biāo)拖拽時(shí)應(yīng)用程序應(yīng)用程序只處理鼠標(biāo)移動消息和鼠標(biāo)松開消息而不進(jìn)行任何其他操作,為了編程簡單,甚至連重繪界面的操作也不處理了,因此可以編一個(gè)通用例程來處理整個(gè)的鼠標(biāo)拖拽來實(shí)現(xiàn)“橡皮筋”操作,該函數(shù)處理過程為
在此插上一段,其實(shí).NET框架還是比較適合Win32的API編程,System.Windows.Form.Control的Handle屬性就是窗體的句柄,可以被其他Win32API作為參數(shù)調(diào)用,CreateParams屬性實(shí)際上就是CreateWindowEx的參數(shù),重載它就可以設(shè)置控件創(chuàng)建時(shí)的樣式;WndProc就是控件處理所有的Windows消息的默認(rèn)過程,也可以重載它自己來處理底層的Windows消息。System.Windows.Forms.Application的靜態(tài)函數(shù)AddMessageFilter和RemoveMessageFilter就可以很方便的為整個(gè)應(yīng)用程序添加或刪除"鉤子"程序。C#語言可以使用System.Runtime.InteropServices.DllImport來導(dǎo)入聲明DLL文件中的API函數(shù)。 |
|
|