|
從兩道經(jīng)典試題談C/C++中聯(lián)合體(union)的使用
宋寶華 21cnbao sweek@21cn.com
試題一:編寫(xiě)一段程序判斷系統(tǒng)中的CPU是Little endian還是Big endian模式?
分析:
作
為一個(gè)計(jì)算機(jī)相關(guān)專(zhuān)業(yè)的人,我們應(yīng)該在計(jì)算機(jī)組成中都學(xué)習(xí)過(guò)什么叫Little endian和Big endian。Little
endian和Big endian是CPU存放數(shù)據(jù)的兩種不同順序。對(duì)于整型、長(zhǎng)整型等數(shù)據(jù)類(lèi)型,Big
endian認(rèn)為第一個(gè)字節(jié)是最高位字節(jié)(按照從低地址到高地址的順序存放數(shù)據(jù)的高位字節(jié)到低位字節(jié));而Little
endian則相反,它認(rèn)為第一個(gè)字節(jié)是最低位字節(jié)(按照從低地址到高地址的順序存放數(shù)據(jù)的低位字節(jié)到高位字節(jié))。
例如,假設(shè)從內(nèi)存地址0x0000開(kāi)始有以下數(shù)據(jù):
如
果我們?nèi)プx取一個(gè)地址為0x0000的四個(gè)字節(jié)變量,若字節(jié)序?yàn)閎ig-endian,則讀出結(jié)果為0x1234abcd;若字節(jié)序位little-
endian,則讀出結(jié)果為0xcdab3412。如果我們將0x1234abcd寫(xiě)入到以0x0000開(kāi)始的內(nèi)存中,則Little
endian和Big endian模式的存放結(jié)果如下:
一般來(lái)說(shuō),x86系列CPU都是little-endian的字節(jié)序,PowerPC通常是Big endian,還有的CPU能通過(guò)跳線來(lái)設(shè)置CPU工作于Little endian還是Big endian模式。
解答:
顯
然,解答這個(gè)問(wèn)題的方法只能是將一個(gè)字節(jié)(CHAR/BYTE類(lèi)型)的數(shù)據(jù)和一個(gè)整型數(shù)據(jù)存放于同樣的內(nèi)存開(kāi)始地址,通過(guò)讀取整型數(shù)據(jù),分析
CHAR/BYTE數(shù)據(jù)在整型數(shù)據(jù)的高位還是低位來(lái)判斷CPU工作于Little endian還是Big endian模式。得出如下的答案:
typedef unsigned char BYTE;
int main(int argc, char* argv[])
{
unsigned int num,*p;
p = #
num = 0;
*(BYTE *)p = 0xff;
if(num == 0xff)
{
printf("The endian of cpu is little\n");
}
else //num == 0xff000000
{
printf("The endian of cpu is big\n");
}
return 0;
}
除
了上述方法(通過(guò)指針類(lèi)型強(qiáng)制轉(zhuǎn)換并對(duì)整型數(shù)據(jù)首字節(jié)賦值,判斷該賦值賦給了高位還是低位)外,還有沒(méi)有更好的辦法呢?我們知道,union的成員本身就
被存放在相同的內(nèi)存空間(共享內(nèi)存,正是union發(fā)揮作用、做貢獻(xiàn)的去處),因此,我們可以將一個(gè)CHAR/BYTE數(shù)據(jù)和一個(gè)整型數(shù)據(jù)同時(shí)作為一個(gè)
union的成員,得出如下答案:
int checkCPU()
{
{
union w
{
int a;
char b;
} c;
c.a = 1;
return (c.b == 1);
}
}
實(shí)現(xiàn)同樣的功能,我們來(lái)看看Linux操作系統(tǒng)中相關(guān)的源代碼是怎么做的:
static union { char c[4]; unsigned long l; } endian_test = { { ‘l‘, ‘?‘, ‘?‘, ‘b‘ } };
#define ENDIANNESS ((char)endian_test.l)
Linux的內(nèi)核作者們僅僅用一個(gè)union變量和一個(gè)簡(jiǎn)單的宏定義就實(shí)現(xiàn)了一大段代碼同樣的功能!由以上一段代碼我們可以深刻領(lǐng)會(huì)到Linux源代碼的精妙之處!
試題二:假設(shè)網(wǎng)絡(luò)節(jié)點(diǎn)A和網(wǎng)絡(luò)節(jié)點(diǎn)B中的通信協(xié)議涉及四類(lèi)報(bào)文,報(bào)文格式為“報(bào)文類(lèi)型字段+報(bào)文內(nèi)容的結(jié)構(gòu)體”,四個(gè)報(bào)文內(nèi)容的結(jié)構(gòu)體類(lèi)型分別為STRUCTTYPE1~ STRUCTTYPE4,請(qǐng)編寫(xiě)程序以最簡(jiǎn)單的方式組織一個(gè)統(tǒng)一的報(bào)文數(shù)據(jù)結(jié)構(gòu)。
分析:
報(bào)文的格式為“報(bào)文類(lèi)型+報(bào)文內(nèi)容的結(jié)構(gòu)體”,在真實(shí)的通信中,每次只能發(fā)四類(lèi)報(bào)文中的一種,我們可以將四類(lèi)報(bào)文的結(jié)構(gòu)體組織為一個(gè)union(共享一段內(nèi)存,但每次有效的只是一種),然后和報(bào)文類(lèi)型字段統(tǒng)一組織成一個(gè)報(bào)文數(shù)據(jù)結(jié)構(gòu)。
解答:
根據(jù)上述分析,我們很自然地得出如下答案:
typedef unsigned char BYTE;
//報(bào)文內(nèi)容聯(lián)合體
typedef union tagPacketContent
{
STRUCTTYPE1 pkt1;
STRUCTTYPE2 pkt2;
STRUCTTYPE3 pkt1;
STRUCTTYPE4 pkt2;
}PacketContent;
//統(tǒng)一的報(bào)文數(shù)據(jù)結(jié)構(gòu)
typedef struct tagPacket
{
BYTE pktType;
PacketContent pktContent;
}Packet;
總結(jié)
在C/C++程序的編寫(xiě)中,當(dāng)多個(gè)基本數(shù)據(jù)類(lèi)型或復(fù)合數(shù)據(jù)結(jié)構(gòu)要占用同一片內(nèi)存時(shí),我們要使用聯(lián)合體(試題一是這樣的例證);當(dāng)多種類(lèi)型,多個(gè)對(duì)象,多個(gè)事物只取其一時(shí)(我們姑且通俗地稱(chēng)其為“n選1”),我們也可以使用聯(lián)合體來(lái)發(fā)揮其長(zhǎng)處(試題二是這樣的例證)。
Trackback: http://tb./TrackBack.aspx?PostId=1054811 |
|
|