小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

轉(zhuǎn):setsockopt參數(shù)詳細(xì)說明 | LinuxByte Blog

 ShangShujie 2007-09-22

轉(zhuǎn):setsockopt參數(shù)詳細(xì)說明

 

int setsockopt(
SOCKET s,
int level,
int optname,
const char* optval,
int optlen
);

s(套接字): 指向一個(gè)打開的套接口描述字
level:(級(jí)別): 指定選項(xiàng)代碼的類型。
SOL_SOCKET: 基本套接口
IPPROTO_IP: IPv4套接口
IPPROTO_IPV6: IPv6套接口
IPPROTO_TCP: TCP套接口
optname(選項(xiàng)名): 選項(xiàng)名稱
optval(選項(xiàng)值): 是一個(gè)指向變量的指針 類型:整形,套接口結(jié)構(gòu), 其他結(jié)構(gòu)類型:linger{}, timeval{ }
optlen(選項(xiàng)長(zhǎng)度) :optval 的大小

返回值:標(biāo)志打開或關(guān)閉某個(gè)特征的二進(jìn)制選項(xiàng)
[/code:1:59df4ce128]

========================================================================
SOL_SOCKET
------------------------------------------------------------------------
SO_BROADCAST 允許發(fā)送廣播數(shù)據(jù) int
適用於 UDP socket。其意義是允許 UDP socket 「廣播」(broadcast)訊息到網(wǎng)路上。

SO_DEBUG 允許調(diào)試 int

SO_DONTROUTE 不查找路由 int

SO_ERROR 獲得套接字錯(cuò)誤 int

SO_KEEPALIVE 保持連接 int
檢測(cè)對(duì)方主機(jī)是否崩潰,避免(服務(wù)器)永遠(yuǎn)阻塞于TCP連接的輸入。 設(shè)置該選項(xiàng)后,如果2小時(shí)內(nèi)在此套接口的任一方向都沒有數(shù)據(jù)交換,TCP就自動(dòng)給對(duì)方 發(fā)一個(gè)保持存活探測(cè)分節(jié)(keepalive probe)。這是一個(gè)對(duì)方必須響應(yīng)的TCP分節(jié).它會(huì)導(dǎo)致以下三種情況: 對(duì)方接收一切正常:以期望的 ACK響應(yīng)。2小時(shí)后,TCP將發(fā)出另一個(gè)探測(cè)分節(jié)。 對(duì)方已崩潰且已重新啟動(dòng):以RST響應(yīng)。套接口的待處理錯(cuò)誤被置為ECONNRESET,套接 口本身則被關(guān)閉。 對(duì)方無任何響應(yīng):源自berkeley的TCP發(fā)送另外8個(gè)探測(cè)分節(jié),相隔75秒一個(gè),試圖得到 一個(gè)響應(yīng)。在發(fā)出第一個(gè)探測(cè)分節(jié)11分鐘15秒后若仍無響應(yīng)就放棄。套接口的待處理錯(cuò) 誤被置為ETIMEOUT,套接口本身則被關(guān)閉。如ICMP錯(cuò)誤是“host unreachable (主機(jī)不 可達(dá))”,說明對(duì)方主機(jī)并沒有崩潰,但是不可達(dá),這種情況下待處理錯(cuò)誤被置為 EHOSTUNREACH。

SO_DONTLINGER 若為真,則SO_LINGER選項(xiàng)被禁止。
SO_LINGER 延遲關(guān)閉連接 struct linger
上面這兩個(gè)選項(xiàng)影響close行為
選項(xiàng) 間隔 關(guān)閉方式 等待關(guān)閉與否
SO_DONTLINGER 不關(guān)心 優(yōu)雅 否
SO_LINGER 零 強(qiáng)制 否
SO_LINGER 非零 優(yōu)雅 是
若設(shè)置了SO_LINGER(亦即linger結(jié)構(gòu)中的l_onoff域設(shè)為非零,參見2.4,4.1.7和4.1.21各節(jié)),并設(shè)置了零超時(shí)間隔,則 closesocket()不被阻塞立即執(zhí)行,不論是否有排隊(duì)數(shù)據(jù)未發(fā)送或未被確認(rèn)。這種關(guān)閉方式稱為“強(qiáng)制”或“失效”關(guān)閉,因?yàn)樘捉涌诘奶撾娐妨⒓幢? 復(fù)位,且丟失了未發(fā)送的數(shù)據(jù)。在遠(yuǎn)端的recv()調(diào)用將以WSAECONNRESET出錯(cuò)。
若設(shè)置了SO_LINGER并確定了非零的超時(shí)間隔,則closesocket()調(diào)用阻塞進(jìn)程,直到所剩數(shù)據(jù)發(fā)送完畢或超時(shí)。這種關(guān)閉稱為“優(yōu)雅的”關(guān) 閉。請(qǐng)注意如果套接口置為非阻塞且 SO_LINGER設(shè)為非零超時(shí),則closesocket()調(diào)用將以WSAEWOULDBLOCK錯(cuò)誤返回。
若在一個(gè)流類套接口上設(shè)置了 SO_DONTLINGER(也就是說將linger結(jié)構(gòu)的l_onoff域設(shè)為零;參見2.4,4.1.7,4.1.21節(jié)),則 closesocket()調(diào)用立即返回。但是,如果可能,排隊(duì)的數(shù)據(jù)將在套接口關(guān)閉前發(fā)送。請(qǐng)注意,在這種情況下WINDOWS套接口實(shí)現(xiàn)將在一段不確 定的時(shí)間內(nèi)保留套接口以及其他資源,這對(duì)于想用所以套接口的應(yīng)用程序來說有一定影響。

SO_OOBINLINE 帶外數(shù)據(jù)放入正常數(shù)據(jù)流,在普通數(shù)據(jù)流中接收帶外數(shù)據(jù) int

SO_RCVBUF 接收緩沖區(qū)大小 int
設(shè)置接收緩沖區(qū)的保留大小
與 SO_MAX_MSG_SIZE 或TCP滑動(dòng)窗口無關(guān),如果一般發(fā)送的包很大很頻繁,那么使用這個(gè)選項(xiàng)

SO_SNDBUF 發(fā)送緩沖區(qū)大小 int
設(shè)置發(fā)送緩沖區(qū)的保留大小
與 SO_MAX_MSG_SIZE 或TCP滑動(dòng)窗口無關(guān),如果一般發(fā)送的包很大很頻繁,那么使用這個(gè)選項(xiàng)
每個(gè)套接口都有一個(gè)發(fā)送緩沖區(qū)和一個(gè)接收緩沖區(qū)。 接收緩沖區(qū)被TCP和UDP用來將接收到的數(shù)據(jù)一直保存到由應(yīng)用進(jìn)程來讀。 TCP:TCP通告另一端的窗口大小。 TCP套接口接收緩沖區(qū)不可能溢出,因?yàn)閷?duì)方不允許發(fā)出超過所通告窗口大小的數(shù)據(jù)。 這就是TCP的流量控制,如果對(duì)方無視窗口大小而發(fā)出了超過宙口大小的數(shù)據(jù),則接 收方TCP將丟棄它。 UDP:當(dāng)接收到的數(shù)據(jù)報(bào)裝不進(jìn)套接口接收緩沖區(qū)時(shí),此數(shù)據(jù)報(bào)就被丟棄。UDP是沒有 流量控制的;快的發(fā)送者可以很容易地就淹沒慢的接收者,導(dǎo)致接收方的UDP丟棄數(shù)據(jù)報(bào)。

SO_RCVLOWAT 接收緩沖區(qū)下限 int
SO_SNDLOWAT 發(fā)送緩沖區(qū)下限 int
每個(gè)套接口都有一個(gè)接收低潮限度和一個(gè)發(fā)送低潮限度。它們是函數(shù)selectt使用的, 接收低潮限度是讓select返回“可讀”而在套接口接收緩沖區(qū)中必須有的數(shù)據(jù)總量。 ——對(duì)于一個(gè)TCP或UDP套接口,此值缺省為1。發(fā)送低潮限度是讓select返回“可寫” 而在套接口發(fā)送緩沖區(qū)中必須有的可用空間。對(duì)于TCP套接口,此值常缺省為2048。 對(duì)于UDP使用低潮限度, 由于其發(fā)送緩沖區(qū)中可用空間的字節(jié)數(shù)是從不變化的,只要 UDP套接口發(fā)送緩沖區(qū)大小大于套接口的低潮限度,這樣的UDP套接口就總是可寫的。 UDP沒有發(fā)送緩沖區(qū),只有發(fā)送緩沖區(qū)的大小。

SO_RCVTIMEO 接收超時(shí) struct timeval
SO_SNDTIMEO 發(fā)送超時(shí) struct timeval
SO_REUSERADDR 允許重用本地地址和端口 int
充許綁定已被使用的地址(或端口號(hào)),可以參考bind的man

SO_EXCLUSIVEADDRUSE
獨(dú)占模式使用端口,就是不充許和其它程序使用SO_REUSEADDR共享的使用某一端口。
在確定多重綁定使用誰的時(shí)候,根據(jù)一條原則是誰的指定最明確則將包遞交給誰,而且沒有權(quán)限之分,也就是說低級(jí)權(quán)限的用戶是可以重綁定在高級(jí)權(quán)限如服務(wù)啟動(dòng)的端口上的,這是非常重大的一個(gè)安全隱患,
如果不想讓自己程序被監(jiān)聽,那么使用這個(gè)選項(xiàng)

SO_TYPE 獲得套接字類型 int
SO_BSDCOMPAT 與BSD系統(tǒng)兼容 int

==========================================================================
IPPROTO_IP
--------------------------------------------------------------------------
IP_HDRINCL 在數(shù)據(jù)包中包含IP首部 int
這個(gè)選項(xiàng)常用于黑客技術(shù)中,隱藏自己的IP地址

IP_OPTINOS IP首部選項(xiàng) int
IP_TOS 服務(wù)類型
IP_TTL 生存時(shí)間 int

以下IPV4選項(xiàng)用于組播
IPv4 選項(xiàng) 數(shù)據(jù)類型 描 述
IP_ADD_MEMBERSHIP struct ip_mreq 加入到組播組中
IP_ROP_MEMBERSHIP struct ip_mreq 從組播組中退出
IP_MULTICAST_IF struct ip_mreq 指定提交組播報(bào)文的接口
IP_MULTICAST_TTL u_char 指定提交組播報(bào)文的TTL
IP_MULTICAST_LOOP u_char 使組播報(bào)文環(huán)路有效或無效
在頭文件中定義了ip_mreq結(jié)構(gòu):
[code:1:63724de67f]
struct ip_mreq {
struct in_addr imr_multiaddr; /* IP multicast address of group */
struct in_addr imr_interface; /* local IP address of interface */
};
[/code:1:63724de67f]
若進(jìn)程要加入到一個(gè)組播組中,用soket的setsockopt()函數(shù)發(fā)送該選項(xiàng)。該選項(xiàng)類型是ip_mreq結(jié)構(gòu),它的第一個(gè)字段imr_multiaddr指定了組播組的地址,第二個(gè)字段imr_interface指定了接口的IPv4地址。
IP_DROP_MEMBERSHIP
該選項(xiàng)用來從某個(gè)組播組中退出。數(shù)據(jù)結(jié)構(gòu)ip_mreq的使用方法與上面相同。
IP_MULTICAST_IF
該選項(xiàng)可以修改網(wǎng)絡(luò)接口,在結(jié)構(gòu)ip_mreq中定義新的接口。
IP_MULTICAST_TTL
設(shè)置組播報(bào)文的數(shù)據(jù)包的TTL(生存時(shí)間)。默認(rèn)值是1,表示數(shù)據(jù)包只能在本地的子網(wǎng)中傳送。
IP_MULTICAST_LOOP
組播組中的成員自己也會(huì)收到它向本組發(fā)送的報(bào)文。這個(gè)選項(xiàng)用于選擇是否激活這種狀態(tài)。

無雙 回復(fù)于:2003-05-08 21:21:52

IPPRO_TCP
--------------------------------------------------------------------------
TCP_MAXSEG TCP最大數(shù)據(jù)段的大小 int
獲取或設(shè)置TCP連接的最大分節(jié)大小(MSS)。返回值是我們的TCP發(fā)送給另一端的最大 數(shù)據(jù)量,它常常就是由另一端用SYN分節(jié)通告的MSS,除非我們的TCP選擇使用一個(gè)比 對(duì)方通告的MSS小些的值。如果此值在套接口連接之前取得,則返回值為未從另·—端 收到Mss選項(xiàng)的情況下所用的缺省值。小于此返回值的信可能真正用在連接上,因?yàn)槠? 如說使用時(shí)間戳選項(xiàng)的話,它在每個(gè)分節(jié)上占用12字節(jié)的TCP選項(xiàng)容量。我們的TcP將 發(fā)送的每個(gè)分節(jié)的最大數(shù)據(jù)量也可在連接存活期內(nèi)改變,但前提是TCP要支持路徑MTU 發(fā)現(xiàn)功能。如果到對(duì)方的路徑改變了,此值可上下調(diào)整。
TCP_NODELAY 不使用Nagle算法 int

指定TCP開始發(fā)送保持存活探測(cè)分節(jié)前以秒為單位的連接空閑時(shí)間。缺省值至少必須為7200秒,即2小時(shí)。此選項(xiàng)僅在SO_KEPALIVEE套接口選項(xiàng)打開時(shí)才有效。

TCP_NODELAY 和 TCP_CORK,
這兩個(gè)選項(xiàng)都對(duì)網(wǎng)絡(luò)連接的行為具有重要的作用。許多UNIX系統(tǒng)都實(shí)現(xiàn)了TCP_NODELAY選項(xiàng),但是,TCP_CORK則是Linux系統(tǒng)所獨(dú)有的 而且相對(duì)較新;它首先在內(nèi)核版本2.4上得以實(shí)現(xiàn)。此外,其他UNIX系統(tǒng)版本也有功能類似的選項(xiàng),值得注意的是,在某種由BSD派生的系統(tǒng)上的 TCP_NOPUSH選項(xiàng)其實(shí)就是TCP_CORK的一部分具體實(shí)現(xiàn)。
TCP_NODELAY和TCP_CORK基本上控制了包的 “Nagle化”,Nagle化在這里的含義是采用Nagle算法把較小的包組裝為更大的幀。John Nagle是Nagle算法的發(fā)明人,后者就是用他的名字來命名的,他在1984年首次用這種方法來嘗試解決福特汽車公司的網(wǎng)絡(luò)擁塞問題(欲了解詳情請(qǐng)參 看IETF RFC 896)。他解決的問題就是所謂的silly window syndrome ,中文稱“愚蠢窗口癥候群”,具體含義是,因?yàn)槠毡榻K端應(yīng)用程序每產(chǎn)生一次擊鍵操作就會(huì)發(fā)送一個(gè)包,而典型情況下一個(gè)包會(huì)擁有一個(gè)字節(jié)的數(shù)據(jù)載荷以及40 個(gè)字節(jié)長(zhǎng)的包頭,于是產(chǎn)生4000%的過載,很輕易地就能令網(wǎng)絡(luò)發(fā)生擁塞,。 Nagle化后來成了一種標(biāo)準(zhǔn)并且立即在因特網(wǎng)上得以實(shí)現(xiàn)。它現(xiàn)在已經(jīng)成為缺省配置了,但在我們看來,有些場(chǎng)合下把這一選項(xiàng)關(guān)掉也是合乎需要的。
現(xiàn)在讓我們假設(shè)某個(gè)應(yīng)用程序發(fā)出了一個(gè)請(qǐng)求,希望發(fā)送小塊數(shù)據(jù)。我們可以選擇立即發(fā)送數(shù)據(jù)或者等待產(chǎn)生更多的數(shù)據(jù)然后再一次發(fā)送兩種策略。如果我們馬上發(fā) 送數(shù)據(jù),那么交互性的以及客戶/服務(wù)器型的應(yīng)用程序?qū)O大地受益。例如,當(dāng)我們正在發(fā)送一個(gè)較短的請(qǐng)求并且等候較大的響應(yīng)時(shí),相關(guān)過載與傳輸?shù)臄?shù)據(jù)總量相 比就會(huì)比較低,而且,如果請(qǐng)求立即發(fā)出那么響應(yīng)時(shí)間也會(huì)快一些。以上操作可以通過設(shè)置套接字的TCP_NODELAY選項(xiàng)來完成,這樣就禁用了Nagle 算法。
另外一種情況則需要我們等到數(shù)據(jù)量達(dá)到最大時(shí)才通過網(wǎng)絡(luò)一次發(fā)送全部數(shù)據(jù),這種數(shù)據(jù)傳輸方式有益于大量數(shù)據(jù)的通信性能,典型的應(yīng)用就是文件服務(wù)器。應(yīng)用 Nagle算法在這種情況下就會(huì)產(chǎn)生問題。但是,如果你正在發(fā)送大量數(shù)據(jù),你可以設(shè)置TCP_CORK選項(xiàng)禁用Nagle化,其方式正好同 TCP_NODELAY相反(TCP_CORK 和 TCP_NODELAY 是互相排斥的)。下面就讓我們仔細(xì)分析下其工作原理。
假設(shè)應(yīng)用程序使用sendfile()函數(shù)來轉(zhuǎn)移大量數(shù)據(jù)。應(yīng)用協(xié)議通常要求發(fā)送某些信息來預(yù)先解釋數(shù)據(jù),這些信息其實(shí)就是報(bào)頭內(nèi)容。典型情況下報(bào)頭很 小,而且套接字上設(shè)置了TCP_NODELAY。有報(bào)頭的包將被立即傳輸,在某些情況下(取決于內(nèi)部的包計(jì)數(shù)器),因?yàn)檫@個(gè)包成功地被對(duì)方收到后需要請(qǐng)求 對(duì)方確認(rèn)。這樣,大量數(shù)據(jù)的傳輸就會(huì)被推遲而且產(chǎn)生了不必要的網(wǎng)絡(luò)流量交換。
但是,如果我們?cè)谔捉幼稚显O(shè)置了TCP_CORK(可以比喻為在管道上插入 “塞子”)選項(xiàng),具有報(bào)頭的包就會(huì)填補(bǔ)大量的數(shù)據(jù),所有的數(shù)據(jù)都根據(jù)大小自動(dòng)地通過包傳輸出去。當(dāng)數(shù)據(jù)傳輸完成時(shí),最好取消TCP_CORK 選項(xiàng)設(shè)置給連接“拔去塞子”以便任一部分的幀都能發(fā)送出去。這同“塞住”網(wǎng)絡(luò)連接同等重要。
總而言之,如果你肯定能一起發(fā)送多個(gè)數(shù)據(jù)集合(例如HTTP響應(yīng)的頭和正文),那么我們建議你設(shè)置TCP_CORK選項(xiàng),這樣在這些數(shù)據(jù)之間不存在延遲。能極大地有益于WWW、FTP以及文件服務(wù)器的性能,同時(shí)也簡(jiǎn)化了你的工作。示例代碼如下:

intfd, on = 1;

/* 此處是創(chuàng)建套接字等操作,出于篇幅的考慮省略*/

setsockopt (fd, SOL_TCP, TCP_CORK, &on, sizeof (on)); /* cork */
write (fd, …);
fprintf (fd, …);
sendfile (fd, …);
write (fd, …);
sendfile (fd, …);

on = 0;
setsockopt (fd, SOL_TCP, TCP_CORK, &on, sizeof (on)); /* 拔去塞子 */

不幸的是,許多常用的程序并沒有考慮到以上問題。例如,Eric Allman編寫的sendmail就沒有對(duì)其套接字設(shè)置任何選項(xiàng)。

Apache HTTPD 是因特網(wǎng)上最流行的Web服務(wù)器,它的所有套接字就都設(shè)置了TCP_NODELAY選項(xiàng),而且其性能也深受大多數(shù)用戶的滿意。這是為什么呢?答案就在于實(shí) 現(xiàn)的差別之上。由BSD衍生的TCP/IP協(xié)議棧(值得注意的是FreeBSD)在這種狀況下的操作就不同。當(dāng)在TCP_NODELAY 模式下提交大量小數(shù)據(jù)塊傳輸時(shí),大量信息將按照一次write()函數(shù)調(diào)用發(fā)送一塊數(shù)據(jù)的方式發(fā)送出去。然而,因?yàn)樨?fù)責(zé)請(qǐng)求交付確認(rèn)的記數(shù)器是面向字節(jié)而 非面向包(在 Linux上)的,所以引入延遲的概率就降低了很多。結(jié)果僅僅和全部數(shù)據(jù)的大小有關(guān)系。而 Linux 在第一包到達(dá)之后就要求確認(rèn),F(xiàn)reeBSD則在進(jìn)行如此操作之前會(huì)等待好幾百個(gè)包。

在Linux系統(tǒng)上,TCP_NODELAY的效果同習(xí)慣于BSD TCP/IP協(xié)議棧的開發(fā)者所期望的效果有很大不同,而且在Linux上的Apache性能表現(xiàn)也會(huì)更差些。其他在Linux上頻繁采用TCP_NODELAY的應(yīng)用程序也有同樣的問題。

TCP_DEFER_ACCEPT

我們首先考慮的第1個(gè)選項(xiàng)是TCP_DEFER_ACCEPT(這是Linux系統(tǒng)上的叫法,其他一些操作系統(tǒng)上也有同樣的選項(xiàng)但使用不同的名 字)。為了理解TCP_DEFER_ACCEPT選項(xiàng)的具體思想,我們有必要大致闡述一下典型的HTTP客戶/服務(wù)器交互過程。請(qǐng)回想下TCP是如何與傳 輸數(shù)據(jù)的目標(biāo)建立連接的。在網(wǎng)絡(luò)上,在分離的單元之間傳輸?shù)男畔⒎Q為IP包(或IP 數(shù)據(jù)報(bào))。一個(gè)包總有一個(gè)攜帶服務(wù)信息的包頭,包頭用于內(nèi)部協(xié)議的處理,并且它也可以攜帶數(shù)據(jù)負(fù)載。服務(wù)信息的典型例子就是一套所謂的標(biāo)志,它把包標(biāo)記代 表TCP/IP協(xié)議棧內(nèi)的特殊含義,例如收到包的成功確認(rèn)等等。通常,在經(jīng)過“標(biāo)記”的包里攜帶負(fù)載是完全可能的,但有時(shí),內(nèi)部邏輯迫使TCP/IP協(xié)議 棧發(fā)出只有包頭的IP包。這些包經(jīng)常會(huì)引發(fā)討厭的網(wǎng)絡(luò)延遲而且還增加了系統(tǒng)的負(fù)載,結(jié)果導(dǎo)致網(wǎng)絡(luò)性能在整體上降低。
現(xiàn)在服務(wù)器創(chuàng)建了一個(gè)套接字同時(shí)等待連接。TCP/IP式的連接過程就是所謂“3次握手”。首先,客戶程序發(fā)送一個(gè)設(shè)置SYN標(biāo)志而且不帶數(shù)據(jù)負(fù)載的 TCP包(一個(gè)SYN包)。服務(wù)器則以發(fā)出帶SYN/ACK標(biāo)志的數(shù)據(jù)包(一個(gè)SYN/ACK包)作為剛才收到包的確認(rèn)響應(yīng)??蛻綦S后發(fā)送一個(gè)ACK包確 認(rèn)收到了第2個(gè)包從而結(jié)束連接過程。在收到客戶發(fā)來的這個(gè)SYN/ACK包之后,服務(wù)器會(huì)喚醒一個(gè)接收進(jìn)程等待數(shù)據(jù)到達(dá)。當(dāng)3次握手完成后,客戶程序即開 始把“有用的”的數(shù)據(jù)發(fā)送給服務(wù)器。通常,一個(gè)HTTP請(qǐng)求的量是很小的而且完全可以裝到一個(gè)包里。但是,在以上的情況下,至少有4個(gè)包將用來進(jìn)行雙向傳 輸,這樣就增加了可觀的延遲時(shí)間。此外,你還得注意到,在“有用的”數(shù)據(jù)被發(fā)送之前,接收方已經(jīng)開始在等待信息了。
為了減輕這些問題所帶來的影響,Linux(以及其他的一些操作系統(tǒng))在其TCP實(shí)現(xiàn)中包括了TCP_DEFER_ACCEPT選項(xiàng)。它們?cè)O(shè)置在偵聽套接 字的服務(wù)器方,該選項(xiàng)命令內(nèi)核不等待最后的ACK包而且在第1個(gè)真正有數(shù)據(jù)的包到達(dá)才初始化偵聽進(jìn)程。在發(fā)送SYN/ACK包之后,服務(wù)器就會(huì)等待客戶程 序發(fā)送含數(shù)據(jù)的IP包。現(xiàn)在,只需要在網(wǎng)絡(luò)上傳送3個(gè)包了,而且還顯著降低了連接建立的延遲,對(duì)HTTP通信而言尤其如此。
這一選項(xiàng)在好些操作系統(tǒng)上都有相應(yīng)的對(duì)等物。例如,在FreeBSD上,同樣的行為可以用以下代碼實(shí)現(xiàn):

/* 為明晰起見,此處略去無關(guān)代碼 */
struct accept_filter_arg af = { "dataready", "" };
setsockopt(s, SOL_SOCKET, SO_ACCEPTFILTER, &af, sizeof(af));
這個(gè)特征在FreeBSD上叫做“接受過濾器”,而且具有多種用法。不過,在幾乎所有的情況下其效果與TCP_DEFER_ACCEPT是一樣的:服務(wù)器 不等待最后的ACK包而僅僅等待攜帶數(shù)據(jù)負(fù)載的包。要了解該選項(xiàng)及其對(duì)高性能Web服務(wù)器的重要意義的更多信息請(qǐng)參考Apache文檔上的有關(guān)內(nèi)容。
就HTTP 客戶/服務(wù)器交互而言,有可能需要改變客戶程序的行為??蛻舫绦?yàn)槭裁匆l(fā)送這種“無用的”ACK包呢?這是因?yàn)?,TCP協(xié)議棧無法知道ACK包的狀態(tài)。 如果采用FTP而非HTTP,那么客戶程序直到接收了FTP服務(wù)器提示的數(shù)據(jù)包之后才發(fā)送數(shù)據(jù)。在這種情況下,延遲的ACK將導(dǎo)致客戶/服務(wù)器交互出現(xiàn)延 遲。為了確定ACK是否必要,客戶程序必須知道應(yīng)用程序協(xié)議及其當(dāng)前狀態(tài)。這樣,修改客戶行為就成為必要了。
對(duì)Linux客戶程序來說,我們還可以采用另一個(gè)選項(xiàng),它也被叫做TCP_DEFER_ACCEPT。我們知道,套接字分成兩種類型,偵聽套接字和連接套 接字,所以它們也各自具有相應(yīng)的 TCP選項(xiàng)集合。因此,經(jīng)常同時(shí)采用的這兩類選項(xiàng)卻具有同樣的名字也是完全可能的。在連接套接字上設(shè)置該選項(xiàng)以后,客戶在收到一個(gè)SYN/ACK包之后就 不再發(fā)送ACK包,而是等待用戶程序的下一個(gè)發(fā)送數(shù)據(jù)請(qǐng)求;因此,服務(wù)器發(fā)送的包也就相應(yīng)減少了。

TCP_QUICKACK

阻止因發(fā)送無用包而引發(fā)延遲的另一個(gè)方法是使用TCP_QUICKACK選項(xiàng)。這一選項(xiàng)與 TCP_DEFER_ACCEPT不同,它不但能用作管理連接建立過程而且在正常數(shù)據(jù)傳輸過程期間也可以使用。另外,它能在客戶/服務(wù)器連接的任何一方設(shè) 置。如果知道數(shù)據(jù)不久即將發(fā)送,那么推遲ACK包的發(fā)送就會(huì)派上用場(chǎng),而且最好在那個(gè)攜帶數(shù)據(jù)的數(shù)據(jù)包上設(shè)置ACK 標(biāo)志以便把網(wǎng)絡(luò)負(fù)載減到最小。當(dāng)發(fā)送方肯定數(shù)據(jù)將被立即發(fā)送(多個(gè)包)時(shí),TCP_QUICKACK 選項(xiàng)可以設(shè)置為0。對(duì)處于“連接”狀態(tài)下的套接字該選項(xiàng)的缺省值是1,首次使用以后內(nèi)核將把該選項(xiàng)立即復(fù)位為1(這是個(gè)一次性的選項(xiàng))。
在某些情形下,發(fā)出ACK包則非常有用。ACK包將確認(rèn)數(shù)據(jù)塊的接收,而且,當(dāng)下一塊被處理時(shí)不至于引入延遲。這種數(shù)據(jù)傳輸模式對(duì)交互過程是相當(dāng)?shù)湫偷?,因?yàn)榇祟惽闆r下用戶的輸入時(shí)刻無法預(yù)測(cè)。在Linux系統(tǒng)上這就是缺省的套接字行為。
在上述情況下,客戶程序在向服務(wù)器發(fā)送HTTP請(qǐng)求,而預(yù)先就知道請(qǐng)求包很短所以在連接建立之后就應(yīng)該立即發(fā)送,這可謂HTTP的典型工作方式。既然沒有 必要發(fā)送一個(gè)純粹的ACK包,所以設(shè)置TCP_QUICKACK為0以提高性能是完全可能的。在服務(wù)器方,這兩種選項(xiàng)都只能在偵聽套接字上設(shè)置一次。所有 的套接字,也就是被接受呼叫間接創(chuàng)建的套接字則會(huì)繼承原有套接字的所有選項(xiàng)。
通過TCP_CORK、TCP_DEFER_ACCEPT和 TCP_QUICKACK選項(xiàng)的組合,參與每一HTTP交互的數(shù)據(jù)包數(shù)量將被降低到最小的可接受水平(根據(jù)TCP協(xié)議的要求和安全方面的考慮)。結(jié)果不僅 是獲得更快的數(shù)據(jù)傳輸和請(qǐng)求處理速度而且還使客戶/服務(wù)器雙向延遲實(shí)現(xiàn)了最小化。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多