效能
語法
WebGet -[sumonly | alldata] [{-url <urlname> [-walk <depth> <span>] [-proxy <urlname>] } | { [-file <filename>] | <# entries to fetch> [-concurrent | -sequential ] } ] -[holdtime <ct> <st>]
-walk 參數不越過先前已越過的連結 (即,不會選取「返回主頁」連結);這樣可以防止無休止的遞迴迴路。-walk 指令亦不會瀏覽連到其他 HTTP 伺服器的連結 (即,不會選取連到 www.ibm.com 之 www.lotus.com 上的連結),這樣可避免無休止地瀏覽 HTTP 伺服器。如果指定的 URL 是外部站台 (即必須透過指定的 Proxy 伺服器存取的 URL),則應使用 -proxy 參數。
-holdtime 參數指定在完成 HTTP 異動之前,WebGet 將等待的時間量。完成 HTTP 異動所需的事件順序是:建立到 HTTP 伺服器的連線,將指令傳送給 HTTP 伺服器,從 HTTP 伺服器接收回資料。
<ct> 參數指出在向 HTTP 伺服器發出指令之後要等待的時間量 (以微秒為單位)。這會有效地使已調度的 HTTP 伺服器執行緒/程序為處於閑置狀態中的要求服務。<ct> 應小於 HTTP 伺服器的連線時間逾時參數 (通常是 2 分鐘)。<st> 參數指定在向 HTTP 伺服器傳送指令之後要等待的時間量。這樣會有效地使服務中的 HTTP 伺服器執行緒/程序保持閑置,即使它可能備妥傳送資料。
從 Web 瀏覽器的角度,指令 [-url www.lotus.com -walk 2 1] 可解釋為:從網頁 www.lotus.com 開始,選取該頁上的兩個連結 (如果該頁至少有兩個連結的話) 並按一下。按一下第一個選取的連結,返回到初始網頁,然後按一下第二個連結,再返回到初始網頁。
範例 2
從 Web 瀏覽器的角度,指令 [-url www.lotus.com -walk 1 2] 可解釋為:從網頁 www.lotus.com 開始,選取該頁上的一個連結並按一下。按一下連結,然後將相同的規則遞迴套用到每一個新頁。假設按一下的第一個連結是 www.lotus.com/notes.htm,則規則需要 WebGet 尋找該頁上的一個連結並越過它。span 參數指出遞迴程序的停止點。
此外,-walk 0 0 指出 WebGet 只應要求由 <urlname> 指出的頁,而不應要求更多。相當於省去 -walk 參數。
或者,諸如 -walk 10000 10000 (或其他較大的數字) 的數字指出您要讓 WebGet 越過該頁上每個可信的連結,更像 Web 機器人。
另請參閱