二、搜索器
“網絡蜘蛛——Spider”,是自動程序,能夠自動地在互聯網中搜索信息。一個典型的網絡蜘蛛工作的方式,是查看一個頁面,並從中找到相關信息,然後它再從該頁面的所有鏈接中出發,繼續尋找相關的信息,以此類推,直至窮盡。對網絡蜘蛛的要求是能夠快速、全面。
凡是需要積累信息的都需要蜘蛛,比如搜索引擎、情報的蒐集、資料的收集、信息的收集。
互聯網的迅速發展,導致了網上信息的爆炸性增長。要在如此浩瀚的信息海洋裏快速、全面的收集信息,就不得不依靠網絡蜘蛛的威力。
功能要求:
基本功能
1、給定網址,列出站內靜態鏈接(包括各種資源)及文件相對路徑;
2、直接取得URL的動態網頁(CGI,ASP,PHP,JSP,ASP.net等);
3、爬行到給定網址所連接的站外網站,執行基本功能1、2;
4、給定網址,根據關鍵字進行搜索並輸出結果。
高級功能
1、能夠處理經過簡單編碼的網站(URL編碼);
2、能夠識別錯誤頁,空頁,轉向頁等;
3、對重複(網頁的內容相同)的網頁不會反覆下載。
性能要求:
佔用資源少、執行速度快。
完成時間:
2007年8月31日前
獎勵措施:
1、根據完成的情況,公司設立兩個等級獎項,一等獎一名,獎品爲數碼相機一部,二等獎兩名,獎品爲MP3一部,三等獎三名,獎品爲優盤一部。
2、同時,公司可以考慮給予獲獎者提供實習機會,並根據實習情況給予就業機會。
|