网络爬虫的设计与实现 毕业论文

本文档由 Freedom 分享于2009-12-20 13:57

文首先从搜索引擎种类和组成出发,对搜索引擎的内部运行机制进行了初步的了解,其次对现在一般的网络爬虫的运行过程给予整体的介绍,以及网络爬虫的搜索策略和所面临的主要技术问题进行了简要的分析,然后通过了三个具体的例子对网络爬虫的内部结构进一步的分析,最后对于网络爬虫Inar(Information Navigation And Retrieval)体系结构设计与实现作了详细的分析。
文档格式:
.doc
文档大小:
652.0K
文档页数:
63
顶 /踩数:
629 0
收藏人数:
91
评论次数:
2
文档热度:
文档分类:
IT计算机  —  开发文档
添加到豆单
文档标签:
网络爬虫 URL cache crawling 网络 网页 爬虫 搜索引擎 processes links
系统标签:
爬虫 网络 实现 多线程 spider 爬行
下载文档
收藏
打印

扫扫二维码,随身浏览文档

手机或平板扫扫即可继续访问

推荐豆丁书房APP  

获取二维码

分享文档

将文档分享至:
分享完整地址
文档地址: 复制
粘贴到BBS或博客
flash地址: 复制

支持嵌入FLASH地址的网站使用

html代码: 复制

默认尺寸450px*300px480px*400px650px*490px

支持嵌入HTML代码的网站使用

分享到