大桔灯文库logo

#Nutch搜索引擎# 相关文档

  • nutch分布式详解.doc

    nutch分布式详解1( Injector)初始抓取时没有任何文件只有几个待抓取的url站点信息假设所有url站点存在rootUrlDir文件目录下(可以是一个或多个文件每个文件一行一个url)需要将这些url导入到crawldb中去以方便在下次generate时能够抓取这些网页? ??? ? 这里详细介绍导入函数injector的分布式过程导入函数调用方式为:(crawlDb rootUr

    日期:2022-05-07 格式:.docx 页数:7页 大小:49KB 发布:
  • 1
  • 1/1页

客服

顶部