apache nutch ? ? java写的网络爬虫减少了很多维护的操作例如检查已损坏的连接为搜索时找到的网页页面制造副本加上apache solr我们可以在访问过的页面里面搜索信息全文本搜索apache nutch和apache的整合比较容易 : : :