#
#
万方数
软件分院2009级 5班 课程设计课程名称:基于Lucene的站内搜索引擎的设计与实现 : 周敏 : 200900008397 分院:软件分院 2011年10月项目评分标准评分等级得分平时成绩(20)态度端正设计认真能积极思考学习纪录好优秀态度较好较认真能积极思考学习纪录较好良好态度一般学习纪录
下面分析一下Nutch搜索引擎系统的特点 一系统架构 ? 总体上Nutch可以分为2个部分:抓取部分和搜索部分抓取程序抓取页面并把抓取回来的数据做成反向索引搜索程序则对反向索引搜索回答用户的请求抓取程序和搜索程序的接口是索引两者都使用索引中的字段抓取程序和搜索程序可以分别位于不同的机器上下面详细介绍一下抓取部分 抓取部分: ? 抓取程序是被Nutch的抓取工具驱动的这是一组工具用来建立和维护
J our nal of Inf o
摘 要随着信息时代的来临人们的生活学习工作和娱乐已经与信息技术充分的融为一体随着群众对互联网参与度的增加和企事业单位信息化的逐步深入信息量也成倍地增长如何能更好地从浩如烟海的数字信息中快速精准地查找到需要的信息成为全国人民的迫切需求尤其是处于信息化建设道路上的中小企业如何快速且廉价地开放自己的信息检索系统对于企业的成长至关重要本文介绍了搜索引擎的基本原理对搜索引擎的一些核心技术进行了介绍与深入的
基于智能
万方数据
基于lucene的校园网搜索引擎[提要] 现代网络信息化水平日益提高网页信息量急剧增加搜索引擎已经成为人们获取所需知识的必要工具之一本文结合校园网搜索引擎的具体需求介绍校园网搜索引擎的整体框架其中lucene作为开源的检索框架具有很好的应用性关键词:搜索引擎lucene网络爬虫站内搜索一引言21世纪是网络信息化的时代网络信息已经成为人们工作与学习中不可或缺的东西网络在世界范围内向用户提供信息服务及
违法有害信息,请在下方选择原因提交举报