首页 官网动态内容详情

搜索引擎按照收录内容分为什么类型和什么类型

2024-03-27 22 网站首席编辑
自考本科计算机信息检索(02139)简答题(一)-今日头条

1.按照网络传输协议不同,网络资源种类有哪些?

答:1)web信息资源

2)Telnet资源

3)FTP信息资源

4)用户组信息资源

5)RSS信息资源

2.网络信息检索工具的性能评价指标有哪些?

答:1)收录范围

2)检索功能

3)检索效率

4)检索结果的处理和展示

5)用户界面设计

3.搜索引擎的主要类型有哪些?

答:1)通用搜索引擎

2)垂直搜索引擎

3)元搜索引擎

4.目录型检索工具的特点有哪些?

答:1)面向用户的易用性

2)提供准确性较高的信息内容

3)提供导航作用良好的检索体系结构

4)以明确的主题和对象为中心设置确定类目

5)有兼容性强的多元类目

5.检索时多义词问题的解决方法?

答:在搜索之前先问自己这个问题,然后用短语、用多个关键词或其他词语代替多义词作为搜索关键词。比如用“三毛 梦里花落知多少”、“三毛 漫画”分别搜索可以满足不同的需求。

6.TRIR技术定义,帮助图像分析、标引的web文档包括哪方面内容?

答:1)TBIR技术沿用传统的文本检索技术,从图像名称、图像尺寸、压缩类型、作者、年代等方面标引图像,忽略图像底层特征对正确识别图像有重要意义的元素。

2)内容:①图像文件名及网址

②图像的替代文字

③图像周围的文字

④图像所在页面的标题

⑤图像的超链接

⑥图像所在网页彼此间的链接

7.网络信息检索技术进行开发和创新的领域?

答:网络信息检索技术要以提高搜索工具的信息服务功能、完善搜索服务为核心,在下列领域进行开发创新。

1)智能检索

①用户需求理解的智能化;

②检索过程的智能化。

2)语义检索

3)垂直搜索

4)基于内容的多媒体信息检索

①颜色特征提取;

②纹理特征提取;

③形状特征提取;

④相关反馈。

5)跨语言检索

6)信息检索可视化

8.互联网信息资源的评价单位及方法?

答:(1)对互联网信息资源的评价是以网站或网页为评价单位,评价标准一般是借鉴传统对印刷文献评价的标准,并结合网络信息的特点,主要着眼于网页所提供的信息内容质量和信息存储方式等综合而成的。

(2)评价方法

1)质量评价方法

定性评价:按照一定的评价标准,对被评站点的各方面特征、质量做出主观评判,一般有问卷调查、专家评议等方式。

定量评价:利用数量分析方法,对相关数据进行调查采集、统计分析,进而做出较系统客观的评判。常见的对网站信息进行定量评价是对访问次数、登录情况、链接数量等进行统计分析,进而对用户兴趣、网站影响力、站点所提供信息的质量水平和可信度做出评判。

2)一般评价方法

①从URL中得到信息;

②查看网站描述和版权说明;

③从链接中获取信息;

④参考他人的评价。

9.搜索引擎一般工作流程及流程的4个主要步骤是什么?

答:(1)工作流程:首先对互联网上的网页进行搜集,其次对搜索来的网页进行预处理,建立网页索引数据库,实时响应用户的查询请求,并对查找到的结果按某种规则进行排序后,返回给用户。

(2)流程的主要4个步骤

1)抓取—从互联网上抓取网页

2)索引—建立索引数据库

3)搜索排序—在索引数据库中搜索排序

4)显示—对搜索结果进行处理排序

10.目录型检索工具的使用方法有哪些?

答:1)采用广度优先查询法;

2)注意了解各个检索工具的收录特点,选择适当工具;

3)掌握各目录检索工具的分类体系;

4)关注热门主题和常用目录;

5)关注开放性目录检索工具。

11.关键词选取的5个常用步骤?

答:1)抽取基础关键词,排除常用词;

2)考虑基础关键词的同义词;

3)考虑上位词和下位词;

4)考虑相关词;

5)总结审视。

12.搜索引擎发展过程中的三个主要阶段的特点和代表引擎?

答:1)第一代搜索引擎是以文档分类导航为特征,基于文档内容的搜索引擎。以Yahoo为代表,它通过人工或自动的方式将筛选过的网络资源,按一定的顺序放置于预先制定的分类体系目录下。

2)第二代搜索引擎产生于20世纪90年代中期,以关键词匹配为特征,并基于超链接分析技术,从而实现网页的自动抓取、排序等,主要代表为Google和百度。

3)第三代搜索引擎目前尚未形成统一的界定标准,开发也处于探索阶段,总的来说它是一种智能化的搜索引擎,可以实现自然语言的无障碍搜索,可以实现语义匹配,可直接返回检索结果而非链接,提供智能化的检索结果排序,并且可能具备推理功能,对复杂的检索问题也能给出符合使用者需要的更精确和权威的答案。

13.搜索引擎的瓶颈和不足以及可能存在的法律风险有哪些?

答:(1)瓶颈和不足

1)搜索引擎的索引能力

2)迎战“深网”

3)搜索结果的排序和输出

(2)法律风险

1)版权风险

2)侵犯隐私的风险

3)搜索引擎营销的法律风险

4)避风港原则

14. FTP协议的功能及获取文件的步骤?

答:(1)功能: FTP协议是互联网使用的,专门用来传输文件的协议,该协议的主要功能是完成从一个系统到另一个系统完整的文件拷贝,即在联网计算机之间传输文件。

(2)步骤

1)登陆

2)浏览目录,找到所需文件

3)设置文件传输参数,选择文件传输模式

4)下载所需文件

15.搜索引擎按领域划分有哪些类型?

答:1)综合型网络检索工具

2)专业型网络检索工具

3)特殊型网络检索工具

16.互联网信息检索时实施检索策略的步骤有哪些?

答:1)判断目标信息可能存在的地方

2)了解互联网信息检索的特殊性

3)了解可用的检索工具

4)仔细分析自己的信息需求,选择合适的工具

5)根据检索结果调整检索策略

17.主题爬虫技术与垂直搜索引擎的特征有哪些?

答:(1)主题爬虫技术:是根据一定的网页分析算法过滤与主题无关的链接,保留主题相关的链接,并将其放入待抓取的URL,并重复上述过程,直到达到系统的某一条件时才停止。

(2)垂直搜索引擎

1)信息采集:采用主动与被动相结合的方式

2)信息加工:进行结构化信息提取和加工

3)信息检索:不仅能够对网页信息的结构化信息进行检索,还提供结构化与非结构化相结合的方式进行检索

18.互联网信息检索的特点有哪些?

答:1)无限的检索范围,动态的检索对象。

2)丰富的检索内容,新兴的检索领域。

3)强大的检索工具,低廉的检索费用。

19.搜索引擎信息索引技术有哪些?

答:1)信息语词的切分和语词词法的分析

2)进行词性标注及相关的自然语言处理

3)建立检索项索引

4)检索结果的处理技术

20.元搜索引擎的优点有哪些?

答:1)信息覆盖面大,检索效率高

2)检索工具扩展性强

3)服务多样化

4)无需考虑网页索引数据库的建立和维护

21.元搜索引擎的缺点有哪些?

答:1)检索结果全面性和可靠性较差

2)不能灵活控制结果的输出

3)检索结果排序不够理想

4)信息搜索覆盖面存在局限性

5)检索式处理较复杂

相关标签: # 自考 # 下载 # 垂直搜索

  • 评论列表 (0条)

 暂无评论,快来抢沙发吧~

发布评论