【单选题】聚焦网络爬虫指选择性地爬行与预先定义好的主题相关的网页。以下属于常用的聚焦爬虫爬行策略的是( )
【简答题】搜索引擎蜘蛛、通用网络爬虫、聚焦网络爬虫、增量式网络爬虫
【简答题】聚焦网络爬虫 又称 ( ) ,是指选择性地爬行预先定义好的与主题相关的页面。 与通用网络爬虫相比,极大地节省了硬件和网络资源 。
【判断题】Web 爬虫主要分为通用网络爬虫和聚焦网络爬虫。
【简答题】下列属于沉积岩构造的是( ) A. 层理构造 B.片理构造 C.节理构造D. 解理构造
【多选题】关于聚焦爬虫的工作原理,下列描述正确的是()。
A.
聚焦爬虫会根据一定的网页分析算法过滤与主题无关的链接,保留有用的链接
C.
根据一定的搜索策略,从URL队列中选择下一步要抓取的网页URL
D.
我们需要根据爬取需求定义聚焦爬虫的爬取目标,并进行相关的描述。