根据关注的信息以及站点内容和结构的不同,可以分为网络抓取和网站爬取
1、网络抓取通常针对特定网站,并在这些站点上获取指定信息。网络抓取用于访问这些特定的页面,如果站点发生变化或者站点中的信息位置发生变化,则需要进行修改。例如:通过网络抓取查看某地餐厅每日特色菜,为了实现该目的,需要抓取其网站中日常更新信息的部分
2、网络爬取通常是以通用的方式构建的,其目标是一系列顶级域名的网站或者是整个网络。爬取可以用来收集更具体的信息,不过更常见的情况是爬取网络,从许多不同的站点或页面中获取小而通用的信息,然后跟踪连接到其他页面中。