精灵球

精灵球就是指的是Instant Data Scraper Chrome 这款浏览器插件。

关于Instant Data Scraper

Instant Data Scraper插件完全在用户的浏览器中运行,并且不会将数据发送到Web Robots。该插件可以将多页数据检索到一个文件中。

支持平台

在Amazon、eBay、Best Buy、Walmart、Etsy、Home Depot、Craigslist、Yelp 等热门网站中,Instant Data Scraper插件均可使用,并且无需使用者具备编码技能。

插件下载

1、在Chrome网上应用店搜索并安装插件“Instant Data Scraper”。

2、如无法访问 Chrome网上应用店,可以离线安装插件:

通过当前页面下载Instant Data Scraper离线安装包,打开扩展程序内的开发者模式,将解压后的crx文件拖拽至扩展程序管理,选择添加插件即可。

插件使用方法

插件使用起来非常简单,以采集亚马逊Review为例:

1、打开产品Reviews页的第一页,网址格式如:https://www.amazon.com/product-reviews/产品的ASIN;

2、点击Instant Data Scraper插件图标,激活「精灵球」;

3、「精灵球」会自动判断可抓取的页面区域,如果区域不对,点击「Try another table」按钮可以切换区域:

4、点击「Locate "Next" button」按钮来定位页面中的「Next」按钮或链接;

5、点击「Start crawling」按钮开始爬取页面,插件会实时显示爬取到数据,请耐心等待,切勿打开其他页面,不然爬取会中断出错;

6、等数据都爬取完了就可以点击绿色按钮进行下载,可选 CSV 或 Excel 文件:

精灵球

7、打开下载好的CSV或Excel文件,删掉你不需要的数据列即可。

简单几步搞定亚马逊评价(Reviews)的爬取和采集!另外,Q&A 也是可以爬取的。