特牛网址导航

python爬虫实践-01-携程酒店评论的爬取_携程酒店评论爬取-CSDN博客

网友收藏
文章浏览阅读6.6k次,点赞4次,收藏65次。0 关键携程网其最大的特点就是:基本上所有的有效数据都是通过Ajax异步请求获取的。本博客的主要内容为:构造Ajax请求,获得返回的reviews数据,由于返回的数据为JSON格式,很好分析判定是否爬完酒店评论直接获取评论数目,想要通过评论下方页码获得总页数比较麻烦,通过分析返回的reviews数据,发现其中有评论数据字段。通过分析不存在评论页面的Ajax请求的返回数据特征,完成爬取结束的判断。下面以https://hotels.ctrip.com/hotels/375126.html_携程酒店评论爬取