- 链接地址:https://blog.csdn.net/shuai_fmzj/article/details/113448295
- 链接标题:使用scrapy的response.replace()过滤特殊符号,爬取tmall店铺商品链接_scrapy 爬取网页时包含 a 标签的span 标签被过滤掉了-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:6174
文章浏览阅读1.1k次。抓取网页有时候会含有一些特殊符号,如, \r, \t, \n等,在使用xpth时会导致定位不到元素,此时就需要先对响应内容做一下过滤,然后使用response.replace()将过滤后的文档重新赋值给response# replace源码部分def replace(self, *args, **kwargs): """Create a new Response with the same attributes except for those given new values. ""_scrapy 爬取网页时包含 a 标签的span 标签被过滤掉了
版权声明:本文发布于特牛网址导航 内容均来源于互联网 如有侵权联系删除