特牛网址导航

python爬取百度贴吧的实例_百度贴吧爬虫案例讲解-CSDN博客

网友收藏
文章浏览阅读3.5k次,点赞4次,收藏37次。今天学习爬虫第二天,我们来试试爬取百度贴吧。我先说下一下我主要步骤:1.首先要获取url2.然后遍历url 获得网页响应3.把爬取的html以文本的形式保存在本地大家先看看百度贴吧(lol吧)看了一些贴吧后 发现贴吧名字都是 “XXX”+吧 然后看看网址第一页第二页第三页三页之后 直接找出url的规律,kw=" " 传递xxx吧 ,pn负责翻页,翻一次 ,加50,从0开始。好接下来就可以开始了。面向对象方法 类 tbspider启动程序我们看看效果文件里面的内_百度贴吧爬虫案例讲解