特牛网址导航

单页爬虫_ctf 在线爬虫单页分析系统-CSDN博客

网友收藏
文章浏览阅读674次。1.项目简介任务:爬取某基金网站数据, 以单页单条模式存储。 性能:抓取各式数据,以dict模式存入数据库,以json模式导出到文本。最后实现90分钟内对全站约3500支基金数据更新, 约100条error。2.版块说明List_page.py 简单抓取列表页面基金代号,方便后面到url队列生成。Crawl.py 分为Gen, Parse, Clean三个部分。 Gen为url队列生成, P_ctf 在线爬虫单页分析系统