爬虫思路

感觉以前学爬虫时完全是瞎碰,,,现在写点思路

  1. 确定要爬的网址
  2. 伪造请求头(header),避免爬虫检测
  3. 抓取相应页面的get
  4. 用beautifulsoup解析get包
  5. 筛选所需的内容(例bs的select()方法,get_text()……)



2022年 February 26日|21:15  作者:
目录: 提问、复习等, 计算机 标签:,,
欢迎留下你的评论~~
订阅
通知
guest
0 Comments
内嵌回复
查看所有评论