python爬虫笔记——Selenium的初级使用

发布时间:2024-03-09 19:01

一、动态渲染页面爬取

1、背景问题

  • 对于访问Web时直接响应的数据(就是response内容可见(不是ajax加载或者被渲染过的数据)),我们使用urllib、requests或Scrapy框架爬取。
  • 对于一般的JavaScript动态渲染的页面信息(Ajax加载),我们可以通过抓包分析Ajax请求地址来抓取信息。
    • Ajax = 异步 JavaScript 和 XML(标准通用标记语言的子集)。
    • Ajax 是一种用于创建快速动态网页的技术。
    • Ajax 是一种在无需重新加载整个网页的情况下,能够更新部分网页的技术。比如:京东指定商品信息的评论信息。

ItVuer - 免责声明 - 关于我们 - 联系我们

本网站信息来源于互联网,如有侵权请联系:561261067@qq.com

桂ICP备16001015号