爬虫,爬取的网页源码为啥中间一部分缺失

2021-03-02 11:00发布

[图] 最需要的那部分缺失了,因为页面是异步加载返回吗?

 最需要的那部分缺失了,因为页面是异步加载返回吗?

8条回答
香蕉牛油果酸奶
2楼 · 2021-03-02 16:33

通过JS修改的,真正的要获取的内容要在哪里寻找,我打开F12在里面有时候找不到

我想吃肉
3楼 · 2021-03-02 16:37

这说明空白部分的html是js加载的,利用python的selenium完成整个页面的加载就可以了。

小王霸
4楼 · 2021-03-02 16:50

网页最终显示的页面源码是经过浏览器解释后的,你get或者post请求到的源码是服务器直接返回的,不一样是正常的。

元则清
5楼 · 2021-03-03 18:44

网页最终显示的页面源码是经过浏览器解释后的,你get或者post请求到的源码是服务器直接返回的,不一样是正常的。

lucky璐呀
6楼 · 2021-03-04 10:02

这说明空白部分的html是js加载的,利用python的selenium完成整个页面的加载就可以了。

ablabla
7楼 · 2021-03-04 14:57

网页最终显示的页面源码是经过浏览器解释后的,你get或者post请求到的源码是服务器直接返回的,不一样是正常的

帅帅马
8楼 · 2021-03-04 16:25

网页最终显示的页面源码是经过浏览器解释后的,你get或者post请求到的源码是服务器直接返回的,不一样是正常的。

是年糕麻麻啊
9楼 · 2021-03-16 09:28

这说明空白部分的html是js加载的,利用python的selenium完成整个页面的加载就可以了。