网络爬虫都学什么？

2020-07-17 15:45发布

16条回答

2021-08-11 15:36

1、基础的前端网页知识，这个是学习网络爬虫的基础，我们爬取的大部分网络数据都是存储在网页中，如果连基本的网页都看不懂，就无从爬取数据，不要求你对网页知识多么的熟悉、精通，最起码的html,css,js要能看懂，如果这些还不会的话，建议花个两三天学习一下

2、要会抓包分析，使用开发者工具（按F12就行），有些网页数据是静态加载的，可以直接请求、解析页面，而有些页面数据是动态加载的，直接请求是获取不到的，这时就需要我们进行抓包分析，获取真实的数据文件，像json，xml等，然后才能解析，提取出我们需要的数据，如果还不熟悉开发者工具，建议学习一下

3、再着就是编程爬取网络数据了，这个根据自己需求选择一门编程语言就行，java，python等都可以，如何没有任何编程基础的话，建议选择python，好学易懂、语法简单，非常适合初学者，有许多现成的爬虫包可直接利用，像urllib,requests,bs4,lxml等，使用起来非常方便，后期熟悉后，你也可以使用scrapy爬虫框架，效率会更高

4、最后，就是存储爬取的数据了，数据量小的话，可以直接利用excel,csv等文件存储，要是数据量比较大的话，你还需要利用数据库进行存储，像mysql,mongodb等，有时间的话，建议可以学习一下

查看其它16个回答

网络爬虫都学什么？

一周热门更多>

相关问答

相关文章

网络爬虫都学什么？

一周热门 更多>

相关问答

相关文章

采纳回答

编辑标签

举报内容

检举类型

检举原因

检举说明(必填)

打开微信“扫一扫”，打开网页后点击屏幕右上角分享按钮

付费偷看金额在0.1-10元之间

一周热门更多>