2020-05-28 19:16发布
可以啊
用java编写爬虫, 有丰富的第三方包, 使用起制来比较容易
JSOUP : 强大的HMTL解析能力, 但抓取能力较弱.
HttpClient: 强大专业的爬取知能力.功能强大, 代码量较多. 解析起来稍微麻烦点
HtmlUnit: 可以模拟浏览器.没有界道面,可以模拟填表,模拟点击等,甚至还支持JavaScript.但是内存占用较多,速度较慢.
一般根据需要,进行搭配使用
最多设置5个标签!
可以啊
用java编写爬虫, 有丰富的第三方包, 使用起制来比较容易
JSOUP : 强大的HMTL解析能力, 但抓取能力较弱.
HttpClient: 强大专业的爬取知能力.功能强大, 代码量较多. 解析起来稍微麻烦点
HtmlUnit: 可以模拟浏览器.没有界道面,可以模拟填表,模拟点击等,甚至还支持JavaScript.但是内存占用较多,速度较慢.
一般根据需要,进行搭配使用
一周热门 更多>