html如何提取同级信息?_第3页回答

2021-01-13 10:40发布

[图]如上图,请教大佬如何提取出访客数1991的数据?我的想法是类似pandas中筛选表格的条件,假设这个表格为dfdf[df['流量来源']=='商品&店铺搜索'][...

如上图,请教大佬如何提取出访客数1991的数据?我的想法是类似pandas中筛选表格的条件,假设这个表格为df

df[df['流量来源']=='商品&店铺搜索']['访客数']

 流量来源的商品店铺搜索我用的是下面代码获取的

sources = soup.find_all('td',{'headers':'流量来源'})for source in sources:s = source.get_text()

请教大佬如何用python实现这种同级的信息提取?因为商品&店铺搜索没有在访客数的属性里,不知道应该如何操作


23条回答
樱田妮妮NiNi
2楼 · 2021-01-15 14:42
from lxml import etree

parse = etree.HTML(text=html)
tr = parse.xpath('//tr[@style="cursor: pointer;"]')
for td in tr:
    x = parse.xpath('//td[@headers="流量来源"]/text()')[0]
    y = parse.xpath('//td[@headers="访客数"]/text()')[0]

 


张成秀 - 快乐开心每一天
3楼 · 2021-01-15 14:46

最直接的办法就是下个Dreamweaver,然后打开直接复制你想要的内容

蛋炒饭炒蛋
4楼 · 2021-01-15 15:45

1、html

      单位帐号
     qqqqqqqqqqq1231

2】js获取p中账号

                var dwzh_p_val = $('#dwzh').siblings()[0].innerText;
                var dwzh = '';
                if(dwzh_p_val){
                    dwzh = dwzh_p_val;
                }


帅帅马
5楼 · 2021-01-15 16:04

1、对 html文本(字符串)使用正则表达式

rlts = re.findall(pttn,html_text)

对自己的正则能力训练提升很快

2、使用第三方库 selenium,直接 `find_elements_by_` 支持各种查找方式,包括xpath、class name、tag、id等



风火轮
6楼 · 2021-01-18 14:13

1、对 html文本(字符串)使用正则表达式

rlts = re.findall(pttn,html_text)

对自己的正则能力训练提升很快

2、使用第三方库 selenium,直接 `find_elements_by_` 支持各种查找方式,包括xpath、class name、tag、id等



20200921文 - 做更棒的自己!
7楼 · 2021-01-18 15:42
<script type="text/javascript">
var txt = '<center><p>abcp>center><p>  afsfsdfasfdsfsafsdfsfsafp><p>  afsfsdfasfdsfsafsdfsfsafp><p>  afsfsdfasfdsfsafsdfsfsafp><p>  afsfsdfasfdsfsafsdfsfsafp><p>  afsfsdfasfdsfsafsdfsfsafp><p>  afsfsdfasfdsfsafsdfsfsafp><p>  afsfsdfasfdsfsafsdfsfsafp><p>  afsfsdfasfdsfsafsdfsfsafp>'
 
//txt.replace(/(<center>(.*?)<\/center>)/,"$1")
//alert(RegExp.$1)
alert(/(<center>(.*?)<\/center>)/.test(txt))
alert(RegExp.$1)
script>


yyy
8楼 · 2021-01-19 15:29

在jquery中,获得同级元素的方法一般有七个,分别是siblings()、next()、nextAll()、nextUntil()、prev()、prevAll()、prevUntil()

相关问题推荐

  • 回答 120

    相对前几年来说,要高上不少了,毕竟入行的人也是越来越多了,基础的工作对应想要参与的人群基数越来越大,但是对于高端人才的需求还是很多,人才还是相对稀缺性的。所以,想要学web或者其他技术也一样,别等,别观望。web前端就业方向特别多包括web前端开发...

  • 回答 25

    相对定位和绝对定位是定位的两种表现形式,区别如下:一、主体不同1、相对定位:是设置为相对定位的元素框会偏移某个距离。2、绝对定位:absolute 脱离文档流,通过 top,bottom,left,right 定位。二、特点不同1、相对定位:在使用相对定位时,无论是否进行移...

  • 抓包是什么意思?2020-04-01 17:36
    回答 7
    已采纳

    抓包(packet capture)就是将网络传输发送与接收的数据包进行截获、重发、编辑、转存等操作,也用来检查网络安全。抓包也经常被用来进行数据截取等。抓包可以通过抓包工具来查看网络数据包内容。通过对抓获的数据包进行分析,可以得到有用的信息。目前流行的...

  • 回答 89

    常用的前端框架有Bootstrap框架、React框架、Vue框架、Angular框架、Foundation框架等等

  • 回答 65
    已采纳

    前端是目的就业前景非常不错的一个计算机技术,但是自学的话还是有一定难度的,网络上自学是碎片化的,同时互联网技术跟新换代快,自己的话比较吃力也学习不到最新的技术。

  • SSR 是什么意思?2020-03-20 18:56
    回答 6

    SSR就是一台服务器,可以利用 SSR 在远程的服务器上配置 SSR,使其能够成为 SSR 节点,这样本地电脑或者其它设备利用 SSR 节点实现 VPN 或者远程上网及游戏加速等方面。ShadowsocksR(简称 SSR)是 Shadowsocks 分支,在 Shadowsocks 的基础上增加了一些数据...

  • 回答 52
    已采纳

    计算机培训方向比较多,建议找适合自己的方向选择培训编程类:JAVA、WEB、Python、C/C++、C#等测试类:软件测试运维类:云计算、网络安全设计类:UI设计、3D建模等

  • 回答 11

    1、代码判断xAxis: {type: &#39;time&#39;,splitLine: {show: false},interval: 3600, // 设置x轴时间间隔axisLabel: {formatter: function(value, index) {return liangTools.unix2hm(value)}}},首先要把xAxis 显示类型设置成time,然后设置对应X轴......

  • 回答 8

    HTML5 + CSS + JavaScript 开发 跨平台重用代码 

  • 回答 4

    采用rem单位自动响应,并提供独有栅格化系统快速定义宽高、边距节省css代码量,同时总结各大型移动端网页,提供一套ui颜色搭配规范,尺寸规范,字体规范等。

  • 回答 10

    iView UI、ioni、SUI

  • 回答 6

     jQTouch 

  • 回答 4

    如果只是普通的移动端用vue react 或者dva 如果是要编译成小程序什么的或者混生 就用uni-app(对应vue语法)taro(对应react) 或者纯原生 这个没有限制的,自己怎么舒服怎么来

  • 回答 4

    因为可以运用在网页和小程序的开饭中,而且开源,用着便宜,企业都很喜欢

  • 回答 10

    一、Visual Studio Code下载地址:https://code.visualstudio.com/微软在2015年4月30日Build 开发者大会上正式宣布了 Visual Studio Code 项目:一个运行于 Mac OS X、Windows和 Linux 之上的,针对于编写现代 Web 和云应用的跨平台源代码编辑器。Visual Stud...

  • 回答 9

    jQuery自带淡入淡出效果 https://www.w3school.com.cn/jquery/jquery_fade.asp 看看这个 

没有解决我的问题,去提问