如何用python 正则表达式把一行中指定位置的字符取出来_Python

6条回答

2楼 · 2021-04-16 09:51

用列表推导式来实现，供参考。
>>> raw_list = ['A_rig', 'B_obj', 'F_rig', 'H_obj', 'T_rig']
>>> new_list = [i for i in raw_list if '_obj' in i]
>>> print(new_list)
['B_obj', 'H_obj']

20200921文 - 做更棒的自己!

3楼 · 2021-04-16 15:09

python 根据正则表达式提取指定的内容
正则表达式是极其强大的，利用正则表达式来提取想要的内容是很方便的事。

下面演示了在python里，通过正则表达式来提取符合要求的内容。

实例代码：
import re# 　　正则表达式是极其强大的，利用正则表达式来提取想要的内容是很方便的事。# 下面演示了在python里，通过正则表达式来提取符合要求的内容。有几个要注意# 的地方就是：# [1] 要用()将需要的内容包含起来# [2] 编号为0的group是整个符合正则表达式的内容，编号为1的是第一个(及对应# 的)包含的内容# @param regex: regular expression, use () to group the result# 正则表达式，用()将要提取的内容包含起来# @param content: # @param index: start from 1, depends on the \p regex's ()# 从1开始，可以通过数(来得到，其中0是全部匹配# @return: the first match of the \p regex# 只返回第一次匹配的内容def extractData(regex, content, index=1): r = '0' p = re.compile(regex) m = p.search(content) if m: r = m.group(index) return r regex = r'第(.*)场雪'content = '2002年的第一场雪'index = 1print extractData(regex, content, index)

典典 - 给你一典典的学习帮助

4楼 · 2021-04-16 19:51

import re
	pattern = re.compile(r'"key":"(.*?)"')
	num1 = pattern.findall('repin_count":617, "is_private":0, "extra":null, "orig_source":null, "tags":[], "board":{"board_id":2681393, "user_id":977900, "title":"UI", "description":"", "category_id":"web_app_icon", "seq":1, "pin_count":782, "follow_count":9084, "like_count":27, "created_at":1350360763, "updated_at":1577953282, "deleting":0, "is_private":0, "extra":null, "key":"4af0f60602b02b587d21d470e54feb584b8a24259322-bYTJnQ"，"pins":[{"pin_id":814738561, "user_id":977900, "board_id":2681393, "file_id":103415954, "file":{"bucket":"hbimg", "key":"4af0f60602b02b587d21d470e54feb584b8a24259322-bYTJnQ", "type":"image/png", "height":600, "width":800, "frames":1, "theme":"001414"}, "media_type":0, "source":"dribbble.com", "link":"https://dribbble.com/shots/2724065-City-Sunset", "raw_text":"City Sunset", "key":"4af0f60602b02b587d21d470e54feb584b8a24259322-bYTJnQ"，')
	print(num1)

我想吃肉

5楼 · 2021-04-16 19:53

import re def Find(string): # findall() 查找匹配正则表达式的字符串 url = re.findall('https?://(?:[-\w.]|(?:%[\da-fA-F]{2}))+', string) return url string = 'Runoob 的网页地址为：https://www.runoob.com，Google 的网页地址为：https://www.google.com'print("Urls: ", Find(string))

一个Ai

6楼 · 2021-04-19 08:44

1. 单个位置的字符串提取

这种情况我们可以使用(.+?)这个正则表达式来提取. 举例,一个字符串"a123b",如果我们想提取ab之间的值123,可以使用findall配合正则表达式,这样会返回一个包含所以符合情况的list,代码如下:

import re
str = "a123b"print re.findall(r"a(.+?)b",str)#输出['123']

1.1贪婪和非贪婪匹配

如果我们有一个字符串”a123b456b”,如果我们想匹配a和最后一个b之间的所有值而非a和第一个出现的b之间的值,可以用?来控制正则贪婪和非贪婪匹配的情况. 代码如下:

复制代码 import re

str = "a123b456b"print re.findall(r"a(.+?)b", str)#输出['123']#?控制只匹配0或1个,所以只会输出和最近的b之间的匹配情况print re.findall(r"a(.+)b", str)#输出['123b456']print re.findall(r"a(.*)b", str)#输出['123b456']

1.2多行匹配

如果你要多行匹配，那么需要加上re.S和re.M标志. 加上re.S后, .将会匹配换行符，默认.不会匹配换行符. 代码如下:

str = "a23b\na34b"re.findall(r"a(\d+)b.+a(\d+)b", str)#输出[]#因为不能处理str中间有\n换行的情况re.findall(r"a(\d+)b.+a(\d+)b", str, re.S)#s输出[('23', '34')]

加上re.M后,^$标志将会匹配每一行，默认^和$只会匹配第一行. 代码如下:

str = "a23b\na34b"re.findall(r"^a(\d+)b", str)#输出['23']re.findall(r"^a(\d+)b", str, re.M)#输出['23', '34']

2. 连续多个位置的字符串提取

这种情况我们可以使用(?P…)这个正则表达式来提取. 举例,如果我们有一行webserver的access日志:'192.168.0.1 25/Oct/2012:14:46:34 "GET /api HTTP/1.1" 200 44 "http://abc.com/search" "Mozilla/5.0"',我们想提取这行日志里面所有的内容,可以写多个(?Pexpr)来提取,其中name可以更改为你为该位置字符串命名的变量,expr改成提取位置的正则即可. 代码如下:

import re
line ='192.168.0.1 25/Oct/2012:14:46:34 "GET /api HTTP/1.1" 200 44 "http://abc.com/search" "Mozilla/5.0"'reg = re.compile('^(?P[^ ]*) (?P[^ ]*) "(?P[^"]*)" (?P[^ ]*) (?P[^ ]*) "(?P[^"]*)" "(?P[^"]*)"')regMatch = reg.match(line)
linebits = regMatch.groupdict()print linebitsfor k, v in linebits.items() :    print k+": "+v

输出的结果为:

status: 200
referrer:  
request: GET /api HTTP/1.1
user_agent: Mozilla/5.0
date: 25/Oct/2012:14:46:34size: 44
remote_ip: 192.168.0.1

帅帅马

7楼 · 2021-04-23 15:09