立即學習:https://edu.csdn.net/course/play/6861/326748?utm_source=blogtoedu
源字符
指代直接存在於字符串內部的子串
#提取出字符串中的python子串
s1=“通過幾天的學習python,我感覺自己python 進步了不少”
list = re.findall("python",s1)
英文狀態的句號點.
指代任意字符,(數字,字母,標點符號,漢字),除去\n換行符,類似linux中的*
#提取出動力總成的值
import re
s2="此次新朗逸主要搭配了1.5L和1.5T兩種動力總成的發動機,別克英朗則搭載了1.0T和1.3T的動力總成"
#re.findall("1...",s2)
re.findall("1\...",s2)
\. 就是.本身,而不再代表anything
反斜槓\
表示轉義字符,用於轉換含義的字符
\n:指定換行
\t 指定tab製表符號
\d:指代0-9中的額任意數字
\s 指代任意一種空白(空格 \tab\ 換行)
\w 指代字母、數字和下劃線的任意一種
\. 指代句號本身
\\ 指代斜槓本身\
#剔除字符串中所有的空白
s3=‘ 距離2019年北京馬拉松開跑只有兩週的時間了,\n 今年的北京馬拉松預報名人數超過了16萬人,\t媒體公佈的中籤率只有16%左右,再創歷年來的新低’
print(s3)
re.sub("\s",s3)
英文狀態中中括號[]
指代字符集合,當需要特定的字符串匹配時們可以選擇中括號