Python網絡爬蟲與信息提取MOOC 測驗3: Python網絡爬蟲之實戰 (第3周)
1、以下不是正則表達式優勢的選項是:
A、一行勝千言
B、實現自動化腳本
C、特徵表達
D、簡潔
正確答案: B
儘管正則表達式可用於自動化腳本,但不直接體現自動腳本的作用。
2、正則表達式:^[A-Za-z\d]+$的含義是什麼?
A、由26個字母和特殊字符d組成的字符串
B、由26個字母和數字組成的字符串
C、由26個字母組成的字符串
D、一個26個字母構成的字符串
正確答案: B
3、正則表達式:\d{3}-\d{8}|\d{4}-\d{7}能匹配哪個?
A、01012345678
B、010-12345678
C、010-1234567
D、0521-12345678
正確答案: B
\d{3}-\d{8}|\d{4}-\d{7}
表示:3個數字-8個數字 或者 4個數字-7個數字
4、re庫可以使用如下方式表示正則表達式:r'[1-9]\d{5}',其中r是什麼意思?
A、正則表達式標記
B、開始位置標記
C、強制標記
D、原生字符串標記
正確答案: D
字符串包括:普通字符串和原生字符串,原生字符串中沒有轉義符(\)。
5、正則表達式:^[A-Za-z]+$的含義是什麼?
A、由26個字母和數字組成的字符串
B、由26個字母和特殊字符d組成的字符串
C、由26個字母組成的字符串
D、由字母a和z、A和Z組成的字符串
正確答案: C
以下這些操作符是正則表達式中最常用的
6、正則表達式:^-?\d+$的含義是什麼?
A、由26個字母和數字組成的字符串
B、一個帶有負號的數字字符串
C、一個整數形式的字符串
D、由26個字母組成的字符串
正確答案: C
以下這些操作符是正則表達式中最常用的:
7、正則表達式:^[0-9]*[1-9][0-9]*$的含義是什麼?
A、由0到9數字組成的字符串
B、數字和*組成的字符串
C、正整數形式的字符串
D、整數形式的字符串
正確答案: C
8、正則表達式:[1-9]\d{5}的含義是什麼?
A、由0到9數字組成的字符串
B、長度爲5的正整數形式字符串
C、首位不爲0的6長度數字形式字符串
D、整數形式的字符串
正確答案: C
9、正則表達式:[\u4e00-\u9fa5]的含義是什麼?
A、一個在\u4e00到\u9fa5之間的字符
B、由\u4e00到\u9fa5字符組成的字符串
C、由\u4e00到\u9fa5中一個或多個字符組成的字符串
D、\u4e00或\u9fa5
正確答案: A
10、Beautiful Soup庫與re庫之間關係,描述正確的是:
A、Beautiful Soup庫中可以加載re庫
B、re庫中可以加載Beautiful Soup庫
C、re庫能實現HTML解析,功能上與Beautiful Soup庫類似
D、這兩個庫沒有關係
正確答案: D
兩者沒關係,re庫以字符串模式匹配與檢索方式提取信息,與Beautiful Soup庫不同。