北理工嵩天Python網絡爬蟲與信息提取MOOC 測驗3: Python網絡爬蟲之實戰 (第3周)

Python網絡爬蟲與信息提取MOOC 測驗3: Python網絡爬蟲之實戰 (第3周)

1、以下不是正則表達式優勢的選項是:‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬

A、一行勝千言

B、實現自動化腳本

C、特徵表達

D、簡潔

正確答案: B 

儘管正則表達式可用於自動化腳本,但不直接體現自動腳本的作用。

2、正則表達式:^[A-Za-z\d]+$的含義是什麼?‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬

A、由26個字母和特殊字符d組成的字符串

B、由26個字母和數字組成的字符串

C、由26個字母組成的字符串

D、一個26個字母構成的字符串

正確答案: B

 

3、正則表達式:\d{3}-\d{8}|\d{4}-\d{7}能匹配哪個?‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬

A、01012345678

B、010-12345678

C、010-1234567

D、0521-12345678

正確答案: B 

\d{3}-\d{8}|\d{4}-\d{7}

表示:3個數字-8個數字    或者 4個數字-7個數字

4、re庫可以使用如下方式表示正則表達式:r'[1-9]\d{5}',其中r是什麼意思?‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬

A、正則表達式標記

B、開始位置標記

C、強制標記

D、原生字符串標記

正確答案: D 

字符串包括:普通字符串和原生字符串,原生字符串中沒有轉義符(\)。

5、正則表達式:^[A-Za-z]+$的含義是什麼?‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬

A、由26個字母和數字組成的字符串

B、由26個字母和特殊字符d組成的字符串

C、由26個字母組成的字符串

D、由字母a和z、A和Z組成的字符串

正確答案: C 

以下這些操作符是正則表達式中最常用的

 

6、正則表達式:^-?\d+$的含義是什麼?‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬

A、由26個字母和數字組成的字符串

B、一個帶有負號的數字字符串

C、一個整數形式的字符串

D、由26個字母組成的字符串

正確答案: C 

以下這些操作符是正則表達式中最常用的:

7、正則表達式:^[0-9]*[1-9][0-9]*$的含義是什麼?‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬

A、由0到9數字組成的字符串

B、數字和*組成的字符串

C、正整數形式的字符串

D、整數形式的字符串

正確答案: C 

 

8、正則表達式:[1-9]\d{5}的含義是什麼?‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬

A、由0到9數字組成的字符串

B、長度爲5的正整數形式字符串

C、首位不爲0的6長度數字形式字符串

D、整數形式的字符串

正確答案: C 

 

9、正則表達式:[\u4e00-\u9fa5]的含義是什麼?‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬

A、一個在\u4e00到\u9fa5之間的字符

B、由\u4e00到\u9fa5字符組成的字符串

C、由\u4e00到\u9fa5中一個或多個字符組成的字符串

D、\u4e00或\u9fa5

 正確答案: A 

 

10、Beautiful Soup庫與re庫之間關係,描述正確的是:‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬

A、Beautiful Soup庫中可以加載re庫

B、re庫中可以加載Beautiful Soup庫

C、re庫能實現HTML解析,功能上與Beautiful Soup庫類似

D、這兩個庫沒有關係

正確答案: D 

兩者沒關係,re庫以字符串模式匹配與檢索方式提取信息,與Beautiful Soup庫不同。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章