幫一個網友寫的代碼,用正則表達式抽出漢字和郵編到字典中

幫一個網友寫的代碼,用正則表達式抽出漢字和郵編到字典中

#coding:utf-8
import re
"""
本代碼由黃老師(python愛好者,qq:1465376564)所寫.

怎麼把下面這段字符串轉化爲字典格式(例如: '北京':'101010100', '朝陽':'101010300' )?

“北京101010100朝陽101010300順義101010400懷柔101010500通州101010600昌平101010700延慶101010800豐臺101010900石景山101011000大興101011100房山101011200密雲101011300門頭溝101011400平谷101011500八達嶺101011600佛爺頂101011700湯河口101011800密雲上甸子101011900齋堂101012000霞雲嶺101012100北京城區101012200”

"""

str1 ="北京101010100朝陽101010300順義101010400懷柔101010500通州101010600昌平101010700延慶101010800豐臺101010900石景山101011000大興101011100房山101011200密雲101011300門頭溝101011400平谷101011500八達嶺101011600佛爺頂101011700湯河口101011800密雲上甸子101011900齋堂101012000霞雲嶺101012100北京城區101012200"
tuples = re.findall(ur"([\u4e00-\u9fa5]+)(\d+)",str1.decode('utf8'))

dic1 = dict(tuples)
for key in dic1:
   print key.encode('utf-8')+':'+dic1[key].encode('utf-8')

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章