Python使用中常見問題總結(四)

尊敬的讀者您好:筆者很高興自己的文章能被閱讀,但原創與編輯均不易,所以轉載請必須註明本文出處並附上本文地址超鏈接以及博主博客地址:https://blog.csdn.net/vensmallzeng。若覺得本文對您有益處還請幫忙點個贊鼓勵一下,筆者在此感謝每一位讀者,如需聯繫筆者,請記下郵箱:[email protected],謝謝合作!

 

 

 

一、字符串中插入字符串

原始表all_available_features_plus_new.txt結構:用戶id \001 特徵...\001特徵...特徵 \001 label

問題:在原始特徵表all_available_features_plus_new.txt中追加特徵,即在label前一個特徵後插入待追加特徵,然後將構成好的新樣本寫入新特徵表all_available_features_plus_new_add.txt中。

with open("all_available_features_plus_new.txt", 'r', encoding='utf-8') as f:
    lines = f.readlines()
    lines_new = ""
    for line in lines:
        line_tmp = ""
        line_cut = line.split('\001')
        l1 = len(line.strip())
        #獲取所有待加入特徵,並拼接成字符串line_tmp
        for i in user_time_new[line_cut[0]]:
          #  print(str(i))
            line_tmp = line_tmp + str(i) + '\001'
        ##將line_tmp字符串插入到label與前一個特徵之間,形成新字符串line_new
        #先變成list,因爲list纔有insert功能
        line = list(line)
        #print(line_tmp)
        #插入line_tmp字符串
        line.insert(l1-1, line_tmp)
        #將list變回新字符串line_new
        line_new = ''.join(line)
        #構造追加新特徵後的所有樣本
        lines_new = lines_new + line_new
f.close()

將構成好的新樣本寫入新特徵表all_available_features_plus_new_add.txt中

file_handle = open('all_available_features_plus_new_add.txt', 'w', encoding='utf-8')
file_handle.write(lines_new)
file_handle.close()

 

 

 

 

日積月累,與君共進,增增小結,未完待續。

發佈了150 篇原創文章 · 獲贊 143 · 訪問量 11萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章