python對list去重的各種方法

原創

2018-12-22 12:53

原文鏈接：https://www.the5fire.com/python-remove-duplicates-in-list.html

直觀方法

最簡單的思路就是：


ids = [1,2,3,3,4,2,3,4,5,6,1]
news_ids = []
for id in ids:
    if id not in news_ids:
        news_ids.append(id)
 
print news_ids

這樣也可行，但是看起來不夠爽。

用set

另外一個解決方案就是用set：


ids = [1,4,3,3,4,2,3,4,5,6,1]
ids = list(set(ids))

這樣的結果是沒有保持原來的順序。

按照索引再次排序

最後通過這種方式解決：


ids = [1,4,3,3,4,2,3,4,5,6,1]
news_ids = list(set(ids))
news_ids.sort(key=ids.index)   # 感謝網友：@Magic 指正。

使用itertools.grouby

文章一開始就提到itertools.grouby, 如果不考慮列表順序的話可用這個：


ids = [1,4,3,3,4,2,3,4,5,6,1]
ids.sort()
it = itertools.groupby(ids)
 
for k, g in it:
    print k

關於itertools.groupby的原理可以看這裏：http://docs.python.org/2/library/itertools.html#itertools.groupby

網友補充：用reduce

網友reatlk留言給了另外的解決方案。我補充並解釋到這裏：


In [5]: ids = [1,4,3,3,4,2,3,4,5,6,1]
 
In [6]: func = lambda x,y:x if y in x else x + [y]
 
In [7]: reduce(func, [[], ] + ids)
Out[7]: [1, 4, 3, 2, 5, 6]

上面是我在ipython中運行的代碼，其中的 lambda x,y:x if y in x else x + [y] 等價於 lambda x,y: y in x and x orx+[y] 。

思路其實就是先把ids變爲[[], 1,4,3,......] ,然後在利用reduce的特性。reduce解釋參看這裏：http://docs.python.org/2/library/functions.html#reduce

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

pymongo.errors.CursorNotFound: cursor id 1058082xxxxxxxx not found mongo索引超時

一，超時原因數據量太大，mongo 的性能處理不過來數據在處理過程中太耗時二，解決方案爲find() 函數設置 no_cursor_timeout = True，表示遊標連接不會主動關閉（需要手動關閉） items

2020-07-08 12:43:13

python下載地址，windows和mac的都有下載地址

下載安裝的路徑我截圖了，這個是windows的，mac在最下面：地址：https://pan.baidu.com/s/1X7dB_D_xqL878cMeYSvCFw 提取碼：eofi 提取二維碼：下載成功後，新建文件夾，做

2020-07-08 07:54:27

OpenCV讀取中文路徑圖像

引言這幾天做點小東西，涉及到OpenCV讀取中文圖像的問題如果直接讀取中文路徑的圖像，往往返回[] import cv2 cv_im = cv2.imread(‘老乾媽.jpg’) 緣起偶然發現opencv 讀取圖

2020-07-08 01:09:29

ftp-client-1

使用語言：python 2.7 主要模塊：ftplib 主要使用一個while循環，沒有進行完整的異常處理，根據實際需求情況修改！ #coding=utf-8 from ftplib import FTP import sys,

2020-07-07 12:48:50

pyftpdlib代碼初印象

添加用戶 from pyftpdlib.authorizers import DummyAuthorizer authorizer = DummyAuthorizer() authorizer.add_user('user',

2020-07-07 12:48:50

pyftpdlib代碼實戰

新建一個基本的ftp服務器 from pyftpdlib.authorizers import DummyAuthorizer from pyftpdlib.handlers import FTPHandler from pyft

2020-07-07 12:48:50

ftp-client-2

編程語言：python 2.7 主要模塊：ftplib 使用cmd模塊實現交互，沒有完整的異常處理，根據實際情況修改！ #coding=utf-8 from cmd import Cmd from ftplib import

2020-07-07 12:48:50

python腳本導出Elasticsearch數據到csv文件

以下是個導出es數據到csv文件的簡單腳本，腳本簡單易懂，主要解決了兩個問題： Elasticsearch數據含中文寫入csv文件會亂碼 unicode編碼的中文數據寫入csv文件會亂碼 from elasticsearch impor

2020-07-07 11:22:13

python基礎之列表推導式

例1： >>> List=[x for x in range(10)] >>> List [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 等價於： >>> List=[] >>> for x in range(10):

2020-07-07 08:38:39

Sublime text3修改tab鍵爲縮進四個空格

在用sublime寫python腳本時，如果混用空格和tab，可能會報錯，因此可以設置將tab改爲4個空格，以便統一格式。添加上圖紅框處代碼即可 # 設置保存時自動轉換 "expand_tabs_on_save": true

weixin_43178406

2020-07-06 18:37:46

Python快樂之旅（基礎知識彙總）

點擊就可以跳轉到相關文章了。一、Python語言介紹 Python語言介紹 Python語言的設計哲學編譯型語言和解釋型語言的區別 Python語言類型二、Python開發環境以及開發工具搭建Python開發環境 P

Liuyuelinjiayou

2020-07-06 18:06:36

datetime的操作

from datetime import date, time, datetime, timedelta, tzinfo 1. datetime模塊簡介 python中關於時間的格式：時間對象格式struct_time（

weixin_43178406

2020-07-06 18:01:18

sklearn中f1_score參數解析

1. f1_score sklearn.metrics.f1_score(y_true, y_pred, labels=None, pos_label=1, average=‘binary’, sample_weight=None

weixin_43178406

2020-07-06 18:01:18

python使用flask封裝restful API

1. 簡介使用flask封裝，簡單來講就是將python文件引入flask。這樣的結果就是在網頁上輸入一個url就能得到結果。下面就講如何進行實現。 2. 任務1：求兩數之和 2.1 代碼講解新建一個server.py的文件，

weixin_43178406

2020-07-06 18:01:18

java與python類對比

1. 構造器方法和變量 super、self、this 4. python代碼實例 class Test(): # 類屬性 country = '中國' province = '陝西省' c

weixin_43178406

2020-07-06 18:01:18

24小時熱門文章

最新文章

最新評論文章