寫在前面
因爲之前做完後(當畢業設計做的)爲了儘量實用打了個exe,結果好多人反應問題,索性直接把代碼、更新exe的鏈接都寫個博客放在這裏(這麼晚才放出源碼就是怕畢設查重……)
全部項目源碼git及說明:https://github.com/naturalcaduceus/picSniffer
打exe包時遇到的問題: https://blog.csdn.net/sinat_27382047/article/details/81304065#comments
最初的demo:https://blog.csdn.net/sinat_27382047/article/details/80051091#comments
打包的exe
嗅圖狗0.9(都說有錯誤,但是在我的電腦上卻正常……):https://pan.baidu.com/s/1BSFGMbyQk1Fqgo4zL5WX4A
腳本裸露的打包exe:
以後看看能不能找到錯誤,更新放出消除錯誤的版本……
這就是界面截圖
功能
正文開始
本人熱衷於蒐集資源(老司機嘿嘿嘿……),常常看到某些貼吧上的圖片然後存到電腦上,最後當想找的時候根本找不到QAQ……於是想法誕生於“畫個草圖就能在文件夾裏找到想找到的圖” (其實最後實現的並不理想),但是爲了這個功能卻實現了很多基礎的特徵搜索(主色調搜索、Dhash特徵值……),於是這個軟件就誕生了。
在網上找到的已有本地識圖工具不是試用收費就是生成一大堆緩存不好用,下面列出我找到的本地識圖工具
- 鏈圖雲:【吐槽:識圖過程產生大量的縮略圖佔用空間而且識圖緩慢。】
- 靈動搜圖:即GiSeek。【吐槽:很多功能還必須是註冊版纔可使用。】
- yitusoutu/以圖搜圖:欣思軟微製作的一款軟件。【吐槽:打開顯示“未找到超級狗”???搜了一下超級狗是加密用的,做的不怎麼樣還特麼加密了?】
- Visual Similarity Duplicate Image Finder:主要目的是幫助用戶在文件夾中查找相同或重複的圖片文件。【吐槽:只能是找重複圖片】
- Picasa3:它能搜索瀏覽自己的計算機的所有圖片,整理照片等等功能。【吐槽,是個好用的圖片瀏覽分類工具……】
其實……界面最開始纔是讓人煩惱的東西,想用C#試過IronPython(結果只支持py2.7),最後老老實實用python自帶的tkinter庫了(推薦B站“莫煩python”的視頻)……
識圖功能
在網上搜到的理論一大堆,識圖算法的代碼卻零零散散,尤其是找到了算法還得明白人家寫的怎麼用……有的壓根沒有算法找,只能自己硬生生想……我下面放出所有我實現的功能有用的鏈接,給也想做圖像相似比對的同學們一些方便(*^_^*)
dhash特徵值比對
感謝:https://segmentfault.com/a/1190000004467183
直方圖比對
感謝:https://segmentfault.com/a/1190000004467183
主色調比對
實用簡單代碼:https://blog.csdn.net/u010196573/article/details/16846173
太複雜了沒用到……:https://blog.csdn.net/lhh31/article/details/52015500
SIFT特徵比對(實現小圖找全圖)
用上了opencv庫內的sift特徵函數。
感謝: https://blog.csdn.net/abcjennifer/article/details/7365882
人臉識別(我現在只是:框選人臉,再借助比對算法大致識別,不是特製的算法)
用到了opencv的heer特徵
感謝(這個找的久,用起來也難……):https://www.cnblogs.com/panlangen/p/7896448.html
篩選、甄別功能
不用於圖像比對的但是很用的到一些功能……
圖片查重(文件夾遍歷)
根據那些算法就能實現一些批量功能了~
文件夾遍歷方法總結:https://blog.csdn.net/sinat_27382047/article/details/80172708
推薦文件夾內相似圖片(tensorflow模型讀圖怎麼用)
自己的血淚求源史T-T: https://blog.csdn.net/sinat_27382047/article/details/80534234
感謝:https://blog.csdn.net/White_Idiot/article/details/78816850
色情圖片識別
可直接用:https://blog.csdn.net/oxuzhenyi/article/details/55000520
識別文字(Tesseract-OCR)
感謝:https://blog.csdn.net/qiushi_1990/article/details/78041375
總結
發現花了那麼長時間(3個月)做完的東西,時間多用於搜索、篩選(找到簡單能用易實現的、去除那些看起來很高大上但是自己用不起的理論……看了看自己的“畢設收藏夾”,有130+的收藏……有現成能用的代碼的卻不超過10個……)也走過徐徐多多的彎路(比如去嘗試自己用2個星期時間訓練出圖片分類模型……)【成品所呈現的……真是冰山一角,有許許多多嘗試過的不可行的東西呈現不出……】,還有繁瑣的小功能,圖片格式轉換,使用根本沒接觸過的東西……,不過本來目標就是從完全不會的python寫一個實用的程序(讓我高興的是,貌似真的有人需要這種工具,知乎上還私信我打不開的問題,讓我有點欣慰。)