原创 Python 正則匹配數字

電話號碼:\d{3}-\d{8}|\d{4}-\d{7} QQ號:[1-9][0-9]{4,} 中國郵政編碼:[1-9]\d{5}(?!\d) 身份

原创 更改VMware虛擬機下Linux的IP地址

環境 centos6.5 1  打開虛擬機的網絡設置      編輯——虛擬機網絡編輯器         選擇NAT模式,找到下面的子網IP地址,你設置的IP需要和這個IP在同一網段,虛擬機的子網掩碼需和這裏的子網掩碼相同 2 編輯虛擬

原创 Python的時間函數處理

Python中的時間函數爲time一般有一下三種處理方式 import time print '當前時間距離1970年:time' print time.time() print '格式化時間戳:time.localtime(time

原创 centos設置阿里雲的源,安裝配置mysql

設置阿里雲的源 1 下載wget yum install wget -y 2 echo 備份當前的yum源 mv /etc/yum.repos.d /etc/yum.repos.d.backup4comex 3 echo 新建空的yum源

原创 VMware出現“This virtual machine appears to be in use.”錯誤

在虛擬機非正常斷電後經常出現無法正常打開虛擬機的情況,報錯: This virtual machine appears to be in use. If this virtual machine is not in use, press

原创 SyntaxError: Non-ASCII character '\xe5' in

環境 Python2.7  Ubuntu16 寫print 的時候,裏面有漢字就報錯,後來查了下Python默認編碼是ascll,所以纔會報錯 解決方案很簡單,在項目的開頭聲明UTF-8就可以了 # -*- coding: UTF-8 -

原创 UnicodeDecodeError: 'ascii' codec can't decode byte 0xef in position 458: ordinal not in range(128)

環境:Ubuntu  Python2.7 解決辦法: 1 命令行查找mimetypes.py路徑 #find  / -name mimetypes.py 2 打開mimetypes.py文件 早期版本: 在 import下一行添加sys

原创 Ubuntu語言設置漢語無法移動

今天新裝的Ubuntu系統,在設置默認語言的時候,發現安裝上簡體漢語後無法拉到上面 解決辦法 找到Ubuntu語言的配置文件 # gedit /etc/default/locale  把裏面改爲以下內容 #  File generated

原创 scrapy+spynner獲取ajax中的內容(以微信公衆號爲例)

現在越來越多的網站的使用ajax來動態加載數據,scrapy只能獲取靜態html中的數據,對於動態加載的就無能爲力了 spynner是一個模擬瀏覽器加載的工具,可以在後臺模擬ajax加載後的網頁,然後再通過scrapy進行爬取 原理就是在

原创 src/png_io.c:3:17: fatal error: png.h

安裝spynner的時候報錯 找了好半天才找到這個文件的位置 sudo apt-get install libpng16-dev 點贊 收藏 分享 文章舉報 LCYong_ 發

原创 解決ValueError('Missing scheme in request url: %s' % self._url)

使用scrapy的ImagesPipeline爬取圖片的時候,運行報錯 Traceback (most recent call last): File "/home/lcy/.local/lib/python2.7/site-pac

原创 反反爬蟲------設置scrapy隨機user_agents

在我們使用爬蟲的時候,總會遇到一些網站規則,限制我們去爬取,其中一個就行限制瀏覽器請求頭 我們可以設置一個user_agent的列表,然後隨機抽取其中的一個作爲瀏覽器請求頭,這樣每次訪問網站就可以使用不同的瀏覽器請求頭了 在setting

原创 java刪除指定目錄下指定格式文件

正在看瘋狂java講義這本書,發現源碼中有我不需要的class文件,想批量把它刪除 代碼如下: import java.io.File; public class Main { static int count = 0;

原创 render() must be called with a dict, not a Context. return HttpResponse(t.render(c))解決

報錯說render()只能傳入字典 錯誤的代碼: def index(request): t=loader.get_template("index.html") title={"title":"hello Django"}

原创 java性能優

字符串 判斷字符串開頭結尾等可使用charAt(索引),該方法根據索引返回該位置的值 分割字符串 使用indexOf(字符),該方法返回第一個字符的