原创 什麼是死鎖,簡述死鎖發生的四個必要條件,如何避免死鎖,解除死鎖

1.死鎖:如果一組進程中的每一個進程都在等待僅由該組進程中的其它進程才能引發的事件,那麼該組進程是死鎖的。 2.產生死鎖的原因: (1)競爭不可搶佔性資源。 (2)競爭可消耗資源。 當系統中供多個進程共享的資源如打印機,公用隊列等

原创 精講你對網站安全的建議

目前很多人都採用開源程序做網站,由於源碼公開,因此程序漏洞暴露明顯,很容易被黑! 安全專家建議大家參考以下部分安全建議,做好自身安全: (1)仔細查看安裝說明,切記修改默認數據庫名,並且一定要把擴展名改爲asp或者asa,因爲不

原创 Hession與Webservice的區別

Hessian:hessian是一個輕量級的remoting onhttp工具,使用簡單的方法提供了RMI的功能,相比WebService,Hessian更簡單、快捷。 採用的是二進制RPC協議,因爲採用了二進制協議,所以它很適合

原创 關於反爬蟲和惡意攻擊的一些策略和思路

摘要: 去年曾遇到過類似的百度爬蟲攻擊,積累了點經驗,文中的方法也很不錯,值得借鑑 前段時間Guang.com經常受到惡意spider攻擊,瘋狂抓取網站內容,一系列機器人spam發廣告,對網站性能有較大影響。 下面我說說

原创 redis 高可用解決方案

【轉自】http://warm-breeze.iteye.com/blog/2020413 本文主要介紹一種通過Jedis&Sentinel實現Redis集羣高可用方案,該方案需要使用Jedis2.2.2及以上版本(強制),Red

原创 深入理解分佈式事務

1、什麼是分佈式事務 分佈式事務就是指事務的參與者、支持事務的服務器、資源服務器以及事務管理器分別位於不同的分佈式系統的不同節點之上。以上是百度百科的解釋,簡單的說,就是一次大的操作由不同的小操作組成,這些小的操作分佈在不同的服務

原创 隨機種子

多數使用隨機數的計算器都有一個輸入端叫做種子。因此種子是用來幹什麼的?爲什麼你試圖改變它?你如何知道將它改變成什麼? 首先說說隨機。隨機是計算的一個問題,如果你輸入相同的命令將總是以相同的結果終止。使用數學計算器產生真實的隨機數這

原创 網絡爬蟲技術總結

摘要: 對於大數據行業,數據的價值不言而喻,在這個信息爆炸的年代,互聯網上有太多的信息數據,對於中小微公司,合理利用爬蟲爬取有價值的數據,是彌補自身先天數據短板的不二選擇,本文主要從爬蟲原理、架構、分類以及反爬蟲技術來對爬蟲技術進

原创 爬蟲技術淺析

摘要: 網絡爬蟲(Web crawler),是一種“自動化瀏覽網絡”的程序,或者說是一種網絡機器人。它們被廣泛用於互聯網搜索引擎或其他類似網站,以獲取或更新這些網站的內容和檢索方式。它們可以自動採集所有其能夠訪問到的頁面內容,以便

原创 高併發下的 Nginx 優化

高併發下的 Nginx 優化 我已經談過一些關於Nginx的常見問題; 其中有一些是關於如何優化Nginx. 很多Nginx新用戶是從Apache遷移過來的,因些他們過去常常調整配置和執行魔術操作來確保服務器高效運行. 我有一些

原创 動態緩存技術之CSI,SSI,ESI

平時我們談頁面,大都數是以頁面爲單位的。 一、CSI (Client Side Includes) 含義:通過iframe、javascript、ajax等方式將另外一個頁面的內容動態包含進來。 原理:整個頁面依然可以靜態化

原创 瞭解壓測

什麼是服務器壓力測試? 通過壓力測試對遊戲或應用服務器性能進行高壓測試,暴露出其所存在的問題 主要是從以下三個維度來衡量 • 響應時間:從用戶角度 • 服務器資源:從系統角度 • 吞吐量:從業務角度 爲什麼要做壓測?

原创 DML,DDL,DCL,DQL的區別

DML 英文縮寫   DML = Data Manipulation Language,數據操縱語言,命令使用戶能夠查詢數據庫以及操作已有數據庫中的數據的計算機語言。具體是指是UPDATE更新、INSERT插入、DELETE刪除。

原创 memcache集羣服務:memagent配置使用

magent是一款開源的memcached代理服務器軟件 地址:http://code.google.com/p/memagent/ 安裝magent到/usr/local/下 cd /usr/local mkdir mag

原创 [Pholcus爬蟲] 應對網站反爬蟲的多項策略

摘要: Pholcus如何應對網站反爬蟲策略? Pholcus應對網站反爬蟲的核心思想就是:模仿人工操作 具體應對策略如下: 1、 兩次請求之間進行隨機暫停 ,該時間可以在操作界面設置 2、 當不需緩存cookie時,設