原创 Google CEO施密特談移動計算、數字隱私和搜索的未來

當你有10億用戶的時候,總會有辦法賺錢的。我們會賺大錢,絕對的,相信我,沒錯的。在科技界,一般來說如果你有了一個有價值的平臺,你就可以此獲利。   我們嘗試找到未來的搜索是什麼樣的,我的意思是說我們依然樂於做一個搜索公司,但我們想以後也許

原创 討論任何主題之前,一定要準備好備選方案

    上個星期和同事們討論認證服務的架構,開始平臺的設計沒有安全方面的考慮,比如如何保護密碼傳輸的安全性。在沒有任何安全方面的方案的情況下,進行漫無目的的討論,也討論出了一個方案,但後來證明並不切實可行。     沒有任何方案,臨時在會

原创 Percona對MySQL標準版本的改進

http://www.penglixun.com/tech/database/percona_vs_mysql.html 週末有空讀了下Percona XtraDB對MySQL InnoDB的改進點,這裏給大家分享下。 一、對可擴展性

原创 領導喜歡員工的15種素質

01. Leadership 領導力 02. Interpersonal 人際關係 03. roblem solving 動手能力 04. Self-Motivation 自強不息 05. Efficien

原创 網絡io模型:epoll

epoll原理   在linux網絡編程中,很長時間使用select做事件觸發。select會隨着監聽fd的數目的增長而降低效率,因爲在實現中,它是採用輪詢的方式處理的,輪詢的fd數目越多,自然耗時就越多。對於IM服務器要支持上萬個鏈接,

原创 linux異步I/O——AIO

Linux的I/O機制經歷了一下幾個階段的演進: 1. 同步阻塞I/O: 用戶進程進行I/O操作,一直阻塞到I/O操作完成爲止。 2. 同步非阻塞I/O: 用戶程序可以通過設置文件描述符的屬性O_NONBLOCK,I/O操作可以立即返回,

原创 多串匹配-AC自動機

AC 自動機即  Aho-Corasick automation ,該算法在 1975 年產生于貝爾實驗室。AC 自動機是用來處理多串匹配問題的,即給你很多串,再給你一篇文章,讓你在文章中找這些串是否出現過,在哪出現。 AC自動機

原创 MapReduce和online實時訪問共存的一種架構——MongoDB

     這兩天閱讀有關MongoDB的技術文章,也一直在思考一個問題。使用MongoDB的MapReduce在做數據的統計運算時,如何不影響MongoDB提供的實時訪問服務。結合HBase的使用經驗,談談自己的體會。      這段時間

原创 搭建一個apache php mysql web服務器

1、在自己的服務器上安裝apache+php+mysql 下載apache,php,mysql   安裝apache: ./configure --prefix=/home/tianyong.wang/sys/apache --enabl

原创 和進程相關聯的用戶信息(讀unix高級編程筆記)

  和每個進程相關聯的用戶id和組id:     實際用戶id   實際組id                             我們實際上是誰   有效用戶id   有效組id   添加組id                   

原创 MapReduce在應用中,感受到的缺點

    MapReduce正在風靡世界,比如google的bigtable,yahoo的hadop/hbase,其核心之一就是MapReduce。簡單的說MapReduce的核心思想:1、數據在哪,運算在哪;2、多機器協同運算。    

原创 POSIX線程:線程私有數據

概念及作用   線程私有數據(thread-specify data,TSD)類似於全局變量,可以跨函數使用,區別是TSD是線程私有的。 創建和註銷 int pthread_key_create(pthread_key_t *key, v

原创 2010-09-02 早上和Jimmy討論近期的工作計劃

    Jimmy閱讀了我草擬的工作計劃表,同時即興討論了一些架構方面的問題。     我的工作計劃表不能描述整體的項目進度,時間上沒有整體的概念。     Session的存儲設計上,如何保持應用層和Session的透明。即如果應用層需

原创 要使自己的網站有明確的目標

      微博現在非常熱門,twitter已經有2億用戶了,國內也有很多網站在作,比如新浪,騰訊,搜狐。有時候我們要問問自己爲什麼要做微博?因爲微博很熱,所以想做微博,那我們做微博就不會成功。微博只是一種手段,比A8,他的使命是讓音樂無

原创 epoll 經驗談

1、首先需要一個內存池,目的在於:·減少頻繁的分配和釋放,提高性能的同時,還能避免內存碎片的問題;·能夠存儲變長的數據,不要很傻瓜地只能預分配一個最大長度;·基於SLAB算法實現內存池是一個好的思路:分配不同大小的多個塊,請求時返回大於請