科學松鼠會網站上不去
關於近期松鼠會網站有時無法訪問的解釋說明
科學松鼠會 發表於 2010-11-30 14:18
關於近期松鼠會網站頻頻發生的無法訪問的問題,和大家解釋壹下目前的最新情況。
隨著松鼠會網站訪問量越來越高,過去使用的虛擬服務器已不能滿足需要。因此11 月15日我們做了網站遷移,啟用了兩臺獨立的服務器,配置比過去要高,以滿足更大的訪問量需求。
從上周壹開始,發生過數次網站無法登錄的事故,直接原因都是數據庫連接數過 多。我們嘗試優化數據庫的配置文件,短時間內看起來數據庫並沒有壓力, 但經 過壹天的運行還是會發生類似的情況。從周三開始,這臺數據庫服務器突然出現無 法遠程登錄的問題,導致沒辦法直接查看服務器的狀態和優化配置, 只能讓機房 的技術人員協助檢查原因。由於機房的技術人員對Linux系統不很熟悉,最後也沒 有找到問題的根本原因。最終確定的方案是周六我們暫時 把數據庫遷移到臨時服務器上,他們幫我們重裝數據庫服務器的系統。
之後又發生了幾次連接過多的問題,都是通過重啟數據庫服務器來解決的。
周六重裝了數據庫服務器的系統,周六、日兩天網站運轉正常,服務器負載也很健 康。但周壹早晨再次出現之前的問題,並且據機房的工作人員說系統已無法登 錄,提示密碼錯誤,後來只能強行破解密碼。
截至目前,我們正在和機房協作排查原因,排查過程可能涉及到許多方 面,並且目前看問題的發生是沒有規律的。目前計劃除了現有技術人員排查外,我們還準備通過聘請外包的運維工程師來幫忙解決這個問題,
網站抽風訪問不易,我們都看在眼裏。再次向大家說聲抱歉。我 們壹定會加班加點找到問題的確切原因,爭取盡快解決這個問題。給大家壹個更明確的交代。