網站被黑現在越來越常見,不僅中國,全世界都一樣。Google官方博客 3 月份的一篇帖子提到,被黑的網站數目 2016 年比 2015 年增加了32%,而且沒有減緩的趨勢。我本身就是賣服務器的,每天在后臺看到的掃描端口、撞密碼、利用CMS漏洞注入之類的太多太多了。
為SEO而黑別人網站是其中一個原因,黑進別人網站后,可以創建頁面,在現有頁面加內容、加鏈接,做轉向,做cloaking等等。當然,SEO只是比較小的原因,更多的黑客是為了干別的。
其實我是覺得,黑別人網站,不是SEO,連黑帽SEO也不是。雖然我不提倡做黑帽SEO,但對黑帽是充滿敬意的。這里有個前提,黑帽SEO不管怎么作弊、折騰,是在自己的網站折騰,黑進別人網站,去折騰別人網站,就跨過底線了。
自己網站被黑了怎么辦?怎樣恢復呢?可能出現的情況非常多,這里只能簡單舉個例子。
首先,注冊百度站長平臺、Google Search Console是必須的,就算是中文網站,沒什么谷歌流量,也要注冊Google Search Console,Google如果發現網站被黑,會在Search Console中給站長留言的。
然后,經常在百度、Google用site:指令,以及“site:domain+敏感關鍵詞”看看自己網站有沒有什么不該出現的標題和描述。敏感關鍵詞可以從色情、賭博開始,再往醫療、法律服務之類的擴展。
舉個例子。現在在百度搜索“托福代考”,第一頁結果如下圖:
(未來看到這個帖子的讀者請注意,過一陣搜索結果不一定是這個樣子了。)
看到里面以“托福代考_托福代考_百度_知道“為標題的那些獨立域名網站了吧,一看這架勢就能肯定,都是被黑了。翻到第二頁就更整齊了:
我翻了三四十頁,都是這個樣子,看來風頭不小。可以看到,留下的QQ號很多是一樣的。沒時間仔細去研究這些網站之間的關系,但被黑的網站域名大多是公司名的漢語拼音首字母、沒任何英文意義的字母組合。訪問了其中一些網站,大部分打開都非常慢。
挑了一個域名看著還算順眼的網站打開,看著挺正常的:
貌似沒有問題,但百度快照是被黑的版本:
可以看到,正常頁面模板,正文處加了關鍵詞。很多被黑的網站顯示的都是這個天津廣播網的頁面。
也許站長已經注意到被黑了,所以已經清理了代碼?所以訪問網站看到的不是百度快照的內容?這些圖都是 5 月 10 號抓的,百度快照是 5 月 7 號,挺新的,這么巧站長在這 3 天清理了網站?為確認,把我的瀏覽器UA改為百度蜘蛛再看看(也就是瀏覽器模仿成百度蜘蛛訪問網站),結果是這樣:
所以,黑客做了cloaking,給百度蜘蛛看到的內容和真實用戶看到的是不一樣的。也許被黑后一直是這樣做的,這個網站站長根本沒發現,也許站長發現被黑了,以為已經清理了代碼,自己訪問看著沒問題,其實還是沒清理干凈,百度蜘蛛抓的還是被黑內容。
再看另一個網站的快照:
除了天津廣播網,這個中國新聞網頁面也是很多被黑網站常用的。訪問網站也是看著正常的。把瀏覽器UA改為百度蜘蛛看到的是這個:
看來做的挺精細,還在輪換關鍵詞呢,做完托福,再做GRE。
如果自己網站被黑了,除了瀏覽器UA改為百度蜘蛛看看是否有cloaking,還要在百度站長平臺的抓取診斷部分,用真正的百度蜘蛛抓一下,看看內容是否異常。有的網站用程序檢測用戶IP地址,然后反查IP是否是真的百度蜘蛛,所以上面使用的改瀏覽器UA的方法不一定能在100%的情況下模仿百度蜘蛛,站長平臺里的抓取診斷就真的是百度蜘蛛了。
如果確認百度蜘蛛抓的是正常內容,快照還是不更新,可能需要等一段時間,百度的抓取、建庫是挺慢的,1- 2 個星期都正常。
至于被黑的原因,最常見的是CMS系統漏洞,這個例子里貌似不像,被黑的網站用什么系統的都有,有用dede的,有discuz的,有WP的,還有什么北方網系統的。
另一個常見的是密碼太簡單,或用的缺省設置,或多個賬號共用相同密碼,還有電腦被染上病毒等等,都可能造成密碼被攻破。
有的時候是整個服務器漏洞,比如這批被黑的網站不少是在120.133.3.xxx這個IP段上,可能和主機商的設置有關,但主機漏洞情況并不常見。
網站被黑的情況五花八門,防止被黑要做的也很多,我不是網絡安全專家,就不瞎說了,SEO們還是需要了解一些安全知識的。