對(duì)于網(wǎng)站被鏡像,網(wǎng)上有不少文章的解決方法,什么百度投訴、絕對(duì)地址、修改.htaccess等等,但這些都不能快速看到效果,今天解決了手里一個(gè)站的惡意鏡像問(wèn)題,有些心得,給大家介紹一種簡(jiǎn)單、快速的解決方法,寫(xiě)出來(lái)給大家分享出來(lái)。
惡意鏡像,也叫惡意克隆,惡意解析,是指有人通過(guò)域名 A 記錄直接解析別人 IP 地址,從而得到一個(gè)在訪問(wèn)者眼中完全相同網(wǎng)站的過(guò)程。其工作原理基本上是這樣子的:有用戶訪問(wèn)鏡像站點(diǎn)時(shí),程序就會(huì)來(lái)正版的站點(diǎn)查詢數(shù)據(jù),并修改相關(guān)鏈接然后呈獻(xiàn)給用戶,實(shí)質(zhì)上還是在讀取原站的數(shù)據(jù)。嚴(yán)謹(jǐn)一點(diǎn)的解釋?zhuān)和ㄟ^(guò)復(fù)制整個(gè)網(wǎng)站或部分網(wǎng)頁(yè)內(nèi)容并分配以不同域名和服務(wù)器,以此欺騙搜索引擎對(duì)同一站點(diǎn)或同一頁(yè)面進(jìn)行多次索引的行為 。
網(wǎng)站被鏡像的危害
通俗的講,惡意鏡像者意圖利用自己有一定權(quán)重的域名進(jìn)行威壓,通過(guò)某些手段復(fù)制了你的站點(diǎn),除了域名不一樣之外,其他內(nèi)容一模一樣,用戶或許根本無(wú)法分辨。甚至對(duì)于一些新的站點(diǎn),搜索引擎都會(huì)迷惑到底哪個(gè)是真的站點(diǎn),那么就有可能正牌的網(wǎng)站被刪除收錄,而盜版的卻被搜索引擎青睞。
雖然目前我們還不知道惡意鏡像我們的網(wǎng)站到底有什么意圖,但肯定對(duì)我們沒(méi)什么好處,如果他這個(gè)域名有點(diǎn)什么不健康的信息,那么我們被鏡像的站點(diǎn)有可能被污染掉,所以還是要警惕這個(gè)現(xiàn)象。
如何知道自己的網(wǎng)站是否被鏡像
復(fù)制自己網(wǎng)站的完整標(biāo)題(PS:查看自己站點(diǎn)首頁(yè)源碼),然后在谷歌和百度等搜索引擎里搜索,如搜索:網(wǎng)站建設(shè),如果有其他網(wǎng)站的網(wǎng)站標(biāo)題、描述及網(wǎng)站內(nèi)容跟你的一樣,只有域名不一樣,那就是被鏡像了。
如何處理網(wǎng)站被鏡像
這類(lèi)鏡像看似一個(gè)完整的站點(diǎn),其實(shí)上是每次用戶訪問(wèn)鏡像站點(diǎn),程序就會(huì)來(lái)正版的站點(diǎn)查詢數(shù)據(jù),并修改相關(guān)鏈接然后呈獻(xiàn)給用戶。實(shí)質(zhì)上還是在讀取原站的數(shù)據(jù)。以下龍笑天下就列舉幾種解決方法,大家自行取舍使用!
方法 1:查清鏡像網(wǎng)站的主機(jī) Ip,通過(guò)禁止 Ip 來(lái)解決
本教程基于 WordPress 程序,其他系統(tǒng)請(qǐng)自測(cè)!
1、獲取鏡像服務(wù)器 ip。注:這個(gè) IP 可能不是 ping 到他域名的 IP
復(fù)制如下代碼,新建一個(gè) php 文件,并命名為“ip.php”上傳到你的網(wǎng)站根目錄。
-
<?php
-
$file = "ip.txt";
-
$ip = $_SERVER['REMOTE_ADDR'];
-
$handle = fopen($file, 'a');
-
fwrite($handle, "IP Address:");
-
fwrite($handle, "$ip");
-
fwrite($handle, "
");
-
fclose($handele);
-
?>
2、然后訪問(wèn)你網(wǎng)站的鏡像站點(diǎn),在地址后面加.../ip.php,然后你就會(huì)在網(wǎng)站根目錄找到 ip.txt 文件了,打開(kāi)復(fù)制里面的 ip 地址。
3、然后打開(kāi)你的.htaccess 文件,在后面加上如下代碼(自行修改為剛剛獲得的 ip)
-
#添加IP黑名單
-
Order Deny,Allow
-
Deny from 162.158.72.179
當(dāng)然,如果你使用 CDN,可以直接在 CDN 后臺(tái)添加 ip 黑名單
這個(gè)時(shí)候你再刷新一下鏡像站點(diǎn),是不是已經(jīng) 403 報(bào)錯(cuò)了呢?這個(gè)時(shí)候已經(jīng)解決了這個(gè)鏡像站點(diǎn),然后就等待蜘蛛將其解決掉吧。
此方法的缺點(diǎn)就是如果鏡像網(wǎng)站更換了 ip,那我們的屏蔽就失敗了
方法 2:JS 來(lái)防護(hù)
在頭部標(biāo)簽:取自 @boke112 導(dǎo)航
<head></head>
里加上下面的 JS 代碼:
-
<script type="text/javascript">
-
if (document.location.host != "www.dococc.com") {
-
location.href = location.href.replace(document.location.host,'www.dococc.com');
-
}
-
</script>
或加上以下的 JS 代碼:
-
<script type="text/javascript">
-
rthost = window.location.host;
-
if (rthost != "www.dococc.com") {
-
top.location.href = "http://www.dococc.com";
-
}
-
</script>
注意:將上面代碼中的
www.dococc.com改為你網(wǎng)站的首頁(yè)主地址,如果我上面填寫(xiě)的不是我網(wǎng)站的主地址
www.dococc.com,而是 pweb.com 的話,就會(huì)導(dǎo)致網(wǎng)站一直刷新!
注:經(jīng)過(guò)本站測(cè)試,如果鏡像站屏蔽了 JS,則該方法失效。所以,最好把方法 2 和方法 3 結(jié)合使用!
(注意:以上方法感覺(jué)并不嚴(yán)嚴(yán)謹(jǐn),js代碼需要稍作修改,改成如下:)
-
<script type="text/javascript">
-
rthost = window.location.host;
-
if (!rthost.indexOf("facaicms.com")) {
-
top.location.href = "http://www.dococc.com";
-
}
-
</script>
方法 3:Js 被屏蔽后防止鏡像的方法
將以下代碼加到網(wǎng)站的 header.php 中:代碼取自 @boke112
-
<div style="display:none;">
-
<script>proxy2016 = false;</script>
-
<img src="" onerror='setTimeout(function(){if(typeof(proxy2016)=="undefined"){window.location.host="http://www.dococc.com";}},3000);'>
-
</div>
有些網(wǎng)站會(huì)屏蔽掉 JS 代碼(如下面的代碼) :
-
<script>...</script>
所以 <script>proxy2016 = false;</script> 代碼將被過(guò)濾掉,img 的 onerror 設(shè)置超時(shí)時(shí)間 3000 毫秒,將運(yùn)行函數(shù)部分,檢測(cè)是否還存在 proxy2016 字符,如果沒(méi)有找到就會(huì)將主機(jī)的 URL 改為 www.dococc.com;為了安全起見(jiàn),將 js 部分可以使用 js 代碼混淆(本站“JS 代碼混淆” 工具 或 站長(zhǎng)之家 JS 混淆工具)。
經(jīng)過(guò)我的測(cè)試,此代碼在 Chrome、IE11 和 360 極速瀏覽器上均有效,會(huì)跳轉(zhuǎn)到源站的原文章頁(yè)!在 Firefox 上則無(wú)效果,鏡像的文章頁(yè)并不會(huì)跳轉(zhuǎn)到原站...... 將代碼中 img 標(biāo)簽的 src 引用地址改為空格或無(wú)效的圖片地址后,在 Firefox 上也起作用了!
方法 4:借助 Img 的 Onerror 事件
代碼如下:
-
<div style="display:none;">
-
<script>tx = false;</script>
-
<img src="" onerror='setTimeout(function(){if(typeof(tx)=="undefined"){window.location.href="http://pw"+"eb123"+".com";}},3000);'>
-
</div>
為了防止域名被替換,我故意做了拆分,這是一個(gè)seTimeout函數(shù) 沒(méi)3秒執(zhí)行一次
這種方法,可以有效防止js或者script代碼被過(guò)濾,算是比較有效的一種方法。
方法 5:通過(guò)禁止某些 User Agent 特征來(lái)防
①、PHP 通用版:
將下面的代碼貼到網(wǎng)站入口文件 index.php 中的第一個(gè) <?php之后即可:
-
-
$ua = $_SERVER['HTTP_USER_AGENT'];
-
$now_ua = array('FeedDemon ','BOT/0.1 (BOT for JCE)','CrawlDaddy ','Java','Feedly','UniversalFeedParser','ApacheBench','Swiftbot','ZmEu','Indy Library','oBot','jaunty','YandexBot','AhrefsBot','MJ12bot','WinHttp','EasouSpider','HttpClient','Microsoft URL Control','YYSpider','jaunty','Python-urllib','lightDeckReports Bot','PHP');
-
if(!$ua) {
-
header("Content-type: text/html; charset=utf-8");
-
die('請(qǐng)勿采集本站,采集者木有小JJ');
-
}else{
-
foreach($now_ua as $value )
-
if(eregi($value,$ua)) {
-
header("Content-type: text/html; charset=utf-8");
-
die('請(qǐng)勿采集本站,采集者木有小JJ!');
-
}
-
}
②、Wordpress 適用版
如果使用上面的 php 版本,WordPress 每次更新就會(huì)需要操作 index.php,比較麻煩,因此弄個(gè)專(zhuān)版。
將下面的代碼貼到 functions.php 中的最后一個(gè) ?>之前即可:
-
-
add_action('wp_head', 'lxtx_deny_mirrored_request', 0);
-
function lxtx_deny_mirrored_request()
-
{
-
$ua = $_SERVER['HTTP_USER_AGENT'];
-
$now_ua = array('FeedDemon ','BOT/0.1 (BOT for JCE)','CrawlDaddy ','Java','Feedly','UniversalFeedParser','ApacheBench','Swiftbot','ZmEu','Indy Library','oBot','jaunty','YandexBot','AhrefsBot','MJ12bot','WinHttp','EasouSpider','HttpClient','Microsoft URL Control','YYSpider','jaunty','Python-urllib','lightDeckReports Bot','PHP');
-
if(!$ua) {
-
header("Content-type: text/html; charset=utf-8");
-
wp_die('請(qǐng)勿采集本站,采集者木有小JJ!');
-
}else{
-
foreach($now_ua as $value )
-
if(eregi($value,$ua)) {
-
header("Content-type: text/html; charset=utf-8");
-
wp_die('請(qǐng)勿采集本站,采集者木有小JJ!');
-
}
-
}
-
}
方法6:直接在服務(wù)端設(shè)置防盜鏈
(1)appach下的防盜鏈設(shè)置:在根目錄下創(chuàng)建.htaccess,里邊添加內(nèi)容:
-
RewriteEngine On
-
RewriteCond %{HTTP_REFERER} !^http:
-
RewriteCond %{HTTP_REFERER} !^$
-
RewriteCond %{HTTP_REFERER} !baidu.com [NC]
-
RewriteCond %{HTTP_REFERER} !google.com [NC]
-
RewriteCond %{HTTP_REFERER} !so.com [NC]
-
RewriteCond %{HTTP_REFERER} !qq.com [NC]
-
RewriteCond %{HTTP_REFERER} !weibo.com [NC]
-
RewriteCond %{HTTP_REFERER} !sm.cn [NC]
-
RewriteCond %{HTTP_REFERER} !sogou.com [NC]
-
RewriteRule .*.(jpe?g|gif|bmp|png|css|js)$ /statics/images/nopic.gif [R,NC,L]
RewriteCond %{HTTP_REFERER} !baidu.com代表放行域名,請(qǐng)放行自己域名以及搜索引擎的域名,可以根據(jù)自己需要添加,最下邊是指防止盜鏈的后綴,一般也就這些了。
(2)nginx防止盜鏈方法
-
#SECURITY-START 防盜鏈配置
-
location ~ .*.(gif|jpg|jpeg|png|bmp|swf|css|js)$
-
{
-
expires 30d;
-
access_log off;
-
valid_referers www.dococc.com m.facaicms.com facaicms.com;
-
if ($invalid_referer){
-
rewrite ^/ http:
-
#return 404;
-
}
-
}
如果原來(lái)有:
-
location ~ .*.(gif|jpg|jpeg|png|bmp|swf)$
-
{
-
expires 30d;
-
}
請(qǐng)找到,并且替換最上面的代碼
(3)CDN的方式,現(xiàn)在的免費(fèi)的cdn都可以設(shè)置防盜鏈已經(jīng)添加ip黑名單的功能,效果還不錯(cuò),如果不會(huì)代碼,可以試試這個(gè)!