

網(wǎng)站崩潰、主機(jī)流量超標(biāo)?這些問(wèn)題不僅嚴(yán)重影響正常運(yùn)營(yíng)和用戶體驗(yàn),還直接推高了成本。背后的一大主因,正是日益流行的“AI機(jī)器人”。
AI機(jī)器人,它們爬取網(wǎng)站,要么訓(xùn)練大型語(yǔ)言模型,要么獲取內(nèi)容,以豐富推理時(shí)的模型響應(yīng)。Fastly報(bào)告中指出,AI爬蟲(chóng)已占機(jī)器人流量的80%,而抓取機(jī)器人構(gòu)成了剩余的20%。
從AI爬蟲(chóng)的流量趨勢(shì)來(lái)看,近幾個(gè)月Meta的爬蟲(chóng)呈上升趨勢(shì)。大多數(shù)爬蟲(chóng)流量波動(dòng)明顯,有時(shí)難以察覺(jué),有時(shí)卻突然飆升至平常的2–3倍,持續(xù)數(shù)日甚至數(shù)周。
雖然一些AI機(jī)器人表現(xiàn)良好,但對(duì)于一些沒(méi)有精心設(shè)計(jì)的AI機(jī)器人,可能會(huì)導(dǎo)致大量消耗帶寬和流量、未經(jīng)授權(quán)使用網(wǎng)站內(nèi)容以及網(wǎng)站分析失真。
這些大規(guī)模的AI爬蟲(chóng)機(jī)器人可能會(huì)導(dǎo)致流量激增,帶來(lái)異常多的訪問(wèn)量,占用流量和帶寬。如果沒(méi)有有效的控制措施,即使是短暫的活動(dòng)突發(fā)也會(huì)導(dǎo)致網(wǎng)站速度變慢、超時(shí)或中斷。
而AI抓取機(jī)器人它們以極高速度抓取內(nèi)容,對(duì)未加防護(hù)的站點(diǎn)造成劇烈沖擊。報(bào)告中的案例,一個(gè)抓取器峰值請(qǐng)求可能達(dá)每分鐘39,000次,相當(dāng)于普通網(wǎng)站每分鐘遭受上千次請(qǐng)求,持續(xù)處于超載狀態(tài)。即便出于非惡意目的,高頻率請(qǐng)求也極易引發(fā)類似DDoS的效果,同時(shí)干擾數(shù)據(jù)分析、損害用戶體驗(yàn)。
因此,建議網(wǎng)站所有者在運(yùn)營(yíng)過(guò)程中,監(jiān)控主機(jī)流量消耗情況,及時(shí)分析流量超標(biāo)原因和實(shí)施應(yīng)對(duì)措施。這樣才能更好避免AI機(jī)器人導(dǎo)致的主機(jī)流量異常過(guò)高的情況。
面對(duì)流量超標(biāo),如何快速定位與解決?以下是核心應(yīng)對(duì)方案。
一、流量監(jiān)控
「虛擬主機(jī)流量使用詳情」功能,提供近近12個(gè)月和近30天的流量統(tǒng)計(jì)圖,實(shí)時(shí)監(jiān)控流量波動(dòng),避免突發(fā)超額,快速定位異常。(功能詳情:http://youyuetrip.com/paas/vhost/flux)
云服務(wù)器可以在控制面板中觀察對(duì)比最近24小時(shí)和最近30天的流量變化情況。
二、流量超標(biāo)
分析解決思路:查看網(wǎng)站訪問(wèn)統(tǒng)計(jì) - 結(jié)合訪問(wèn)統(tǒng)計(jì)分析網(wǎng)站訪問(wèn)日志 - 確定原因采取相應(yīng)措施。
1、查看網(wǎng)站訪問(wèn)統(tǒng)計(jì)
(1)登錄到虛擬主機(jī)管理面板,點(diǎn)擊“訪問(wèn)統(tǒng)計(jì)”和“流量分析”
(2)先查看訪問(wèn)統(tǒng)計(jì),確定流量類型,包括瀏覽器和非瀏覽器。
(3)根據(jù)流量類型詳細(xì)查看訪問(wèn)統(tǒng)計(jì)數(shù)據(jù):
A.瀏覽器流量占用高,可查看url網(wǎng)址、主機(jī)ip、搜索引擎機(jī)器人等統(tǒng)計(jì)數(shù)據(jù),以確定網(wǎng)站中是哪類文件,哪些url地址被大量訪問(wèn),以及是哪些IP,哪些蜘蛛等訪問(wèn)量大。
B.非瀏覽器流量占用高,可查看http報(bào)錯(cuò)碼,確定是什么狀態(tài)情況下產(chǎn)生的非瀏覽器流量。
2、分析網(wǎng)站訪問(wèn)日志
根據(jù)網(wǎng)站訪問(wèn)統(tǒng)計(jì)中按“按日期統(tǒng)計(jì)”數(shù)據(jù)找一天流量較大的日志下載至本地使用記事本編輯器打開(kāi)對(duì)日志具體分析核實(shí)。
3、解決措施
(1)啟用「防盜鏈」功能
某類文件被外部盜鏈,導(dǎo)致主機(jī)流量被大量消耗,為避免不必要的流量消耗和潛在的安全風(fēng)險(xiǎn),建議啟用防盜鏈功能,僅允許您的域名訪問(wèn)資源,阻止外部盜鏈。
虛擬主機(jī)防盜鏈設(shè)置:http://youyuetrip.com/faq/list.asp?unid=628
西部數(shù)碼虛擬主機(jī)系統(tǒng)會(huì)在當(dāng)天流量大于50G或當(dāng)天流量大于月流量30%的異常情況下,自動(dòng)幫用戶啟用“防盜鏈”功能,以免異常流量過(guò)多。
云服務(wù)器防盜鏈流程:http://youyuetrip.com/faq/list.asp?unid=553
(2)虛擬主機(jī)可使用「請(qǐng)求限制」功能
網(wǎng)站流量出現(xiàn)突增,可能是由于AI機(jī)器人爬蟲(chóng)和抓取,導(dǎo)致異常訪問(wèn)過(guò)高,可使用「請(qǐng)求限制」功能,可以禁止境外訪問(wèn),或拒絕某些IP段的訪問(wèn),也可以限制單個(gè)IP同時(shí)訪問(wèn)的數(shù)量等。
(3)屏蔽攔截蜘蛛抓。ㄌ摂M主機(jī)和云主機(jī)均適用)
其他某搜索引擎蜘蛛、IP、useragent等導(dǎo)致流量超標(biāo)異常的?赏ㄟ^(guò)web.config或.htaccess進(jìn)行攔截屏蔽。
apache、iis規(guī)則屏蔽攔截蜘蛛抓取:http://faq.myhostadmin.net/faq/list.asp?unid=662
apache、iis屏蔽限制ip訪問(wèn):http://faq.myhostadmin.net/faq/list.asp?unid=681
如果是正常的搜索引擎蜘蛛訪問(wèn),不建議對(duì)蜘蛛進(jìn)行禁止,否則可能會(huì)影響網(wǎng)站在百度等搜索引擎中的收錄和排名。
(4)升級(jí)主機(jī)
正常訪問(wèn)情況主機(jī)流量配置低導(dǎo)致超標(biāo)。如占用流量的文件類別、url網(wǎng)址、搜索蜘蛛、訪問(wèn)IP等數(shù)據(jù)都較均衡,無(wú)明顯差異等。請(qǐng)升級(jí)主機(jī)至流量配額更大的型號(hào),如獨(dú)享虛擬主機(jī)(流量配額較大),或不限流量的云服務(wù)器。
(5)圖片處理
網(wǎng)站頁(yè)面數(shù)據(jù)過(guò)大導(dǎo)致流量超標(biāo)。如首頁(yè)中加載的圖片過(guò)大,同時(shí)圖片設(shè)計(jì)過(guò)大等,可聯(lián)系網(wǎng)站程序方人員減少頁(yè)面的圖片數(shù),減小圖片大小等方式處理。
更多關(guān)于網(wǎng)站流量超標(biāo)排查和應(yīng)對(duì)措施,點(diǎn)擊查看:http://youyuetrip.com/faq/list.asp?unid=2452
(6) 購(gòu)買(mǎi)安全產(chǎn)品進(jìn)行攔截防護(hù)
參考報(bào)告:
https://learn.fastly.com/rs/025-XKO-469/images/Fastly-Threat-Insights-Report.pdf
400-028-5800
028-62778877
您好,非正常上班時(shí)間若有緊急技術(shù)問(wèn)題,請(qǐng)撥總機(jī)后按7號(hào)鍵, 其他問(wèn)題請(qǐng)?zhí)峤还位蛟谏习鄷r(shí)間聯(lián)系,謝謝支持!