您的当前位置:主页 > 新闻资讯 > 技术交流
总结搜索引擎蜘蛛抓取不到页面的原因及改善措
作者: admin 发布时间: 2020-01-02 13:47

    在诊断过程中,我们会遇到这样的问题.有些网页内容很好,用户可以正常访问.然而,搜索引擎蜘蛛只是不能正常访问和抓取它们,导致搜索结果覆盖率不足,这是等搜索引擎和网站的损失.称之为"抢夺例外".对于很多内容不能正常抓取的网站,100搜索引擎会认为网站存在用户体验的缺陷,降低网站的评价,在抓取、索引、排序等方面会受到一定程度的影响,从而最终影响网站从搜索引擎获取流量.

    下面总结一些常见的搜索引擎蜘蛛抓取不到的原因,供大家参考.

 

    有两种服务器连接异常:一是网站不稳定,蜘蛛在尝试连接到你的网站服务器时暂时无法连接;二是蜘蛛已经无法连接到你的网站服务器.

 

    服务器连接异常的原因通常是您的网站服务器太大和过载.您网站上的程序也可能无法正常工作.此方法可以检查空间的服务器(如Apache、IIS)是否已安装或正常运行,或者空间的防火墙是否阻止蜘蛛爬网.

 

    有两种网络运营商:电信、联通和移动.蜘蛛无法通过运营商的网络访问你的网站,所以你需要联系运营商,或者购买更好的服务空间或CDN服务.

 

    当蜘蛛无法解析你的网站IP时,就会出现DNS异常.可能是你的网站IP地址不对,或者蜘蛛被域名服务商禁止.您可以使用whois或host来检查您网站的IP地址是否正确和可解析.如果没有,请与域名服务提供商联系.例如,pro犁SEO的域名提供商是Wannet,并更新IP地址.

 

    IP屏蔽的性能包括:限制网络的导出IP地址,禁止该IP段的用户访问内容,特别是屏蔽蜘蛛的IP地址.当你的网站不想蜘蛛访问,你可以设置它.如果您希望蜘蛛访问,请检查相关设置,或联系空间服务提供商更改设置.当然,蜘蛛一般都会抢到它.

 

    总结搜索引擎蜘蛛抓取不到页面的原因及改善措施

 

    简而言之,死链接指的是正常但后来失败的链接.当死链接发送请求时,服务器返回404错误页.死链包括协议死链和内容死链.协议死链:由页面的TCP协议状态/ HTTP协议状态明确指示的死链,如404, 403, 503状态等内容死链:服务器返回的状态是正常的,但内容已被更改为不存在的信息页,已被删除,或需要权限,与原文内容无关.

 

    对于死链,建议网站使用协议死链,通过站长平台死链工具提交给,这样可以更快地找到死链,减少死链对用户和搜索引擎的影响.

 

    将网络请求重定向到另一个位置是一个跳转,它指的是以下情况:

 

    (1) 当前页是无效页(包括要删除的内容、死链等),直接跳转到上一个目录或主页.的建议是删除无效页面的入口超链接.

 

    (2)长期以来跳转到其他域名,如更改网站域名,建议使用301重定向跳转协议进行设置.

 

    (3) 对于引荐人的例外情况:该网页不用于引荐人的正常行为;

 

    (4) 对于Baidu-UA的例外:返回Baidu-UA页面的行为与页面的原始内容不同;

 

    (5) JS跳转异常:网页加载无法识别和发送的JS跳转代码,用户通过搜索结果进入网页后跳转.

 

    (6) 偶尔因压力过大而被禁:会根据网站规模、访问量等信息自动设置合理的抓取压力.但在压力控制异常等异常情况下,服务器会根据自身负载进行保护意外闭锁.在这种情况下,请在返回码中返回503(503serviceunavailable,等同于404serviceunavailable),蜘蛛会在一段时间内再次尝试抓取链接.如果网站处于空闲状态,将成功对其进行爬网.

本文链接地址: 总结搜索引擎蜘蛛抓取不到页面的原因及改善措http://www.021hy.net/xwzx/jsjl/202001021489.html


火迎网络

  • 地址: 上海嘉定区鹤旋路58弄18号1210室

坚持给顾客更好的,
在您需要帮助的时候我们在身边...

主营业务: 网站建设 |seo优化 |整站优化 |   

版权所有    ©2019 .  上海火迎网络科技有限公司  | 沪ICP备19020429号-1