您好!欢迎光临珍品源码!本站资源24小时自动发货,一次付费,终身下载,销售只是起点,服务永无止境! 立即加入我们

神马搜索引擎Spider介绍

 作者 :   珍品源码管理员 本文共845个字,预计阅读时间需要3分钟 发布时间: 2020-08-30 共312人阅读

1. 神马Spider

神马Spider是神马访问互联网,自动化抓取网页的程序。Spider抓取下网页,建立索引,使用户可通过搜索引擎搜索到互联网上的资源。

 

2. 神马Spider的user-agent及ip地址

user-agent,是http协议中的一个属性,代表了终端的身份。神马Spider的user-agent为:Yisouspider,因为历史原因此user-agent名称将会继续使用。

神马Spider的ip地址是一组ip池,会动态变,因此不在此列举

3. 神马Spider的网站访问频率

神马会根据网站的规模、服务能力、页面质量、更新速度等因素来决定对网站的访问频率。通常质量高、网页更新快的网站神马spider访问的频率相对会高,以保证高质、时效的能够展现给用户。

4. 神马spider如何发现新网页

神马spider发现新网页的方式有多种,最典型的是在已发现的网页中分析超链关系,选取url并抓取,如此不断拓展,尽可能多的抓取到有价值的网页。另外,神马会从dns服务商处获取新网站域名,能够及时抓取到新建网站。

5. 关于robots协议

robots.txt是搜索引擎访问网站是要访问的第一个文件,以确定哪些网页是允许或禁止抓取的。神马搜索遵守互联网robots协议,如您希望完全禁止神马访问或对部分目录禁止访问,您可以通过robots.txt文件来设置内容,限定神马Spider的访问权限。

robots.txt必须放在网站根目录下,且文件名要小写。

具体的写法:

1) 完全禁止神马Spider抓取:

User-agent: Yisouspider

Disallow: /

2) 禁止神马spider抓取指定目录

User-agent: Yisouspider

Disallow: /update

Disallow: /history

禁止抓取update、history目录下网页

6. 神马Spider是否会造成带宽负担

神马Spider有规范的抓取流程,同时也会考虑网站的忙闲时段来抓取,因此不会给网站造成带宽负担。

珍品源码ZPYDM.COM一个高级程序员模板开发平台,专注dedecms模板开发及WordPress模板制作,包括织梦网站模板、织梦商业模板、WordPress模板、CMS网站模板、网站模板、网页模板、网站源码等模板开发及交易,为建站开发人员提供优质的服务。
珍品源码 » 神马搜索引擎Spider介绍

发表评论

售后服务:

  • 售后服务范围 1、商业模板使用范围内问题免费咨询
    2、源码安装、模板安装(一般 ¥500)服务答疑仅限SVIP用户
    3、需自备服务器或由技术人员负责代买。
    付费增值服务 1、提供dedecms模板、WordPress主题、discuz模板优化等服务请详询在线客服
    2、承接 WordPress、DedeCMS、Discuz 等系统建站、仿站、开发、定制等服务
    3、服务器环境配置(一般 ¥500)
    4、网站中毒处理(需额外付费,1000元/次)
    售后服务时间 周一至周日(法定节假日除外) 9:00-23:00
    免责声明 本站所提供的模板(主题/插件)等资源仅供学习交流,若使用商业用途,请购买正版授权,否则产生的一切后果将由下载用户自行承担,有部分资源为网上收集或仿制而来,若模板侵犯了您的合法权益,请来信通知我们(Email: 418172526@qq.com),我们会及时删除,给您带来的不便,我们深表歉意!

Hi, 如果你对这款模板有疑问,可以跟我联系哦!

联系作者

珍品源码提供最优质的资源集合,开通VIP,无套路海量精品资源任意下载

立即查看 开通VIP
开通SVIP 享更多特权,建议使用 QQ 登录
喜欢我嘛?喜欢就按“ctrl+D”收藏我吧!♡