Robots.txt是什么

来源:设计经验分享网
添加时间:2024年02月

Robots.txt是你穿告诉搜索机器人哪些页面你会喜欢他们不能够访问您的网站的文本(而不是html)文件。Robots.txt是不是强制性的搜索引擎,但是搜索引擎一般遵守他们都问什么不该做。务必要澄清robots.txt不从防止搜索引擎抓取您的网站(即它是不一的防火墙或密码保护的一种)的一种方法,您放置一个robots.txt文件的事实是有点像把一条注释"请不要输入"一个解锁的门——上如不能防止小偷进来,但好人,将不打开门,然后输入。也就是为什么我们说是否真的有森sitive数据,是太依赖robots.txt,以防止被索引,并显示在搜索结果的不完善。


robots.txt的位置是非常重要的。它必须是主目录中,因为否则用户代理(搜索引擎)不会能够找到它——他们不中搜索名为robots.txt的文件的整个站点。相反,他们首先主目录(如http://mydomain.com/robots.txt)中查找和他们那里找不到它,如果他们只是假定此站点没有robots.txt文件,因此他们索引他们发现路上的一切。因此,如果你不穿robots.txt中适当的位置,不要惊讶搜索引擎索引了您的整个站点。
概念与结构的robots.txt已发展了十多年前,如果您有兴趣进一步了解它,请访问http://www.robotstxt.org/或因为这篇文章中,我们会处理只与一个robots.txt文件的最重要的环节,您可以转到标准的机器人排除直。下一步我们会与结构继续robots.txt文件。
Robots.txtFile的结构
一个robots.txt的结构是相当简单(和几乎不能灵活)–它是用户代理和不允许的文件和目录的一个无穷列表。基本上,语法如下所示:
用户代理:
不允许:
"用户代理"是搜索引擎的抓取工具和不允许:列出的文件和要从索引中排除的目录。在"用户代理:"和"不允许:"条目,您可以包含注释行–只是在行的开头放置,#号:
#所有用户代理不都允许以查看该/temp目录。
用户代理:*
不允许:/temp/
Robots.txtFile的陷阱
当你开始做复杂的文件–即您决定允许不同的用户代理访问不同的目录–可以开始问题,如果你没有支付费用的robots.txt文件陷阱,特别重视。常见的错误包括打字错误和有冲突的指令。拼写错误的用户-代理后用户代理和Disallow,,缺少冒号的目录包括拼写错误等。打字错误可以很难找到,但在某些情况下验证工具的帮助。
更严重的问题是有逻辑错误。例如:
用户代理:*
不允许:/temp/
用户代理:Googlebot
不允许:/images/
不允许:/temp/
不允许:/cgi-bin/
上面的示例中是一个允许访问除在/temp站点上的所有内容的所有代理的robots.txt从目录。达在这里很好,但更高版本在那里是另一个记录,为Googlebot指定限制性更强的条款。Googlebot开始读取robots.txt,它会看到所有文件夹除外/temp/并都允许的(包括Googlebot本身)的所有用户代理。这是足够的了解,它不会读到文件和一切除了/temp/-包括/images/和/cgi-bin,会索引/,你认为你已经告诉它不要Googlebot。你看到一个robots.txt文件结构的简单但仍严重的错误可以方便地进行。
用于生成和验证Robots.txt文件工具
记住,你可以有一个robots.txt文件的简单语法,您可以始终阅读这一切都是可以的但它是更易于使用验证程序类似这样:http://tool.motoricerca.info/robots-checker.phtml。这些工具报告有关常见的错误,如缺少斜杠或冒号,检测不到的如该会危及你的努力。为例如果您键入:
user-agent:*
不允许:/temp/
这是错误的因为有"用户"和"代理"之间没有斜杠和语法不正确。

在这种情况下当您有一个复杂的robots.txt文件–即你给不同的用户代理的不同指令或您有一长串的目录和子目录中排除,编写文件手动可以一个真正的痛苦。但不用担心,——有的工具,将为您生成该文件。什么是更多有允许选择哪些文件,并点的可视化工具,是要排除的文件夹。即使你不喜欢为robots.txt代买一个图形化的工具,但在在线工具为您提供帮助。为例服务器端机器人发电机提供的用户代理的下拉列表,您可以列出文件的文本框,您不希望建立索引。坦白的说,它不好帮了除非您想要设置特定的规则,为不同的搜索引擎,因为在任何情况下,您键入的目录列表,但不只是什么。

本文由网站建设公司易捷网络发布,转载请注明文章出处!

 

平面设计相关资讯推荐阅读:


商城网页建设需要满足什么需求呢响应式网页设计的要点是什么深圳通过h5进行网页建设可以使网页更加简单方便吗企业网页后台程序的安全性也会影响网页排名深圳网页开发应该注意哪些细节深圳网页建设公司讲解抓取潜在客户的经验技巧深圳网页建设介绍三个关于404页面的设置问题解析HTML5页面的价值在何处如何树立好品牌理念利用DNSpod解决“空间不支持301重定向”的问题介绍两款网页模型设计工具你知道网页建设有哪些需求吗该怎么做对症下药!如何设计受欢迎的引导页建设手机网页的几个关键点搜索引擎如何判断网页文章是不是原创网络营销如何通过微信裂变吸引流量-深圳网页建设用户需求分析对深圳网页建设的影响Outlook设置IMAP方式收发邮件如何创建有价值的推广软文网页制作需要注意的几大环节云主机、虚拟主机、主机租用适用于哪些企业网页制作的五个技巧你知道吗一个好的网页建设,指标是什么品牌网页建设:驱动它前行的动力是什么网页设计制作公司解读seoer值得期待的明天深圳商城网页设计需要遵守哪些原则制作营销网页的要素怎样才能打造出较具看点的企业网页深圳网页建设接触的电商网页构成要素手机网页建设需要什么内容所谓的精准营销悖论就是越精准,需要获取的隐私就越多解析游戏化营销如何才能做出好看的网页设计这些技巧要掌握!企业网页多久改版一次网页制作该如何做好关键词需求分析与网页布局深圳网页定制开发设计网页的主题风格有哪几个步骤来看黑白灰的大气范网页设计如何进行网页的真实用户监控(RUM)网页持续维护,排名才会有好的进展网页成企业标配企业宣传产品被用户吐槽也可以成为优势吗-深圳网页建设分享网页建设上线较易犯几个错误你知晓吗有价值的网络建设文案都有这个方法网页开发常犯的十大错误PHP程序语言开发网页的优势在哪里深圳网页制作需要注意什么深圳网页建设公司为您讲解独立服务器的基本管理及如何下载网页源文件电子商务进到“百货商店大战”时期建站:网页建设销售市场的需求解析-企业网页SEO优化的几个关键点网页建设的费用以及怎么让网页利益最大化网页建设做网页制作的技术有哪些涨知识,网页建设内页如何正确微调对号入座!您的网页搭建有专业性吗深圳酒店网页建设方案策划书邮件营销怎么破深圳网页建设教你如何赢得良好第一印象微信小程序为什么这么火,建设小程序有哪些好处进行网页设计前要搞清楚的十三个问题网页建设助力企业全面营销网页设计价格一般都是根据什么来收取费用呢
网站备案号:豫ICP备2024041165号