SEO优化中的爬行、抓取、索引、收录，指的都是什么？

联系电话：15900619600
159 0061 9600（微信同号）

● 上海 ● 北京 ● 南京 ● 杭州 ● 深圳 ● 广州 ● 重庆

在线服务：

当前位置：网站首页 >> 网站优化技术 >> 上海网站优化问题解答 >> SEO优化中的爬行、抓取、索引、收录，指的都是什么？

SEO优化中的爬行、抓取、索引、收录，指的都是什么？

发布时间：2019/10/14来源地址：智淇信息部

爬行是什么？
爬行指的是搜索引擎蜘蛛从已知页面上解析出链接指向的URL，然后沿着链接发现新页面（也就是链接指向的URL）的过程。当然，蜘蛛并不是发现新URL马上就爬过去抓取新页面，而是把发现的URL存放到待抓地址库中，蜘蛛按照一定顺序从地址库中提取要抓取的URL。

抓取是什么？
抓取是搜索引擎蜘蛛从待抓地址库中提取要抓的URL，访问这个URL，把读取的HTML代码存入数据库。蜘蛛的抓取就是像浏览器一样打开这个页面，和用户浏览器访问一样，也会在服务器原始日志中留下记录。

索引是什么？
索引指的是将一个URL的信息进行整理，存入数据库，也就是索引库，用户搜索时，搜索引擎从索引库中提取URL信息并排序展现出来。索引的英文是index。索引库是用于搜索的，所以被索引的URL是可以被用户搜索到的，没有被索引的URL用户在搜索结果中是看不到的。
要注意的是，所谓“一个URL的信息“，并不限于蜘蛛从URL上抓取来的内容，还有来自其它来源的信息，如外部链接、链接的锚文字等。有的时候，索引库中关于这个URL的的信息，根本没有从这个URL抓取来的内容，但搜索引擎知道这个URL的存在，并且有一些其它信息。
抓取和索引不是一回事。

收录是什么？
我个人觉得收录和索引没有区别。只不过收录是从搜索用户角度看的，搜索时能找到这个URL，就是这个URL被收录了。从搜索引擎角度看，URL被收录了，也就是这个URL的信息在索引库中存在。英文并没有收录这个词，和索引用的是同一个词index。

noindex的作用是什么？
页面头信息中放上meta noindex标签是告诉搜索引擎不要索引这个URL，也就是用户搜索时找不到这个URL的信息，这个URL不会返回在搜索结果列表中。
noindex不是告诉搜索引擎不要抓取这个URL，实际上，noindex要起作用，这个URL是必须先被抓取的，不然搜索引擎怎么看到页面HTML代码中有noindex标签呢？

robots文件的作用是什么？
robots文件是告诉搜索引擎，某些URL不要抓取。注意，这里说的是不要抓取，没说不要索引。和noindex是正相反的。

nofollow的作用是什么？
给链接加上nofollow属性是告诉搜索引擎，不要沿着这个链接爬行，就当这个链接不存在。注意，nofollow只是告诉蜘蛛不要爬这个链接，没有说不要抓取链接指向的URL，也没有说不要索引链接指向的URL，nofollow既没禁止抓取，也没禁止索引。
概念说过后，指出几个SEO们经常弄不明白的情况：

没有被抓取的页面是可以被索引的
也就是说，蜘蛛没有访问和抓取这个页面（比如被robots文件禁止抓取），这个页面却有信息存在索引库中，用户搜索时还能看到。

----------------------------------------------------
· 微信公众号怎么创建   [2022/6/11]
· 在seo网站优化师眼里的高质量页面   [2020/12/17]
· seo排名优化时需要注意的那些事！   [2020/12/14]
· seo网站优化自学简单吗   [2020/12/2]
· SEO怎么做才能让网站内容页快速被百度收录   [2020/11/20]

您的观点或提问

暂无观点或提问！
　第1页　共0页　每页10条记录共0条记录

资讯分类

资讯分类

上海网站优化流程 | 网络商城网站建设 | 上海手机网站建设 | 上海网站建设案例 | 怎样优化自己的网站

地址：上海市浦东新区高桥镇联系电话：15900619600
© 2009-2024 上海智淇网络科技有限公司版权所有 All rights reserved.