当前位置:首页> 经验心得 > 网站是否未被收录相关的因素有哪些?

网站是否未被收录相关的因素有哪些?

2022-01-25 19:59:53 来源: 网络   编辑: 佚名   浏览(367)人   
0
    要学习搜索引擎优化,必须了解搜索引擎的工作原理。今天我们想谈谈百度搜索引擎的工作原理。在了解了搜索引擎的工作原理之后,它会涉及到一些收集方面的问题。那么,与网站是否未被收录相关的因素有哪些?
    让我们首先了解什么是搜索引擎蜘蛛?搜索引擎蜘蛛是一个获取信息的程序。与主要搜索引擎对应的爬行器是不同的。
    百度蜘蛛
    谷歌蜘蛛:谷歌机器人
    360蜘蛛
    搜狗蜘蛛
    ……
    搜索引擎的工作原理
    1、搜索引擎工作流
    1.抓取:沿着链接抓取页面信息。
    蜘蛛沿着链环爬行并抓住它,链环分为深度和宽度。宽度抓取:一级一级抓取主页、专栏页面和专栏页面中的页面。深度爬行:主页、专栏页、专栏页分页、专栏页)爬行器沿着链接爬行。
    2.过滤:如果内容质量不好,则进行过滤,如收集内容、无关内容、不足内容等。如果一些高质量的内容在很长一段时间内没有被收录,那么它将在一段时间后被收录。
    3.存储索引库:提取和组织质量信息,建立索引库。
    4.显示:将内容存储在临时索引库中。通过一些算法进行排序后,当用户搜索关键字时,搜索者会快速检测索引库中有价值的内容,并根据用户输入的查询关键字显示它们。
    2、网站未收录的原因
    1.是否允许蜘蛛抓取。首先要看的是是否有蜘蛛抓取你的网站,然后分析其他原因。蜘蛛不允许在机器人文件中爬行,因此蜘蛛不会爬行。
    2.需要一个周期。好的内容被放置在临时索引库中,并通过一些算法进行排序。如果没有包含一些高质量的内容,那是因为它还需要一个循环。
    3.内容质量差。过滤时直接过滤。
    4.如果蜘蛛无法识别某些东西,它会直接过滤。蜘蛛不能识别什么?
    (1)JS蜘蛛无法识别。建议只使用一个或两个。
    (2)图片上的内容可以被人眼识别,但蜘蛛无法识别。它需要添加alt属性。
    (3)Flash,就像视频一样。本视频的主要内容需要在视频的上下文中进行解释。
    (4)Iframe框架。有很多层次。
    (5)嵌套表。
    5.登录信息页面。蜘蛛不能进入这样的页面
    3、预防措施
    1.不要改变整篇文章的内容,尤其是标题。不要移动或删除它,否则会形成死链。
    2.显示结果需要一些时间(2个月内正常)。该网站已上线一周,尚未被收录。这需要一个循环时间。
    3.内容丰富。文本、图片、视频等。
    4.吸引蜘蛛。主动提交给搜索引擎(可重复提交),链接。采取主动。
    5.蜘蛛追踪,网站IIS日志。

【版权与免责声明】如发现内容存在版权问题,烦请提供相关信息发邮件至 1439028666@qq.com ,我们将及时沟通进行删除处理。 本站内容除了 98link( http://www.98link.com/ )特别标记的原创外,其它均为网友转载内容,涉及言论、版权与本站无关。