我们将告诉您一个SEO事实:百度对网页进行排名,而不是网站。其实它将回答有关搜索引擎如何运作的许多问题,我们无法在本文中全部涵盖。一旦您考虑了这个看似不起眼的声明,您就会看到在制定自然搜索策略时牢记它如何可以简化您的许多决策。
看,我们不需要在这里过度复杂化,但让我们深入研究这个观点如何改变事情,有时真的让一些SEO专业人士感到不安。
基本上,“搜索引擎对网页而不是网站进行排名”意味着搜索引擎将其机器人抓取和索引的每个网页都视为自己的内容、代码和链接的独立小世界。
因此,就排名和索引而言,该网页可以存在于它喜欢的任何域名中,搜索引擎也会以同样的方式对待它。
为什么一些SEO专业人士讨厌这个说法呢?因为它的存在打破了他们珍视的许多概念——而且因为他们的业务取决于人们相信他们的这些概念存在。
让我们不要过多关注事情的这一方面。相反,我们将看看这个想法如何解释我们如何知道在搜索引擎上的排名是如何工作的。
让我们先将其工作原理分解为三个领域:内容、网页设计和权重(链接)。
当涉及到SEO的内容领域时,它与“百度对网页进行排名,而不是网站”的概念一致:不相关的内容会损害了我的网站排名?
仔细观察你会发现很多新闻网站有几十个话题,和谐共处,互不伤害。为什么?百度本身排名网页,而不是网站。
如果您考虑一下,我们不会希望生活在百度根据整个网站的单个主题对网页进行排名的世界。
您的企业可能是生产彩色玻璃窗的,但这不意味着您网站上的每个页面都应该针对“彩色玻璃窗”进行排名。
如果您已经在SEO优化行业中工作了很长时间,那么您可能至少听过一次关于“子域与子文件夹”的争论。但其实对于搜索引擎来说,这没大关系。
为什么不重要?因为百度对网页而不是网站进行排名。因此,这些网页可以存在于子域或子文件夹中,百度会以同样的方式对待它们。
我们不想生活在一个网站上一页的错误拖累整个网站的世界。例如,您很可能遇到过其中一个网页比其他所有网页都慢的情况。这个单一页面不会拖累整个网站,只会拖累那一页。
近来比较流行和有效的SEO策略之一是内容中心。该过程也称为支柱集群模型,基于创建“中心”或“支柱”主题的想法,该主题链接到其他子页面或子主题的“集群”,提供有关中心或支柱内容的更多详细信息。
这种策略如此有效的原因之一是因为它允许一种简单的方法将从入站链接获得的权重传递到您的主要主题中心到子主题(反之亦然)。
为什么效果这么好?虽然这些内部链接可能不如外部链接强大,但它们仍然拥有很大的力量,因为百度将它们视为具有自己权重的单个页面。
有时,我们会看到有人声称这种内容策略还有助于为您的整个网站创建整体“主题权威”,但鉴于百度针对“网页,而不是网站”的规则,我们知道这不是真的。这给我们带来了整个网站或域名(如果您愿意)的整体权重的概念。
虽然一些SEO工具公司以推动这个概念而闻名,但百度将第一个告诉你它根本不存在。
现在,您可能会问:如果这个网站范围的权威指标不存在,为什么像“寄生虫托管”这样的垃圾链接构建策略如此有效?
其实它根本不起作用。寄生虫托管是指链接构建者从隐藏在知名的、通常是教育网站上的内容中出售链接。然而,这种“黑客”有效的唯一衡量标准是受其他具有高级别指标的域名影响,而不是实际排名变化。
“网页,而不是网站”揭示了基于完全不真实的SEO概念的交易的欺骗性,因为根本没有所谓的网站权重的概念。不要浪费你的钱试图提升一个网站的权重。
SEO行业的一些人喜欢用非官方的概念来解释为什么网站不行,其实这些概念本身就是错误的。我们不是第一个说搜索引擎对网页而不是网站进行排名的人,但我们怀疑我们会是最后一个,因为大多数SEO需要突出网站的重要而非网页。希望现在您对百度的排名原理知道得更清楚了。
做过网站排名的朋友们都知道要优化关键词,优化网站,但是不知道文章发布被抓取后,爬虫经历了什么?为什么别人网站的排名比你高,为什么你的这个关键词比别人排名高,如何能让自己网站的关键词能获得一个好的排名,如何能让搜索引擎更加青睐自己的网站,今天我们一起来学习一下网站文章被爬虫抓取后,百度搜索引擎是怎么给关键词排名的呢?
我们作为一名Seoer,必须知道搜索引擎的工作原理,你只有知道搜索引擎的工作原理你才能更好的对此加以在网站优化的过程中加以运用。今天简单地在这里给大家分享一下搜索引擎的工作原理。
搜索引擎的工作原理
搜索引擎的工作过程大致可以划分为三个步骤: 搜索引擎蜘蛛爬行和抓取数据 、 搜索引擎后台预处理(索引)所收集的数据 、搜索引擎按照一定方式进行网站(网页)的排名。
一、搜索引擎蜘蛛爬行和抓取数据
搜索引擎蜘蛛会爬行和抓取你网站上的数据,首先我们要给搜索引擎一个入口,越多的搜索引擎的抓取入口就意味着越多的抓取机会。新站可以在百度,360搜索引擎提交网站,让它更快知道你的存在。
为什么原创文章更利于搜索引擎的抓取,因为搜索引擎爬行和抓取数据的时候,搜索引擎会检查内容,并匹配本身数据库存在的内容,如果权重低的站大量转载内容,蜘蛛爬取后在数据库中对比,不是原创没有任何价值后,将不再来爬取你的网站,而且严重情况可能会怀疑作弊,给你网站降权或者不在百度中展示你的网站,你之前有的关键词排名也美哟了。所以对于新站的一个建议是原创最好。
二、搜索引擎后台预处理(索引)所收集的数据
1、提取网站内容如文字等:对于搜索引擎在网站抓取的内容进行提取相关意义内容,去掉一些不必要的标签等。
2、进行中文分词及去掉无用词:把网页中的文字进行拆分、分词,并且过滤掉文章中的一些无意义的词,如“的、地”等
3、对内容消除非重要内容:去掉与意义内容正文无关的文字如一些本身存在的回帖,发帖之类
4、去掉网站重复内容:多个一样内容的页面,要从数据库中删除掉重复页面和链接。
5、索引内容:正向及反向索引,以链接出发,对应若干关键词叫正向索引;或者以关键词出发,对应多个链接的方式叫反向索引。
6、链接关系计算:计算每个页面有哪些导入页面,导入锚文本关键词,形成了页面(链接)的权重(如PR),并存储该权重的数值。
三、搜索引擎按照一定方式进行网站(网页)的排名
1、搜索关键词处理:对于搜索的词进行分词、去掉无用字、拼写矫正、指令处理等
2、查找关键词对应链接集合:用第一步得出的分词后的关键词到反向索引表进行查询,找到该词对应的所有链接
3、初始子集选择:基于各页面(链接)权重数值高低,筛选一个适当的关键词对应链接的子集(几千或几万)。
4、相关性计算:看分词关键词的常用度(常用度低的词搜索引擎更关注)、看词出现频率密度、关键词的位置及形式(关键词位置重要,如开头,结尾,H1中,粗体中等相关性高)、关键词距离(距离小的相关性高)、外链锚文字相关性、外链源本身相关性及链接周围文字(这个应该是考虑的最多的,可能这个就能体现我们对我们外部优化的一些工作的要求)
5、排名过滤及调整:经过前几步,大体排名就已经确定了。搜索引擎还会对结果集进行一些过滤,对作弊及涉嫌作弊页面,会放到集合最后。
6、将搜索的排名结果显示:这个就不多解释,就是搜索之后呈现给你的结果。
7、搜索结果的缓存:搜索引擎排名出结果后,会对结果集进行缓存,不必每次重新计算。
8、用户查询及点击日志:日志文件中的数据对搜索引擎判断搜索结果质量,调整搜索算法,预期搜索趋势等都有比较重要意义,甚至会根据用户体验来反作用与排名结果。
以上就是“网站文章被爬虫抓取后,百度搜索引擎是怎么给关键词排名的呢?”的全部内容,如果有没有表达清楚的地方,欢迎大家留言,一起进步。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 lkba@aliyun.com 举报,一经查实,本站将立刻删除。
转载请注明来自专注SEO技术,教程,推广 ,本文标题:《百度搜索引擎是怎么给关键词排名的呢(百度网站排名靠前的原因)》
标签:关键词排名百度网站排名
留言咨询