当前位置:雅虎网站目录 » 站长资讯 » 站长资讯 » 搜索引擎 » 文章详细

网页结构对搜索引擎抓取网页影响

来源:站长分类目录 浏览:567次 时间:2014-10-23
我是从事seo网站优化的工作人员,在此分享自己的学习过程,我一直相信,探究事物的本源,会让具体的seo网站优化工作变得更加可控、应用更加自如。最后这句对已入门者是废话哈。下面进入正题。

  一、为什么进行网页结构化?

  1)网页结构化是搜索引擎识别网页检索价值的基础。

  网页结构化可以理解为搜索引擎系统更深入工作的一个前期筛选,或者理解为流水线上的一个工序,出于效率、资源占用的考虑,把这道工序放到了前面。

  2)网页结构化让搜索引擎节约了大量的存储。

  网页结构化就是搜索引擎把抓取来的原始数据进行瘦身减负的过程。把页面中有价值的并且能够代表页面属性的部分留下,其他东东彻底卸掉。很自然地,就节约了大量的空间。

  二、网页结构化目标是什么?

  其实作为seo网站优化人员最想知道的是,网页结构化抽取页面的哪几个属性来代表网页。所以本文标题也就定为了“网页结构化目标是提取网页的5个基本属性”。即下面5个基本属性,这5个属性对于检索来说极其重要。

  (1) 标题(title):这里的标题特指HTML标识语言中中间的文字部分,这部分文字表达了网页的 基本含义。和锚文本相同的是,都是用来描述网页的内容的属性;和锚文本不同的是,这个标题是由该网页制作者本人编写的。

  (2)锚文本(anchor text):也是描述网页内容的属性之一。比如北京大学主页可能被另外一些网页中存在的锚(anchor)所指向,其锚文本(如文字为“北京大学官网”)就是北京大学网站主页的描述。特别是对于某些没有标题的网页,锚文本是有益的补充。

  (3)正文标题(content title):在HTML网页中,网页的标题由标签标识。实际的情况是由于网页编写者的疏忽,或者其他原 因,标签中的文字不能代表网页的主要内容,为此需要抽取正文中的适当文字作为正文标题。


  (4)正文(content):锚文本、标题和正文标题都是网页的简短描述,而正文是一个网页的主体内容,它完整地表述了网页的主体内容,一般出现在div、table和p等HTML标签中。

  (5)正向链接(link):正向链接是网页制作者编写的引导用户继续在网上冲浪的链接,这些链接的文字也是其他网页的锚文本。

推荐站点

  • 纸质化妆盒厂家纸质化妆盒厂家

    纸质化妆盒、又叫纸质眼影盒、纸质腮红盒、眼影纸本、手工眼影本、眼影书本等叫法、纸质化妆品盒有以下优势。。。1、纸质眼影盒特点,产品多元化:工艺纸盒具有重量轻、品种多样化的特点。不像注塑的产品由于磨具限制的原因,款式形状单一。2、环保优势:纸质眼影盒内外选用的均是纸质的环保材料,具有可回收、可降解等特点,相比现有的眼影盒通过注塑成型,更加环保,可有效防止环境的污染和破坏不但可以重复利用,还可以用废弃的纸包装制品造肥。3、技术优势:纸包装材料伸缩性小,不受热和光的影响,具有更好的稳定性;纸的不透明性,能够提供隐蔽隔离,使某些产品不能从包装外部看到,满足了某些产品的包装需要。工艺纸盒还具有良好的透气性、柔软性、强度及可控的撕裂性能;使产品有很好的弹性和韧性,可以对被包装物提供一定的保护作用。

    www.f58f.com
  • 大中华电子商务网大中华电子商务网

    大中华电子商务网免费发布不限制条数,大中华电子商务网是一个可以免费发布分类信息的B2B平台。可免费发布您的产品信息!便捷免费的B2B供求信息发布平台

    www.greatercnb2b.com
  • 大中国商业信息网大中国商业信息网

    大中国商业信息网免费发布不限制条数,大中国商业信息网是一个可以免费发布分类信息的B2B平台。可免费发布您的产品信息!便捷免费的B2B供求信息发布平台

    www.greatcnb2b.com
  • 全球商务信息网全球商务信息网

    欢迎访问全球商务信息网,这里有各行业信息网/B2B电子商务网站,是最方便的免费网络推广平台,已成为无数商家网络营销/网络推广的首选网站

    www.globalb2bcn.com
  • 国际电子商务网国际电子商务网

    欢迎访问国际电子商务网,这里有各行业信息网/B2B电子商务网站,是最方便的免费网络推广平台,已成为无数商家网络营销/网络推广的首选网站

    www.intbtb.com