WEB前端-搜索引擎工作原理与SEO优化

布满荆棘的人生 2023-06-02 09:17 87阅读 0赞

一、搜索引擎工作原理

搜索引擎的工作分为三个阶段,即爬行,索引和检索

" class="reference-link">1、爬行 1731684-20190814153046726-1864177528.png

搜索引擎具有网络爬虫或蜘蛛来执行爬网,每次抓取工具访问网页时,它都会复制该网页并将其网址添加到索引中。

在“蜘蛛”抓取网页内容,提炼关键词的这个过程中,就存在一个问题:“蜘蛛”能否看懂。如果网站内容是 flash 和 js,那么它是看不懂的。相应的,如果网站内容是它的语言,那么它便能看懂,它的语言即 SEO

" class="reference-link">2、索引 1731684-20190814153112108-856509403.png

此阶段,爬网程序会创建搜索引擎的索引。索引就像一本巨大的书,其中包含爬虫找到的每个网页的副本。如果任何网页发生更改,则抓取工具会使用新内容更新图书

" class="reference-link">3、检索 1731684-20190814153154158-220674171.png

这是搜索引擎以特定顺序提供最有用和最相关答案的最后阶段

二、SEO 简介

全称:Search English Optimization,搜索引擎优化,即为了提升网页在搜索引擎自然搜索结果中的收录数量以及排序位置而做的优化。

1、SEO 的分类

  • 白帽 SEO:起到了改良和规范网站设计的作用,使网站对搜索引擎和用户更加友好,并从搜索引擎中获取合理的流量
  • 黑帽 SEO:利用和放大搜索引擎政策缺陷来获取更多用户的访问量

2、白帽 SEO 的使用

(1)对网站的标题、关键字、描述精心设置,反映网站的定位,让搜索引擎明白网站是做什么的;

(2)网站内容优化:内容与关键字的对应,增加关键字的密度;

(3)在网站上合理设置 Robot.txt 文件;

(4)生成针对搜索引擎友好的网站地图;

(5)增加外部链接,到各个网站上宣传;

三、前端 SEO 优化

通过网站的结构布局设计和网页代码优化,使前端页面既能让浏览器用户能够看懂,也能让“蜘蛛”看懂

1、网站结构布局优化

(1)控制首页链接数量

对于中小型企业网站,建议首页链接在100个以内,链接的性质可以包含页面导航、底部导航、锚文字链接等

(2)扁平化的目录层次

尽量让“蜘蛛”只跳转3次,就能到达网站内的任何一个内页

(3)导航优化

导航应该尽量采用文字方式,也可以搭配图片导航,但标签务必添加“alt”和“title”属性,告诉搜索引擎导航的定位

  1. <img src="" alt="" title="">

其次,在每一个网页上应该加上面包屑导航

1731684-20190814150417403-323702089.png

对用户而言,可以让用户了解当前所处的位置,形成更好的位置感,并方便用户操作;

对蜘蛛而言,能够清楚的了解网站结构,同时还增加了大量的内部链接,方便抓取,降低跳出率。

(4)结构布局的规范优化

  a、页面头部:logo 及主导航,以及用户的信息

  b、页面主体:左边面包屑导航及正文;右边放热门文章及相关文章,既增强了页面相关性,也增强页面的权重

  c、页面底部:版权信息和友情链接

注意:分页导航推荐写法:“1 2 3 4 5 6 7 8 9 10 下拉框/输入框”,这样“蜘蛛”能够根据相应页码直接跳转,下拉框直接选择页面跳转

1731684-20190814153711002-736324227.png

(5)控制页面的大小

一个页面最好不要超过100k,太大,页面加载速度慢,用户体验不好,并且一旦超时,“蜘蛛”也会离开

2、网页代码优化

(1)</h4><p>标题,强调重点即可,尽量做到每个页面的 <title> 标题内容不重复</p> <pre><code><title>英雄联盟全新官方网站-腾讯游戏</title> </code></pre><h4 id="h4--2-meta-keywords-"><a name="(2)<meta keywords>" class="reference-link"></a><span class="header-link octicon octicon-link"></span>(2)<meta keywords></h4><p>关键词,列举出几个页面的重要关键字即可</p> <pre><code><meta name="Keywords" content="英雄联盟,lol,lol新手礼包,lol攻略,lol视频,lol视频攻略,英雄资料,英雄联盟战争学院,明星解说视频,101战争学院,英雄,攻略,WCG,点亮图标,赛事"> </code></pre><h4 id="h4--3-meta-description-"><a name="(3)<meta description>" class="reference-link"></a><span class="header-link octicon octicon-link"></span>(3)<meta description></h4><p>网页描述,高度概括网页内容的关键词,每个页面也要有所不同</p> <pre><code><meta name="Description" content="英雄联盟官方网站,海量风格各异的英雄,丰富、便捷的物品合成系统,游戏内置的匹配、排行和竞技系统,独创的“召唤师”系统及技能、符文、天赋等系统组合,必将带你进入一个崭新而又丰富多彩的游戏世界。"> </code></pre><h4 id="h4--4-"><a name="(4)标签语义化" class="reference-link"></a><span class="header-link octicon octicon-link"></span>(4)标签语义化</h4><p>比如:h1-h6是用于标题类的,<nav>标签是用来设置页面主导航的等</p> <h4 id="h4--5-a-"><a name="(5)<a>标签:" class="reference-link"></a><span class="header-link octicon octicon-link"></span>(5)<a>标签:</h4><p>页内链接,要加“title” 属性加以说明,让访客和 “蜘蛛” 知道;</p> <p>外部链接,链接到其他网站的,则需要加上 el=”nofollow” 属性,避免“蜘蛛”爬了外部链接之后,就不回了</p> <h4 id="h4--6-h1-"><a name="(6)正文标题要用 <h1> 标签:" class="reference-link"></a><span class="header-link octicon octicon-link"></span>(6)正文标题要用 <h1> 标签:</h4><p>“蜘蛛” 认为它最重要,若不喜欢<h1>的默认样式可以通过CSS设置</p> <h4 id="h4--7-br-"><a name="(7)<br>" class="reference-link"></a><span class="header-link octicon octicon-link"></span>(7)<br></h4><p>只用于文本内容的换行</p> <pre><code><p> 第一行文字<br/> 第二行文字<br/> 第三行文字 </p> </code></pre><h4 id="h4--8-caption-"><a name="(8)<caption>" class="reference-link"></a><span class="header-link octicon octicon-link"></span>(8)<caption></h4><p>表格应该使用 <caption> 表格标题标签</p> <h4 id="h4--9-img-alt-"><a name="(9)<img> 应使用 “alt” 属性加以说明" class="reference-link"></a><span class="header-link octicon octicon-link"></span>(9)<img> 应使用 “alt” 属性加以说明</h4><h4 id="h4--10-strong-em-"><a name="(10)<strong> 和 <em> : 需要强调时使用" class="reference-link"></a><span class="header-link octicon octicon-link"></span>(10)<strong> 和 <em> : 需要强调时使用</h4><p><strong>标签在搜索引擎中能突出关键词</p> <p><em>标签强调效果仅次于 <strong></p> <p>而 <b>、<i>标签: 只是用于显示效果时使用,在 SEO 中不起效果</p> <h4 id="h4--11-nbsp-copy-"><a name="(11)避免使用   和 ©" class="reference-link"></a><span class="header-link octicon octicon-link"></span>(11)避免使用   和 ©</h4><p>空格符   应用 CSS 进行设置</p> <p>版权符 © 可以直接使用输入法打“©”</p> <h4 id="h4--12-iframe-"><a name="(12)少用 iframe 框架,因为“蜘蛛”一般不会读取其中的内容" class="reference-link"></a><span class="header-link octicon octicon-link"></span>(12)少用 iframe 框架,因为“蜘蛛”一般不会读取其中的内容</h4><h4 id="h4--13-display-none-"><a name="(13)少用 display: none;" class="reference-link"></a><span class="header-link octicon octicon-link"></span>(13)少用 display: none;</h4><p>对于不想显示的文字内容,应当设置 z-index 或设置到浏览器显示器之外。因为搜索引擎会过滤掉 display:none 中的内容</p> <p>转载于<img src="https://www.webpagefx.com/tools/emoji-cheat-sheet/graphics/emojis/https.png" class="emoji" title=":https:" alt=":https:" />//www.cnblogs.com/Leophen/p/11352587.html</p>

发表评论

表情:
评论列表 (有 0 条评论,87人围观)

还没有评论,来说两句吧...

相关阅读

    相关 web前端性能&SEO优化

    web前端性能&SEO优化 网站的划分一般为二:前端和后台。我们可以理解成后台是用来实现网站的功能的,比如:实现用户注册,用户能够为文章发表评论等等。而前端呢?其实应该是

    相关 搜索引擎工作原理

    搜索引擎的工作原理 第一步:爬行 搜索引擎是通过一种特定的规律的软件跟踪网页的链接,从一个链接爬到另一个链接,像蜘蛛在蜘蛛网上爬行一样,所以被称为“蜘蛛”,也被称为

    相关 浅析SEO搜索引擎优化

    什么是搜索引擎优化     搜索引擎优化,简称为SEO,表面的含义来看,是让网站更容易被搜索引擎收录,并且当用户通过搜索引擎进行检索时在检索结果中获得好的排名位置,从而达

    相关 前端seo优化

    前端 seo 优化 一、什么是seo优化: SEO是指通过采用易于搜索引擎索引的合理手段,使网站各项基本要素适合搜索引擎检索原则并且对用户更友好(Search