青海360搜索排名的原理与优化方法
一、搜索引擎工作原理
当我们在360搜索框输入关键词,点击搜索按钮时,随后出现搜索结果。探究背后的运行机制,搜索引擎需要完成许多复杂工作。
在360搜索后台,存在一个特别庞大的数据库,里面储存着海量关键词,每个关键词又对应着大量网址,这些网址是360程序从浩瀚互联网中逐个抓取收集的,这些程序被称为"搜索引擎蜘蛛"或"网络爬虫"。这些不知疲倦的"蜘蛛"终日穿梭于互联网,从一个链接跳转到另一个链接,抓取页面内容,进行解析提炼,提取其中的关键词,如果"蜘蛛"判定该关键词在数据库中尚未收录且对用户有价值就会存入数据库。相反,如果"蜘蛛"认为是垃圾信息或重复内容,就会选择舍弃,继续爬行,寻找最新、有用的信息保存起来供用户检索。当用户发起搜索时,就能匹配出与关键词相关的网址呈现给用户。
由于单个关键词往往对应多个网址,于是就产生了排序问题,相应的与关键词匹配度最高的网址自然排在前面。在"蜘蛛"抓取网页内容,提炼关键词的过程中,存在一个重要问题:"蜘蛛"能否正确识别。如果网站内容采用Flash和JS技术,那么它就无法理解,会陷入困惑,即便关键词再精准也无济于事。相对应的,如果网站内容采用它能理解的语言,那么它就能顺利抓取,这种语言就是SEO。
二、SEO简介
全称:Search Engine Optimization,搜索引擎优化。自搜索引擎诞生之日起,SEO便应运而生。
存在价值:旨在提升网页在搜索引擎自然搜索结果中的收录数量及排名位置而实施的优化行为。简单来说,就是希望360等搜索引擎能更多收录我们优化后的网站,并且在用户搜索时让网站排名靠前。
分类:白帽SEO与黑帽SEO。白帽SEO,能够改进和规范网站设计,使网站对搜索引擎和用户更加友好,同时网站也能从搜索引擎获得合理流量,这是搜索引擎提倡和支持的。黑帽SEO,利用和放大搜索引擎规则漏洞获取更多用户访问量,这类行为多数属于欺骗搜索引擎,通常搜索引擎厂商是不支持与鼓励的。本文重点讨论白帽SEO,那么白帽SEO具体能做哪些工作呢?
- 精心设置网站标题、关键词和描述,体现网站定位,让搜索引擎明确网站主营业务;
- 网站内容优化:确保内容与关键词对应,适当提高关键词密度;
- 在网站根目录合理配置Robot.txt文件;
- 制作对搜索引擎友好的网站地图;
- 增加外部链接,在各个平台进行推广;
三、前端SEO
通过网站结构布局设计和网页代码优化,使前端页面既便于浏览器用户理解,也方便"蜘蛛"抓取。
(1)网站结构布局优化:力求简洁明了,直入主题,推崇扁平化结构。
通常而言,网站结构层级越少,越容易被"蜘蛛"抓取,也就越容易被收录。普通中小型网站目录结构若超过三级,"蜘蛛"可能就不愿继续深入,"万一迷路了怎么办"。根据相关调研:用户如果经过3次跳转仍未找到所需信息,很可能选择离开。因此,三层目录结构也是基于用户体验的考量。为此我们需要做到:
- 控制首页链接数量
因此针对青海地区的中小企业网站,建议首页链接控制在100个以内,链接形式可包含页面导航、底部导航、锚文本链接等,注意链接要建立在良好用户体验和引导用户获取信息的基础上。
- 采用扁平化目录层级,尽量确保"蜘蛛"只需跳转3次就能到达站内任何页面。扁平化目录结构,例如:"青海旅游"-->"青海湖"-->"骑行攻略"、"摄影指南"、"住宿推荐",通过3级就能找到住宿信息。
- 导航优化
其次,每个网页都应添加面包屑导航,优势在于:从用户体验角度,能让用户清楚当前位置及该页面在网站中的位置,帮助用户快速理解网站组织结构,形成明确方位感,同时提供返回各层级的入口,方便用户操作;对"蜘蛛"而言,能够清晰掌握网站架构,同时增加大量内部链接,便于抓取,降低跳出率。
- 网站结构布局--不容忽视的细节
特别注意:分页导航的写法,推荐采用:"首页 1 2 3 4 5 6 7 8 9 下拉框",这样"蜘蛛"可以直接根据页码跳转,下拉框实现快速页面切换。而不推荐使用:"首页 下一页 尾页"的形式,尤其当分页数量庞大时,"蜘蛛"需要反复爬行才能完成抓取,会感到疲惫、容易放弃。
- 控制页面体积,减少http请求,提升网站加载速度。
(2)网页代码优化
- 标题:突出重点即可,尽量将核心关键词前置,避免关键词重复,尽量保证每个页面标题具有独特性。标题中不要设置重复内容。
- 标签:关键词,列出几个页面重要关键词即可,切记不要过度堆砌。
- 标签:网页描述,需要高度概括网页内容,切记不能过长,避免关键词过度堆砌,每个页面的描述也要有所区别。
- 中的标签:尽量实现代码语义化,在合适位置使用恰当标签,用正确的标签做正确的事。让代码阅读者和"蜘蛛"都能一目了然。例如:h1-h6应用于标题类内容。
- 超链接标签:站内链接,需添加"title"属性进行说明,让访客和"蜘蛛"了解链接指向。而外部链接,指向其他网站的,则需要添加el="nofollow"属性,告知"蜘蛛"不要跟踪,因为一旦"蜘蛛"跟踪外部链接后,可能就不会返回了。
- 正文标题采用h1标签:"蜘蛛"认为它最重要,若不满意h1的默认样式可以通过CSS调整。尽量确保正文标题使用h1标签,副标题使用h2标签,而其他位置不应随意滥用h系列标题标签。
- 换行标签:仅用于文本内容的换行
- 表格应使用表格标题标签
- 图片应使用"alt"属性进行描述
- 加粗,强调标签:需要强调时使用。加粗标签在搜索引擎中会受到高度重视,它能突出关键词,展现重要内容,强调标签的强调效果仅次于加粗标签。
11、文本缩进不要使用特殊符号 应该使用CSS进行设置。版权符号不要使用特殊符号 可以直接通过输入法,输入"banquan",选择序号5即可输入版权符号。
12、巧妙运用CSS布局,将重要内容的HTML代码置于最前面,最前面的内容被视为最重要,优先让"蜘蛛"抓取,进行内容关键词提取。
- 重要内容避免使用JS输出,因为"蜘蛛"无法识别
- 尽量减少iframe框架使用,因为"蜘蛛"通常不会读取其中内容
- 谨慎使用display:none:对于不想显示的文字内容,应设置z-index或将其定位到浏览器显示区域外。因为搜索引擎会过滤display:none中的内容。
- 持续精简代码
- 如果是操作DOM的js代码,应尽量放置在body结束标签之前,html代码之后。
发表评论