在SEO网站优化的工作黄阔登,大多数朋友应该注意快照和网站的数量又名绥化站长网,并进行重量和流量的网站。就个人而言,包容性问题从根本上与两个重要的内容模块和内容的质量有关,符合网站的定位。 直接干燥产品:如何快速实现包含网站。让我们从五个方面开始。 我来谈谈它:黄阔登搜索引擎(spider=spider)如何知道如何包含网页?第一,通过蜘蛛的抓取链接网站的页面,然后蜘蛛索引良好的内容,使网站内容的质量有待提高。 ,以及网站的内容,符合网站的相关性。 第一,搜索引擎是调查的主要对象。为了让蜘蛛能够包含他们自己的网站,必须准备好网站。 1.网站可访问性:可以正常访问,不答应对蜘蛛的访问设置限制(例如,登录密码可见,验证码不可见),页面无效无法显示=404。 2.网站内容的可识别性:文本,图像,CSS,js,flash,视频。 3.相关性:关系,网站内容和用户需求的相关性之间的关系。 其次,用户体验以用户为中心。 1.用户必须启动:解决用户的问题,为用户提供访问信息的信息或渠道。 2.在页面的导航体验中,在页面设计中研究用户的浏览习惯,又名绥化站长网并改进内容的设计以改善外观。 第三黄阔登,在网站本身的页面上查找问题。 1.搜索引擎和用户仍在考虑网页的开放速度。速度受到蜘蛛跟踪和用户导航的影响。 2.页面标题, 3.网页内容 4.网络内容的相似性。 5.相关内链 6.广告页面 第四,优化维度。 1.优化细节,主要是因为页面不是页面是所有页面,又名绥化站长网专业优化不同页面用于不同目的。 开始:如果导航和推举功能是完美的。文章页面:网站内容清楚,图文并茂。满足用户需求,解决用户问题及相关建议。 产品页面:提供有关产品的完整实用信息和有效的购物门户。 下载页面黄阔登,文档页面和问答页面基于搜索引擎包含规则,并符合用户的浏览体验,以满足精确的需求和相关需求。我把细节给了整体。 2.总的来说,价值需求是主要的,寻找精确的用户群,使服务和产品稀缺和不可替代,内容又名绥化站长网,紧跟时代潮流,永不停歇。 V.列入前的考虑因素。 该网站不包含在该集合中,应该在所有方面进行考虑。新站是老站吗? 每个人都有自己的机会与朋友分享。这可以用名词“惯性思想”来解释。如果不包含该网站,则不会包含或部分包含该网站。 (仅包括百度,或仅包括360,包括搜狗)专有的地毯网站现在只有百度。 搜索引擎的算法更接近,最近百度的新算法,称为算法Breeze,专门打击与页面的标题和内容不匹配的网页。黄阔登, 又名绥化站长网
在SEO工作的过程中,我们偶然会遇到HTTP500内部服务器错误,这样的问题,它是一个明显的HTTP状态码,它在告知站长,你的网站与服务器某些配置一定呈现问题。从SEO的角度,如果你不能够及时解决相关问题,那么你的网站会晤临短期内与百度爬虫失去链接,时间长久的话,会严重影响网站的相关排名。那么,如何解决,HTTP500内部服务器错误?根据以往SEO网站诊断的经历,绿泡泡堂SEO学习网,将通过如下内容,进行浅析:HTTP500错误是什么原因:一般情况下,产生500错误的原因有很多,但主要包括如下两种情况:① 程序代码② 服务器配置相对于程序代码而言,由于你进行站点升级,对网站改版,增添了一些常见的使用插件,比如,你的WordPress插件版本,可能需要更高版本的PHP。而相对于IIS服务器而言,特殊是早期习惯用2003win server ,而升级到2008,2012的时候,经常由于配置问题诞生HTTP 500 内部服务器错误。HTTP 500 - 内部服务器错误(Internal Server Error)常见列表:① HTTP 500.0 错误一般情况下,通常都是基于web.config配置的问题,你可能需要审查伪静态的书写规则,以及ISAPI错误。② HTTP 500.12 错误通常它经常发生在网站治理系统安装上出现问题,比如:早期基于微软Moss搭建的站点,有的时候会因为IIS没有安装完整,呈现这个问题,完全安装IIS后,尝试再次重新启动。③ HTTP 500.19 错误诞生500.19 Internal Server Error错误的原因有很多,但比较常见的问题就是IIS7.5的时候,经常忽略ASP.NET的抉择安装,而IIS10的时候,配置文件访问权限的问题。解决这个问题,非常简陋:前者,你只需要尝试从新安装,然后从新启动IIS即可。后者,你需要添加一个新用户,然后,针对其访问权限,给予全部答应即可。HTTP 500 错误 ,SEO处理:如果你的网站由于HTTP500内部服务器错误,在2-3内,仍旧没有得到合理的解决方案,这里我们通常,建议大家,在百度搜索资源平台,抉择“闭站掩护”。当你完全审查好站点问题的时候,再次开启,否则,在一定程度上,长期得不到搜索引擎访问,可能会被有删除索引的风险。总结:关于HTTP 500 内部服务器错误,仍旧有诸多原因,而上述内容,只是简单的介绍下,常见情况,以及作为SEO人员,暂时的解决方案,避免造成过多的缺失,仅供参考。 绿泡泡堂SEO学习网 https://www.绿泡泡堂seo.com浅析, HTTP500内部服务器错误, 怎么解决
网站被搜索引擎收录后才有机会参与关键词排名,站长们到底怎么解决百度网站收录和快照更新呢?今天由绿泡泡堂SEO创始人邢庆涛为大家分享一些SEO干货,这些SEO实操技巧都是被实践验证过的,渴望能帮助到中小站长彻底解决网站收录问题。 如果需要技术帮助可联系 18600119496 同微信号,秒更新到最新时间!百度搜索引擎是中文搜索首先名,我们就拿百度搜索为例,由邢庆涛为大家用最直观便的实操方法为大家分享百度网站收录和快照更新技巧。我们在操作前先假设您的文章或网页是符合搜索引擎规范的,假如您发布的文章是采集的,或是通过SEO工具自动生成的,这类违反SEO规范的内容确实受搜索引擎爱慕。该网站收录方法只针对有价值的内容而言,咱们言归正传...1、百度URL提交百度URL提交推测很多站长都操作过,我就简单说一下操作步骤,重点是阐述一下操作要点和注意事项。第一打开百度,将需要收录的URL地址输入百度搜索框,点击百度一下,操作步骤如下: 2、搜到网-SEO收录工具第一打开搜到“网页快照分析”工具,http://tool.soudao.com/ 输入要诊断的网址(URL)点击“分析” 抉择未收录选项再抉择要未收录的网址进行提交。如下图: 注意:token是在百度搜索资源平台申请的推送用的准入密钥,使用该功能必须先开通百度站长工具。https://ziyuan.baidu.com/ 常见问题如下:1)、和原先的sitemap提交接口有什么区别?答:状态反馈更及时了,原先提交后需要登录到站长平台查看提交是否成功。目前只要根据提交后返回的数据就可以判定了。2)、已经存在的提交sitemap数据的程序代码需要做什么修改?答:主要修改两点。首先点,提交的接口需要修改;第二点,需要处理下接口返回的信息,失败后需要根据错误进行相应处理,报错的链接是无法提交成功的。3)、为什么提交成功后看不到数据变化?答:我们反馈的是新提交链接的数量,如果您提交的链接在之前提交过(即重复提交)是不会被统计到的。4)、在什么时机使用主动推送提交功能效果最明显?答:页面链接诞生或发布时立刻提交,这样效果是最好的。5)、每次提交一条数据和多条数据有什么区别?答:没有区别。6)、重复提交已经发布的链接会有什么问题?答:会有两个影响。首先,将浪费您提交的配额,每个站点每天可提交的数量是有限制的,如果您都提交了旧链接,当有新链接时可能因为配额耗尽无法提交。第二,如果您经常重复提交旧链接,我们会下调您的配额,您可能会失去主动推送功能的权限。7)、主动推送可以推多少条链接?答:主动推送可提交的链接数量上限是根据您提交的新诞生有价值链接数量而决定的,百度会根据您提交数量的情况不定期对上限额进行调整,提交的新诞生有价值链接数量越多,可提交链接的上限越高。3、超级蜘蛛SEO外链工具 4、友情链接加速网页收录5、站内链接加速网页收录6、高质量外链加速网页收录7、网站添加百度站长工具-主动推送代码,添加网网站html的body内8、绿泡泡堂SEO-快速收录SEO工具
原标题:哈锅乐成 进入太阳能光热发电范畴 中广核德令哈项目是我国第一个50MW槽式太阳能光热发电项目,哈电团体 哈尔滨锅炉厂有限责任公司负责研发制造定期排污扩容器、连续 排污扩容器和汽水分离器三台产物 ,日前,这三台产物 全部顺遂 产成,发往现场,标记 着哈锅开辟 太阳能光热发电市场迈出了紧张 一步。 据相识 ,中广核德令哈项目位于青海省海西蒙古族藏族自治州德令哈市财产 园区内,是国内光热发电财产 比年 来首个开工建立 的贸易 运用项目,也是哈锅首个利用 太阳能发电项目。由于产物 用于光热发电,运行条件差别 于其他通例 装备 ,在技能 上提出了更高的要求。为了包管 产物 性能和利用 寿命,哈锅技能 职员 做了大量分析模仿 和论证,对产物 性能和强度举行 了多次核算,确保了产物 的可靠性和安全性。记者采访中相识 到,光热发电项目是比年 国家重点攻关项目,属于节能环保型产物 ,重要 是利用 太阳热能变化 成 高温蒸汽驱动蒸汽轮机举行 发电。哈锅中广核德令哈项目产物 顺遂 产成具有紧张 的战略意义,标记 着哈锅乐成 进入太阳能光热发电范畴 ,实现了财产 开辟 新突破,为企业转型升级提供了有力支持 。(李天彪记者李爱民)
域名解析是什么意思,域名解析怎么弄 网站建设离不开域名和服务器,对于域名而言,就是要做好域名解析,把域名解析到对于的服务器ip上。那么具体域名解析是什么意思,域名解析怎么弄呢?本文就给大家介绍下域名解析相关的问题,以及域名解析错误怎么办。一、域名解析是什么意思域名解析是把域名指向网站空间IP,让人们通过注册的域名可以方便地访问到网站的一种服务。域名解析也叫域名指向、服务器设置、域名配置以及反向IP登记等等。说得简陋点就是将好记的域名解析成IP,服务由DNS服务器完成,是把域名解析到一个IP地址,然后在此IP地址的主机上将一个子目录与域名绑定。通常采用自顶向下逐级解析的算法。域名解析通常是跟DNS和网站服务器联系的:1、DNS域名解析服务器就是为了给你解决这问题才来到这个世界的,对DNS就是域名解析关键之所在,域名解析服务器是一个提供域名指向的服务器软件其实从上面流程也能看出。2、网站空间简陋地讲,就是存放网站内容的空间。有了门牌还在建个房吧!网站空间就象是建房子的地皮,有了空间才可以把网站程序放上去我们才可以看到网站。3、泛域名解析泛域名解析是指将*.域名解析到同一IP。在域名前添加任何子域名,均可访问到所指向的WEB地址。也就是客户的域名acom之下所设的*.acom全部解析到同一个IP地址上去。比如客户设**.acom就会自己自动解析到与acom同一个IP地址上去。二、域名解析怎么弄首先步:在域名治理面板,抉择新增解析记录。截图中是已经做好解析的二级域名。第二步:填写相关信息1、主机记录:就是二级域名的内容,比如说论坛域名通常设置bbs,那么整个二级域名就是bbs.abc.com这样的形势;2、类型:通常抉择A记录就可以了,如果服务器的ip随时会发生变化,则需要抉择CNAME这种形势;3、线路:抉择默认即可;4、记录值:就是网站服务器的ip地址。填写完信息后,提交就可完成域名解析。三、域名解析错误怎么办1、dns错误解决办法:使用杀毒软件对电脑进行全盘扫描。2、网站故障当发现打开某些网站会呈现dns错误,但又有些大站打开一切正常,这种情况多数由于网站域名服务器故障或网站服务器有故障。解决办法:由于是网站本身的问题,所以一般也无法解决,只有等到网站恢复正常才可以访问。3、网络故障网络故障是比较常见的打引起DNS错误的原因,经常由于没网络打开网页就有类似的提示。解决办法:修复网络问题即可。关于域名解析的问题,本文重点介绍了域名解析是什么意思,域名解析怎么弄,以及域名解析错误怎么办。总之来说,域名解释还是很好理解的,并且域名解析的做法也很简陋,只需要两个简陋的步骤就能解决。至于域名解析错误,通常大部分网站是不会呈现域名解析错误的,如果遇到了域名解析错误的情况,可以根据前面说过的办法去搞定。 --
谷歌的官方域名谷歌公司的官方域名是“googlecom”,而非“Gcn”“cn”域名的寄义 “cn”是中国的国家顶级域名,通常用于标识在中国注册或运营的网站固然 谷歌在中国设有分公司和办公室,但并未注册或利用 “Gcn”这个域名大概 的重定向假如 有人实行 访问“Gcn”,他们很大概 会被重。
关于SEO而言,在日常工作中,咱们常常会在百度中检索"网页标题"的排名状况,但偶尔也会遇到一些特别状况,比方:在百度查找成果中显现的网页标题是过错的,乃至是不相关的,这让SEO新人感到很困惑。标题显现不全严厉意义上这并不能算是网页title显现过错,因为它仅仅并没有彻底展示,其主要原因是标题文字过长,特殊是在挪动端,这儿给咱们主张,标题的字数尽量维持在0个字效果,而关键词尽量不要超越个字。 标题抓取失误因为博客本身技能原因,导致百度蜘蛛并不能很好的抓取网页标题,而是随机从页面中提取的相关标题,典型的事例便是整站是Flash站点。那么处理这个问题,你能够使用百度查找资源平台下的抓取确诊,先核对问题页面,看看百度蜘蛛是否能够顺畅抓取。 网站遭受黑客在以往的SEO工作中,咱们常常发现被黑网站出现这个问题,最常见的技能手段便是"百度快照绑架"当蜘蛛抓取的时分,它会主动替换别的一套标签,然后促进页面标题在查找成果中,展示过错,而站内显现的时分却没有任何问题。 Robots封禁这是新手SEO,常常出现的一个严重过错,当装备Robots的时分,封禁了特定的目录,导致部分目录下的页面内容无法抓取,因为页面权重相对较高,百度仍旧是抓取了这个页面,而并没有进行索引,比方:淘宝主页。
“404 NOT FOUND, 404错误 ”(或“ 找不到页面 ”) – 是服务器无法找到用户请求的文档时发生的标准HTTP状态代码 。基本上,这是一个不存在或链接丢失的页面。可能会以以下情况呈现:404404错误404未找到错误404404页面不存在未找到错误404找不到HTTP 404404 NOT FOUND是什么原因导致404错误?网页已从网站上删除用户输入的URL地址不正确页面已挪动,重定向配置不正确服务器呈现故障志愿情况下,网站不应该呈现404错误。但是,如果网站拥有大量的页面这是无法避免的。 当一个网页被绕过时,搜索引擎机器人会报告几十个错误,但如果这个数字增添了几百甚至几千呢?如果404错误的数量超过网站总页数的10%,则应启动快速干预和解决方案。出现大量404错误可能有很多原因,但大多数都与代码,链接,服务器配置问题有关。另一个原因是病毒攻击(例如,在网站上放置木马)。即使在防备和删除之后,机器人将在一段时间后继续绕过创建的页面,这也可能导致呈现大量404错误。如何追踪损坏的链接及其重定向?1.Yandex.Metrica 在Yandex.Metrica中跟踪损坏的链接和重定向,转到“访问者设置”。只需将此字符串放在计数器代码中:params:window.yaParams||{ }});此外,再将此JS代码放在404页面上的某个位置:这里url – 是404页面的当前地址,url referrer是访问它的地址。这样,您不仅可以跟踪所有损坏的链接,还可以跟踪它们所在的页面。2.Google Analytics将此代码放在404页面上,跟踪重定向其中document.location.pathname + document.location.search – 是网站上找不到的网页网址; document.referrer – 用户重定向的页面的URL。3.百度站长在百度站长治理平台查看抓取反常选项,并下载对应的数据进行查看。4.Google Search Console在Google网站站长中使用“抓取” – “抓取错误” – “错误404”查找错误。404错误对SEO有什么影响?有一种观点认为,带有404错误的页面会直接影响网站的索引及其在搜索结果中的位置,但在大多数情况下,这种说法是错误的。机器人找到这样的页面会发生什么?它将它从索引中删除(如果它在那里,如果没有 – 机器人根本不扫描它)。因为它不再具有信息性和实用性,但是你需要记住SOFT错误的存在。SOFT 404不是来自服务器的官方响应,而是标记,在爬行后由搜索引擎分配给页面。抉择301还是404?您是否配置了404服务器响应或301重定向?要确定这一点,必须分别分析每个案例。如果由于某种原因,页面从站点中完全删除,请配置404服务器响应。 在以下情况下301重定向更好:页面的地址已更改(例如,由于结构更改);页面与用户的请求相关;可以重定向到具有类似内容的另一个页面(具有相同的主题);404错误和行为因素在用户搜索某些内容呈现404错误页面时。在这种情况下,用户通常会做什么?关闭选项卡并搜索新网站。404服务器响应的页面越多,用户遇到此错误的时间越多,他们在网站上花费的时间就越少,并且会很快离开。搜索引擎算法以一种特殊关注行为因素的方式运作,因为它们在排名过程中起着非常重要的作用。为避免恶化行为因素,您应该鼓励用户留在网站上。要做到这一点,您应该以有趣和创造性的方式解决创建404页面的问题。对于404错误页面的一般建议:它应该包含主页面的链接;您应该礼貌地告知用户他/她想要访问的页面不可用,当然这一切都取决于网站的主题和目标受众。对于网上商店,添加搜索行和提供服务的站点 – 联系信息是必须的。相关内容:HTTP500内部服务器错误修复方法404页面自适应html源码,404模板页面下载相关文章推举网站打开速度慢怎么办? 众所周知,页面打开速度在我们的网站中很重要。在百度排名系统方面,页面速度是一个关键因素。百度运算网页速度,并根 […]...如何正确实施网站分页? 分页是什么? 分页是页面的序数编号,通常位于网站页面的底部,在大多数情况下,它用于页面分区。通常情况下看起来像 […]...HTML5:SVG入门 SVG(可缩放矢量图形)答应您在网页中创建完全按比例放大和缩小的图像,无论用户设备屏幕的大小如何。此外,您可以 […]...NGINX是什么,以及它是如何工作的 NGINX,发音类似于“engine-ex”,是一个开源Web服务器,自从它最初作为Web服务器成功以来,现在 […]...自定义404错误页面优化 虽然您可能渴望404页面错误永远不会发生,但这似乎是不可避免的,无论是什么原因,404错误都会发生。 在这篇文 […]...404, NOT, FOUND错误呈现的原因及解决办法
“404 NOT FOUND, 404错误 ”(或“ 找不到页面 ”) – 是服务器无法找到用户请求的文档时发生的标准HTTP状态代码 。基本上,这是一个不存在或链接丢失的页面。可能会以以下情况呈现:404404错误404未找到错误404404页面不存在未找到错误404找不到HTTP 404404 NOT FOUND是什么原因导致404错误?网页已从网站上删除用户输入的URL地址不正确页面已挪动,重定向配置不正确服务器呈现故障志愿情况下,网站不应该呈现404错误。但是,如果网站拥有大量的页面这是无法避免的。 当一个网页被绕过时,搜索引擎机器人会报告几十个错误,但如果这个数字增添了几百甚至几千呢?如果404错误的数量超过网站总页数的10%,则应启动快速干预和解决方案。呈现大量404错误可能有很多原因,但大多数都与代码,链接,服务器配置问题有关。另一个原因是病毒攻击(例如,在网站上放置木马)。即使在防备和删除之后,机器人将在一段时间后继续绕过创建的页面,这也可能导致呈现大量404错误。如何追踪损坏的链接及其重定向?1.Yandex.Metrica 在Yandex.Metrica中跟踪损坏的链接和重定向,转到“访问者设置”。只需将此字符串放在计数器代码中:params:window.yaParams||{ }});此外,再将此JS代码放在404页面上的某个位置:这里url – 是404页面的当前地址,url referrer是访问它的地址。这样,您不仅可以跟踪所有损坏的链接,还可以跟踪它们所在的页面。2.Google Analytics将此代码放在404页面上,跟踪重定向其中document.location.pathname + document.location.search – 是网站上找不到的网页网址; document.referrer – 用户重定向的页面的URL。3.百度站长在百度站长治理平台查看抓取反常选项,并下载对应的数据进行查看。4.Google Search Console在Google网站站长中使用“抓取” – “抓取错误” – “错误404”查找错误。404错误对SEO有什么影响?有一种观点认为,带有404错误的页面会直接影响网站的索引及其在搜索结果中的位置,但在大多数情况下,这种说法是错误的。机器人找到这样的页面会发生什么?它将它从索引中删除(如果它在那里,如果没有 – 机器人根本不扫描它)。因为它不再具有信息性和实用性,但是你需要记住SOFT错误的存在。SOFT 404不是来自服务器的官方响应,而是标记,在爬行后由搜索引擎分配给页面。抉择301还是404?您是否配置了404服务器响应或301重定向?要确定这一点,必须分别分析每个案例。如果由于某种原因,页面从站点中完全删除,请配置404服务器响应。 在以下情况下301重定向更好:页面的地址已更改(例如,由于结构更改);页面与用户的请求相关;可以重定向到具有类似内容的另一个页面(具有相同的主题);404错误和行为因素在用户搜索某些内容呈现404错误页面时。在这种情况下,用户通常会做什么?关闭选项卡并搜索新网站。404服务器响应的页面越多,用户遇到此错误的时间越多,他们在网站上花费的时间就越少,并且会很快离开。搜索引擎算法以一种特殊关注行为因素的方式运作,因为它们在排名过程中起着非常重要的作用。为避免恶化行为因素,您应该鼓励用户留在网站上。要做到这一点,您应该以有趣和创造性的方式解决创建404页面的问题。对于404错误页面的一般建议:它应该包含主页面的链接;您应该礼貌地告知用户他/她想要访问的页面不可用,当然这一切都取决于网站的主题和目标受众。对于网上商店,添加搜索行和提供服务的站点 – 联系信息是必须的。相关内容:HTTP500内部服务器错误修复方法404页面自适应html源码,404模板页面下载相关文章推举网站打开速度慢怎么办? 众所周知,页面打开速度在我们的网站中很重要。在百度排名系统方面,页面速度是一个关键因素。百度运算网页速度,并根 […]...如何正确实施网站分页? 分页是什么? 分页是页面的序数编号,通常位于网站页面的底部,在大多数情况下,它用于页面分区。通常情况下看起来像 […]...HTML5:SVG入门 SVG(可缩放矢量图形)答应您在网页中创建完全按比例放大和缩小的图像,无论用户设备屏幕的大小如何。此外,您可以 […]...NGINX是什么,以及它是如何工作的 NGINX,发音类似于“engine-ex”,是一个开源Web服务器,自从它最初作为Web服务器成功以来,现在 […]...自定义404错误页面优化 虽然您可能渴望404页面错误永远不会发生,但这似乎是不可避免的,无论是什么原因,404错误都会发生。 在这篇文 […]...404, NOT, FOUND错误呈现的原因及解决办法
现在很多人都在做搜索引擎优化,大的方向每个人都懂:内容,标题,关键字,外链等等。但是要想比别人做得更好,就需要看细节的东西了。本文列出了一些常见搜索引擎优化问题,以及具体的解决方案,渴望对相关的人员有所帮助。1. URL的大小写这个问题常见于使用.NET技术的网站,事实上是因为网站服务器在配置上就是要响应大写的URL,它不会重定向或者重写小写的版本。随着搜索引擎在识别标准版本和忽略重复版本的技术上有了很大的进步,我们也常常不关注这个问题。但是,搜索引擎并不完美,所以我们必须要自己动手。如何解决:在IIS 7服务器上有一个URL重写模块,可以帮助解决这个问题。在这个工具的界面上,你可以执行小写的URL,之后这条规则就会加到网站的配置文件中,从而解决问题。2. 首页有多个版本这个问题也是经常会在.NET的网站上碰到,当然其他的平台也会有。举个例子,我们通常会碰到这种URL:www.example.com/default.aspxwww.example.com/index.htmlwww.example.com/home当然,现在搜索引擎也会帮你解决这个问题,但是最好的做法是首先时间自己解决。如何解决:要发现这些网页可能会有点棘手,因为不同的平台有不同的URL结构,所以解决方法有点像猜谜。你可以用工具摹仿蜘蛛爬行你的网站,导出excel表的爬行记录,筛选Meta标签,搜索网站首页标题,很容易就可以找到重复的首页。我比较倾向于301转向,将其他重复页面指向到我们确定的那个首页,你也可以通过添加rel=canonical标签来解决这个问题。另一种方案是使用工具,例如Screaming Frog,来摹仿蜘蛛爬行,找出指向重复页面的链接。然后你可以编辑这些重复的页面,指向正确的URL,这样就不需要通过301转向而担心链接权重的降低。小提示:你可以查看每条URL的谷歌缓存,来看是否有问题。如果谷歌没有发现重复的URL是一样的,你可以看到这写URL不同的PR和缓存日期。3. URL结尾的查询参数在有数据库驱动的电子商务网站,这种问题很常见。也并不是说其他类型的网站没有,但是一般电子商务网站上有大量的产品属性和筛选选项,如颜色,大小等。在这种情况下,用户点击的URL在搜索引擎优化方面都比较友好,但是可以常常看到有很多链接的结尾是像我下面的例子这样的:www.example.com/product-category?colour=12在这个例子中,某种颜色是作为筛选产品类别的依据。这种筛选方法对于用户来说是很好的,但是对搜索引擎就不好了,尤其是有时候客户并不是用颜色来搜索某个特定的产品。在这种情况下,对某些关键词来说,这个URL就不是一个好的登陆页。当很多的参数结合起来的时候,可能会导致蜘蛛资源被用尽。更糟糕的是,有时候尽管参数的位置不一样,但是却返回相同的内容,例如:www.example.com/product-category?colour=12&size=5www.example.com/product-category?size=5&colour=12尽管路径不一样,但是这两个URL返回的是相同内容,搜索引擎会认为这些页面是重复内容。请记住,谷歌是根据你网站的PR值来分配蜘蛛资源的。请确保这些蜘蛛资源有充分的利用。如何解决:在继续之前,我们要解决另外一种常见的相关问题:URL可能对搜索引擎不友好是因为他们不是数据库驱动的。在这个特别情况下,我并不担心以上的问题,我更担心的是蜘蛛资源浪费和一些不需要的页面被索引了。第一要解决的是哪些页面是要蜘蛛爬取和索引的,这个取决于你的关键字研究,你需要交叉引用数据库中核心关键词的属性。在电子商务网站,每个产品都有其关联的属性,这也是数据库的一部分。下面是一些常见的例子:Size (i.e. Large) 尺寸(大)Colour (i.e. Black) 颜色(黑色)Price (i.e. £49.99) 价格 (£49.99)Brand (i.e. North Face) 品牌(North Face)你的工作是要找出哪些属性是关键词的一部分,用户可以找到这个产品。还要确定用户需要使用哪些属性的组合。这样做后,你可能会发现一个搜索量很高的关键词是North Face + waterproof jackets(防水夹克)。这时,你需要做一个被爬行和索引的North Face + waterproof jackets登陆页。还要确保数据库属性中有一个对搜索引擎友好的URL,不是"waterproof-jackets/?brand=5" 而是"waterproof-jackets/north-face/."还要将这些URL添加在网站的导航结构中,PR值可以传递,用户也很容易找到。另一方面,你可能会发现Northface+Black这个组合的关键词搜索量很低。你也就不会想要Northface+Black这两个属性的页面被爬行和索引。如果你已经清晰哪些属性是要被索引的,哪些不需要,下一步行动要不要开始取决于URL有没有被索引。如果URL还没有被索引,最简陋的方法是把URL结构添加到robots.txt文件中。要完成这个可能需要多尝试一下RegEx,请确保RegEx是正确的来以防万一。此外一定要使用谷歌的治理员工具Fetch, 需要注意的是,把已经被索引的URL添加到Robots.txt文件中不会让 他们从索引库中被删除。如果URL已经被索引,我们需要用rel=canonical标签来解决。如果不巧网站正在开发中,你不能进行修改的工作,你会像上面遇到的情况一样不能解决核心问题,这时候,rel=canonical标签可以帮助你延迟一点解决问题。把rel=canonical标签添加到你不想被索引的URL上,然后指向不想被索引的相关URL。4. 软404错误这种情况通常不在预料中,用户没有觉得什么不一样,但是搜索引擎蜘蛛知道不同之处。软404页面意味着你发现不了真正的错误页面,也找不到网站上那些地方对用户体验不好。从链接建设的角度看,哪个方法都不是最佳抉择。可能你有过来的链接链到了坏的URL上,但是却很难追踪这些链接,然后重定向到正确的页面。如何解决:幸运的是,对于网站开发人员来说,返回一个404状态比200要相对简陋很多。设计一个很酷的404页面对于你自己和用户来说都是一种享受。用谷歌治理员工具中的一些功能可以帮助你找到软404页面,它会告诉你已经检测到的软404页面。你也可以自己手动检测,随便用一个坏链接来测试,看看你得到的返回状态是什么。我很爱慕用Web Sniffer这个工具来检测,如果你是用Chrome浏览器的话,也可以用Ayima这个工具。5. 302重定向而不是301重定向网站开发人员很容易将这个重定向弄错,因为从用户的角度来看,两者没有区别,但是搜索引擎确实分别对待的。301重定向是永久性的,搜索引擎认为它会传递权重到新的页面。302重定向是暂时的,搜索引擎认为它不会传递权重,因为搜索引擎觉得某天这个页面又会回来。如何解决:要找到302重定向的URL,我建议用Screaming Frog或者是IIS SEO Toolkit这两个工具,它们可以进行深度爬行。然后检查看它们是应该用302重定向还是301.要解决这个问题,你可以要求网站开发人员改变规则,用301重定向而不是302。6. 坏的/旧的SitemapXML网站地图对于搜索引擎蜘蛛爬取网站的所有链接是非常有用的,虽然有时候它不是非常必要。Sitemap可以正确引导搜索引擎。但是,一些XML sitemaps是一次性的,很快就过时了,导致一些坏链接还在里面,但是新的链接却没有。志愿的状态是,要定期更新XML sitemap,删除坏链接并添加新链接。对于一个大的网站来说,经常添加新页面是很重要的。Bing也说过,他们对于sitemap的“脏乱”也是有一个临界值的,如果超出了这个临界值,他们就不那么信赖这个网站。如何解决:第一,审核你当前的sitemap,找出坏链接。可以用Mike King这个工具。其次,告诉网站开发人员网站的动态,以便定期更新。根据你的资源来确定周期:每天一次,每周一次或者是每月一次。这些更新绘画一些时间,但是从长远来说会节约你很多时间的。这里有个额外的提示:你可以尝试创建一些sitemap,只包含最新的产品,然后以更高的频率来更新这些特定的sitemap。如果你有足够的开发资源,也可以创建一个sitemap,只包含没有索引的URL。7. 给robots.txt文件错误的指令最近遇到一些例子,很多页面被爬取和索引是因为他们被锁定在robots.txt文件中。这些页面之所以会被爬取是因为robots.txt文件中的指令是错误的。单独的命令是正确的,但是结合在一起是就是错误的。如何解决:谨慎使用robots命令,如果有单独的指令,要确认接下来的其他指令是什么,即使是这些指令已经被提到过。充分利用谷歌治理员工具的测试功能,它会告诉你它对你的robots.txt文件的反应。8. robots.txt中有隐蔽字符我最近帮客户做了一个技术审核,发现谷歌治理员工具给我一个告诫:“语法不理解”。我检查了一遍文件,然后测试了一下,一切都很正常。最后我的同事诊断出了问题:在文件中发现了一个隐蔽字符。如何解决:解决这个问题很简陋。简陋重写robots.txt文件,然后运行一遍命令,再重新检查。9. 谷歌爬行 base64 URL这个问题很有趣,最近一个客户发现在治理员工具中发现404错误在大量增添。我们一看,发现几乎所有的错误都是这个格式的URL:/AWYgeW91IGhhdmUgZGVjb2RlZA0KdGhpcyB5b3Ugc2hvdWxkIGRlZmluaXRlbHkNCmdldCBhIGxpZmU/。治理员工具会告诉你这些404的来源,我们就去页面找这个URL是怎样生成的。经过大量的发掘,我们发现这些信赖凭证(authentication tokens)都是Ruby on Rails生成的,是为了防止跨站点请求。在网页的代码中有一些,谷歌蜘蛛还试图去爬取这些信息!更大的问题是,这些信赖凭证(authentication tokens)是动态生成的,并且独一无二,因此我们找不到。如何解决:针对这个情况,很幸运,我们可以通过添加Regex到robots.txt文件中,告诉蜘蛛不要爬行这些URL。10. 服务器配置不当我遇到了一个问题,某个网站的主登录页没有排名。这个页面以前是有排名的,但是在某个时候掉下来了。所有的页面看起来都不错,看不出有任何的作弊嫌疑。经过大量的调查和发掘,最后发现原先是由于服务器的错误配置,一个小小的错误造成的,这个服务器是HTTP标头的。通常,客户端(浏览器)会发送接受标头,指出它能理解的文件类型,这几乎不会修改服务器的操作。服务器端会发送内容形式标头,来识别文件是HTML,PDF或者是JPEG之类的。这家网站的服务器返回的是文件类型标头。如果你发送的接受标头是以text/html开头,那是服务器作为内容类型标头返回的内容。这种行为很特殊,但是很难注意到,因为浏览器总是发送以text/html开头的接受标头。但是,Googlebot在爬行的时候会发送"Accept:*/*"(表示它接受所有的东西)。我发现,如果我发送*/*标头,服务器就会挂掉,因为*/*不是一个有效的内容类型,服务器会崩溃,发送错误的响应。把浏览器的用户代理改成Googlebot并不会影响HTTP标头,像websniffer这种工具不会发送跟Googlebot一样的标头,因此,你根本不会注意到这个问题。改掉这个问题几天后,页面又重新被索引了。常见的搜索引擎优化问题, 以及解决方法-长沙网络推广公司