SEO名人好文章系列,是本人收集前辈们分享过的精华,听听大牛的思考,对自己做SEO帮助很大。今天分享的是GoGo闯的好文章:【SEO牛人GoGo闯】:SEO数据分析②几个数据分析的实例
4个多月没更新,原因是忙且懒。一登后台,关注都1000多了,上回看记得还不到500......趁现在有点时间,赶紧瞎写一篇。
上回数据分析①主要说的是爬虫和数据分析的关系,那么数据分析②打算说几个数据分析的案例。
案例1:收录分析
- 背景
要分析的页面类似大众点评的商户页面,UGC构成页面的主体内容,所以UGC越多,页面内容越饱满。
此类页面总体收录情况不佳,又因为UGC数量决定页面包含的信息量,于是想看看UGC数量跟收录率的关系。
- 指标
ITSEO年会道哥分享过,收录分索引库和进快照库的区别,大众上说的收录是指进快照库的,而决定引入流量大小的是进入索引库的页面。所以确定如下指标
倒排占比:进入索引库的页面比例。指能在百度通过关键词搜索出来,有机会拿流量的页面。小伙伴可以到:site.itseo.net 来查询一批页面的倒排占比。
正排占比:进入快照库的页面比例。指能通过url搜出来页面,但通过关键词不能。只建立快照,但没编入索引的页面。是基本拿不了流量的页面。
收录占比:进入快照库 + 索引库的页面比例
未收录占比:快照都没有的页面比例。要么还没抓到,要么页面质量太渣
- 检测方法:
因为要查看UGC数量与收录之前的关系,先把所有商户页面按对应的UGC数量分个组,比如UGC数量为0的页面分成一组、UGC数量为1的分成一组.....UGC数量10-20的分成一组......
分完组后,开始跑每组页面的上述四个指标,跑出的数据如下
- 数据:
- 分析:
横坐标为UGC数量,纵坐标为对应的指标数据。观察数据,可以看到几个明显的趋势:
① UGC数量越多,倒排占比越高
② UGC数量越多,正排占比越少
③ 总收录率,除了0条UGC的页面,其他基本持平
④ 按照倒排占比的增长幅度,UGC 0-1是一个区间,1-10是一个区间,10+是另一个区间
通过数据可以发现,通过增加UGC数量,可以增加倒排占比,进而引入更多的搜索流量。
其中对0条UGC的页面开刀是性价比最高的,因为0条UGC的页面只要增加1个UGC,倒排占比就可以增加3倍。
于是我们可以想各种办法来给0条UGC的页面导入1条UGC数据,那导入UGC从哪来?怎么改?是倒腾内容的事,之前也专门写过这方面的内容,可以去看历史消息。
案例二:流量分析
流量下跌,有些SEO碰见总会有些慌张的,当然流量下跌也不一定是SEO的问题,也可能是外部原因,也可能是行业趋势,也可能是搜索引擎的正常变动(也有可能是抽风,但一般不是~.~)
有个比较完善的排查流程:
① 排查统计工具是否出现问题
统计工具与web log做对比,或多个统计工具对比,同比上周、去年,环比昨天,看趋势是否一致。
若一致则很可能是正常搜索趋势;若不一致,则可能是网站自身、搜索引擎变动、统计工具BUG导致(比如统计代码加错了、误删了......),具体原因需进行下一步排查
② 排查是否是阿拉丁、竞价或其他特性展示的变化抢走自然搜索流量。若不是,则继续下一步
③ 排查是否所有搜索引擎都掉。
因为同一时间点,所有搜索引擎都被降权的概率太低了。所以,若所有搜索引擎都掉,则是网站本身出了问题,排查日志是否出现非200状态码,或者web服务器节点能否正常访问等。若只是某个渠道下跌,则继续进行下一步排查
④ 检测搜索引擎流量分发情况。
接着上一步,若某个搜索引擎流量下跌,不一定是SEO问题,也可能是搜索引擎的正常变动。首先,一类流量词(注意这里是流量词,不是长尾词)80%的流量总是会分发到10-20个网站,我们按照找SEO竞品的思路,先找到流量分发TOP20的网站,然后长期监控同一批词在这20个网站在搜索引擎的展现情况。
正常情况,这20个网站的展现情况应该是此起彼伏的,比如原先展现量最大的5个站掉了20%,那剩下15个站加一块应该涨了20%,这种情况是正常流量分发变化,因为搜索引擎同时惩罚多个同行业站点的概率也不高。但若只有你一个站点的展现量往下掉,那基本上可以确定是自身SEO问题了。
⑤ 检测网站收录、排名,该看日志看日志,该查排名查排名,这就对症下药了。
之前我面试每个人都问了这个问题,挺多人都直接跳到第5步,而忽略前4步的排查,这有可能会造成无用功,而浪费很多时间。
案例三:找可优化的方法
做SEO总共就这3点:提高页面质量、优化链接结构、提高链接数量,但具体手段需要看不同情况,方法上是需要不断创新的,来满足最本质的要求。
找可优化的方法,需要先找到行业内做的比较好的网站,然后观察这些站的共同点,然后开始抄。
比如好多流量站(日均IP >= 页面数量的那种)的共同点:模板轻、速度快、页面包含连续大量的文本内容、标题简短且命中搜索词、关键词竞争度小但有点搜索量、网站结构简单、同主题内容高度聚合、有一定外部链接......
那么以上这些点就可以照搬到自己的网站上
GoGo闯个人介绍:
流量贩子,91年4月生。做过SEO,搞过站群,熟悉python、linux、mysql、mongodb等。好运动,一礼拜不骑行、跑步、举铁就浑身难受。果粉、黑色脑残粉。希望 ‘成为一个有趣的人,拥有保持独立人格和独立思考能力’。好折腾,连续写一天代码不头疼,连续学一年新语言不怵头。好户外,已骑行川藏线、滇藏线、环津京翼。
个人博客:http://www.kaopuseo.com/ (探讨SEO、黑帽、黑色产业、互联网流量引入、流量转化与变现的观点、想法及技巧)。微信公众号:流量贩子。
西安SEO总结:
(1)收录分析:倒排、正排、占比
(2)流量分析(暴跌):统计工具因素、是否各大搜索都是、百度阿拉丁竞价因素、同行网站关键词监控(百度流量分发)、自身网站收录排名
(3)找可优化的方法:提高页面质量、优化链接结构、提高链接数量
(4)优秀流量站(日均IP >= 页面数量的那种)