SEO名人好文章系列,是本人收集前辈们分享过的精华,听听大牛的思考,对自己做SEO帮助很大。今天分享的是GoGo闯的好文章:【SEO牛人GoGo闯】SEO数据监控系统
用了几天时间重做了数据监控系统的核心部分。
https://github.com/a631381602/ceshi
https://github.com/a631381602/ceshi_include
更改点:
1、全部采用Scrapy作为数据抓取工具,原来是pycurl + beautifulsoup。
2、代理来源为scrapinghub + 自建http代理服务器,一块使用
3、一台阿里云服务器做数据抓取,另配置一台阿里云RDS做数据存储,存放抓取结果、JS报表数据、url和关键词
4、djanjo做前端页面,展示目前监控的进度
监控周期由原先的5~7天缩减到1天,目前每天全站,排名抽查关键词样本量24万,收录抽查样本量20万。
后续有时间搞下集群,可能的话争取搞个查询速度不逊于奏鸣的系统~前提是公司给我报销的情况下~~
截图
抓取数据:
分析数据:
图表:
文章来源:GoGo闯博客http://www.kaopuseo.com/?p=169
GoGo闯个人介绍:
流量贩子,91年4月生。做过SEO,搞过站群,熟悉python、linux、mysql、mongodb等。好运动,一礼拜不骑行、跑步、举铁就浑身难受。果粉、黑色脑残粉。希望 ‘成为一个有趣的人,拥有保持独立人格和独立思考能力’。好折腾,连续写一天代码不头疼,连续学一年新语言不怵头。好户外,已骑行川藏线、滇藏线、环津京翼。
个人博客:http://www.kaopuseo.com/ (探讨SEO、黑帽、黑色产业、互联网流量引入、流量转化与变现的观点、想法及技巧)。微信公众号:流量贩子。
西安SEO总结:
(1)利用Python进行SEO的数据监控
(2)利用它数据来科学化SEO
(3)利用科学化的SEO来做出更多的流量