SEO名人好文章系列,是本人收集前辈们分享过的精华,听听大牛的思考,对自己做SEO帮助很大。今天分享的是Zero的好文章:《走进搜索引擎》SEO要点章节
一直认为《走进搜索引擎》是一本相对最适合的SEO入门书籍。
其中的内容,对于SEO学习初期,尤其需要先形象了解中文分词、倒排索引与TF-IDF三者之间的逻辑关系,很好的代表了从用户搜索一个词,到搜索引擎返回搜索结果的大致实现机制。可以先排除掉大多数SEO新手对于“关键词”的误解。
但同时,毕竟此书本身是搜索引擎领域的书籍,很多比例的内容对于SEO的作用也不大。因此我之前整理了其中的SEO重点章节,页数对应的是《走进搜索引擎》的第二版。第一版的话,只能去对下章节名了,其中多数章节应该是类似的。
下载系统
Page 6 搜索引擎的体系结构
Page 12 万维网的直径
Page 16 宽度优先策略
Page 19 不重复抓取策略
Page 25 网页抓取优先策略
Page 26 网页重访策略
Page 31 其他应该主要注意的礼貌性问题
分析系统
Page 46 网页结构化的目标
Page 52 通过投票方法得到正文
Page 56 网页查重
Page 61 中文分词
Page 68 PageRank的基本想法
索引系统
Page 87 倒排索引
查询系统
Page 113 什么是信息熵
Page 115 检索词和查询词的区别
Page 116 自动文本摘要
Page 122 关键词权重的量化方法TF-IDF
Page 137 中文自动摘要
Page 145 推测用户查询意图
排序学习
Page 186 查询相关/无关的排序模型
Page 217 排序特征
Zeor个人介绍:
ZERO 90后 技术宅 于赶集网管SEO流量相关事宜 各类技术涉及广泛,Python每天都打交道,患有离开VIM会死症状,热爱Linux弃用Windows多年 SEO从通宵看完一本误人子弟的电子书开始,研究理论、观察实际手法、自己落实推进,也做出了几十万的日流量 拥有那么些水瓶座的博爱精神,
SEO前线学堂(www.seoqx.com),旨在传播领先的SEO优化思路、操作方向,及相应SEO教程案例的分享。创办者ZERO,曾全职负责过赶集、美团等网站,后创业提供顾问业务,外包服务于各种行业规模不一的网站。