(1)选择策略,到底该获取那些网页。
(2)重访策略,多久重新获取已经访问过的网页。
(3)并行策略,如何安排分散式的资料获取。
(4)不扰策略,如何在获取资料时,不影响网站的效能。
并行策略与搜索引擎优化没有太大的关联,我们不再深入讨论。后续就来谈搜索引擎的选择策略、重访策略与不扰策略。
不同的搜索引擎有不同的资料获取策略,不过最终目的都是希望把力气花在优秀的资料上,如果余力再去获取其他的资料。因此选择策略就主宰了获取优秀资料的重任。
计算机不会知道什么样的资料才是优秀的资料,因此起点就由人来决定。多数搜索引擎会由可以信赖的第三方开始,这个可以信赖的第三方就是具有公信力的目录网站、学术单位、公家单位与非营利的组织团体。因此被这个可以信赖的第三方所连接的网站就具备较优势的起点,但是并非保证能够有优秀的结果。
因此许多人认为被目录网站或被学术单位收录可以有较好的搜索结果,其实只是一个误会,最后结果是否能过如愿,ahi牵涉太多的因素。有太多网站没有被信赖的第三方连接,却比被信赖的第三方连接的网站有更优秀的搜索结果。
不管如何,有个优势的起点总是好事,因此搜索引擎优化操作还是尽量要被信赖的第三方连接。如果还是无法被连接的话,那么使用各搜索引擎的登录网站也是一个方法。