网站收录问题
2008-06-26 5:33 pm 作者:kblog
问:我新开的网站www. abcd. com,Google收录正常,百度和雅虎就是不收录。
请问,我的网址以前有人使用过的,是不是以前的人作毕,被K掉了呀,还有,如果查,这个域名是不是被百度K过?
答:百度从07年10月以后对收录新网站尤其是.cn网站更加严格了,在这段时间里面一直在研究如果让百度收录的问题,虽然还没有见到什么真正的效果在哪?但是几个基本的原因已经分析出来,总体应该归纳于下面几点:
1.百度反作弊手法调整,网页关键字过多(大家也许没有注意到,因为经常做站的人是不会用什么计算工具的,一切凭感觉 导致了网页关键字过度)引起;
2.百度反链接算法调整,现在已经不是依靠留言本,blog的时代了,所以不是以前那样做好站加点链接就进百度了。
3.百度推出新搜索功能 blog 搜索引起 (具体观察中)
4.百度对于过分敏感关键字做出了算法调整,可能更多是依据网页更新速度、流量、优质链接等更多的综合因素来决定收录站点;
5.大众的共识点,并不是百度不收录站点,而是百度暂时将站点放在缓存数据库里,待检验符合他的规则后再展现给访问者。
对策:
1.建立优秀的百度联盟站点,依靠百度联盟站带动百度收录,百度联盟站每天的PV能控制在3000+是最好的;
2.以不变应万变,坚持更新站点,内容创新,交换优质链接;
3.控制好站点的关键字密度,不要再用以往的模式来做站,真正的把内容体现出来,炒作再厉害,你也必须有。
总结:百度如果不适当的调整目前的算法,那百度的数据库估计也会越来越少了,我们急的同时他也急,人家是上市公司 也是全球最大的中文搜索引擎,没有内容他也会失去更多,等待也许明智点。
百度联盟也曾经发出个通知 我们可以借鉴下
关于排行榜用户资料清理的通知 (几点不规范的做法)
网站名称不符合要求的情况:
1、 您的网站名称带有乱码
2、 您的网站名称带有符号
3、 您的网站名称长度已超过15个字符
4、 您的网站名称中带有推广或介绍文字
5、 您的网站名称过于简单、语义描述可能有歧义
6、 您的网站名称为英文域名地址
7、 您的网站名称与网站内容明显不符
8、 您的网站页面无搜索框
9、 您的网站无法访问
10、您的网站无缩略图
11、您的网站其他资料不全
12、您的网站内容不健康
13、您的网站名称无法注册
排行榜的要求也有几点:
1. 网站内容要求合法、健康、无违法和反动、色情等内容、没有任何恶意代码的网站
2. 网站名称和网站内容描述要和网站实际内容相一致、不能包含特殊符号和不符合网站内容的描述
分类于:未分类 | 76 views | 没有评论| 返回顶部
问:我有个网站,只因前几天因服务器停了就被百度给K了,到现在还没被收录。
答:最简单直接的办法是用site:www.yourdomain.com,如果没有任何搜索结果这种可能性很大。
但是baidu也不会无缘无故K站的,服务器宕机这个原因只会出现短暂的无法查询到结果,对百度而言通常需要1周左右的时间蜘蛛会从新回到你的网站上,google大约需要2-3天的时间,而Yahoo则不挑食,基本上网站重新开通bot就会重新检索你的网站,如果能够查询到服务器IIS的话你会看到这样的规律。另外需注意:蜘蛛或bot重新检索网站不代表马上更新网站内容,这还需要时间等待。
这种情况也适用于更换服务器IP!
分类于:未分类 | 63 views | 没有评论| 返回顶部
问:百度一个多月没有更新收录我网站,肯定没有非法内容,现在我只是担心被百度K掉?
答:先自查,这个估计是你的网站上有不符合百度收录的内容?如果是——修改之;
或者是你的内容为大量采集内容;
在等待收录/更新期间,切忌别忘记了继续保持一定频率的网站更新,文章以原创为主。
分类于:未分类 | 66 views | 没有评论| 返回顶部
问题:我的网站www .abcd .cn以前被百度收录了8000多条。今天突然一条也没有了,百度收录为o。这是什么原因啊。是不是被百度k站了啊?有什么办法补救呢?
补充:为什么会被k站呢?我的站一直运营的很好的,百度已经收录了8000多条信息了,突然间一下什么都没有了?会不会是别人举报了?
可能性:
你最好先看看IIS日志,看看为什么被K站.以下是百度蜘蛛爬行检测代码诠释:
2xx 成功
200 正常;请求已完成。
201 正常;紧接 POST 命令。
202 正常;已接受用于处理,但处理尚未完成。
203 正常;部分信息 — 返回的信息只是一部分。
204 正常;无响应 — 已接收请求,但不存在要回送的信息。
3xx 重定向
301 已移动 — 请求的数据具有新的位置且更改是永久的。
302 已找到 — 请求的数据临时具有不同 URI。
303 请参阅其它 — 可在另一 URI 下找到对请求的响应,且应使用 GET 方法检索此响应。
304 未修改 — 未按预期修改文档。
305 使用代理 — 必须通过位置字段中提供的代理来访问请求的资源。
306 未使用 — 不再使用;保留此代码以便将来使用。
4xx 客户机中出现的错误
400 错误请求 — 请求中有语法问题,或不能满足请求。
401 未授权 — 未授权客户机访问数据。
402 需要付款 — 表示计费系统已有效。
403 禁止 — 即使有授权也不需要访问。
404 找不到 — 服务器找不到给定的资源;文档不存在。
407 代理认证请求 — 客户机首先必须使用代理认证自身。
410 请求的网页不存在(永久);
415 介质类型不受支持 — 服务器拒绝服务请求,因为不支持请求实体的格式。
5xx 服务器中出现的错误
500 内部错误 — 因为意外情况,服务器不能完成请求。
501 未执行 — 服务器不支持请求的工具。
502 错误网关 — 服务器接收到来自上游服务器的无效响应。
503 无法获得服务 — 由于临时过载或维护,服务器无法处理请求。
比如说:
2008-05-10 00:28:03 W3SVC818374 222.214.218.36 GET /flash/1622.html - 80 - 221.10.254.26 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0 21089
如果你的网址是www .abcd .cn这就意味着百度蜘蛛在2008-05-10 00:28:03 爬过flash/1622.html 这一页,200 0 0 21089中的200协议代码代表了请求已完成也就是它发现这页并以入库了。根据这个我们可以多查看iis日志,研究蜘蛛爬行的路径,找出自己网站存在的问题,进而改正。
分类于:未分类 | 80 views | 没有评论| 返回顶部