爱站屋资源- 一生为免费为站长提供SEO网站优化网络优秀资源分享 申请友链 我要投稿    
爱站屋广告位

网站首页 网络资讯 正文

页面超过128k,也会不收录?

2018-09-29 网络资讯 181 ℃ 0 评论

    最近站长收到一个抓取优化例子,分享给各位,站长们谨记不要出现相同的情况:

站长反馈:

       网站主体内容都是js,针对用户访问,没有做优化;网站针对爬虫抓取做了优化,直接将图片二进制内容放到了html中导致页面长度过长;优化后发现内容却不被百度收录

       页面质量很好,还特意针对爬虫做了优化,为什么内容反而不收录了呢?

爱站屋博客分析:

       1、网站针对爬虫爬取做的优化,直接将图片二进制内容放到了html中导致页面长度过长,网站长度达164k;

       2、 站点优化后将主体内容放于最后,图片却放于前面;

       3、爬虫抓取内容后,页面内容过长被截,已抓取无法识别到主体内容,最终导致页面被认定为空短不收录。

90建议:

       1、不建议站点使用js生成主体内容,如js渲染出错,很可能导致页面内容读取错误,页面无法抓取;

       2、 如站点针对爬虫爬取做优化,建议页面长度在128k之内,不要过长;

       3、针对爬取做优化,请将主体内容放于前方,避免因为抓取截断造成的内容抓取不全。

Tags:站长资讯教程

< 第十二网宣 >
如有密码均为:di12.com
学到东西应该懂得感恩作者 无脑喷子永封IP段+删帐号所有评论
本站资源软件和源码 文章大部分为网上收集,如侵犯您的权利,请告知管理员,我们会及时删除,并向您赔礼道歉.

站长QQ:1400000222  官方QQ群:558413792

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

搜索
最近发表
«   2019年2月   »
123
45678910
11121314151617
18192021222324
25262728
文章归档

分享:

支付宝

微信