期货交易自动化论坛

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 24|回复: 0

大型网站网页内容重复问题的解决思路 - 比特币今日价格

[复制链接] |主动推送

285万

主题

285万

帖子

855万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
8553710
发表于 2022-9-11 07:31:36 | 显示全部楼层 |阅读模式
网页内容重复指的是搜索引擎对两个以上网页通过它的计算方法比较后认定的结果,一般来讲两个网页的相似度(网页相似度查询检测)超过一定的比例就会被搜索引擎判定为网页重复。在一些大型的网站,网页内容重复的现象时有发生,有些是不可避免的,如一些基础数据需要不断的重复调用;有些是在网站规划之初,没有考虑到搜索引擎而产生的。这些问题是一些在对网站进行搜索引擎强化时面临的困难,那么有没有解决办法呢?
利用Robots解决网页内容重复问题
Robots在秦爱的博客中已经有过介绍,其存在的意义是告诉搜索引擎哪些内容不希望不它进行抓取和索引收录,详细可看《Google测试Robots.txt,你的网站合乎规则吗?》及《利用Robots.txt做搜索引擎优化》,其格式分为两种:一种是在根目录下放置Robots.txt文件,一种是在 head 中放置meta标签 meta name="robots" content="none" ,这个标签的意思是告诉搜索引擎蜘蛛不收录不索引该页,content的属性还有all,index,noindex,follow,nofollow,all=index,follow,none=noindex,nofollow。
利用搜索引擎对一些内容不收录或收录极差的原则解决网页内容重复
一般来讲,图片或动画(GIF、JPG、FLASH)、JS代码、结构(IFRAME框架)三种内容会阻碍搜索引擎的收录,基于这种规律,我们可以将一些重复度较高的内容通过以上三种形式来表现,进而解决两个不同URL网页相似度过高的问题。事实上,秦爱带着这种思路研究一些门户型网站或一些B2B(B2C)网站时,发现他们已经在广泛使用。图片、JS代码不需说明,几乎所有的搜索引擎都不能有效读取,针对IFRAME框架有人研究表明百度是坚决不收录的,而谷歌有较少收录。
通过Link Canonical 属性指定权威网页
Google、Yahoo、Live search 支持Link的一个新属性Canonical,为网页指定权威链接(authoritative|canonical URL),目的就在于解决网页内容的重复问题。其格式为: link rel="canonical" href="authoritative | canonical URL"/ ,具体说明如下:
● href 可以是绝对地址或相对地址,但不能指向不同的域名(子域名不属于不同的域名),否则会被忽略;
● link rel="canonical" 属性可以被传递,即A页面指定B为权威链接,B指定C为权威网页,则搜索引擎会认为C是A和B共同的首选权威网页;
● 如果 href 指向的是一个404页,则搜索引擎仍会索引这个页的内容,并试图找到一个标准页。
举个例子:
● /

更多SEO资讯,请关注 a href=" ;
link网站

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|期货交易自动化论坛

GMT+8, 2024-11-26 21:32 , Processed in 0.104202 second(s), 27 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表