NEWS
如何避免重復性收錄
在互聯網中,信息的重復是在所難免的。然而,搜索引擎怎么樣才能識別重復的信息呢?怎樣判斷哪些網頁的信息是原創,哪些是“復制”的?哪些重復的信 息室有價值的,哪些又是可以舍棄的?下面大敏給各位分享下自學后得出的答案。
一個網站里,重復信息主要包括轉載內容及鏡像內容這兩種,搜索引擎在對頁面進行分析時,必須具備識別重復信息的能力。因為,存儲大量的重復的信息, 不僅給服務器增加負擔,而且還會給用戶體驗造成影響。但這不意味著所有重復信息都是沒價值的,搜索引擎認為轉載內容不如原創內容重要,賦予原創性的內容頁 面有著更高的權重,而鏡像內容則幾乎被忽略
轉載頁面
轉載頁面是指那些與原創頁面的正文內容(搜索引擎通過算法,清楚文章頁面多余的信息,例如:廣告,圖片,側邊欄,然后,就得到正文內容)相近或相同 的頁面。然后,搜索引擎如何識別轉載頁面呢?首先,把正文內容分為N個區域,如果有M個區域(M是搜索引擎指定的一個閾值)是相同或者相似的,則搜索引擎 認為這些頁面互為轉載內容,
鏡像頁面
內容完全相同的頁面互為鏡像頁面。要想判斷頁面是否互為鏡像頁面,搜索引擎首先把這些頁面分成N個區域進行比較,如果這N個區域的內容完全一樣,則 認為這些也頁面互為鏡像頁面。然后再綜合頁面權重值,頁面最后修改時間,判斷哪個才是源頁面,哪個是鏡像頁面。
本文由廣州網站建設公司-三行網絡原創,轉載請保留版權( 廣州網站建設www.gongxing888.com )三行網絡——專注于企業網站建設、響應式營銷型網站定制,歡迎來電咨詢!熱線:020-85628720、15915767698
上一篇:網站備案新規讓國外市場空前繁榮 下一篇:谷歌建站-谷歌Google排名優化指南