<big id="n3dbt"><strong id="n3dbt"></strong></big>
      1. <small id="n3dbt"><delect id="n3dbt"></delect></small>

        <thead id="n3dbt"><ruby id="n3dbt"><rp id="n3dbt"></rp></ruby></thead>
        <th id="n3dbt"></th>
        <span id="n3dbt"></span><span id="n3dbt"></span><span id="n3dbt"></span><strike id="n3dbt"></strike>

        建站百科Website News

        當前位置:首頁 »分享!!避免大量重復URL被百度收錄

        分享!!避免大量重復URL被百度收錄

        至成科技 2015-07-09 訪問量(1705) 評論(0)
        摘要:

        首先聲明,我們只談論有檢索意義的URL,也就是用戶會從搜索引擎查找的頁面。其他頁面按照常用的方法做屏蔽就好了。鑒于很多站長都愛討論整體的收錄量,我必須潑一下冷水,也許你的有效收錄是1/10。

        URL參數

        也叫URL query,是一個較復雜,較容易被忽視,較容易被妥協的問題。他是網站運營中必不可少的元素,如果簡單的去除,其他部門就無法工作了。 靜態化是的話題,URL參數經常被用于以下幾方面:
          同一個實體的不同狀態展示,比如同一個酒店,在不同時間點會有不同的房間庫存:http://www.travel.com/hotel/123/?checkindate=2015-06-09&checkoutdate=2015-06-10
          為了統計不同渠道的流量:http://www.vxdmg.com/?tracking=website_a
          為了統計不同渠道,具體模塊的點擊量:http://www.xazcit.com/?tracking=website_a&click_spot=zone_abc
          調試:http://www.a.com/product/item123/?debug=true

        出現這種問題的壞處有幾點:
          1. 浪費搜索引擎對你網站的各項配額,從而影響其他正常的頁面。
          2. 丟失很多本應拿到的鏈接加分,站外渠道的鏈接往往是較優質的。同一個URL的分值可能分散成幾十份。
          3. SEO的流量被統計到別的渠道(因為tracking字段寫的是別的渠道,而且被收錄被點擊)
          4. 往往形成一種局面,產品用一套URL,SEO用另一套URL, 甚至不同渠道用不同的URL,后期開發和維護的成本極高。

        為了解決這個問題,首先要弄清URL的定義。以我的理解,每一個URL是一個靜態的、獨立不重復的、有意義的實體,一般也有檢索意義(就是有人會搜)。比如一個人、一輛車、一條道路、一個0件。而不能混入各種"狀態",比如這個人生病的時候,難道就不是他自己了么? 一件商品在促銷的狀態難道是另一件商品了么?

        理論上canonical標簽就可以解決這個問題了, 但是從實際測試結果看,百度對這個標簽的支持優先級非常0, 幾乎可以忽略不計。那么我的解決方案是這樣的:
          1. 建立好網站的思維導圖和元信息。
          2. 所有和SEO元信息相關的參數都放到路徑中去
          3. 所有和SEO元信息不相干的參數都放到#后邊,因為#后邊不影響web服務器返回的內容。簡單的說就是用"#"替代"?"。
          4. 每個頁面中都利用js獲取#后邊的參數對,通過二次請求發回給統計服務器
          5. 如果#后邊的參數影響頁面內容,比如酒店的入住日期。那么這部分內容用ajax加載就行,他是不穩定的,不屬于頁面內容的一部分。(當然還有變通的辦法,暫不贅述。)
          6. 原始的#錨點定義肯定會沖突,定義一個#后邊的變量,并用js控制屏幕滾動,來原始錨點的作用。

        有人可能會想到,根據ua判斷,如果是搜索引擎爬蟲,就用跳轉的方式去掉URL參數。但效率較高的方法必然是從一開始就不展示錯誤URL。那么前面的例子優化后就變成了:

        其實很多網站早就使用這種方式了,但是還有很多網站由于開發效率無法及時實現。所以對于一般的小網站,一定要考慮開發成本,不要輕易冒進。只要能避免問題的發生,變通的方法是很多的。

        路徑中使用非必要元素

        很多網站仿照亞馬遜的做法,把商品名體現在URL中,然后再通過id來決定頁面展示的內容:http://www.amazon.cn/博集典藏館043?基督山伯爵-亞歷山大?仲馬/dp/B005TZHJEQ/

        這樣雖然可以提高一些相關性,但是很危險。在長期甚至短期的時間內,大量商品的名稱是非常可能有變化的,那么URL也就跟著變化。成本也是非常高的,因為加大了技術實現難度,不管從站內還是站外,每次增加鏈接都是一個很麻煩的事情。

        在我接手藝龍SEO之前,URL被全部改成了這樣,對我早期的工作造成了非常巨大的負擔:http://www.a.com/Shangrila_International_Hotel-12345678-hotel/

        通過日志分析發現基本所有的百度蜘蛛發起的請求都被301跳轉了快速(日志分析方法可參考SEO健康度 )。細致調查后發現,從SEO拼接規則到后臺的漢字和翻譯數據被一直修改。也就是說,這個URL相關的元素有:
          1. 中文 (非必要元素)
          2. 由中文翻譯的英文 (非必要元素)
          3. id (必要元素)

        而當時負責SEO的同事把英文和id拼接在了URL中,那么這樣一個URL先后變成過:
          http://www.a.com/Shangrila_International_Hotel-12345678-hotel/
          http://www.a.com/Xianggelila_International_Hotel-12345678-hotel/
          http://www.a.com/XiangGeLiLa_International_Hotel-12345678-hotel/
          http://www.a.com/Shangrila_guoji_Hotel-12345678-hotel/

        跟"相關性"比,URL的先進性和穩定性更重要。所以針對這個問題,URL的較佳策略應該是:http://www.a.com/hotel/12345678/

        如果這個id是隸屬于一個分類下的,比如城市,那么就可以是:http://www.a.com/hotel/beijing/123/

        從技術角度說, id一般是數據庫的primary key,可以是數字也可以是字符串,那么這個時候URL是一維的; id也可以是聯合的先進索引,那么URL就是二維的,就像上面的(bejing,123)缺一不可。電商類網站列表頁經常用到三維以上。

        大小寫

        如果網站的技術架構用的是開源系統,一般是不會有這個問題的。如果使用了微軟的技術架構,這個問題非常常見:
          http://www.vxdmg.com/newyork/
          http://www.xazcit.com/Newyork/
          http://www.xazcit.com/NewYork/

        我的建議是統一使用小寫,大寫自動跳轉為小寫(小心301死循環!)。

        目錄的規范

        很多網站同時存在這樣的URL,無形中把收錄量擴大了一倍:
          http://www.vxdmg.com/product/123
          http://www.vxdmg.com/product/123/
          上邊先進個路徑的意思是在product目錄下有一個123文件。第二個路徑的意思是在product目錄下有一個123目錄,這個目錄下可能有很多文件,但是他代表眾多文件中的index.html或index.php或default.aspx等優先級較高的那個文件。為了避免歧義,我定義文件都是用".html"結尾的。

        至成科技(西安網站建設)總結:

        1. 所有部門統一使用SEO定義的URL,屏蔽非SEO URL的入口。
          2. 用"#"替代"?"
          3. 統一使用小寫
          4. 目錄的規范
          5. 把不規范的URL跳轉到規范的URL

        網友評論

        登錄后可評論,請登錄

        全部評論:0條

        掃描左側二維碼
        關注至成微信公眾號

        西安至成信息科技有限公司  Copyright 2012-2019  xazcit.com  All rights reserved.

        Email:[email protected]     郵政編碼:710016     《中華人民共和國增值電信業務經營許可證》陜B1.B2-20140011     陜ICP備12008874號-1

        聯系地址:西安市經開區鳳城四路西安國際企業中心B座23層06-10室    售前咨詢熱線:029-89390727    售后服務電話:029-89393039

        西安網站建設、網站設計制作公司-至成科技,已為眾多企業提供網站建設網站制作響應式網站設計手機網站建設虛擬主機云主機服務器租用等建站解決方案。

        網絡警察 12321垃圾信息舉報 不良信息舉報 中國文明網 西安工商
        ×
        安徽25选5计划 辽宁35选7开奖规则 河北时时彩开奖结果走势图 快乐10分规则 30选5开奖号码结果今天 360新疆11选5投注 陕西快乐10分钟开奖结果百宝 深圳风采36选7 三分彩 海南环岛赛开奖 湖南福彩中奖名单公布 天地癞子斗地主规则 3d组六六码遗漏 彩仙子码报的网站 江苏快三 云南时时彩多人玩吗