關(guān)于 URL 的一些不可不知的知識
來源:
|
作者:yswltg
|
發(fā)布時間: 2019-09-19
|
2403 次瀏覽
|
分享到:
URL的最基本的使命是唯一地代表 Internet 上的一個對象,URL 必須和 Internet 上的對象一對一匹配。然而現(xiàn)實中,這很難實現(xiàn),我們經(jīng)常可以通過多個 URL 到達同一個頁面,比如, http://mysite.com/product/tv 和 http://mysite.com/product?name=tv,這種情形在現(xiàn)代 CMS 中更是比比皆是,針對這個問題,SEO moz 有一篇很好的文章,講到了如何使用 Canonical URL 機制解決站點中的重復(fù) URL 問題。URL 應(yīng)該是永久的,這就要求你在站點上線前就非常嚴謹?shù)匾?guī)劃 URL。如果有一天,你不得不更改 URL,一定使用 HTTP 301 機制,告訴瀏覽器和搜索引擎,你的那個 URL 所代表的對象,已經(jīng)搬遷到新地址,這個機制可以保證你舊地址所獲得 PR 不會被清零。
URL 的最基本的使命是唯一地代表 Internet 上的一個對象,URL 必須和 Internet 上的對象一對一匹配。然而現(xiàn)實中,這很難實現(xiàn),我們經(jīng)??梢酝ㄟ^多個 URL 到達同一個頁面,比如, http://mysite.com/product/tv 和 http://mysite.com/product?name=tv,這種情形在現(xiàn)代 CMS 中更是比比皆是,針對這個問題,SEO moz 有一篇很好的文章,講到了如何使用 Canonical URL 機制解決站點中的重復(fù) URL 問題。
URL 應(yīng)該是永久的,這就要求你在站點上線前就非常嚴謹?shù)匾?guī)劃 URL。如果有一天,你不得不更改 URL,一定使用 HTTP 301 機制,告訴瀏覽器和搜索引擎,你的那個 URL 所代表的對象,已經(jīng)搬遷到新地址,這個機制可以保證你舊地址所獲得 PR 不會被清零。
盡可能用戶友好
這是 URL 設(shè)計的根本,你的 URL 應(yīng)該為最終用戶而設(shè)計。保持 URL 友好的一個好辦法是在保證可讀性的同時讓它盡可能短。比如 /about 就好過 /about-acme-corp-page,當然,保持簡短不能犧牲可讀性, /13d2 一類的地址短則短矣,但并不友好。如果要在 Twitter, Facebook 一類的社會媒體網(wǎng)絡(luò)分享你的 URL,可以使用 Bit.ly 一類的網(wǎng)址縮短工具,但這種工具產(chǎn)生的縮短 URL 并不友好,在 Wordpress 一類的 CMS 中,可以使用 PrettyLink Pro 或 Short URL plugin 一類的可控制的地址縮短插件。
URL 的設(shè)計切忌使用一些對用戶來說沒有意義的內(nèi)容,比如數(shù)據(jù)庫的 ID 號, /products/23 這樣的 URL 地址對用戶是極不友好的,應(yīng)當使用 /products/ballpoint-pen 一類的地址。
保持一致性
站點內(nèi)的所有 URL 必須保持一致的格式和結(jié)構(gòu),這樣可以為用戶帶來信任感,如果你必須更改 URL 格式和結(jié)構(gòu),需要使用 HTTP 301 機制。
可預(yù)測的 URL
這也是 URL 一致性的一個表現(xiàn),如果你的 URL 擁有很好的一致性,用戶可以根據(jù) URL 猜測別的內(nèi)容的 URL,假如 /events/2010/01 指向 2010 年 1 月份的日程內(nèi)容,那
/events/2009/01 應(yīng)當指向 2009 年 1 月的日程。
/events/2010 應(yīng)當指向 2010 年全年的日程。
/events/2010/01/21 應(yīng)當指向2010年1月21日的日程。
URL中的關(guān)鍵詞
URL 中應(yīng)該包含本頁重點內(nèi)容的關(guān)鍵詞,比如 /posts/2010/07/02/trip-best-buy-memory-cards 一類的 URL 本身就是對頁面內(nèi)容的反應(yīng)。在 URL 包含重點內(nèi)容關(guān)鍵詞,也可以提高 SEO 性能。SEO 的一個很重要的原則就是,在 URL 地址中包含內(nèi)容關(guān)鍵詞。
關(guān)于 URL 的技術(shù)細節(jié)
下面說的是有關(guān) URL 的一些技術(shù)細節(jié)。
URL 不應(yīng)包含 .html, aspx, cfm 一類的后綴
這類信息對最終用戶是沒有意義的,卻占了額外的空間,一個例外是 .atom, .rss, .json 一類的特殊地址,這類地址是有特別的意義的。譯者注:在某些虛擬主機式 Web 服務(wù)器,這種做法未必現(xiàn)實。
URL 不應(yīng)包含 WWW 部分
WWW 部分并不包含任何意義,是一個額外的負擔,不友好??梢允褂?HTTP 301 機制,將 www.domain.com 定向到 domain.com 。
URL 的格式
URL 的格式如下:
domain.com/[key information]/[name]/?[modifiers]
Key information 部分一般代表信息的類型或類別。Modifiers 部分則屬于查詢字符串范疇,它不應(yīng)當代表數(shù)據(jù)結(jié)構(gòu),應(yīng)當代表數(shù)據(jù)的修飾。Key information 部分應(yīng)當盡可能簡短,同時應(yīng)當表現(xiàn)出一種層級關(guān)系,比如 http://domain.com/posts/servers/nginx-ubuntu-10.04,或 http://domain.com/news/tech/2007/11/05/google-announces-android。
Google News 對新聞源有一個有趣的要求,Google 要求新聞源頁面的 URL 中必須包含至少 3 位唯一的數(shù)字,因為他們會忽略年份數(shù)字,因此,應(yīng)該使用一個5位或5位以上的數(shù)字。另外,也應(yīng)該提供 Google News 站點地圖 。如果你想向 Google 提供新聞,必須按這樣的結(jié)構(gòu)提供 URL,當然保持一致性,可以預(yù)測性也是必需的。
使用小寫字符
URL 中所有字符都應(yīng)使用小寫,這更容易閱讀。
URL 中包含的行為元素
URL 查詢字符串中可能包含一些表示行為的元素,比如 show, delete, edit 等。非破壞性的行為可以體現(xiàn)在 URL 中,破壞性的行為應(yīng)該使用 POST 。
使用 URL 友好字符
在 URL 中體現(xiàn)網(wǎng)頁標題的時候,往往會用到一些特殊字符,應(yīng)當把它們轉(zhuǎn)換為 URL 友好字符:
全部大寫字符換成小寫
諸如 é 一類的字符應(yīng)轉(zhuǎn)換成對應(yīng)的 e
空格使用短劃線代替
諸如 !, @, #, $, %, ^, &, * 一類的字符應(yīng)該使用短劃線代替
雙短劃線應(yīng)該使用單短劃線代替
另外,沒有必要的話,避免使用 %20 一類的 URL 逃逸符。