400-677-9528

在線QQ客服

QQ咨詢

微信掃一掃咨詢

大熊貓 URL

閱讀量:7820

各位朋友們,你們好.上一次的文章小編帶大家了解了推廣的入門知識之一的網絡爬蟲,很多朋友跟小編反應說希望小編能夠繼續系統的講解一些推廣的知識.今天,小編就帶大家繼續了解推廣的入門知識—URL.

什么是URL

url是統一資源定位符,對可以從互聯網上得到的資源的位置和訪問方法的一種簡潔的表示,是互聯網上標準資源的地址。互聯網上的每個文件都有一個唯一的URL,它包含的信息指出文件的位置以及瀏覽器應該怎么處理它。

它最初是由蒂姆·伯納斯·李發明用來作為萬維網的地址。現在它已經被萬維網聯盟編制為互聯網標準RFC1738了。


URL的結構

基本URL包含模式(或稱協議)、服務器名稱(或IP地址)、路徑和文件名,如“協議://授權/路徑?查詢”。完整的、帶有授權部分的普通統一資源標志符語法看上去如下:協議://用戶名:密碼@子域名.域名.頂級域名:端口號/目錄/文件名.文件后綴?參數=值#標志。

第一部分

模式/協議(scheme):它告訴瀏覽器如何處理將要打開的文件。最常用的模式是超文本傳輸協議(Hypertext Transfer Protocol,縮寫為HTTP),這個協議可以用來訪問網絡。 [1] 其他協議如下:

http——超文本傳輸協議資源

https——用安全套接字層傳送的

ftp——

mailto——電子郵件地址

ldap——輕型目錄訪問協議搜索

file——當地電腦或網上分享的文件

news——Usenet新聞組

gopher——Gopher協議

telnet——Telnet協議

第二部分

文件所在的服務器的名稱或IP地址,后面是到達這個文件的路徑和文件本身的名稱。服務器的名稱或IP地址后面有時還跟一個冒號和一個端口號。它也可以包含接觸服務器必須的用戶名稱和密碼。路徑部分包含等級結構的路徑定義,一般來說不同部分之間以斜線(/)分隔。詢問部分一般用來傳送對服務器上的數據庫進行動態詢問時所需要的參數。 [2]

有時候,URL以斜杠“/”結尾,而沒有給出文件名,在這種情況下,URL引用路徑中最后一個目錄中的默認文件(通常對應于主頁),這個文件常常被稱為 index.html 或 default.htm。

URL的分類

絕對

絕對URL(absolute URL)顯示文件的完整路徑,這意味著絕對URL本身所在的位置與被引用的實際文件的位置無關,

相對

相對URL(relative URL)以包含URL本身的文件夾的位置為參考點,描述目標文件夾的位置。如果目標文件與當前頁面(也就是包含URL的頁面)在同一個目錄,那么這個文件的相對URL僅僅是文件名和擴展名,如果目標文件在當前目錄的子目錄中,那么它的相對URL是子目錄名,后面是斜杠,然后是目標文件的文件名和擴展名。

如果要引用文件層次結構中更高層目錄中的文件,那么使用兩個句點和一條斜杠。可以組合和重復使用兩個句點和一條斜杠,從而引用當前文件所在的硬盤上的任何文件,

一般來說,對于同一服務器上的文件,應該總是使用相對URL,它們更容易輸入,而且在將頁面從本地系統轉移到服務器上時更方便,只要每個文件的相對位置保持不變,鏈接就仍然是有效地。

URL的大小寫

統一資源定位符一般是分大小寫的,不過服務器管理員可以確定在回復詢問時大小寫是否被區分。有些服務器在收到不同大小寫的詢問時的回復是相同的。地址結尾的"."號在互聯網的發展初期,訪問一個網站不是單純的輸入這樣DNS服務器才能夠識別。后來,微軟公司在WindowsNT3.51中對其進行了修改,可以自動在DNS查詢時自動增加一個.號,隨后UNIXNetWare也隨之而跟進,讓服務器可以識別結尾沒有"."的域名。但是,符號"."在現在的網址中仍然可以使用,統一資源定位符的日常使用超文本傳輸協議統一資源定位符將從互聯網獲取信息的四個基本元素包括在一個簡單的地址中。


URL通用格式

URL的語法:大多數URL語法都建立在9個部分構成的通用格式上,而其中最重要的是方案(scheme)、主機(host)和路徑(path)

通用格式:方案://用戶名:密碼@主機名:端口/服務器上資源的路徑;參數?查詢#片段

1、方案:指訪問服務器以獲取資源時要使用哪種協議。比如,http、https和FTP等

2、主機和端口:指資源宿主服務器的主機名或IP地址。端口是指資源宿主服務器正在監聽的端口,很多HTTP的默認端口號是80。比如,131.33.22.35:850,這里的IP地址是主機名,端口是850

3、用戶名和密碼:很多服務器都要求輸入用戶名和密碼才會允許用戶訪問數據,如FTP服務器

4、路徑:路徑說明了資源位于服務器的什么地方。

5、參數:為了向應用程序提供它們所需要的輸入參數,以便正確地與服務器進行交互,URL中有個參數組件。由字符“;”將其與URL的其余部分分隔開來。

6、查詢:很多資源,比如數據庫服務、搜索引擎,都可以通過提問題或進行查詢來縮小請求資源的范圍。由字符“?”將其與URL的其余部分分隔開來。

7、片段:#代表網頁中的一個位置,其右面的字符就是該位置的標識符(一般情況下,錨鏈接會用到)


相關閱讀

平臺信息
平臺介紹
代理合作
公告/FAQ
平臺公告
常見問題
注冊說明
限免產品
搜索緩存
洛陽商通網絡技術有限公司
400-677-9528
洛陽市澗西區南昌路85號(創展國際)1幢20層

洛陽商通網絡技術有限公司-商通網旗下平臺:stw5.cn;lystwl.cn;365ifw.com

鹿鼎记彩金