说到网站分析,我们经常会提到URL、页面路径、网址参数、锚、域名、子域名、顶级域名等等,说起来可能都知道一些,但是却又无法准确辨识其中的差异。以至于到具体的应用的时候,容易出现概念模糊,应用错误的情况。

URI(统一资源标志符,Uniform Resource Identifier)

说到URL(统一资源定位符,Uniform / Universal Resource Locator),就不得不先说下URI了:URL和URN(统一资源名,Uniform Resource Name)共同组成了URI。URN是用于定义该事物身份,而URL是定义了找到它的方法。

URL(统一资源定位符,Uniform / Universal Resource Locator)

回到最常用的URL,我们也俗称网页地址。它是咱们上网的门牌,是互联网中的标准地址。通常一个URL中包含了以下几个部分:

  • 传输协议(HTTP、HTTPS、FTP等)
  • 一个冒号,两个斜杠(汗,这也是啊!)
  • 主机(通常是一个域名,也有是IP的)
  • 端口(服务器上网络端口号,默认80,可选项)
  • 路径(以“/”开头的一个文件路径)
  • 查询(以“?”开头的一串查询参数,QueryString)

url

做了一张简图说明URL的结构,但是这个图并不是非常完美,因为通常查询(QueryString)部分也包含了锚(Anchor)。

网站分析中的域名(Domain)

关于域名(Domain)部分,通常是包括:

  • 根域名(顶级域名,如:root.com)
  • 二级域名(子域名,如:www.root.com,shop.root.com)
  • 三级域名(子域名,如:hi.shop.root.com)

这些都是不同的域名,他们相同的都是,他们都属于同一个根域名——root.com。一个根域名可以具有许多个子域名,子域名又包含二级、三级、N级之分。另外,国内常见的:.com.cn / .cn 之类,与 .com 是属于并列的关系,是域名的后缀名。.com 是国际顶级域名,而 .cn之类是中国顶级域名,当然,也有 .us 是美国顶级域名,.asia是亚洲顶级域名等等(好吧,这里有一个顶级域名列表)。

在网站分析中,我们需要了解到的是,Cookie是只能在相同域名内读写的。即在跨域名的时候,是不允许读写的(详见网站分析中的Cookie)。因此在做网站数据监测的时候,我们也是可以设置Cookie属于哪一个域名,实现多域名站点的跟踪。如果是属于根域名,那么默认的,当访客在不同子域名之间访问的时候,是以相同的身份访问的。(如果要了解更多关于跨域跟踪的内容,可以参见:Google Analytics部署 跨域跟踪

相同URL就是相同网页吗?

不一定!首先,URL如果是一直到路径(Path)部分都相同,那么说明当我们访问的是同一个文件。那么为什么同一个文件还会有不同的网页呢?现在许多网页的内容都是动态生成的,网站服务器会根据查询参数(QueryString)的不一样,动态的返回一些与之对应的内容。所以才会出现相同URL不一定是对应相同网页内容的。

需要注意的是,Flash网站,又并不经过网页地址传输这些了。它通过另一个渠道传输查询内容和返回内容数据,因此,通过URL判断页面的方法并不适用于Flash构建的站点。如果我们需要对Flash网站的访问数据进行跟踪,依然建议通过在Flash内部使用Google Analytics虚拟页面的功能进行子页面的浏览跟踪(当然也可以使用GA的Flash开发包实现Flash内跟踪)。

参考资料:

发表评论

您的电子邮箱地址不会被公开。