网站分析之常见应用识别

在进行网站分析的时候,我们常常会分析网站上使用了一些什么应用,包括使用了什么网站分析工具、广告管理工具、代码管理工具(TagManager)、广告监测工具、广告联盟工具、推荐系统应用、社交分享工具。有些应用是我们可以直观的、可视的观察到的,例如社交分享工具;而有些应用是我们不那么容易发觉的,例如网站分析工具,这个时候我们就需要通过技术手段,准确的判断网站使用了哪一家厂商的什么工具。这对我们进行全面的网站分析有不可言喻的作用。

网络应用识别的原理

网络应用一般是通过Javascript实现页面内容交互,那么其必然会加载Javascript代码或文件包。当然,要发生数据交换,在用户的客户端浏览器与网络应用服务端之间必然也会有网络数据传输。那么综合来看,我们可以通过以下方式查看网站上所加载的网络应用:

  • 查看页面源文件:通过查看页面源代码,搜索看是否加载网络应用相关的代码
  • 查看页面所加载的其他Javascript文件
  • 查看访问页面时候客户端浏览器与服务端的网络数据传输
  • 查看当前网页的Cookie数据

使用Chrome开发者工具查看页面加载的Javascript

  1. 使用Chrome访问需要分析的网页;
  2. 单击地址栏,按F12调出开发者工具;
  3. 查看开发者工具的Sources标签页;

下面是我使用Chrome开发者工具查看苏宁易购网站的文档加载情况:

suning-doc

可以看到,整个页面包含的文档内容来自三个域名:

  • 苏宁官方的两个域名,包含了页面主要内容
  • Google Analytics域名,包含了ga.js这个统计文件

常见互联网应用

网站分析工具类

域名 文件 厂商 功能
www.google-analytics.com ga.js;analytics.js Google Google Classic Analytics and Google Universal Analytics
* coremetrics.js IBM IBM Coremetrics
hm.baidu.com h.js Baidu 百度统计
tccs.qq.com ping.js 腾讯 腾讯分析
s*.cnzz.com stat.php 阿里巴巴 CNZZ
*.2o7.net s_code.js Adobe Adobe Analytics(Omniture)

《大型网站SEO优化实践》学习笔记

本文主要内容源自2013年阿里技术嘉年华中阿里巴巴周文君分享《[2] 后端-大型网站SEO优化实践》。学习过后,受益匪浅,特作笔记,经常回顾吸收学习。

大型网站SEO的特点&优势&挑战

特点

  • 页面数量巨大
  • SEO流量高,长尾流量占比大
  • 数以百计的Web应用
  • 跨团队、多团队协作

优势

  • 页面内容丰富,数量多(UGC)
  • 域名初始权重高
  • 无需刻意进行link building,用户会主动帮忙进行链接建设和推广
  • 网站安全及性能优化由专业团队负责

挑战

  • 用户内容如何更好地匹配用户搜索Query(如:博文、帖子)
  • 如何更好的挖掘、整合用户内容,生成更有价值网页
  • SEO优化方案竞彩遭遇用户体验冲突,KPI冲突

Web应用SEO定位

  • SEO需结合产品定位及产品核心价值(寻找价值关键词)
  • SEO流量预估(内容特点、页面数量,按照同类产品的索引量与SEO流量比值来进行预估,如:页面数*收录率 : SEO流量 = 200:1 ~ 10:1)
  • 注重品牌效应
  • 营销活动(营销活动期间做好相关优化,SEO具有时效性)

大型网站SEO基本策略

SEO技术研究

seo-tech

SEO元素周期表

优化初期三板斧

  • URL规范化:URL规范化是大型网站SEO优化的根本,解决得是搜索引擎网页库,索引库,URL库中的Key问题。URL规范化影响着网站核心资源被抓取及索引效率,权重等
  • 页面元素优化:页面元素优化决定着未来流量上升的高度;Title&Description,不同的场景,采用不同的模板;H,P,B,Strong标签,图片alt属性,页面无效链接添加rel=”nofollow”等
  • 提升核心资源被抓取效率:优化初期应优先关注收录率,而非排名及流量(70%比较合理)
  • 新URL规范化+robots禁止策略简单粗暴,非常有效

优化中后期应注重的三点

URL规范旧状

  • URL规范旧状:多域名;全静态化,全动态化,半静态化等多套URL规范;URL层级太深;URL解析代码复杂冗余,性能低,维护成本高。

问题与挑战

  • 参数全静态化,本质还是动态化,SEO效果差;跟前端工程师合作效率低,如:JS拼接静态URL问题;URL中特殊字符解析问题,如%2F(/),%4E(N);form表单提交产生多余的301跳转,增加前端性能负担(20ms左右)。

URL规范化问题对策(搜索引擎)

  • noidex,nofollow标签;301跳转;canonical标签;webmaster可设置动态参数处理方式

我们如何解决?

提升网站核心资源被爬去效率

  • 引导爬虫抓取网站核心资源:站点扁平结构,实施难,重点优化面包屑;sitemap每日全量更新,补充Spider URL库;页面部分推荐模块异步改同步加载,核心资源URL部署到权重高的页面
  • 减少无效URL的抓取:robots.txt禁止无效URL被抓取及被索引;通过noindex meta标签禁止URL被索引(百度暂不支持);nofollow的使用
  • 提升网站抓取量:避免搜索引擎官方爬虫被安全软件拦截;逐步上调站长平台抓取压力,及时更新死链sitemap

大型网站SEO优化中后期应注意的三点

  • 专注Query分析:Search Query = Search Requirement;用户搜索的query是否match页面Title中的关键词;词库分库分档
  • 调排名:准侧,对排在第二及第三页的关键词,重点分析调优。三页以后的关键词,投入产出比较低
  • 研究anti-spam:坚持白帽,杜绝黑帽;研究anti-spam防止不正确优化被判作弊

全站SEO效果监控

日志分析脚本

  • 定时分析
  • Email分析报告
  • 图形化报表
  • 统计SEO基本指标数据(分产品线,分搜索引擎)

SEO统计报表

构建傻瓜数据平台

  • 全站SEO效果监控
  • SEO爬虫分析
  • SEO收录及反链分析
  • SEO基本指标统计

排名监控

  • 核心关键词核心应用每日排名
  • 竞争对手排名监控

第三方数据

  • 搜索引擎开放的监控数据:百度站长平台,Google、Bing Webmaster
  • 第三方统计工具

Do Everything with Tools

  • 搜索引擎提供的SEO工具
  • 页面Title&Description优化工具
  • 链接分析工具
  • 流量监控工具
  • 页面诊断分析工具

移动WAP的SEO优化

  • 自主适配:根据user-agent自主适配到WAP页面
  • 标注meta声明:name=”mobile-agent”
  • 开放适配协议:百度站长平台提交开放适配协议,以适配协议为准
  • Doctype声明:Doctype声明有助于搜索引擎识别该页面是否合适手机浏览。WAP页协议:xhtml/wml/html5

SEO领域体系化建设

seo

大公司SEO项目合作方式及挑战

seo-co

参考资料:

 

Google Analytics部署 营销活动跟踪

在部署网站分析工具的时候,我们常常会将网站分析工具用于跟踪营销活动。监测广告投放的着陆表现,有利于我们评估广告效果,监控后续转化。及时的调整广告投放与着陆应用,使我们广告达到尽量好的效果。

Google Analytics跟踪营销活动的原理

跟踪营销活动,我们是通过在着陆网页(Landing Page)加上我们定义好的URL参数,Google Analytics会收集被访问的URL,传入到GA服务器。Google Analytics平台将会对预定好的参数进行处理,鉴别出归属于广告系列的那一部分流量。

例如,一个静态的着陆页面(Landing Page)的URL可能是:

http://www.mysite.com/landing-page.html

当加上我们的跟踪参数(Google UTM)之后:

http://www.mysite.com/landing-page.html?utm_source=baidu&utm_medium=cpc&utm_campaign=brand-zone

又例如,一个动态的着陆页面的URL是:

http://www.mysite.com/landing-page.php?product=123

当我们加上跟踪参数之后:

http://www.mysite.com/landing-page.php?product=123&utm_source=baidu&utm_medium=cpc&utm_campaign=brand-zone

其他跟踪营销活动的方式

除了在广告投放的目标URL(Landing Page URL)上加入Google UTM广告参数之外,也会有一些其他方式跟踪营销活动:

  • 写第三方域名下的Cookie,记录访问者的广告来源
  • 查看链接的来源(Referrer)信息,可以作为参考,但不完全靠谱

Google UTM的五个参数

Google Analytics为营销活动着陆页的跟踪给出了五个参数可供使用:

标记参数 必填? 描述
utm_source Yes 使用 utm_source 来标识搜索引擎、简报名称或其他来源。
示例:utm_source=google
utm_medium Yes 使用 utm_medium 来标识媒介,例如电子邮件或每次点击费用。
示例:utm_medium=cpc
utm_term No 用于付费搜索。使用 utm_term 来注明此广告的关键字。
示例:utm_term=running+shoes
utm_content No 用于 A/B 测试和在内容联盟网络投放的广告。使用 utm_content 区分指向同一网址的广告或链接。
示例:utm_content=logolink 或 utm_content=textlink
utm_campaign No 用于关键字分析。使用 utm_campaign 来标识特定的产品促销活动或战略性广告系列。
示例: utm_campaign=spring_sale

当然,这五个标记参数名也是可以定义的,在媒体资源-跟踪信息一级设置这个五个参数。

custom-ad

营销网址构建工具

自动跟踪Google Adwords

如果我们有使用Google Adwords进行广告投放,我们也可以关联Google Adwords与Google Analytics账户,直接对Adwords广告进行跟踪监测。详细说明可以参见Google官方的为 Google Analytics(分析)配置 AdWords一文。