系统功能配置阶段的主要工作是通过配置指定数据采集、处理、输出、展现等方面的规则,通常由网站分析系统管理员实现。系统功能配置包括数据安全设置、数据处理设置、数据转化设置、数据整合设置和数据智能工作设置。
数据安全设置的目的是实现数据安全管理,保证数据不被泄露,通过特定数据的匿名化处理、用户权限和共享权限设置实现。
IP匿名处理是数据匿名处理的主要方法,根据匿名程度的不同可分为以下四个层次。
普通匿名化,只隐藏IP最后一个地址段,如123.123.123.***
中等匿名化,隐藏IP最后两个地址段,如123.123.***.***
增强匿名化,隐藏IP最后三个地址段,如123.***.***.***
IP完全匿名,隐藏所有IP地址信息,这意味着用户IP来源信息全部隐藏或删除
注意 IP数据匿名化处理后,部分地域报表可能无法使用。原因是所有关于地区、国家、城市等地域报表都是基于IP地址匹配形成,没有IP数据,地域报表无法处理。
数据权限设置通常包括对用户群组以及用户角色的控制。用户群组是将一类用户分为一个群组,然后针对该群组设置数据权限。用户群组管理是大型网站分析系统中用户有效管理的主要方式,群组分类通常按照企业组织架构或业务流程划分。
数据权限的灵活性是网站分析系统强大与否的重要参考标准,尤其对于大型企业数据安全可能是压倒一切的工作前提。如果不能让业务部门接触系统,那数据价值很难发挥。数据权限控制的主体分为以下几种:
维度和指标:指定用户只能使用某些维度和指标
用户有效期:指定用户特定时间范围或登录失效时间
限定IP登录:某些公司只允许公司内登录,可指定只能在特定IP地址段登录系统
功能架构:指定用户只能查看某些报表、书签、报告、功能模块等,如报表菜单可见度,数据导入导出,事件、目标、用户、报告、细分、热图、漏斗、市场营销的新建、删除、过滤、细分,API调用,Excel应用等,功能架构控制是目前最主要的用户权限设置形式。
特定数据内容:基于功能架构的权限控制只能控制用户是否能查看报表,但无法在同一报表中让不同部门或用户角色只看特定内容,比如在进入来源渠道报表中,SEM权限只能看SEM的数据,新媒体权限只能看新媒体。
数据共享设置包括报告、书签、细分、目标、权限等在不同用户之间的共享。数据共享对于大型企业的数据工作尤为重要,数据共享能在数据中心的控制下,使用所有部门统一数据应用标准,如建立统一的用户群体细分标准、使用相同的自定义指标或标准报告等;数据共享还能减少不同部门对于相同或类似工作的重复劳动,如各个部门都会在大型活动之后进行数据分析,针对这个活动可以建立可共享的数据内容,方便各部门工作。
数据处理设置包括数据跟踪设置、数据过滤规则、数据分组、数据变量规则、模型计算规则等。强大的网站功能报表需要复杂的数据处理逻辑支持,数据处理规则是网站分析系统数据处理的核心,也是网站分析系统功能强大与否最重要的评价标准。
数据跟踪设置在大多数据网站分析系统中都使用默认定义,如Visit的定义时间默认是30分钟,搜索引擎报表通过固定的搜索引擎列表实现。这些底层的逻辑定义,大多可以通过代码部署实现。如以下是Google Analytics自定义搜索引擎列表代码:
[‘_addOrganic’, ‘baidu’, ‘word’],
[‘_addOrganic’, ‘soso’, ‘w’],
[‘_addOrganic’, ‘youdao’, ‘q’],
[‘_addOrganic’, ‘sogou’, ‘query’],
跟踪设置除了直接部署代码外,还可以通过系统后台配置实现,这种实现方法具有很多优势:一是简化了实施代码,减少技术出错几率;二是网站分析师可以自己定义处理逻辑,减少了对IT的依赖,保证数据规则及时生效。常见的数据跟踪设置包括以下7方面:
数据过滤是对采集到的数据进行过滤,只保留符合特定规则的数据集。数据过滤规则具体内容详见4.1.2“数据采集规则”。数据过滤规则主要应用在可以建立多个Profile或有多个AccountID的情况下,需要根据不同业务模块或组织架构进行数据划分,以实现不同用户只能查看特定数据的需求。根据数据的业务属性进行Profile或AccountID划分的场景,也可在全样数据下通过用户权限设置划分不同的数据内容,该方式是付费网站分析工具划分权重的主要方法。
注意 付费网站分析工具除GAP(Google Anaytics Premium)外,普遍采用按Server Call付费的购买方式,建立多个Profile或Account意味着同样的数据需要处理多次,会造成费用叠加计算从而提高网站分析工具费用。
数据分组规则是对符合特定规则的数据按照一定类别进行划分。数据分组规则根可分为自动匹配规则和利用对照表归纳两种形式。
自动匹配规则
自动匹配规则是系统根据设置,自动将符合规则的数据划分为一类。实现自动匹配规则的前提条件是:指定的数据必须具备规律性特征,这种特征的表现通常是:
以某个/几个字段开头
以某个/几个字段结尾
中间包含某几个字段
数据长度固定
自动匹配规则具有广泛的应用价值,一方面可以实现数据分类汇总,另一方面减少手动整理和人工参与的工作量,因此是数据分类的最佳实现方案。以电商网站页面分类举例:大型电商网站可能拥有超过百万级的网页数量,如果要宏观掌握网站在各个板块间的流量分布必须使用页面分组功能。网站板块按功能可划分为首页、列表页、终端页、超市页、活动页、购物车页、帮助中心等,针对每个板块只需遵循页面结构定义逻辑即可。比如列表页的URL结构特征是包含/list/,终端页URL结构特征是包含/product/,这样系统就可以直接根据规则生成页面分组数据。
注意 自动匹配规则通常用正则表达式表示。正则表达式是数据过滤、筛选的重要方式,被很多高级网站分析系统支持。
在网站分析系统中,Webtrekk中的Feed 、Adobe Analytics的分类规则生成器提供了自动数据分组功能。如图4-6是Adobe Analytics使用正则表达式对一串字符中的特定字符进行分类。
图4-6 使用Adobe Analytics正则表达式书写自动规则
图4-6中^.(s).*$的意思是:第一个为任意字符,第二个字符是s,后面包含任意个任意字符。根据这个规则,4s3234、asddd等都可以被过滤出来。
对照表归纳
对照表归纳是将要分类的数据下载到本地,然后根据数据格式整理后上传到系统中进行处理。该方法常用于临时数据更改某些特定数据分类或无法通过自动规则实现分类情况。
表4-1是一个无规律渠道标记的数据对照表。
表4-1 渠道分组数据
跟踪代码 推广模块 渠道
1209fds SEM Baidu
5hse3 CPS 返利网
6uuth SEM Google
Fg45 AD 暴风
56 AD Sina
8o7hh EDM 126
小提示 对毫无规律的字段分组是一件非常复杂的工作,在前期数据标记或或代码部署时要做好数据特征归类,便于后期自动规则分类(优先选择)或手动上传分类。
数据分组最常应用于四个场景:网站页面分组、销售商品分组、营销渠道分组和用户分组。
Adobe Analytics的Saint、Webtrekk的类别模块都可以实现对照表分组功能。图4-7展示的是Webtrekk针对数据类别的扩展。
图4-7 Webtrekk数据类别扩展
大型网站分析系统中自定义维度和指标都需要指定变量,目的是告诉系统该变量存储的是什么信息,数据源从哪来,如何处理直接的得到数据源等。
变量基本设置
变量名、变量对应的部署ID、过期时间、数据类型、数据计算逻辑(计算记录数还是计算数据汇总值)等。其中最重要的是变量对应的部分ID。举例:以Adobe Analytics举例,为了提高站内搜索用户体验,需要跟踪用户搜索后返回的结果数(比如用户搜索了A关键字,返回结果是100条还是10条),实现此功能需要单独设置一个变量来记录该数据。
步骤一 底层代码部署实施,使用eVar7为返回关键字数据,搜索某个关键字后返回代码如下:
s.eVar7=1033;
步骤二 在Adobe Sitecatalyst后台中,启用变量并设置相关参数如图4-8所示。
图4-8 Adobe Analytics后台eVar变量配置
以上两步设置之后,当数据收集并处理完成后,前台数据报告即可使用。
变量数据来源:网站数据有两个来源:一是通过网站跟踪代码采集(上面的例子属于这种情况),二是外部数据导入。对于外部数据导入,同样需要提前设置。如图4-9针对付款状态的变量参数中,数据源需要从外部销售系统同步,因此数据源需要选择映射表。
图4-9 Webtrekk后台变量配置
查找替换规则
查找替换规则是将特定值的格式进行替换甚至更改具体值。
数据格式的替换最常用的是大小写转换,常用于网站URL中大小写字母混用导致同一条数据记录被分拆成多条记录的情况,为了正确反映数据记录需要统一大小写。如表4-2所示,两个URL地址指向同一个页面,由于网站URL结构不规范出现了大小写不同的两条记录,该记录在数据报告中会显示为2条记录,此时可使用格式替换功能。
表4-2同一个页面的两个URL地址
URL地址
code: http://www.searchmarketingart.com/about-author
code: http://www.searchmarketingart.com/About-Author
查找替换还可用于特定值的更改替换。在上面的分组设置中,我们提到了自动分组和对照表归纳两种方法,但我们还可以使用第三种方法实现——替换,替换的实现逻辑跟分组规则类似,只不过使用替换功能后,只显示替换后的值,而被原始值无法显示。这种替换功能适用于具有多个Profile或AccountID的账户。
如图4-10所示,利用Google Analytics中的搜索替换规则把所有从“/products/”开始到结尾的URL字符全部替换成“产品列表页”。配置完成后的“网页”数据报告中,将不再出现包含“/products/”及之后的数据记录,其数据记录全部被替换成“产品列表页”字样。如图4-11所示。
图4-10 Google Analytics查找与替换设置
图4-11 Google Analytics网页数据报告
数据组合规则
数据组合规则是将不同的值按照一定的逻辑进行“合并”并形成新的值,其功能类似于Excel中的CONCATENATE函数。
数据组合规则通常用于合并零散数据为新的数据,如Google Analytics的URL报表中,默认只显示URL中域名之后开始的目录和文件部分,而隐藏了Http协议和主机名。比如http://www.searchmarketingart.com/ 只显示为 / ,这种做法的弊端在于当网站中通常存在多个域名时,URL中的目录和文件结构可能相同,这会导致在URL报表中无法区分。比如http://www.searchmarketingart.com/ 和http://webtrekk.searchmarketingart.com/ 都会显示为 / ,此时无法分辨两个URL的具体数据。
图4-12是Google Analytics显示HTTP协议和主域名的配置方法。
图4-12 Google Analytices利用高级规则显示完整URL