< 返回
web挖掘在网络广告定制中的应用

[摘 要]本文简要叙述了web挖掘技术和网络广告的概念,重点研究了web挖掘技术在网络广告定制中的应用。

[关键词]web挖掘;网络广告;广告定制

[中图分类号]f724.6;tp311[文献标识码]a[文章编号]1673-0194(2007)12-0081-02

自从万维网www出现以来,internet 已经成为人们获取信息的重要媒介,现在许多站点的收入来自广告。据“艾瑞市场咨询”的调查数据表明,2006年中国网络广告市场达到46.28亿元,这一数据还会继续增长。许多商家将目光从传统的广告模式转向网络广告。网站如何设置、播放什么样式的网络广告才能吸引网民而不是造成网民的反感已成为网站设计者、经营者需要考虑的问题。但通过进行大量调查的方式发现网民喜好是不可能的,因此本文提出了应用web挖掘技术来定制网络广告。

1 web挖掘和网络广告概述

web挖掘是指从大量非结构化、异构的web信息资源中发现有效的、新颖的、潜在可用的及最终可理解的知识的非平凡提取过程。一般来讲,web挖掘分3类:(1)web内容挖掘(web content mining):从大量的web 数据中发现并抽取有用信息的过程;(2)web使用挖掘(web usage mining):通过挖掘用户的web 日志(log)记录,发现用户访问web 页面的模式,得到有价值的信息;(3)web结构挖掘(web structure mining):从www链接结构关系网络中推导出知识。网络广告是特定的主体通过网络媒体向目标群体进行的有偿信息传播活动,该活动会引起该主体与目标群体之间的互动信息交流。

2 应用web挖掘技术定制网络广告

web挖掘技术的运用主要分为3个阶段:数据准备、数据操作、结果表达。广告主需要的数据主要来自两个方面:(1)用户的背景信息,主要来自用户的登记表;(2)来自用户的点击流,主要用于考查用户的行为表现。所有这些信息都被保存在一个数据库中,生成大量的记录文件和登记表,利用这些数据进行分析、挖掘,充分了解用户的喜好、购买模式,可以为广告主体提出行之有效的广告方案,实现商家渴望的个性化网络营销。

2. 1个性化广告推荐

个性化(personalization)广告推荐可以提高网络广告的针对性,进而提高网络广告的效果。通过个性化,发送给潜在客户的广告可以根据顾客的特定信息而有所选择。

2. 1. 1智能化广告推送机制

将web挖掘技术和客户关系管理(customer relationship management,crm)系统结合,并将提取出来的知识应用于网络广告的推送和拉取过程,可以提高internet数据库的智能水平,使网络广告具有更强的针对性和目的性。通过知识发现系统的分析,系统将判断访客的身份、所处地域,并根据当地的消费倾向和消费政策,主动推送产品广告的服务信息。对于老客户,系统可以通过智能邮件式推送和智能专用式推送定期向他们发送有关新产品的信息及相关技术资料。

2. 1. 2个性化技术方法

利用web挖掘方法分析web 访问日志可以帮助人们根据用户群访问的相似性,进行页面和用户聚类分析,直接对用户进行页面内容过滤、传送,为用户提供个性化的服务。个性化服务技术一般分为3 类:第一类是企业web 站点管理员根据用户统计数、静态个性文件或用户会话(user session)记录制定一系列规则并利用这些规则为特定用户提供特定服务;第二类是基于内容的过滤(content-based filtering)系统,通过用户历史访问内容挖掘用户访问模式并将该模式需求同url(uniform resource locator)结合以满足用户个性化需求;第三种是协作过滤(collaborative filtering)系统,通过用户群的相似性进行内容推荐。

2. 1. 3web内容挖掘和web使用挖掘的整合应用

基于内容挖掘和使用挖掘的个性化方法的整个过程可以划分为两个相互独立的部分:离线过程和在线过程。离线过程包括数据预处理和相关的数据挖掘过程,其结果是得到用户的共同使用模式和概念空间;在线过程作为实时推荐机,它的作用是为当前用户活动会话提供个性化推荐。整个体系结构如图1 所示。该体系首先对站点文档以及服务器日志进行数据预处理,分别得到倒置文档结构及事务文件,并对其表示形式进行统一化,再分别对它们进行聚类,得到相应的概念空间及使用模式,通过对概念空间和使用模式的进一步处理,得到用户的共同概念空间和共同使用模式(分别表示用户在内容聚类和使用聚类中的重叠区域)。将它们与当前活动用户会话进行匹配,得到最终的推荐结果。

由内容挖掘和使用挖掘分别得到用户共同概念空间和共同使用模式,作为输入数据为推荐机所使用。推荐机是web 个性化系统的在线部分,其任务是根据当前用户会话进行推荐,即推荐出与当前用户会话最匹配的对象的集合(广告、链接、产品等)。

2. 2网站优化

随着电子商务的发展,网站、网页的设计日益为业主所重视。强化信息构架的规则、操作行为指南、体现人性情感、取悦用户心理等都是重要的设计环节。商品广告展示个性不再是艺术家的专利,它已成为消费市场的重要消费动力。

2. 2. 1细化站点结构

站点细化有以下一些技术方法:(1)路径分析:常用于判定在一个web站点中最频繁访问的路径,可以知道对某种东西感兴趣的用户的访问路径,在这些路径上可以放置相应内容的广告,可以更精细地改进站点结构;(2)关联规则发现:可以从web访问事务集中,找到一般性的关联知识。利用这些相关性,可以更好地组织站点内的web空间;(3)序列模式发现:找到那些如“一些项跟随另一个项”这样的内部事务模式。发现序列模式,能够便于预测用户的访问模式,有助于开展针对这种模式的有针对性的广告服务。依赖于发现的关联规则和序列模式,能够在服务器方动态地创立有针对性的页面,以满足访问者的特定需求;(4)统计分析:对网页的访问种类、时间、不同种类的统计分析,有助于改进系统性能、增强系统安全性,便于网页的修改并能够提供决策支持。

2. 2. 2文本挖掘

通过对网站内容(主要是文本内容)的挖掘,可以有效地组织网站信息。例如采用自动归类技术实现网站信息的层次性(hierarchy)组织;同时可以结合对用户访问日志记录信息的挖掘,把握用户的兴趣,从而有助于开展网站信息推送服务以及个人信息的定制服务。

2. 2. 3logsom方法

logsom算法使用动态的信息来描述用户的行为,logsom系统使用自组织图谱(self-organizing map,som)按照用户的导航模式将网页组织成一个二维表。som可将web页数据组织在一个类中,以图表的形式表示类之间的关系。系统首先创建一个web日志文件,用它来表示日期、时间和所请求web页的地址以及用户计算机的ip(internet protocol)。logsom方法可识别公司潜在的客户访问了哪些网页,从而为公司提供决策信息。现在,不再由公司主观地决定将网络广告放在哪儿,而是需要用户导航模式的支持。

2. 3软件应用:互联网广告评测系统(weamax ads)

互联网广告评测系统(weamax ads)可以对企业投放在各种网站上的文字、图片、flash 等广告进行监控,对广告用户的行为进行挖掘分析,分析企业网站的所有用户访问,是一套专业的广告分析和评测系统。该软件全面采用商业智能中的数据仓库、在线分析处理和数据(web)挖掘3项高端技术,智能化的设计将有效地监测企业投放在网站上的广告,并且能全面优化企业自身网站的内容。它能有效鉴定网络广告投放的效果,进一步提高广告投放的效果。

3 结 语

本文结合web挖掘技术探讨了网络广告的定制,希望能对网络广告的定制起到一定的借鉴作用。

主要参考文献

[1] 谢新洲. 企业信息化与竞争情报[m]. 北京:北京大学出版社 ,2006:296,306,381-382.

[2] 胡亚慧等. web内容挖掘与使用挖掘的整合应用[j]. 空军雷达学院学报,2006,28(3):56.

[3] 方智等. 基于web 挖掘的个性化服务[j]. 湘潭大学自然科学学报,2006,28(3):28-29.

[4] 毛国君等. 数据挖掘原理与算法[m]. 北京:清华大学出版社, 2005:224,233.

[5] smith k a and ng a. web page clustering using a self-organizing map of user navigation patterns.[j]. decision support systems, 2003,35(2):245-256.