论网站信息挖掘技术在搜索引擎优化几及电子商务中的主要

网站信息挖掘的应用领域涉及搜索引擎、电子商务、网络购物、网络学习、电子政务等各个领域,并且网站信息挖掘的应用本身也正在成为一个热点。以下以搜索引擎、电子商务、知识服务为例阐述网站信息挖掘的主要应用。

(A)网站信息挖掘在搜索引擎中的应用

搜索引擎对于网站的发展与普及应用起到了巨大的推动作用,然而由于网站信息数据的复杂性以及网络爬虫、搜索引擎自身存在的缺陷,搜索引擎也暴娓出一些不足。表现在:

①用户检索到的结果难以直接满足用户的需求,与用户所需要的信息相比,检索到的有用信总往往淹没在众多的无用信息中;

②检索结果难以满足用户的个性化满求。

利用网站信息挖掘技术,可以提高搜索引擎获取信息与反馈结果的质贵,更好地满足用户的个性化需求。主要应用包括:

(1)页面文本自动分类。

目前,搜索引擎中页面分类绝大部分依靠手工操作。通过网站内容挖掘弓机器学习技术可对页面文档进行自动分类,克服了人工分类中信息检索不全面、更新速度慢的缺点。

(2)权威页面的发现。

网站上存在着一种重要的页面,这些页面中包含某个专业领域的权威信息。利用网站结构挖掘技术,可以对页面的权威度进行计算和排序,从而使用户能够优先看到权威度商的页面。

(3)用户兴趣偏好的挖掘。

利用网站访问历史日志挖掘技术,可对用户历史浏览佶息进行分析以获得用户兴趣,使得搜索引擎可以按照兴趣偏好对用户搜索结果集进行过滤与扩展。

通过网站信息挖掘技术在搜索引擎中的应用,有效地提高了网站检索的速度、召回率以及准确率。

(B)网站信息挖掘在电子商务中的应用

对电子商务系统中网站访问历史日志与访问内容挖掘,可以获得用户的访问模式以及有价值的信息,例如,用户的兴趣爱好、购买频率、所属用户群及其特征、页面访问情况、广告点击情况。

这些信息有助于商家对客户进行分类,发现和吸引潜在客户,制定更有效的市场营销策略,为客户提供个性化的定制服务,从而获得更大的竞争优势。

网站信息挖掘在电子商务中的应用主要包括:

(1)用户的分类与聚类。

通过对网站访问历史日志的分析,对用户按浏览行为的相似性进行分类与聚类,并分析每类用户的共同特征。用户的分类与聚类?又?谌蒙碳腋?玫亓私庥没У男巳ぜ靶枨螅???髡??疽趁婺谌荩?蚩突?峁└?姓攵孕缘姆?瘛?/P>

(2)站点内容重组织。

网站上页面内容的安排和链接如同超市中物品在货架上的摆设,把关联的物品摆放在一起?又?谙?堋Mü?酝??志的关联规则挖掘,可以动态建立存在关联性物品之间的超链接,使用户能够很容易地访问到所需的物品,提高销锷率。

(C)网站信息挖掘在知识服务中的应用

网站已成为人类最大的知识库,由于Weh资源的爆炸性增长以及资源本身的非结构特性,实现"将合适的知识以合适的方式提供给合适的用户",正面临两项难题:

①如何以合适的粒度提供知识资源服务?符合人们认知粒度的知识服务可以有效地提高认知效率,然而现有基于关键词的金文检索所获取的资源实体一般为文件,难以获得文件内部的知识元及语义关系,也不能提供多粒度的知识服务。

②如何满足用户的个性需求?现有搜索引擎由于未考虑用户兴趣,因而只能为用户提供无差别的、"千人一面"的服务。

网站信息挖掘技术有助于解决上述问题。网站信息挖掘在知识服务中的应用主要包括:

(1)知识建构。

知识建构是建立符合知识内在关联的知识结构的过程。利用网站内容挖掘技术,从网站页面中获取基本知识元索,包括概念、概念间的语义关系、知识元、知识元间的关联关系,并以此建立面向特定领域的知识体系。通过知识建构,可以重新组织网站页面中的知识元索,据此提供符合人们认知特点的多粒度、多层次的知识服务。

(2)用户的个性、兴趣挖掘。

通过对网站访问历史日志以及用户访问内容的分析,一方面挖掘出用户行为弓个性之间的关联关系,并以此Q动获取用户个性特征;另一方面获取用户兴趣及其变化趋势。个性与兴趣是网络教育系统甸用户制定个性化学习策略与推荐个性化学习资源的依据。

上述三个应用一方面体现了网站信息挖掘的主要功能,另一方面也表明在具体应用中,往往需要综合运用内容、结构、日志多种网站信息挖掘技术。

这主要是由于单一类型的网站信息数据所蕴含的信息都具有局限性,针对单一类沏的网站信息挖掘技术很难解决实际问题。

陕西弈聪软件信息技术股份有限公司
电话:13679229477    02989322522
陕西省西安航天基地神州四路科为城墅20栋4301