商务人士不胜垃圾邮件困扰,专家提出全新防范策略
2003-08-18
corpease
拥有电子邮箱的商务人士经常会受到垃圾邮件的困扰,删除各种各样的政治、色情和产品推销邮件会消耗正常的工作时间,数量过多的垃圾邮件还会令人感到烦躁不安,无法集中精力优先处理最重要的商务信函,从而工作效率大受影响。更糟糕的是,垃圾邮件让商务人士无法安度长假期,因为垃圾邮件很可能借此机会汹涌而入,令邮箱爆满,无法再接受任何新的邮件。
收费邮箱服务商对垃圾邮件问题非常头痛,尽管反垃圾邮件是很多收费邮箱标榜的卖点,实际上要做到这一点是非常困难的,目前收费邮箱服务商都是通过"关键字检索"技术来识别一封邮件是否应该过滤掉,例如带有暴力色情字眼的邮件,但是语言的表现形式太丰富了,垃圾邮件发送者轻易地用一点小花招就能绕过这些限制,服务商一面要不断设置新的关键字过滤规则的时候,一面又不敢过度地增加规则,因为邮件过滤会消耗大量的资源。
专业企业邮箱服务商--尚易公司(corpease.net)负责人陈诗峰表示,目前这种垃圾邮件防范技术比较机械,与人判断一封邮件是否是垃圾邮件的过程有很大的不同,我们总是能够精确无误地在Outlook里面手工删除垃圾邮件,因为目前的反垃圾邮件技术还不能够很好地模拟人的这种分析和判断的过程,故而无法做到这一点。
陈诗峰指出,一项人工智能技术可望给垃圾邮件过滤技术提供新的思路,这项技术已经成功地应用在考古学上。
例如,在考古中发现了一段从未见过的古文字,以前要确定其作者是很困难的,需要国宝级的专家才有可能考证出来,而现在考古学家可以先把已知的古代作者的诗文分类入库,然后逐一和新发现的古文拼在一起,运用这种新的人工智能技术进行比较,两者相似度越高,属于同一作者的可能性就越高。
这种新的人工智能技术应用了Windows操作系统上最常用的WinZip压缩技术,WinZip压缩技术的原理是找出一段文字内反复出现的词句,换以一个较短的单词,这就是所谓的“压缩”。同样地,我们可以把两篇文章拼在一起进行压缩,压缩率越高两篇文章越相似,由此我们可以判断他们是否属于同一个作者,同一个年代,应用到反垃圾邮件技术上,就可以判断是否属于同一类的垃圾邮件。
这种新技术有望缓解给日益恶化的垃圾邮件问题。陈诗峰认为:现在识别垃圾邮件主要依靠“关键字匹配”技术,对垃圾邮件的识别能力低,而运用这种人工智能新技术,只要不断地更新各类垃圾邮件的样本库,对每一封进入系统的邮件进行分类合并压缩,比较邮件的压缩率,当其高于某一指标就是可疑邮件,可以更准确地识别形式经常变换的垃圾邮件。这种技术还可以应用到Foxmail,
Outlook,Express等客户端的软件,提高其反垃圾邮件的性能。 |