邮件内容的智能分析与处理开题报告

 2022-11-09 11:05:18

1. 研究目的与意义

随着Internet的迅速发展,电子邮件的应用变得十分的广泛,但是电子邮件的广泛应用也带来了许多的问题,例如广告邮件、诈骗邮件还有一些带有病毒的邮件等诸多种类的垃圾邮件也随之而来。

垃圾邮件信息占用了大量的网络,系统,存储等资源,垃圾邮件过多也使得某些重要邮件被用户错当作垃圾邮件而遗漏,用户的邮箱往往会有好几页的垃圾邮件,这时候用户会手动批量的对这些邮件进行删除,这时就很容易把一些有用的重要邮件给删除了。

因此,对邮件内容进行智能的分析与处理对于当下的邮箱系统来说是非常重要的,这能让用户快速的找到有用的重要的信息邮件,充分减少了用户在处理垃圾信息邮件上浪费的时间,和垃圾邮件对客户造成的损失。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 课题关键问题和重难点

首先要对POP3和IMAP协议有比较深的了解,熟悉数据库,在中文分词分析这块的算法和效率上是个比较难的地方,检索的词如果过短容易造成语义错误,语义过于片面、而导致的因为标题和内容分词错误而不能正确的过滤邮件和对邮件进行分类。

而检索的词太长又会造成效率的低下。

中文的词在不同的句子中语义差距很大,可以随意搭配组成词语,三个字靠在一起可能就会形成2个词语,如何对它进行正确的分词匹配是一个比较大的难点。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 国内外研究现状(文献综述)

电子邮件发明于20世纪70年代,在80年代兴起70年代的沉寂主要是由于当时使用Arpanet网络的人太少,网络的速度也仅为56Kbps标准速度的二十分之一。

受网络速度的限制,那时的用户只能发送些简短的信息,根本不能够发送大量的照片,文件等;到了80年代中期,个人电脑开始兴起,电子邮件开始在广大电脑迷以及大学生中广泛传播开来;到90年代中期,互联网浏览器诞生,全球网民人数激增,电子邮件开始被广为使用。

使电子邮件成为主流的第一个程序是Euroda,是由史蒂夫道纳尔在1988年编写的。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究方案

首先建立垃圾邮件词库和邮件标签库,垃圾邮件词库用于存储垃圾邮件的关键词,邮件标签库用于存储邮件分类的信息。

客户端通过POP3协议或者IMAP4协议从邮件服务器上获取邮件,首先对IP地址、域名、邮件地址通过黑白名单的方式进行过滤,对黑名单的垃圾邮件进行屏蔽,白名单的邮件允许放行。

然后对邮件的标题通过基于字符串匹配的分词方法(正向最大匹配法/逆向最大匹配法/最小切分法相结合)进行中文分词分析,到词库中匹配,如果匹配成功则归为垃圾邮件过滤。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 工作计划

第1周:学生撰写开题报告和完成外文翻译。

第2周:指导学生进行课题总体规划和课题的详细设计。

第3-5周:指导学生进行课题模块化设计并进行模块代码编写与调试。

剩余内容已隐藏,您需要先支付 1元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。