综述:编写邮件系统或邮件列表程序是php应用的一个大的分支,既管php提供了简单的用于发email的函数,但在实际应用中,会涉及到发送带附件的邮件、测试用户输入的email地址的有效性,尤有必要用专门的章节来讲述。
mime是什么?
mime表示多用途internet邮件扩允协议。mime扩允了基本的面向文本的internet邮件系统,以便可以在消息中包含二进制附件。
rfc822在消息体的内容中做了一点限制:就是只能使用简单的ascii文本。所以,mime信息由正常的internet文本邮件组成,文本邮件拥有一些特别的符合rfc822的信息头和格式化过的信息体(用ascii的子集来表示的附件)。这些mime头给出了一种在邮件中表示附件的特别的方法。
mime信息包含了哪些东西?
一个普通的文本邮件的信息包含一个头部分(to: from: subject: 等等)和一个体部分(hello mr.,等等)。在一个符合mime的信息中,邮件的各个部分叫做mime段,每段前也缀以一个特别的头。mime邮件只是基于rfc 822邮件的一个扩展。然而它有着自已的rfc规范集。
头字段
mime头根据在邮件包中的位置,大体上分为mime信息头和mime段头,mime信息头指整个邮件的头,而mime段头只每个mime段的头。
mime信息头有:
mime-version:
这个头提供了所用mime的版本号。这个值习惯上为1.0。
content-type:
它定义了数据的类型,以便数据能被适当的处理。有效的类型有:text,image, audio,video,applications,multipart和message。注意任何一个二进制附件都应该被叫做application/octet-stream。这个头的一些用例为:image/jpg, application/mswork,multipart/mixed 。
content-transfer-encoding:
它说明了对数据所执行的编码方式,客户/mua将用它对附件进行解码。对于每个附件,可以使用7bit,8bit,binary ,quoted-printable,base64和custom中的一种编码方式。7bit编码是用在us ascii字符集上的常用的一种编码方式。8bit 和binary编码一般不用。对可读的标准文本,如果传输要经过对格式有影响的网关时对其进行保护,可以使用quoted printable 。base64是一种通用方法,在需要决定使用哪一种编码方法时,它提供了一个不用费脑子的选择;它通常用在二进制,非文本数据上。注意,任何非7bit 数据必须用一种模式编码,这样它就可以通过internet邮件网关。
content-id:
如果content-type是message/external-body或multipart/alternative时,这个头就有用了。
content-description:
这是一个可选的头。它是任何信息段内容的自由文本描述。描述必须使用us-ascii码。
content-disposition:
这是一个试验性的头,它用于给客户程序/mua提供提示,来决定是否在行内显示附件或作为单独的附件。
mime段头(出现在实际的mime附件部分的头),除了mime-version头,可以拥有以上任何头字段。如果一个mime头是信息块的一部分,它将作用于整个信息体。例如,如果content-transfer-encoding显示在信息(整个信息)头中,它应用于整个信息体,但是如果它显示在一个mime段里,它"只能"用于那个段中。
如何创建符合mime的信息?
最简单的mime信息
这个信息没有任何段,即没有附件。但是它有必要的头。
from: [email protected]
to: 'alex (the great)' <[email protected]>
subject: bucephalus
mime-version: 1.0
hello alexander,
how's bucephalus doing?
这只是一个简单的拥有mime头的符合rfc-822 的信息(文本邮件)。需要注意的是content-type头默认为content-type: text/plain;charset='us-ascii'。
下面是一个更为复杂的例子:
from: 'alex (the great)' <[email protected]>
to: [email protected]
subject: re: bucephalus
mime-version: 1.0
content-type: image/jpg;
name='buce.jpg'
content-transfer-encoding: base64
content-description: take a look at him yourself
<……base64 encoded jpg image of bucephalus……>
如果想发送多个附件,并且类型也不统一,怎么办?这就是我们将要讨论的"多部分信息"。
多部分信息(multipart messages)
这个概念允许在一封邮件中发送多条项目。例如,假设alexander想要给[email protected]发送一封他的马的照片的邮件,同时还附带有马的家族图谱及精彩的说明。这样一个简单的要求没有多部分消息的概念是无法被满足的。在这种情况下,我们创建了一个使用content-type的信息头的封装来支持邮件的不同部分,以便收信人得到图片,家族图谱和精彩的说明。
content-type 头现在拥有一个"multipart"的值,它表示这是一个完整的邮件信息并且这个头只封装了信息。而且它还有一个"mixed"的子类型(例如图片和文本文件是不同的类型)。
让我们看一下:
from: 'alex (the great)' <[email protected]>
to: [email protected]
subject: re: bucephalus
mime-version: 1.0
content-type: multipart/mixed;
boundary="xx-1234ded00099a";
content-transfer-encoding: 7bit
this is a mime encoded message
--xx-1234ded00099a
content-type: text/plain; charset=us-ascii
content-transfer-encoding: 7bit
hi php,
attached you will find my horse, bucephalus', pedigree chart and photo
alex
--xx-1234ded00099a
content-type: image/jpg;
name="buce.jpg";
content-transfer-encoding: base64
content-description: "a photo of bucephalus"
<.....base64 encoded jpg image of bucephalus...>
--xx-1234ded00099a
content-type: application/octet-stream;
name="pedigree.doc"
content-transfer-encoding: base64
content-description: "pedigree chart of the great horse"
<.....base64 encoded doc (pedigree.doc) of bucephalus...>
--xx-1234ded00099a--
让我们来看一下其中各个部分的含义:
1)、在mime信息头中的content-transfer-encoding,为"7bit"。因为content-type为multipart/mixed,编码应该是7bit,8bit或二进制中的一种, 7bit是一种广泛使用的格式。
2)、象这样一条信息包含了多种信息。客户程序是如何知道jpg图片,文档和普通文本之间的区别呢?在content-type后面有一个boundary="xx-1234ded00099a"参数。这个值用来分离邮件中的不同部分。它叫做mime边界标记。边界标记的值必须尽可能的唯一,以免在超出邮件范围时发生混乱。
3)、"警告"信息("this is a mime encoded message")在那里是为了让不符合mime的客户程序能够把它显示给用户,否则他们就不理解一个空白邮件是什么意思。
4)、现在,回到边界标记。如果你观察这个简单的邮件,会发现边界标记(xx-1234ded00099a在每一个分都出现了,也就是,在每部分之间都使用了一个边界标记,然而,每个边界标记都以两个连接符开始。很重要的一点需要注意的就是在最后一个mime段的后面,边界标记不仅仅以那两个边接符作为开始,同时也以它俩作为结束。这一点一定不能忘记,因为它定义了邮件的范围。
5)、让我们看一下前两个mime段:
第一段是普通文本信息,因此content-type为text/plain,并且编码为7bit(我们也可以省略它,因为如果不指明它也会默认为如此)。
第二个就是jpeg图片。相应的表示为content-type: image/jpg。name="buce.jpg"(出现在content-type的后面,称之为参数),指出了文件的名字;它就是可以在客户程序中看到的附件的名字。如果不给出name="buce.jpg" ,描述字段(如果给出)将作为附件的名字显示出来 。
6)、注意jpeg 图片可以在邮件件中被显示出来,如果客户程序可以显示行内附件。或者,你可以向客户程指明你想如何显示附件。例如,如果存在content-disposition: attachment头,jpeg图片将被显示为一个附件图标。
如何创建和实现mime邮件类?
现在让我们用php创建和实现一个mime邮件类。这个mime类必须能够:
1、增加附件
2、对每一个独立的请求,对所附的数据进行编码
3、创建mime段/头
4、生成一个包含mime段/头的完整的邮件
5、将整个邮件作为字符串返回
6、用本地的邮件处理程序进行发送(或选择调用一个smtp邮件处理程序)
这个类叫做mime_mail。
<?php
class mime_mail {
var $to;
var $from;
var $subject;
var $body;
var $headers = "";
var $errstr="";
var $base64_func= ''; // 如果未指定使用php的base64函数
var $qp_func = ''; // 此时为空
var $mailer = ""; // 将其设为有效的邮件对象的名字
?>
这里有一些公共处理的变量(也就是,可以在脚本中直接操纵的变量)。这些变量中的大部分都是自说明的。$headers包含了可选的想要发送给邮件处理程序的头信息。$errstr 是一个包含可读错误字符串的变量,它可以用在调用脚本中。
$base64_func和$qp_func是"函数处理器",用户可以进行定制。缺省地,它们被设为空串。对于$base64_func,一个空串意味着我们将使用php内置的base64_encode()函数 。quoted printable可以通过$qp_func被处理。在php中没有内置的quoted-printable 编码函数(然而,安装了imap则可以使用imap_qprint())。在这篇文章中我们将不再讨论quoted_printable方法。
<?php
//私有:
var $mimeparts = array();
?>
$mimeparts是一个内部数组,包含了邮件信息中各自独立的符合mime段。请不要在这个类(或派生类)之外操纵它和其它的私有方法/变量。
<?php
// 构造函数
function mime_mail($from="", $to="", $subject="", $body="", $headers = "")
{
$this->to = $to;
$this->from = $from;
$this->subject = $subject;
$this->body = $body;
if (is_array($headers)) {
if (sizeof($headers)>1) $headers=join(crlf, $headers);
else $headers=$headers[0];
}
if ($from) {
$headers = preg_replace("!(from: ?.+?[ ]? )!i", '', $headers);
}
$this->headers = chop($headers);
$this->mimeparts[] = "" ; //增加位置0
return;
}
?>
我们拥有对象的构造函数,它使用"from"和"to"邮件地址,主题和邮件体和头作为参数。对于邮件体部分,可以给出你将可能输入的正常邮件。最后一个参数是可选的(用户自定义)头。例如,x-mailer: mymailer_1.0。请注意$headers可以是一个数组,包含了将要发给邮件发送程序的不同的头,或者只是某个特别头的容器。你不能在$headers参数中发送from: 头,如果它被找到,这部分将自动被去掉。你可以象下面使用多个头:array("x-mailer: mymailer_1.0", "x-organization: phpbuilder.com")。
$mimeparts用一个空项(索引0)创建,在后面我们将看到这样用的道理。
我们将mime信息头的生成,mime段头的生成和最终的邮件消息的生成分成几个模块。方法的实现是直接从我们前面遇到的mime基础而来的。
<?php
function attach($data, $description = "", $contenttype = octet, $encoding = base64, $disp = '') {
if (empty($data)) return 0;
if (trim($contenttype) == '') $contenttype = octet ;
if (trim($encoding) == '') $encoding = base64;
if ($encoding == bit7) $emsg = $data;
elseif ($encoding == qp) $emsg = $$this->qp_func($data);
elseif ($encoding == base64) {
if (!$this->base64_func) $emsg = base64_encode($data);
else $emsg = $$this->base64_func($data);
}
$emsg = chunk_split($emsg);
//检查是否content-type是text/plain并且如果没有指定charset,追加缺省的charset
if (preg_match("!^".text."!i", $contenttype) && !preg_match("!;charset=!i", $contenttype)) $contenttype .= ";
charset=".charset ;
$msg = sprintf("content-type: %scontent-transfer-encoding: %s%s%s%s",
$contenttype.crlf, $encoding.crlf,
((($description) && (body != $description))?"content-description: $description".crlf:""),
($disp?"content-disposition: $disp".crlf:""),
crlf.$emsg.crlf);
body==$description? $this->mimeparts[0] = $msg: $this->mimeparts[]= $msg ;
return sizeof($this->mimeparts);
}
?>
我们来仔细地分析一下这个方法:
1、这个方法使用的参数有:
所附的实际数据($data)
与content-description头相应的数据描述($description)
将用在content-type头中的数据content-type值($contentype)
用在content-transfer-encoding中的编码值($encoding)
用在content-disposition头$disp中的布局值,可以是inline或attach,两个都是常量
2、如base64,text这样的值等等,作为常量被定义在附加的.def文件中。
3、使用$encoding值来决定需要用哪种编码方式对数据进行编码。有效的值是bit7(或7bit),qp或base64。这个函数同时也检查了是否用户要使用他/她自已的base64或qp函数。在写这篇文章时,在我们的类中只有bit7和base64被实现了,然而,你可以传递你自已的quoted-printable 函数来使用,通过在前面讨论的$qp_func类变量。
4、在编码处理之后,可以注意到对编码的信息使用了chunk_split()。这个函数根据可选长度将字符串分割成小段。因为我们没有指出长度,缺省长度使用76。
5、接着,如果$contenttype参数包含text/plain,则必须给出"charset=" 参数的值。它的缺省值被定义在常量charset中,值为us-ascii。注意当头使用参数值传递时,在头与参数之间必须有一个分号";"。
例如,content-type: text/plain; charset=us-ascii
6、如果其它mime段头各自的值被传递给这个方法,这些段头被创建。毕竟我们不想拥有一个没有描述的content-description头。在创建这些头之后,我们追加上经过编码的数据部分信息。(检查一下方法中的sprintf()语句)。同样,注意我们使用了一个叫body(又是一个常量)的特别描述字段。这就是我们用在类实现中的东西。如果描述字段与body一样,我们将其赋给$mimeheaders数组中的第一个元素。对于这个请多读几遍。
7、attach() 返回$mimeparts数组的当前大小,用在调用脚本的引用中。通过这种方法就可以知道一个附件"x"存在哪一个索引中(实际返回的值要比在数组中的索引小1)
8、注意所有的头必须用一个crlf()序列结束。
接着,我们看一下fattach()方法,fattach()与attach()相似,但是它使用一个文件名作为它的第一个参数(作为attach()中$data的替换)。这个方法只是一个封装,以便调用者可以用一个文件来调用fattach。fattach()然后将文件读出,接着调用attach()来追加数据。这个方法在失败时返回0,可以在$errstr 变量中找到解释或者当成功时,返回文件附件在$mimeparts数组中的索引号。
我们现在已经开发了附加数据的功能,对它们进行编码并且将单独的mime段放在私有数组中。还需要完成的工作是:
*.完成mime的各个段
*.创建包含mime信息头的邮件信息头,邮件原始的信息头(如to:, from:等等)并且包括任何用户定义的头。在头后面追加完整的mime段,这样一个完整的邮件包就生成了。
我们将考查的下一个方法是,build_message(),它是通过一个gen_email()的方法来调用的。请注意build_message()是一个私有方法。
<?php
function build_message() {
……
//情况1:存在附件列表,所以mime信息头必须是multipart/mixed
if (is_array($this->mimeparts) && ($nparts > 1)) {
……
// 如果存在mimie段,则邮件体也要变成附件
if (!empty($this->body)) {
$this->attach($this->body, body, text, bit7);
}
// 现在创建邮件的各个mime段
for ($i=0 ; $i < $nparts; $i++) {
if (!empty($this->mimeparts[$i]))
$msg .= crlf.'--'.$boundary.crlf.$this->mimeparts[$i]. crlf;
}
$msg .= '--'.$boundary.'--'.crlf;
$msg = $c_ver.$c_type.$c_enc.$c_desc.$warning.$msg;
} else {
……
}
return $msg;
}
?>
1、我们知道了每一个mime段都有一个边界标记,这个标记有一个唯一的id。边界标记被用在:
mime信息头中,用来指示附件必须从哪进行划分
mime段中;实际用在每一段的前面和后面来划分附件的边界(记住:最后一个边界标记要以两个连接符(--)结束,用于指示范围结束)。 $boundary包含了边界标记,并且它是通过一个随机数进行了唯一化再做md5哈希生成的。另外,我们给$boundary冠以一个"pm?"的前缀,这里"?"是一个随机字母。举一个boundary的例子就是"pmk------2345ee5de0052eba4daf47287953d37e"(pm表示php mime,所以你可以将其改为你的可能的初始值)。
2、在生成mime头的处理中我们必须考虑两种情况。这些情况影响了邮件的原始邮件体($body在构造函数中)以哪种方式被看待和mime信息头的特别表示。情况1就是:可以有许多的附件被包含。在这种情况下,请注意作为信息的部分被放上了警告字符串"this is a mime encoding message"。因此,真正的消息体本身也必须以附件形式加到信息中!邮件的文本通常是附件列表中的第一个附件,在我们的例子中就是$mimeparts。这个正好就是为什么我们要占用一个$mimeparts索引的原因,以便让第一个索引(是0)可以用于邮件文本部分。邮件体必须以7bit编码进行附加。
<?php
if (!empty($this->body)) {
$this->attach($this->body, body, text, bit7);
}
?>
上面的一小段代码完成附加邮件文本部分作为一个mime附件的工作。注意,我们使用了'body'常量来指示attach()要将附件加到何处。
第二种情况就是当不存在附件时,在这种情况下,如果提供了邮件文本,它将是包含在局部变量$msg中的唯一信息;在这种情况下不需要mime头。(然而,在这种情况下我们还应该只把mime-version头指定出来)
3、mime信息头(mime-version,content-type, 等等。)在有附件的时候被创建。为了用mime消息头来创建消息体,首先mime信息头要被创建。然后各个有效的mime段通过$mimeheaders数组被反复处理。这就是边界标识被实际使用的地点。根据规则的一致性,对一个mime段被前缀上两个连接符('--'.$boundary.crlf)并且在最后一个mime段的后面,在边界标识后追加两个连接符表示邮件范围结束。
4、在变量$msg中的完整的信息作为这个方法的值被返回。
下一个方法,get_email()通过build_message()方法完成mime消息的生成。因为build_message()是一个内部方法,get_email()在调用完build_message()之后,创建rfc 822的信息头并且追加上mime信息。
<?php
function gen_email($force=false) {
if (!empty($this->email) && !$force) return $this->email ; // saves processing
$email = "";
if (empty($this->subject)) $this->subject = nosubject;
if (!empty($this->from)) $email .= 'from: '.$this->from.crlf;
if (!empty($this->headers)) $email .= $this->headers.crlf;
$email .= $this->build_message();
$this->email = $email;
return $this->email;
}
?>
对于我们的类的一个实例来说,类的成员$email拥有生成的整个邮件信息。为了避免信息被无必要的重新生成,这个方法继续创建邮件头,并且只有当$mail为空时才调用build_message()。然而,你可以通过调用gen_email()来强制重新处理。(如果"to"信息被改变或加入了一个新的附件,调用者显示想这么做)。
gen_email()创建了更熟悉的from头。另外,如果没有指定主题,它将主题设为缺省值(no subject)。我们直到后面才将to和subject 的内含保存起来。这个方法返回完整的邮件信息,这样就结束了创建mime信息的任务。
值得说明的其它两个方法是print_mail()和send_mail(),两个都使用了$force参数。print_mail()输出整个邮件信息,send_mail()使用php的mail()函数发送信息。可选的,send_mail()使用了一个smtp对象和它的发送方法(由用户指定)来发送邮件。
如何测试email的有效性?
一般我们常希望拜访自己网站的朋友能留下email,但是很多人都会随便打,造成管理员的困扰,以下这个类可以在线检查email是否有效(存不存在)
……
function verifyrule($email) ;
function verifyonline($email) ;
function verify($email,$type=0) {
if($type==0) return $this->verifyrule($email) ; //为0只检查email语法
else return $this->verifyonline($email) ; //否则在线检查
}
……
基本思想是:
首先检查是否符合email语法标准,如果符合,取得用户输入的email的主机信息,用getmxrr()函数取得改主机dns中的mx字段,然后进一步检查输入的email是否存在。
用法:
$input=new cemail;
/检查语法
if($input->verify("[email protected]",0)) echo "有效";
else echo "无效";
//在线检查是否真的有该邮件
if($m->verify("[email protected]",1)) echo "有效";
else echo "无效";
新闻热点
疑难解答