Ik ben bezig met een mailclient te schrijven. Ik ben op het punt waarop ik tevreden ben hoe het werkt en wil nu met de functionaliteit verder gaan. Mijn doel was een uitgebreide spamfilter te schrijven, waar ik nu mee bezig ben. Ik heb hier een voorbeeldmailtje waarmee ik mijn vraag zal uitleggen:
quote:
X-Gmail-Received: 5f772e8643d73f157a0ee5e2c9e38c38ef0d8f86
Delivered-To: *****@gmail.com
Received: by 10.38.88.44 with SMTP id l44cs3332rnb;
Fri, 26 Nov 2004 03:50:40 -0800 (PST)
Received: by 10.54.10.60 with SMTP id 60mr817824wrj;
Fri, 26 Nov 2004 03:50:40 -0800 (PST)
Return-Path: <asenke@aahlife.com>
Received: from virtual.endoria.net (falcon.endoria.net [217.115.204.252])
by mx.gmail.com with ESMTP id d7si742803wra;
Fri, 26 Nov 2004 03:50:40 -0800 (PST)
Received-SPF: neutral (gmail.com: 217.115.204.252 is neither permitted nor denied by domain of asenke@aahlife.com)
Received: from [218.83.117.109] (helo=aahlife.com)
by virtual.endoria.net with smtp (Exim 4.43)
id 1CXecT-00039x-D0; Fri, 26 Nov 2004 12:50:38 +0100
Message-ID: <9A42DD7B.7AC5E3F@aahlife.com>
Date: Fri, 26 Nov 2004 10:58:19 +0200
From: "chanel fernandez" <asenke@aahlife.com>
User-Agent: IncrediMail 2001 (1800838)
0X-Accept-Language: en-us
MIME-Version: 1.0
To: "Jenifer Bryant" <*****@ixney.net>
Subject: Experience More Powerful Erections
Content-Type: text/html;
charset="us-ascii"
Content-Transfer-Encoding: 7bit
X-Spam-Score: 0.1 (/)
X-Spam-Report: Spam detection software, running on the system "falcon", has
identified this incoming email as possible spam. The original message
has been attached to this so you can view it (if it isn't spam) or block
similar future email. If you have any questions, see
noc@endoria.net for details.
Content preview: male enhancement and performance system Forget about
your partner faking her orgasm or not being able to please her. You
will be able to penetrate deeper so your partner will experience more
pleasure as well as multiple orgasms during sexual intercourse. 86% of
women surveyed said that they would like their partner to be more
'full' sexually. [...]
Content analysis details: (0.1 points, 5.0 required)
pts rule name description
---- ---------------------- --------------------------------------------------
0.1 MIME_HTML_ONLY BODY: Message only has text/html MIME parts
0.0 HTML_MESSAGE BODY: HTML included in message
X-Scan-Signature: b3d66e4f7ec97340352e1c8ba0b9bb51
X-Powered-By: Endoria.net Mail
X-Report-Abuse-To: abuse@endoria.net
<HTML>
male enhancement and performance system<br>
<br>
Forget about your partner faking her orgasm or not being able to please
her. You will be able to penetrate deeper so your partner will experience
more pleasure as well as multiple orgasms during sexual intercourse.
86% of women surveyed said that they would like their partner to be more
'full' sexually.--knip--
</FONT></HTML>
Ten eerste wil ik alles waar een dubbelepunt achter staat in een array hebben.
Dingen als
Return-Path: <bladie@blaat.com> naar $msg[$x]['Return-path'] = '<bladie@blaat.com>';
Wat is de makkelijkste manier om dat te doen? Met een preg_match? Wat alle 'keys' gemeen hebben is dat ze op een newline beginnen met een hoofdletter, waarna enkele tekens komen en een dubbele punt. Wat voor pattern maak ik daarvan?
En ten tweede wil ik punten geven aan bepaalde woorden die in de body staan. Maar, bijvoorbeeld woorden als
viagra,
medicinal e.d. (ik heb al een lijst aangelegd) moeten zwaarder wegen dan woorden als
credit. Ik kan de woorden wel in een array zetten met de punten erbij, bijvoorbeeld:
$rule['0.5'] = array('viagra', 'medicinal', 'sex', 'xxx');
$rule['0,2'] = array('credit', 'free');
Ik wil elke keer dat deze woorden voorkomen het betreffende aantal strafpunten aan het totaal strafpunten toevoegen. Hoe kan ik dit het makkelijkst doen? Ik hoef geen kant en klaar script, maar een schopje in de goede richting zou mooi zijn