Η μορφή mbox

Πώς οι πελάτες ηλεκτρονικού ταχυδρομείου αποθηκεύουν αλληλογραφία στον σκληρό σας δίσκο

Η πιο συνηθισμένη μορφή αποθήκευσης των μηνυμάτων ηλεκτρονικού ταχυδρομείου είναι η μορφή mbox. MBOX σημαίνει MailBOX. Ένα mbox είναι ένα μόνο αρχείο που περιέχει μηδέν ή περισσότερα μηνύματα ηλεκτρονικού ταχυδρομείου.

Η μορφή mbox

Αν χρησιμοποιούμε τη μορφή mbox για την αποθήκευση μηνυμάτων ηλεκτρονικού ταχυδρομείου, τα βάζουμε όλα σε ένα αρχείο. Αυτό δημιουργεί περισσότερο ή λιγότερο μεγάλο αρχείο κειμένου (το ηλεκτρονικό μήνυμα ηλεκτρονικού ταχυδρομείου πάντα υπάρχει μόνο ως κείμενο ASCII 7-bit, οτιδήποτε άλλο - για παράδειγμα τα συνημμένα - κωδικοποιούνται ) που περιέχουν ένα μήνυμα ηλεκτρονικού ταχυδρομείου μετά το άλλο. Πώς μπορούμε να ξέρουμε πού θα τελειώσει;

Ευτυχώς, όλα τα μηνύματα ηλεκτρονικού ταχυδρομείου έχουν τουλάχιστον μία γραμμή από την αρχή στην αρχή της. Κάθε μήνυμα αρχίζει με "Από" (Από ακολουθούμενο από έναν χαρακτήρα κενής θέσης, που ονομάζεται επίσης "Από_" γραμμή). Αν αυτή η ακολουθία ("Από") στην αρχή μίας γραμμής προηγείται από μια κενή γραμμή ή βρίσκεται στην κορυφή του αρχείου, βρήκαμε την αρχή ενός μηνύματος.

Επομένως, αυτό που ψάχνουμε όταν αναλύουμε ένα αρχείο mbox είναι ουσιαστικά μια κενή γραμμή ακολουθούμενη από "Από".

Ως κανονική έκφραση, μπορούμε να γράψουμε αυτό ως "\ n \ nFrom. * \ N". Μόνο το πρώτο μήνυμα είναι διαφορετικό. Αρχίζει απλά με "Από" στην αρχή μιας γραμμής ("^ Από. * \ N").

& # 34; Από & # 34; στο Σώμα

Τι γίνεται αν ακριβώς η παραπάνω ακολουθία εμφανίζεται στο σώμα ενός μηνύματος ηλεκτρονικού ταχυδρομείου; Τι θα συμβεί αν τα ακόλουθα είναι μέρος ενός μηνύματος ηλεκτρονικού ταχυδρομείου;

... Σας στέλνω την πιο πρόσφατη αναφορά.

Από αυτή την αναφορά, δεν χρειάζεται ...

Εδώ, έχουμε μια κενή γραμμή ακολουθούμενη από "Από" στην αρχή της γραμμής. Αν αυτό εμφανίζεται σε ένα αρχείο mbox, έχουμε ξεκάθαρα την αρχή ενός νέου μηνύματος. Τουλάχιστον αυτός είναι ο λόγος που σκέφτεται ο αναλυτής - και γιατί και ο πελάτης ηλεκτρονικού ταχυδρομείου και θα είμαστε αρκετά συγκεχυμένοι με ένα μήνυμα ηλεκτρονικού ταχυδρομείου που δεν περιέχει ούτε αποστολέα ούτε παραλήπτη, αλλά αρχίζει με "Από αυτή την αναφορά".

Για να αποφύγουμε τέτοιες καταστροφικές συνθήκες, πρέπει να διασφαλίσουμε ότι το "Από" δεν εμφανίζεται ποτέ στην αρχή μιας γραμμής μετά από μια κενή γραμμή στο σώμα ενός μηνύματος ηλεκτρονικού ταχυδρομείου.

Κάθε φορά που προσθέτουμε ένα νέο μήνυμα σε ένα αρχείο mbox , αναζητούμε τέτοιες ακολουθίες στο σώμα και απλά αντικαθιστούμε το "From" με το "> From". Αυτό καθιστά αδύνατες τις παρερμηνείες. Το παραπάνω παράδειγμα τώρα μοιάζει με αυτό και δεν ενεργοποιεί πλέον τον αναλυτή:

... Σας στέλνω την πιο πρόσφατη αναφορά.

> Από αυτήν την αναφορά, δεν χρειάζεται ...

Αυτός είναι ο λόγος για τον οποίο μπορείτε μερικές φορές να βρείτε "> Από" σε ένα μήνυμα ηλεκτρονικού ταχυδρομείου όπου θα περίμενε κανείς απλό "Από".