ctdl_iconv_open() remove from citadel and switch to new api
[citadel.git] / citadel / internet_addressing.c
1 /*
2  * $Id$
3  *
4  * This file contains functions which handle the mapping of Internet addresses
5  * to users on the Citadel system.
6  */
7
8 #include "sysdep.h"
9 #include <stdlib.h>
10 #include <unistd.h>
11 #include <stdio.h>
12 #include <fcntl.h>
13 #include <ctype.h>
14 #include <signal.h>
15 #include <pwd.h>
16 #include <errno.h>
17 #include <sys/types.h>
18
19 #if TIME_WITH_SYS_TIME
20 # include <sys/time.h>
21 # include <time.h>
22 #else
23 # if HAVE_SYS_TIME_H
24 #  include <sys/time.h>
25 # else
26 #  include <time.h>
27 # endif
28 #endif
29
30 #include <sys/wait.h>
31 #include <string.h>
32 #include <limits.h>
33 #include <libcitadel.h>
34 #include "citadel.h"
35 #include "server.h"
36 #include "sysdep_decls.h"
37 #include "citserver.h"
38 #include "support.h"
39 #include "config.h"
40 #include "msgbase.h"
41 #include "internet_addressing.h"
42 #include "user_ops.h"
43 #include "room_ops.h"
44 #include "parsedate.h"
45 #include "database.h"
46
47
48 #ifndef HAVE_SNPRINTF
49 #include "snprintf.h"
50 #endif
51
52
53 #ifdef HAVE_ICONV
54 #include <iconv.h>
55
56 #if 0
57 /* This is the non-define version in case of s.b. needing to debug */
58 inline void FindNextEnd (char *bptr, char *end)
59 {
60         /* Find the next ?Q? */
61         end = strchr(bptr + 2, '?');
62         if (end == NULL) return NULL;
63         if (((*(end + 1) == 'B') || (*(end + 1) == 'Q')) && 
64             (*(end + 2) == '?')) {
65                 /* skip on to the end of the cluster, the next ?= */
66                 end = strstr(end + 3, "?=");
67         }
68         else
69                 /* sort of half valid encoding, try to find an end. */
70                 end = strstr(bptr, "?=");
71 }
72 #endif
73
74 #define FindNextEnd(bptr, end) { \
75         end = strchr(bptr + 2, '?'); \
76         if (end != NULL) { \
77                 if (((*(end + 1) == 'B') || (*(end + 1) == 'Q')) && (*(end + 2) == '?')) { \
78                         end = strstr(end + 3, "?="); \
79                 } else end = strstr(bptr, "?="); \
80         } \
81 }
82
83 /*
84  * Handle subjects with RFC2047 encoding such as:
85  * =?koi8-r?B?78bP0s3Mxc7JxSDXz9rE1dvO2c3JINvB0sHNySDP?=
86  */
87 void utf8ify_rfc822_string(char *buf) {
88         char *start, *end, *next, *nextend, *ptr;
89         char newbuf[1024];
90         char charset[128];
91         char encoding[16];
92         char istr[1024];
93         iconv_t ic = (iconv_t)(-1) ;
94         char *ibuf;                     /**< Buffer of characters to be converted */
95         char *obuf;                     /**< Buffer for converted characters */
96         size_t ibuflen;                 /**< Length of input buffer */
97         size_t obuflen;                 /**< Length of output buffer */
98         char *isav;                     /**< Saved pointer to input buffer */
99         char *osav;                     /**< Saved pointer to output buffer */
100         int passes = 0;
101         int i, len, delta;
102         int illegal_non_rfc2047_encoding = 0;
103
104         /* Sometimes, badly formed messages contain strings which were simply
105          *  written out directly in some foreign character set instead of
106          *  using RFC2047 encoding.  This is illegal but we will attempt to
107          *  handle it anyway by converting from a user-specified default
108          *  charset to UTF-8 if we see any nonprintable characters.
109          */
110         len = strlen(buf);
111         for (i=0; i<len; ++i) {
112                 if ((buf[i] < 32) || (buf[i] > 126)) {
113                         illegal_non_rfc2047_encoding = 1;
114                         i = len; ///< take a shortcut, it won't be more than one.
115                 }
116         }
117         if (illegal_non_rfc2047_encoding) {
118                 const char *default_header_charset = "iso-8859-1";
119                 if ( (strcasecmp(default_header_charset, "UTF-8")) && (strcasecmp(default_header_charset, "us-ascii")) ) {
120                         ctdl_iconv_open("UTF-8", default_header_charset, &ic);
121                         if (ic != (iconv_t)(-1) ) {
122                                 ibuf = malloc(1024);
123                                 isav = ibuf;
124                                 safestrncpy(ibuf, buf, 1024);
125                                 ibuflen = strlen(ibuf);
126                                 obuflen = 1024;
127                                 obuf = (char *) malloc(obuflen);
128                                 osav = obuf;
129                                 iconv(ic, &ibuf, &ibuflen, &obuf, &obuflen);
130                                 osav[1024-obuflen] = 0;
131                                 strcpy(buf, osav);
132                                 free(osav);
133                                 iconv_close(ic);
134                                 free(isav);
135                         }
136                 }
137         }
138
139         /* pre evaluate the first pair */
140         nextend = end = NULL;
141         len = strlen(buf);
142         start = strstr(buf, "=?");
143         if (start != NULL) 
144                 FindNextEnd (start, end);
145
146         while ((start != NULL) && (end != NULL))
147         {
148                 next = strstr(end, "=?");
149                 if (next != NULL)
150                         FindNextEnd(next, nextend);
151                 if (nextend == NULL)
152                         next = NULL;
153
154                 /* did we find two partitions */
155                 if ((next != NULL) && 
156                     ((next - end) > 2))
157                 {
158                         ptr = end + 2;
159                         while ((ptr < next) && 
160                                (isspace(*ptr) ||
161                                 (*ptr == '\r') ||
162                                 (*ptr == '\n') || 
163                                 (*ptr == '\t')))
164                                 ptr ++;
165                         /* did we find a gab just filled with blanks? */
166                         if (ptr == next)
167                         {
168                                 memmove (end + 2,
169                                          next,
170                                          len - (next - start));
171
172                                 /* now terminate the gab at the end */
173                                 delta = (next - end) - 2;
174                                 len -= delta;
175                                 buf[len] = '\0';
176
177                                 /* move next to its new location. */
178                                 next -= delta;
179                                 nextend -= delta;
180                         }
181                 }
182                 /* our next-pair is our new first pair now. */
183                 start = next;
184                 end = nextend;
185         }
186
187         /* Now we handle foreign character sets properly encoded
188          * in RFC2047 format.
189          */
190         start = strstr(buf, "=?");
191         FindNextEnd((start != NULL)? start : buf, end);
192         while (start != NULL && end != NULL && end > start)
193         {
194                 extract_token(charset, start, 1, '?', sizeof charset);
195                 extract_token(encoding, start, 2, '?', sizeof encoding);
196                 extract_token(istr, start, 3, '?', sizeof istr);
197
198                 ibuf = malloc(1024);
199                 isav = ibuf;
200                 if (!strcasecmp(encoding, "B")) {       /**< base64 */
201                         ibuflen = CtdlDecodeBase64(ibuf, istr, strlen(istr));
202                 }
203                 else if (!strcasecmp(encoding, "Q")) {  /**< quoted-printable */
204                         size_t len;
205                         long pos;
206                         
207                         len = strlen(istr);
208                         pos = 0;
209                         while (pos < len)
210                         {
211                                 if (istr[pos] == '_') istr[pos] = ' ';
212                                 pos++;
213                         }
214
215                         ibuflen = CtdlDecodeQuotedPrintable(ibuf, istr, len);
216                 }
217                 else {
218                         strcpy(ibuf, istr);             /**< unknown encoding */
219                         ibuflen = strlen(istr);
220                 }
221
222                 ctdl_iconv_open("UTF-8", charset, &ic);
223                 if (ic != (iconv_t)(-1) ) {
224                         obuflen = 1024;
225                         obuf = (char *) malloc(obuflen);
226                         osav = obuf;
227                         iconv(ic, &ibuf, &ibuflen, &obuf, &obuflen);
228                         osav[1024-obuflen] = 0;
229
230                         end = start;
231                         end++;
232                         strcpy(start, "");
233                         remove_token(end, 0, '?');
234                         remove_token(end, 0, '?');
235                         remove_token(end, 0, '?');
236                         remove_token(end, 0, '?');
237                         strcpy(end, &end[1]);
238
239                         snprintf(newbuf, sizeof newbuf, "%s%s%s", buf, osav, end);
240                         strcpy(buf, newbuf);
241                         free(osav);
242                         iconv_close(ic);
243                 }
244                 else {
245                         end = start;
246                         end++;
247                         strcpy(start, "");
248                         remove_token(end, 0, '?');
249                         remove_token(end, 0, '?');
250                         remove_token(end, 0, '?');
251                         remove_token(end, 0, '?');
252                         strcpy(end, &end[1]);
253
254                         snprintf(newbuf, sizeof newbuf, "%s(unreadable)%s", buf, end);
255                         strcpy(buf, newbuf);
256                 }
257
258                 free(isav);
259
260                 /*
261                  * Since spammers will go to all sorts of absurd lengths to get their
262                  * messages through, there are LOTS of corrupt headers out there.
263                  * So, prevent a really badly formed RFC2047 header from throwing
264                  * this function into an infinite loop.
265                  */
266                 ++passes;
267                 if (passes > 20) return;
268
269                 start = strstr(buf, "=?");
270                 FindNextEnd((start != NULL)? start : buf, end);
271         }
272
273 }
274 #else
275 inline void utf8ify_rfc822_string(char *a){};
276
277 #endif
278
279
280
281 struct trynamebuf {
282         char buffer1[SIZ];
283         char buffer2[SIZ];
284 };
285
286 char *inetcfg = NULL;
287 struct spamstrings_t *spamstrings = NULL;
288
289
290 /*
291  * Return nonzero if the supplied name is an alias for this host.
292  */
293 int CtdlHostAlias(char *fqdn) {
294         int config_lines;
295         int i;
296         char buf[256];
297         char host[256], type[256];
298
299         if (fqdn == NULL) return(hostalias_nomatch);
300         if (IsEmptyStr(fqdn)) return(hostalias_nomatch);
301         if (!strcasecmp(fqdn, "localhost")) return(hostalias_localhost);
302         if (!strcasecmp(fqdn, config.c_fqdn)) return(hostalias_localhost);
303         if (!strcasecmp(fqdn, config.c_nodename)) return(hostalias_localhost);
304         if (inetcfg == NULL) return(hostalias_nomatch);
305
306         config_lines = num_tokens(inetcfg, '\n');
307         for (i=0; i<config_lines; ++i) {
308                 extract_token(buf, inetcfg, i, '\n', sizeof buf);
309                 extract_token(host, buf, 0, '|', sizeof host);
310                 extract_token(type, buf, 1, '|', sizeof type);
311
312                 if ( (!strcasecmp(type, "localhost"))
313                    && (!strcasecmp(fqdn, host)))
314                         return(hostalias_localhost);
315
316                 if ( (!strcasecmp(type, "directory"))
317                    && (!strcasecmp(fqdn, host)))
318                         return(hostalias_directory);
319
320                 if ( (!strcasecmp(type, "masqdomain"))
321                    && (!strcasecmp(fqdn, host)))
322                         return(hostalias_masq);
323
324         }
325
326         return(hostalias_nomatch);
327 }
328
329
330
331
332
333
334
335 /*
336  * Return 0 if a given string fuzzy-matches a Citadel user account
337  *
338  * FIXME ... this needs to be updated to handle aliases.
339  */
340 int fuzzy_match(struct ctdluser *us, char *matchstring) {
341         int a;
342         long len;
343
344         if ( (!strncasecmp(matchstring, "cit", 3)) 
345            && (atol(&matchstring[3]) == us->usernum)) {
346                 return 0;
347         }
348
349         len = strlen(matchstring);
350         for (a=0; !IsEmptyStr(&us->fullname[a]); ++a) {
351                 if (!strncasecmp(&us->fullname[a],
352                    matchstring, len)) {
353                         return 0;
354                 }
355         }
356         return -1;
357 }
358
359
360 /*
361  * Unfold a multi-line field into a single line, removing multi-whitespaces
362  */
363 void unfold_rfc822_field(char *field) {
364         int i;
365         int quote = 0;
366
367         striplt(field);         /* remove leading/trailing whitespace */
368
369         /* convert non-space whitespace to spaces, and remove double blanks */
370         for (i=0; i<strlen(field); ++i) {
371                 if (field[i]=='\"') quote = 1 - quote;
372                 if (!quote) {
373                         if (isspace(field[i])) field[i] = ' ';
374                         while (isspace(field[i]) && isspace(field[i+1])) {
375                                 strcpy(&field[i+1], &field[i+2]);
376                         }
377                 }
378         }
379 }
380
381
382
383 /*
384  * Split an RFC822-style address into userid, host, and full name
385  *
386  */
387 void process_rfc822_addr(const char *rfc822, char *user, char *node, char *name)
388 {
389         int a;
390
391         strcpy(user, "");
392         strcpy(node, config.c_fqdn);
393         strcpy(name, "");
394
395         if (rfc822 == NULL) return;
396
397         /* extract full name - first, it's From minus <userid> */
398         strcpy(name, rfc822);
399         stripout(name, '<', '>');
400
401         /* strip anything to the left of a bang */
402         while ((!IsEmptyStr(name)) && (haschar(name, '!') > 0))
403                 strcpy(name, &name[1]);
404
405         /* and anything to the right of a @ or % */
406         for (a = 0; a < strlen(name); ++a) {
407                 if (name[a] == '@')
408                         name[a] = 0;
409                 if (name[a] == '%')
410                         name[a] = 0;
411         }
412
413         /* but if there are parentheses, that changes the rules... */
414         if ((haschar(rfc822, '(') == 1) && (haschar(rfc822, ')') == 1)) {
415                 strcpy(name, rfc822);
416                 stripallbut(name, '(', ')');
417         }
418
419         /* but if there are a set of quotes, that supersedes everything */
420         if (haschar(rfc822, 34) == 2) {
421                 strcpy(name, rfc822);
422                 while ((!IsEmptyStr(name)) && (name[0] != 34)) {
423                         strcpy(&name[0], &name[1]);
424                 }
425                 strcpy(&name[0], &name[1]);
426                 for (a = 0; a < strlen(name); ++a)
427                         if (name[a] == 34)
428                                 name[a] = 0;
429         }
430         /* extract user id */
431         strcpy(user, rfc822);
432
433         /* first get rid of anything in parens */
434         stripout(user, '(', ')');
435
436         /* if there's a set of angle brackets, strip it down to that */
437         if ((haschar(user, '<') == 1) && (haschar(user, '>') == 1)) {
438                 stripallbut(user, '<', '>');
439         }
440
441         /* strip anything to the left of a bang */
442         while ((!IsEmptyStr(user)) && (haschar(user, '!') > 0))
443                 strcpy(user, &user[1]);
444
445         /* and anything to the right of a @ or % */
446         for (a = 0; a < strlen(user); ++a) {
447                 if (user[a] == '@')
448                         user[a] = 0;
449                 if (user[a] == '%')
450                         user[a] = 0;
451         }
452
453
454         /* extract node name */
455         strcpy(node, rfc822);
456
457         /* first get rid of anything in parens */
458         stripout(node, '(', ')');
459
460         /* if there's a set of angle brackets, strip it down to that */
461         if ((haschar(node, '<') == 1) && (haschar(node, '>') == 1)) {
462                 stripallbut(node, '<', '>');
463         }
464
465         /* If no node specified, tack ours on instead */
466         if (
467                 (haschar(node, '@')==0)
468                 && (haschar(node, '%')==0)
469                 && (haschar(node, '!')==0)
470         ) {
471                 strcpy(node, config.c_nodename);
472         }
473
474         else {
475
476                 /* strip anything to the left of a @ */
477                 while ((!IsEmptyStr(node)) && (haschar(node, '@') > 0))
478                         strcpy(node, &node[1]);
479         
480                 /* strip anything to the left of a % */
481                 while ((!IsEmptyStr(node)) && (haschar(node, '%') > 0))
482                         strcpy(node, &node[1]);
483         
484                 /* reduce multiple system bang paths to node!user */
485                 while ((!IsEmptyStr(node)) && (haschar(node, '!') > 1))
486                         strcpy(node, &node[1]);
487         
488                 /* now get rid of the user portion of a node!user string */
489                 for (a = 0; a < strlen(node); ++a)
490                         if (node[a] == '!')
491                                 node[a] = 0;
492         }
493
494         /* strip leading and trailing spaces in all strings */
495         striplt(user);
496         striplt(node);
497         striplt(name);
498
499         /* If we processed a string that had the address in angle brackets
500          * but no name outside the brackets, we now have an empty name.  In
501          * this case, use the user portion of the address as the name.
502          */
503         if ((IsEmptyStr(name)) && (!IsEmptyStr(user))) {
504                 strcpy(name, user);
505         }
506 }
507
508
509
510 /*
511  * convert_field() is a helper function for convert_internet_message().
512  * Given start/end positions for an rfc822 field, it converts it to a Citadel
513  * field if it wants to, and unfolds it if necessary.
514  *
515  * Returns 1 if the field was converted and inserted into the Citadel message
516  * structure, implying that the source field should be removed from the
517  * message text.
518  */
519 int convert_field(struct CtdlMessage *msg, int beg, int end) {
520         char *rfc822;
521         char *key, *value;
522         int i;
523         int colonpos = (-1);
524         int processed = 0;
525         char buf[SIZ];
526         char user[1024];
527         char node[1024];
528         char name[1024];
529         char addr[1024];
530         time_t parsed_date;
531
532         rfc822 = msg->cm_fields['M'];   /* M field contains rfc822 text */
533         for (i = end; i >= beg; --i) {
534                 if (rfc822[i] == ':') colonpos = i;
535         }
536
537         if (colonpos < 0) return(0);    /* no colon? not a valid header line */
538
539         key = malloc((end - beg) + 2);
540         safestrncpy(key, &rfc822[beg], (end-beg)+1);
541         key[colonpos - beg] = 0;
542         value = &key[(colonpos - beg) + 1];
543         unfold_rfc822_field(value);
544
545         /*
546          * Here's the big rfc822-to-citadel loop.
547          */
548
549         /* Date/time is converted into a unix timestamp.  If the conversion
550          * fails, we replace it with the time the message arrived locally.
551          */
552         if (!strcasecmp(key, "Date")) {
553                 parsed_date = parsedate(value);
554                 if (parsed_date < 0L) parsed_date = time(NULL);
555                 snprintf(buf, sizeof buf, "%ld", (long)parsed_date );
556                 if (msg->cm_fields['T'] == NULL)
557                         msg->cm_fields['T'] = strdup(buf);
558                 processed = 1;
559         }
560
561         else if (!strcasecmp(key, "From")) {
562                 process_rfc822_addr(value, user, node, name);
563                 CtdlLogPrintf(CTDL_DEBUG, "Converted to <%s@%s> (%s)\n", user, node, name);
564                 snprintf(addr, sizeof addr, "%s@%s", user, node);
565                 if (msg->cm_fields['A'] == NULL)
566                         msg->cm_fields['A'] = strdup(name);
567                 processed = 1;
568                 if (msg->cm_fields['F'] == NULL)
569                         msg->cm_fields['F'] = strdup(addr);
570                 processed = 1;
571         }
572
573         else if (!strcasecmp(key, "Subject")) {
574                 if (msg->cm_fields['U'] == NULL)
575                         msg->cm_fields['U'] = strdup(value);
576                 processed = 1;
577         }
578
579         else if (!strcasecmp(key, "List-ID")) {
580                 if (msg->cm_fields['L'] == NULL)
581                         msg->cm_fields['L'] = strdup(value);
582                 processed = 1;
583         }
584
585         else if (!strcasecmp(key, "To")) {
586                 if (msg->cm_fields['R'] == NULL)
587                         msg->cm_fields['R'] = strdup(value);
588                 processed = 1;
589         }
590
591         else if (!strcasecmp(key, "CC")) {
592                 if (msg->cm_fields['Y'] == NULL)
593                         msg->cm_fields['Y'] = strdup(value);
594                 processed = 1;
595         }
596
597         else if (!strcasecmp(key, "Message-ID")) {
598                 if (msg->cm_fields['I'] != NULL) {
599                         CtdlLogPrintf(CTDL_WARNING, "duplicate message id\n");
600                 }
601
602                 if (msg->cm_fields['I'] == NULL) {
603                         msg->cm_fields['I'] = strdup(value);
604
605                         /* Strip angle brackets */
606                         while (haschar(msg->cm_fields['I'], '<') > 0) {
607                                 strcpy(&msg->cm_fields['I'][0],
608                                         &msg->cm_fields['I'][1]);
609                         }
610                         for (i = 0; i<strlen(msg->cm_fields['I']); ++i)
611                                 if (msg->cm_fields['I'][i] == '>')
612                                         msg->cm_fields['I'][i] = 0;
613                 }
614
615                 processed = 1;
616         }
617
618         else if (!strcasecmp(key, "Return-Path")) {
619                 if (msg->cm_fields['P'] == NULL)
620                         msg->cm_fields['P'] = strdup(value);
621                 processed = 1;
622         }
623
624         else if (!strcasecmp(key, "Envelope-To")) {
625                 if (msg->cm_fields['V'] == NULL)
626                         msg->cm_fields['V'] = strdup(value);
627                 processed = 1;
628         }
629
630         else if (!strcasecmp(key, "References")) {
631                 if (msg->cm_fields['W'] != NULL) {
632                         free(msg->cm_fields['W']);
633                 }
634                 msg->cm_fields['W'] = strdup(value);
635                 processed = 1;
636         }
637
638         else if (!strcasecmp(key, "In-reply-to")) {
639                 if (msg->cm_fields['W'] == NULL) {              /* References: supersedes In-reply-to: */
640                         msg->cm_fields['W'] = strdup(value);
641                 }
642                 processed = 1;
643         }
644
645
646
647         /* Clean up and move on. */
648         free(key);      /* Don't free 'value', it's actually the same buffer */
649         return(processed);
650 }
651
652
653 /*
654  * Convert RFC822 references format (References) to Citadel references format (Weferences)
655  */
656 void convert_references_to_wefewences(char *str) {
657         int bracket_nesting = 0;
658         char *ptr = str;
659         char *moveptr = NULL;
660         char ch;
661
662         while(*ptr) {
663                 ch = *ptr;
664                 if (ch == '>') {
665                         --bracket_nesting;
666                         if (bracket_nesting < 0) bracket_nesting = 0;
667                 }
668                 if ((ch == '>') && (bracket_nesting == 0) && (*(ptr+1)) && (ptr>str) ) {
669                         *ptr = '|';
670                         ++ptr;
671                 }
672                 else if (bracket_nesting > 0) {
673                         ++ptr;
674                 }
675                 else {
676                         moveptr = ptr;
677                         while (*moveptr) {
678                                 *moveptr = *(moveptr+1);
679                                 ++moveptr;
680                         }
681                 }
682                 if (ch == '<') ++bracket_nesting;
683         }
684
685 }
686
687
688 /*
689  * Convert an RFC822 message (headers + body) to a CtdlMessage structure.
690  * NOTE: the supplied buffer becomes part of the CtdlMessage structure, and
691  * will be deallocated when CtdlFreeMessage() is called.  Therefore, the
692  * supplied buffer should be DEREFERENCED.  It should not be freed or used
693  * again.
694  */
695 struct CtdlMessage *convert_internet_message(char *rfc822) {
696
697         struct CtdlMessage *msg;
698         int pos, beg, end, msglen;
699         int done;
700         char buf[SIZ];
701         int converted;
702
703         msg = malloc(sizeof(struct CtdlMessage));
704         if (msg == NULL) return msg;
705
706         memset(msg, 0, sizeof(struct CtdlMessage));
707         msg->cm_magic = CTDLMESSAGE_MAGIC;      /* self check */
708         msg->cm_anon_type = 0;                  /* never anonymous */
709         msg->cm_format_type = FMT_RFC822;       /* internet message */
710         msg->cm_fields['M'] = rfc822;
711
712         pos = 0;
713         done = 0;
714
715         while (!done) {
716
717                 /* Locate beginning and end of field, keeping in mind that
718                  * some fields might be multiline
719                  */
720                 beg = pos;
721                 end = (-1);
722
723                 msglen = strlen(rfc822);        
724                 while ( (end < 0) && (done == 0) ) {
725
726                         if ((rfc822[pos]=='\n')
727                            && (!isspace(rfc822[pos+1]))) {
728                                 end = pos;
729                         }
730
731                         /* done with headers? */
732                         if (   (rfc822[pos]=='\n')
733                            && ( (rfc822[pos+1]=='\n')
734                               ||(rfc822[pos+1]=='\r')) ) {
735                                 end = pos;
736                                 done = 1;
737                         }
738
739                         if (pos >= (msglen-1) ) {
740                                 end = pos;
741                                 done = 1;
742                         }
743
744                         ++pos;
745
746                 }
747
748                 /* At this point we have a field.  Are we interested in it? */
749                 converted = convert_field(msg, beg, end);
750
751                 /* Strip the field out of the RFC822 header if we used it */
752                 if (converted) {
753                         strcpy(&rfc822[beg], &rfc822[pos]);
754                         pos = beg;
755                 }
756
757                 /* If we've hit the end of the message, bail out */
758                 if (pos > strlen(rfc822)) done = 1;
759         }
760
761         /* Follow-up sanity checks... */
762
763         /* If there's no timestamp on this message, set it to now. */
764         if (msg->cm_fields['T'] == NULL) {
765                 snprintf(buf, sizeof buf, "%ld", (long)time(NULL));
766                 msg->cm_fields['T'] = strdup(buf);
767         }
768
769         /* If a W (references, or rather, Wefewences) field is present, we
770          * have to convert it from RFC822 format to Citadel format.
771          */
772         if (msg->cm_fields['W'] != NULL) {
773                 convert_references_to_wefewences(msg->cm_fields['W']);
774         }
775
776         return msg;
777 }
778
779
780
781 /*
782  * Look for a particular header field in an RFC822 message text.  If the
783  * requested field is found, it is unfolded (if necessary) and returned to
784  * the caller.  The field name is stripped out, leaving only its contents.
785  * The caller is responsible for freeing the returned buffer.  If the requested
786  * field is not present, or anything else goes wrong, it returns NULL.
787  */
788 char *rfc822_fetch_field(char *rfc822, char *fieldname) {
789         char *fieldbuf = NULL;
790         char *end_of_headers;
791         char *field_start;
792         char *ptr;
793         char *cont;
794         char fieldhdr[SIZ];
795
796         /* Should never happen, but sometimes we get stupid */
797         if (rfc822 == NULL) return(NULL);
798         if (fieldname == NULL) return(NULL);
799
800         snprintf(fieldhdr, sizeof fieldhdr, "%s:", fieldname);
801
802         /* Locate the end of the headers, so we don't run past that point */
803         end_of_headers = bmstrcasestr(rfc822, "\n\r\n");
804         if (end_of_headers == NULL) {
805                 end_of_headers = bmstrcasestr(rfc822, "\n\n");
806         }
807         if (end_of_headers == NULL) return (NULL);
808
809         field_start = bmstrcasestr(rfc822, fieldhdr);
810         if (field_start == NULL) return(NULL);
811         if (field_start > end_of_headers) return(NULL);
812
813         fieldbuf = malloc(SIZ);
814         strcpy(fieldbuf, "");
815
816         ptr = field_start;
817         ptr = memreadline(ptr, fieldbuf, SIZ-strlen(fieldbuf) );
818         while ( (isspace(ptr[0])) && (ptr < end_of_headers) ) {
819                 strcat(fieldbuf, " ");
820                 cont = &fieldbuf[strlen(fieldbuf)];
821                 ptr = memreadline(ptr, cont, SIZ-strlen(fieldbuf) );
822                 striplt(cont);
823         }
824
825         strcpy(fieldbuf, &fieldbuf[strlen(fieldhdr)]);
826         striplt(fieldbuf);
827
828         return(fieldbuf);
829 }
830
831
832
833 /*****************************************************************************
834  *                      DIRECTORY MANAGEMENT FUNCTIONS                       *
835  *****************************************************************************/
836
837 /*
838  * Generate the index key for an Internet e-mail address to be looked up
839  * in the database.
840  */
841 void directory_key(char *key, char *addr) {
842         int i;
843         int keylen = 0;
844
845         for (i=0; !IsEmptyStr(&addr[i]); ++i) {
846                 if (!isspace(addr[i])) {
847                         key[keylen++] = tolower(addr[i]);
848                 }
849         }
850         key[keylen++] = 0;
851
852         CtdlLogPrintf(CTDL_DEBUG, "Directory key is <%s>\n", key);
853 }
854
855
856
857 /* Return nonzero if the supplied address is in a domain we keep in
858  * the directory
859  */
860 int IsDirectory(char *addr, int allow_masq_domains) {
861         char domain[256];
862         int h;
863
864         extract_token(domain, addr, 1, '@', sizeof domain);
865         striplt(domain);
866
867         h = CtdlHostAlias(domain);
868
869         if ( (h == hostalias_masq) && allow_masq_domains)
870                 return(1);
871         
872         if ( (h == hostalias_localhost) || (h == hostalias_directory) ) {
873                 return(1);
874         }
875         else {
876                 return(0);
877         }
878 }
879
880
881 /*
882  * Initialize the directory database (erasing anything already there)
883  */
884 void CtdlDirectoryInit(void) {
885         cdb_trunc(CDB_DIRECTORY);
886 }
887
888
889 /*
890  * Add an Internet e-mail address to the directory for a user
891  */
892 void CtdlDirectoryAddUser(char *internet_addr, char *citadel_addr) {
893         char key[SIZ];
894
895         CtdlLogPrintf(CTDL_DEBUG, "Dir: %s --> %s\n",
896                 internet_addr, citadel_addr);
897         if (IsDirectory(internet_addr, 0) == 0) return;
898
899         directory_key(key, internet_addr);
900
901         cdb_store(CDB_DIRECTORY, key, strlen(key),
902                 citadel_addr, strlen(citadel_addr)+1 );
903 }
904
905
906 /*
907  * Delete an Internet e-mail address from the directory.
908  *
909  * (NOTE: we don't actually use or need the citadel_addr variable; it's merely
910  * here because the callback API expects to be able to send it.)
911  */
912 void CtdlDirectoryDelUser(char *internet_addr, char *citadel_addr) {
913         char key[SIZ];
914
915         directory_key(key, internet_addr);
916         cdb_delete(CDB_DIRECTORY, key, strlen(key) );
917 }
918
919
920 /*
921  * Look up an Internet e-mail address in the directory.
922  * On success: returns 0, and Citadel address stored in 'target'
923  * On failure: returns nonzero
924  */
925 int CtdlDirectoryLookup(char *target, char *internet_addr, size_t targbuflen) {
926         struct cdbdata *cdbrec;
927         char key[SIZ];
928
929         /* Dump it in there unchanged, just for kicks */
930         safestrncpy(target, internet_addr, targbuflen);
931
932         /* Only do lookups for addresses with hostnames in them */
933         if (num_tokens(internet_addr, '@') != 2) return(-1);
934
935         /* Only do lookups for domains in the directory */
936         if (IsDirectory(internet_addr, 0) == 0) return(-1);
937
938         directory_key(key, internet_addr);
939         cdbrec = cdb_fetch(CDB_DIRECTORY, key, strlen(key) );
940         if (cdbrec != NULL) {
941                 safestrncpy(target, cdbrec->ptr, targbuflen);
942                 cdb_free(cdbrec);
943                 return(0);
944         }
945
946         return(-1);
947 }
948
949
950 /*
951  * Harvest any email addresses that someone might want to have in their
952  * "collected addresses" book.
953  */
954 char *harvest_collected_addresses(struct CtdlMessage *msg) {
955         char *coll = NULL;
956         char addr[256];
957         char user[256], node[256], name[256];
958         int is_harvestable;
959         int i, j, h;
960         int field = 0;
961
962         if (msg == NULL) return(NULL);
963
964         is_harvestable = 1;
965         strcpy(addr, "");       
966         if (msg->cm_fields['A'] != NULL) {
967                 strcat(addr, msg->cm_fields['A']);
968         }
969         if (msg->cm_fields['F'] != NULL) {
970                 strcat(addr, " <");
971                 strcat(addr, msg->cm_fields['F']);
972                 strcat(addr, ">");
973                 if (IsDirectory(msg->cm_fields['F'], 0)) {
974                         is_harvestable = 0;
975                 }
976         }
977
978         if (is_harvestable) {
979                 coll = strdup(addr);
980         }
981         else {
982                 coll = strdup("");
983         }
984
985         if (coll == NULL) return(NULL);
986
987         /* Scan both the R (To) and Y (CC) fields */
988         for (i = 0; i < 2; ++i) {
989                 if (i == 0) field = 'R' ;
990                 if (i == 1) field = 'Y' ;
991
992                 if (msg->cm_fields[field] != NULL) {
993                         for (j=0; j<num_tokens(msg->cm_fields[field], ','); ++j) {
994                                 extract_token(addr, msg->cm_fields[field], j, ',', sizeof addr);
995                                 if (strstr(addr, "=?") != NULL)
996                                         utf8ify_rfc822_string(addr);
997                                 process_rfc822_addr(addr, user, node, name);
998                                 h = CtdlHostAlias(node);
999                                 if ( (h != hostalias_localhost) && (h != hostalias_directory) ) {
1000                                         coll = realloc(coll, strlen(coll) + strlen(addr) + 4);
1001                                         if (coll == NULL) return(NULL);
1002                                         if (!IsEmptyStr(coll)) {
1003                                                 strcat(coll, ",");
1004                                         }
1005                                         striplt(addr);
1006                                         strcat(coll, addr);
1007                                 }
1008                         }
1009                 }
1010         }
1011
1012         if (IsEmptyStr(coll)) {
1013                 free(coll);
1014                 return(NULL);
1015         }
1016         return(coll);
1017 }