Well, it doesn't crash anymore, but it also doesn't work at all. Is that an improvement?
[citadel.git] / citadel / internet_addressing.c
1 /*
2  * This file contains functions which handle the mapping of Internet addresses
3  * to users on the Citadel system.
4  *
5  * Copyright (c) 1987-2021 by the citadel.org team
6  *
7  * This program is open source software; you can redistribute it and/or modify
8  * it under the terms of the GNU General Public License version 3.
9  *
10  * This program is distributed in the hope that it will be useful,
11  * but WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13  * GNU General Public License for more details.
14  */
15
16 #include "sysdep.h"
17 #include <stdlib.h>
18 #include <unistd.h>
19 #include <stdio.h>
20 #include <fcntl.h>
21 #include <ctype.h>
22 #include <signal.h>
23 #include <pwd.h>
24 #include <errno.h>
25 #include <sys/types.h>
26 #include <time.h>
27 #include <sys/wait.h>
28 #include <string.h>
29 #include <limits.h>
30 #include <libcitadel.h>
31 #include "citadel.h"
32 #include "server.h"
33 #include "sysdep_decls.h"
34 #include "citserver.h"
35 #include "support.h"
36 #include "config.h"
37 #include "msgbase.h"
38 #include "internet_addressing.h"
39 #include "user_ops.h"
40 #include "room_ops.h"
41 #include "parsedate.h"
42 #include "database.h"
43 #include "ctdl_module.h"
44 #ifdef HAVE_ICONV
45 #include <iconv.h>
46
47 /* This is the non-define version in case it is needed for debugging */
48 #if 0
49 inline void FindNextEnd (char *bptr, char *end)
50 {
51         /* Find the next ?Q? */
52         end = strchr(bptr + 2, '?');
53         if (end == NULL) return NULL;
54         if (((*(end + 1) == 'B') || (*(end + 1) == 'Q')) && 
55             (*(end + 2) == '?')) {
56                 /* skip on to the end of the cluster, the next ?= */
57                 end = strstr(end + 3, "?=");
58         }
59         else
60                 /* sort of half valid encoding, try to find an end. */
61                 end = strstr(bptr, "?=");
62 }
63 #endif
64
65 #define FindNextEnd(bptr, end) { \
66         end = strchr(bptr + 2, '?'); \
67         if (end != NULL) { \
68                 if (((*(end + 1) == 'B') || (*(end + 1) == 'Q')) && (*(end + 2) == '?')) { \
69                         end = strstr(end + 3, "?="); \
70                 } else end = strstr(bptr, "?="); \
71         } \
72 }
73
74 /*
75  * Handle subjects with RFC2047 encoding such as:
76  * =?koi8-r?B?78bP0s3Mxc7JxSDXz9rE1dvO2c3JINvB0sHNySDP?=
77  */
78 void utf8ify_rfc822_string(char *buf) {
79         char *start, *end, *next, *nextend, *ptr;
80         char newbuf[1024];
81         char charset[128];
82         char encoding[16];
83         char istr[1024];
84         iconv_t ic = (iconv_t)(-1) ;
85         char *ibuf;                     // Buffer of characters to be converted
86         char *obuf;                     // Buffer for converted characters
87         size_t ibuflen;                 // Length of input buffer
88         size_t obuflen;                 // Length of output buffer
89         char *isav;                     // Saved pointer to input buffer
90         char *osav;                     // Saved pointer to output buffer
91         int passes = 0;
92         int i, len, delta;
93         int illegal_non_rfc2047_encoding = 0;
94
95         /* Sometimes, badly formed messages contain strings which were simply
96          * written out directly in some foreign character set instead of
97          * using RFC2047 encoding.  This is illegal but we will attempt to
98          * handle it anyway by converting from a user-specified default
99          * charset to UTF-8 if we see any nonprintable characters.
100          */
101         len = strlen(buf);
102         for (i=0; i<len; ++i) {
103                 if ((buf[i] < 32) || (buf[i] > 126)) {
104                         illegal_non_rfc2047_encoding = 1;
105                         i = len;        // take a shortcut, it won't be more than one.
106                 }
107         }
108         if (illegal_non_rfc2047_encoding) {
109                 const char *default_header_charset = "iso-8859-1";
110                 if ( (strcasecmp(default_header_charset, "UTF-8")) && (strcasecmp(default_header_charset, "us-ascii")) ) {
111                         ctdl_iconv_open("UTF-8", default_header_charset, &ic);
112                         if (ic != (iconv_t)(-1) ) {
113                                 ibuf = malloc(1024);
114                                 isav = ibuf;
115                                 safestrncpy(ibuf, buf, 1024);
116                                 ibuflen = strlen(ibuf);
117                                 obuflen = 1024;
118                                 obuf = (char *) malloc(obuflen);
119                                 osav = obuf;
120                                 iconv(ic, &ibuf, &ibuflen, &obuf, &obuflen);
121                                 osav[1024-obuflen] = 0;
122                                 strcpy(buf, osav);
123                                 free(osav);
124                                 iconv_close(ic);
125                                 free(isav);
126                         }
127                 }
128         }
129
130         /* pre evaluate the first pair */
131         nextend = end = NULL;
132         len = strlen(buf);
133         start = strstr(buf, "=?");
134         if (start != NULL) 
135                 FindNextEnd (start, end);
136
137         while ((start != NULL) && (end != NULL)) {
138                 next = strstr(end, "=?");
139                 if (next != NULL)
140                         FindNextEnd(next, nextend);
141                 if (nextend == NULL)
142                         next = NULL;
143
144                 /* did we find two partitions */
145                 if ((next != NULL) && ((next - end) > 2)) {
146                         ptr = end + 2;
147                         while ((ptr < next) && 
148                                (isspace(*ptr) ||
149                                 (*ptr == '\r') ||
150                                 (*ptr == '\n') || 
151                                 (*ptr == '\t')))
152                                 ptr ++;
153                         /* did we find a gab just filled with blanks? */
154                         if (ptr == next)
155                         {
156                                 memmove (end + 2,
157                                          next,
158                                          len - (next - start));
159
160                                 /* now terminate the gab at the end */
161                                 delta = (next - end) - 2;
162                                 len -= delta;
163                                 buf[len] = '\0';
164
165                                 /* move next to its new location. */
166                                 next -= delta;
167                                 nextend -= delta;
168                         }
169                 }
170                 /* our next-pair is our new first pair now. */
171                 start = next;
172                 end = nextend;
173         }
174
175         // Now we handle foreign character sets properly encoded in RFC2047 format.
176         start = strstr(buf, "=?");
177         FindNextEnd((start != NULL)? start : buf, end);
178         while (start != NULL && end != NULL && end > start) {
179                 extract_token(charset, start, 1, '?', sizeof charset);
180                 extract_token(encoding, start, 2, '?', sizeof encoding);
181                 extract_token(istr, start, 3, '?', sizeof istr);
182
183                 ibuf = malloc(1024);
184                 isav = ibuf;
185                 if (!strcasecmp(encoding, "B")) {       // base64
186                         ibuflen = CtdlDecodeBase64(ibuf, istr, strlen(istr));
187                 }
188                 else if (!strcasecmp(encoding, "Q")) {  // quoted-printable
189                         size_t len;
190                         unsigned long pos;
191                         
192                         len = strlen(istr);
193                         pos = 0;
194                         while (pos < len) {
195                                 if (istr[pos] == '_') istr[pos] = ' ';
196                                 pos++;
197                         }
198                         ibuflen = CtdlDecodeQuotedPrintable(ibuf, istr, len);
199                 }
200                 else {
201                         strcpy(ibuf, istr);             // unknown encoding
202                         ibuflen = strlen(istr);
203                 }
204
205                 ctdl_iconv_open("UTF-8", charset, &ic);
206                 if (ic != (iconv_t)(-1) ) {
207                         obuflen = 1024;
208                         obuf = (char *) malloc(obuflen);
209                         osav = obuf;
210                         iconv(ic, &ibuf, &ibuflen, &obuf, &obuflen);
211                         osav[1024-obuflen] = 0;
212
213                         end = start;
214                         end++;
215                         strcpy(start, "");
216                         remove_token(end, 0, '?');
217                         remove_token(end, 0, '?');
218                         remove_token(end, 0, '?');
219                         remove_token(end, 0, '?');
220                         strcpy(end, &end[1]);
221
222                         snprintf(newbuf, sizeof newbuf, "%s%s%s", buf, osav, end);
223                         strcpy(buf, newbuf);
224                         free(osav);
225                         iconv_close(ic);
226                 }
227                 else {
228                         end = start;
229                         end++;
230                         strcpy(start, "");
231                         remove_token(end, 0, '?');
232                         remove_token(end, 0, '?');
233                         remove_token(end, 0, '?');
234                         remove_token(end, 0, '?');
235                         strcpy(end, &end[1]);
236
237                         snprintf(newbuf, sizeof newbuf, "%s(unreadable)%s", buf, end);
238                         strcpy(buf, newbuf);
239                 }
240
241                 free(isav);
242
243                 /*
244                  * Since spammers will go to all sorts of absurd lengths to get their
245                  * messages through, there are LOTS of corrupt headers out there.
246                  * So, prevent a really badly formed RFC2047 header from throwing
247                  * this function into an infinite loop.
248                  */
249                 ++passes;
250                 if (passes > 20) return;
251
252                 start = strstr(buf, "=?");
253                 FindNextEnd((start != NULL)? start : buf, end);
254         }
255
256 }
257 #else
258 inline void utf8ify_rfc822_string(char *a){};
259
260 #endif
261
262
263 char *inetcfg = NULL;
264
265 /*
266  * Return nonzero if the supplied name is an alias for this host.
267  */
268 int CtdlHostAlias(char *fqdn) {
269         int config_lines;
270         int i;
271         char buf[256];
272         char host[256], type[256];
273         int found = 0;
274
275         if (fqdn == NULL)                                       return(hostalias_nomatch);
276         if (IsEmptyStr(fqdn))                                   return(hostalias_nomatch);
277         if (!strcasecmp(fqdn, "localhost"))                     return(hostalias_localhost);
278         if (!strcasecmp(fqdn, CtdlGetConfigStr("c_fqdn")))      return(hostalias_localhost);
279         if (!strcasecmp(fqdn, CtdlGetConfigStr("c_nodename")))  return(hostalias_localhost);
280         if (inetcfg == NULL)                                    return(hostalias_nomatch);
281
282         config_lines = num_tokens(inetcfg, '\n');
283         for (i=0; i<config_lines; ++i) {
284                 extract_token(buf, inetcfg, i, '\n', sizeof buf);
285                 extract_token(host, buf, 0, '|', sizeof host);
286                 extract_token(type, buf, 1, '|', sizeof type);
287
288                 found = 0;
289
290                 /* Process these in a specific order, in case there are multiple matches.
291                  * We want localhost to override masq, for example.
292                  */
293
294                 if ( (!strcasecmp(type, "masqdomain")) && (!strcasecmp(fqdn, host))) {
295                         found = hostalias_masq;
296                 }
297
298                 if ( (!strcasecmp(type, "localhost")) && (!strcasecmp(fqdn, host))) {
299                         found = hostalias_localhost;
300                 }
301
302                 // "directory" used to be a distributed version of "localhost" but they're both the same now
303                 if ( (!strcasecmp(type, "directory")) && (!strcasecmp(fqdn, host))) {
304                         found = hostalias_localhost;
305                 }
306
307                 if (found) return(found);
308         }
309         return(hostalias_nomatch);
310 }
311
312
313 /*
314  * Determine whether a given Internet address belongs to the current user
315  */
316 int CtdlIsMe(char *addr, int addr_buf_len) {
317         struct recptypes *recp;
318         int i;
319
320         recp = validate_recipients(addr, NULL, 0);
321         if (recp == NULL) return(0);
322
323         if (recp->num_local == 0) {
324                 free_recipients(recp);
325                 return(0);
326         }
327
328         for (i=0; i<recp->num_local; ++i) {
329                 extract_token(addr, recp->recp_local, i, '|', addr_buf_len);
330                 if (!strcasecmp(addr, CC->user.fullname)) {
331                         free_recipients(recp);
332                         return(1);
333                 }
334         }
335
336         free_recipients(recp);
337         return(0);
338 }
339
340
341 /* If the last item in a list of recipients was truncated to a partial address,
342  * remove it completely in order to avoid choking library functions.
343  */
344 void sanitize_truncated_recipient(char *str)
345 {
346         if (!str) return;
347         if (num_tokens(str, ',') < 2) return;
348
349         int len = strlen(str);
350         if (len < 900) return;
351         if (len > 998) str[998] = 0;
352
353         char *cptr = strrchr(str, ',');
354         if (!cptr) return;
355
356         char *lptr = strchr(cptr, '<');
357         char *rptr = strchr(cptr, '>');
358
359         if ( (lptr) && (rptr) && (rptr > lptr) ) return;
360
361         *cptr = 0;
362 }
363
364
365 /*
366  * This function is self explanatory.
367  * (What can I say, I'm in a weird mood today...)
368  */
369 void remove_any_whitespace_to_the_left_or_right_of_at_symbol(char *name) {
370         char *ptr;
371         if (!name) return;
372
373         for (ptr=name; *ptr; ++ptr) {
374                 while ( (isspace(*ptr)) && (*(ptr+1)=='@') ) {
375                         strcpy(ptr, ptr+1);
376                         if (ptr > name) --ptr;
377                 }
378                 while ( (*ptr=='@') && (*(ptr+1)!=0) && (isspace(*(ptr+1))) ) {
379                         strcpy(ptr+1, ptr+2);
380                 }
381         }
382 }
383
384
385 // values that can be returned by expand_aliases()
386 enum {
387         EA_ERROR,               // Can't send message due to bad address
388         EA_MULTIPLE,            // Alias expanded into multiple recipients -- run me again!
389         EA_LOCAL,               // Local message, do no network processing
390         EA_INTERNET             // Convert msg and send as Internet mail
391 };
392
393
394 // Process alias and routing info for email addresses
395 int expand_aliases(char *name, char *aliases) {
396         int a;
397         char aaa[SIZ];
398         int at = 0;
399         char node[64];
400
401         syslog(LOG_DEBUG, "internet_addressing: \x1b[34mexpand_aliases(%s)\x1b[0m", name);
402         if (aliases) {
403                 int num_aliases = num_tokens(aliases, '\n');
404                 for (a=0; a<num_aliases; ++a) {
405                         extract_token(aaa, aliases, a, '\n', sizeof aaa);
406                         char *bar = strchr(aaa, '|');
407                         if (bar) {
408                                 bar[0] = 0;
409                                 ++bar;
410                                 striplt(aaa);
411                                 striplt(bar);
412                                 syslog(LOG_DEBUG, "\x1b[32malias #%d: compare <%s> to <%s>\x1b[0m", a, name, aaa);
413                                 if (!strcasecmp(name, aaa)) {
414                                         syslog(LOG_DEBUG, "internet_addressing: global alias <%s> to <%s>", name, bar);
415                                         strcpy(name, bar);
416                                 }
417                         }
418                 }
419                 if (strchr(name, ',')) {
420                         return(EA_MULTIPLE);
421                 }
422         }
423
424         char original_name[256];                                // Now go for the regular aliases
425         safestrncpy(original_name, name, sizeof original_name);
426
427         // should these checks still be here, or maybe move them to split_recps() ?
428         striplt(name);
429         remove_any_whitespace_to_the_left_or_right_of_at_symbol(name);
430         stripallbut(name, '<', '>');
431
432         /* Hit the email address directory */
433         if (CtdlDirectoryLookup(aaa, name, sizeof aaa) == 0) {
434                 strcpy(name, aaa);
435         }
436
437         if (strcasecmp(original_name, name)) {
438                 syslog(LOG_INFO, "internet_addressing: directory alias <%s> to <%s>", original_name, name);
439         }
440
441         /* Change "user @ xxx" to "user" if xxx is an alias for this host */
442         for (a=0; name[a] != '\0'; ++a) {
443                 if (name[a] == '@') {
444                         if (CtdlHostAlias(&name[a+1]) == hostalias_localhost) {
445                                 name[a] = 0;
446                                 syslog(LOG_DEBUG, "internet_addressing: host is local, recipient is <%s>", name);
447                                 break;
448                         }
449                 }
450         }
451
452         /* determine local or remote type, see citadel.h */
453         at = haschar(name, '@');
454         if (at == 0) return(EA_LOCAL);          /* no @'s - local address */
455         if (at > 1) return(EA_ERROR);           /* >1 @'s - invalid address */
456         remove_any_whitespace_to_the_left_or_right_of_at_symbol(name);
457
458         /* figure out the delivery mode */
459         extract_token(node, name, 1, '@', sizeof node);
460
461         /* If there are one or more dots in the nodename, we assume that it
462          * is an FQDN and will attempt SMTP delivery to the Internet.
463          */
464         if (haschar(node, '.') > 0) {
465                 return(EA_INTERNET);
466         }
467
468         /* If we get to this point it's an invalid node name */
469         return (EA_ERROR);
470 }
471
472
473 // Return a supplied list of email addresses as an array, removing superfluous information and syntax.
474 Array *split_recps(char *addresses) {
475
476         // Copy the supplied address list into our own memory space, because we are going to mangle it.
477         char *a = malloc(strlen(addresses));
478         if (a == NULL) {
479                 syslog(LOG_ERR, "internet_addressing: malloc() failed: %m");
480                 return(NULL);
481         }
482
483         // Strip out anything in double quotes
484         a[0] = 0;
485         int toggle = 0;
486         int pos = 0;
487         char *t;
488         for (t=addresses; t[0]; ++t) {
489                 if (t[0] == '\"') {
490                         toggle = 1 - toggle;
491                 }
492                 else if (!toggle) {
493                         a[pos++] = t[0];
494                         a[pos] = 0;
495                 }
496         }
497
498         // Transform all qualifying delimiters to commas
499         for (t=a; t[0]; ++t) {
500                 if ((t[0]==';') || (t[0]=='|')) {
501                         t[0]=',';
502                 }
503         }
504
505         // Tokenize the recipients into an array
506         Array *recipients_array = array_new(256);               // no single recipient should be bigger than 256 bytes
507
508         int num_addresses = num_tokens(a, ',');
509         syslog(LOG_DEBUG, "\x1b[35mEXTRACING: %d addresses from <%s>\x1b[0m", num_addresses, a);
510         for (int i=0; i<num_addresses; ++i) {
511                 char this_address[256];
512                 extract_token(this_address, a, i, ',', sizeof this_address);
513                 syslog(LOG_DEBUG, "\x1b[35mEXTRACTED: <%s>\x1b[0m", this_address);
514                 striplt(this_address);                          // strip leading and trailing whitespace
515                 stripout(this_address, '(', ')');               // remove any portion in parentheses
516                 stripallbut(this_address, '<', '>');            // if angle brackets are present, keep only what is inside them
517                 syslog(LOG_DEBUG, "\x1b[35mPROCESSED: <%s>\x1b[0m", this_address);
518                 array_append(recipients_array, this_address);
519         }
520
521         free(a);                                                // We don't need this buffer anymore.
522         return(recipients_array);                               // Return the completed array to the caller.
523 }
524
525
526 // Validate recipients, count delivery types and errors, and handle aliasing
527 // FIXME check for dupes!!!!!
528 //
529 // Returns 0 if all addresses are ok, ret->num_error = -1 if no addresses 
530 // were specified, or the number of addresses found invalid.
531 //
532 // Caller needs to free the result using free_recipients()
533 //
534 struct recptypes *validate_recipients(char *supplied_recipients, const char *RemoteIdentifier, int Flags) {
535         struct recptypes *ret;
536         char *recipients = NULL;
537         char append[SIZ];
538         long len;
539         int mailtype;
540         int invalid;
541         struct ctdluser tempUS;
542         struct ctdlroom original_room;
543         int err = 0;
544         char errmsg[SIZ];
545         char *org_recp;
546         char this_recp[256];
547
548         syslog(LOG_DEBUG, "internet_addressing: \x1b[32mvalidate_recipients(%s) \x1b[0m", supplied_recipients);
549
550         ret = (struct recptypes *) malloc(sizeof(struct recptypes));                    // Initialize
551         if (ret == NULL) return(NULL);
552         memset(ret, 0, sizeof(struct recptypes));                                       // set all values to null/zero
553
554         if (supplied_recipients == NULL) {
555                 recipients = strdup("");
556         }
557         else {
558                 recipients = strdup(supplied_recipients);
559         }
560
561         len = strlen(recipients) + 1024;                                                // allocate memory
562         ret->errormsg = malloc(len);
563         ret->recp_local = malloc(len);
564         ret->recp_internet = malloc(len);
565         ret->recp_room = malloc(len);
566         ret->display_recp = malloc(len);
567         ret->recp_orgroom = malloc(len);
568
569         ret->errormsg[0] = 0;
570         ret->recp_local[0] = 0;
571         ret->recp_internet[0] = 0;
572         ret->recp_room[0] = 0;
573         ret->recp_orgroom[0] = 0;
574         ret->display_recp[0] = 0;
575         ret->recptypes_magic = RECPTYPES_MAGIC;
576
577         //char *aliases = CtdlGetSysConfig(GLOBAL_ALIASES);     // First hit the Global Alias Table
578         char *aliases = strdup("root|admin,ajc@citadel.org,artcancro@gmail.com\n abuse|admin\n ajc|ajc@citadel.org\n");
579
580         Array *recp_array = split_recps(supplied_recipients);
581         int original_array_len = array_len(recp_array);
582         syslog(LOG_DEBUG, "\x1b[32moriginal_array_len=%d\x1b[0m", original_array_len);
583         for (int r=0; r<array_len(recp_array); ++r) {
584                 syslog(LOG_DEBUG, "\x1b[32m\x1b[7mrecipient #%d is %s \x1b[0m", r, (char *)array_get_element_at(recp_array, r) );
585                 org_recp = (char *)array_get_element_at(recp_array, r);
586                 strncpy(this_recp, org_recp, sizeof this_recp);
587                 mailtype = expand_aliases(this_recp, aliases);
588
589                 // If an alias expanded to multiple recipients, strip off those recipients and append them
590                 // to the end of the array.  This loop will hit those again when it gets there.
591                 // Note that we don't do this after we get past the *original* array length, to avoid aliasing loops.
592                 if (mailtype == EA_MULTIPLE) {
593                         if (r < original_array_len) {
594                                 char *comma;
595                                 while ((comma = strrchr(this_recp, ','))) {
596                                         comma[0] = 0;
597                                         array_append(recp_array, &comma[1]);
598                                         strcpy(org_recp, this_recp);
599                                 }
600                         }
601                         else {
602                                 mailtype = EA_ERROR;
603                         }
604                 }
605
606                 mailtype = expand_aliases(this_recp, aliases);          // do it ONCE again to handle alias expansions
607                 if (mailtype == EA_MULTIPLE) {
608                         mailtype = EA_ERROR;                    // and fail if it wants to expand a second time
609                 }
610
611                 invalid = 0;
612                 errmsg[0] = 0;
613                 switch(mailtype) {
614                 case EA_LOCAL:                                  // There are several types of "local" recipients.
615
616                         // Old BBS conventions require mail to "sysop" to go somewhere.  Send it to the admin room.
617                         if (!strcasecmp(this_recp, "sysop")) {
618                                 ++ret->num_room;
619                                 strcpy(this_recp, CtdlGetConfigStr("c_aideroom"));
620                                 if (!IsEmptyStr(ret->recp_room)) {
621                                         strcat(ret->recp_room, "|");
622                                 }
623                                 strcat(ret->recp_room, this_recp);
624                         }
625
626                         // This handles rooms which can receive posts via email.
627                         else if (!strncasecmp(this_recp, "room_", 5)) {
628                                 original_room = CC->room;                               // Remember where we parked
629
630                                 char mail_to_room[ROOMNAMELEN];
631                                 char *m;
632                                 strncpy(mail_to_room, &this_recp[5], sizeof mail_to_room);
633                                 for (m = mail_to_room; *m; ++m) {
634                                         if (m[0] == '_') m[0]=' ';
635                                 }
636                                 if (!CtdlGetRoom(&CC->room, mail_to_room)) {            // Find the room they asked for
637
638                                         err = CtdlDoIHavePermissionToPostInThisRoom(    // check for write permissions to room
639                                                 errmsg, 
640                                                 sizeof errmsg, 
641                                                 RemoteIdentifier,
642                                                 Flags,
643                                                 0                                       // 0 means "this is not a reply"
644                                         );
645                                         if (err) {
646                                                 ++ret->num_error;
647                                                 invalid = 1;
648                                         } 
649                                         else {
650                                                 ++ret->num_room;
651                                                 if (!IsEmptyStr(ret->recp_room)) {
652                                                         strcat(ret->recp_room, "|");
653                                                 }
654                                                 strcat(ret->recp_room, &this_recp[5]);
655         
656                                                 if (!IsEmptyStr(ret->recp_orgroom)) {
657                                                         strcat(ret->recp_orgroom, "|");
658                                                 }
659                                                 strcat(ret->recp_orgroom, org_recp);
660         
661                                         }
662                                 }
663                                 else {                                                  // no such room exists
664                                         ++ret->num_error;
665                                         invalid = 1;
666                                 }
667                                                 
668                                 // Restore this session's original room location.
669                                 CC->room = original_room;
670
671                         }
672
673                         // This handles the most common case, which is mail to a user's inbox.
674                         else if (CtdlGetUser(&tempUS, this_recp) == 0) {
675                                 ++ret->num_local;
676                                 strcpy(this_recp, tempUS.fullname);
677                                 if (!IsEmptyStr(ret->recp_local)) {
678                                         strcat(ret->recp_local, "|");
679                                 }
680                                 strcat(ret->recp_local, this_recp);
681                         }
682
683                         // No match for this recipient
684                         else {
685                                 ++ret->num_error;
686                                 invalid = 1;
687                         }
688                         break;
689                 case EA_INTERNET:
690                         // Yes, you're reading this correctly: if the target domain points back to the local system,
691                         // the address is invalid.  That's because if the address were valid, we would have
692                         // already translated it to a local address by now.
693                         if (IsDirectory(this_recp, 0)) {
694                                 ++ret->num_error;
695                                 invalid = 1;
696                         }
697                         else {
698                                 ++ret->num_internet;
699                                 if (!IsEmptyStr(ret->recp_internet)) {
700                                         strcat(ret->recp_internet, "|");
701                                 }
702                                 strcat(ret->recp_internet, this_recp);
703                         }
704                         break;
705                 case EA_ERROR:
706                         ++ret->num_error;
707                         invalid = 1;
708                         break;
709                 }
710                 if (invalid) {
711                         if (IsEmptyStr(errmsg)) {
712                                 snprintf(append, sizeof append, "Invalid recipient: %s", this_recp);
713                         }
714                         else {
715                                 snprintf(append, sizeof append, "%s", errmsg);
716                         }
717                         if ( (strlen(ret->errormsg) + strlen(append) + 3) < SIZ) {
718                                 if (!IsEmptyStr(ret->errormsg)) {
719                                         strcat(ret->errormsg, "; ");
720                                 }
721                                 strcat(ret->errormsg, append);
722                         }
723                 }
724                 else {
725                         if (IsEmptyStr(ret->display_recp)) {
726                                 strcpy(append, this_recp);
727                         }
728                         else {
729                                 snprintf(append, sizeof append, ", %s", this_recp);
730                         }
731                         if ( (strlen(ret->display_recp)+strlen(append)) < SIZ) {
732                                 strcat(ret->display_recp, append);
733                         }
734                 }
735         }
736
737         if (aliases != NULL) {          // ok, we're done with the global alias list now
738                 free(aliases);
739         }
740
741         if ( (ret->num_local + ret->num_internet + ret->num_room + ret->num_error) == 0) {
742                 ret->num_error = (-1);
743                 strcpy(ret->errormsg, "No recipients specified.");
744         }
745
746         syslog(LOG_DEBUG, "internet_addressing: validate_recipients() = %d local, %d room, %d SMTP, %d error",
747                 ret->num_local, ret->num_room, ret->num_internet, ret->num_error
748         );
749
750         free(recipients);
751         array_free(recp_array);
752
753         return(ret);
754 }
755
756
757 /*
758  * Destructor for recptypes
759  */
760 void free_recipients(struct recptypes *valid) {
761
762         if (valid == NULL) {
763                 return;
764         }
765
766         if (valid->recptypes_magic != RECPTYPES_MAGIC) {
767                 syslog(LOG_ERR, "internet_addressing: attempt to call free_recipients() on some other data type!");
768                 abort();
769         }
770
771         if (valid->errormsg != NULL)            free(valid->errormsg);
772         if (valid->recp_local != NULL)          free(valid->recp_local);
773         if (valid->recp_internet != NULL)       free(valid->recp_internet);
774         if (valid->recp_room != NULL)           free(valid->recp_room);
775         if (valid->recp_orgroom != NULL)        free(valid->recp_orgroom);
776         if (valid->display_recp != NULL)        free(valid->display_recp);
777         if (valid->bounce_to != NULL)           free(valid->bounce_to);
778         if (valid->envelope_from != NULL)       free(valid->envelope_from);
779         if (valid->sending_room != NULL)        free(valid->sending_room);
780         free(valid);
781 }
782
783
784 char *qp_encode_email_addrs(char *source) {
785         char *user, *node, *name;
786         const char headerStr[] = "=?UTF-8?Q?";
787         char *Encoded;
788         char *EncodedName;
789         char *nPtr;
790         int need_to_encode = 0;
791         long SourceLen;
792         long EncodedMaxLen;
793         long nColons = 0;
794         long *AddrPtr;
795         long *AddrUtf8;
796         long nAddrPtrMax = 50;
797         long nmax;
798         int InQuotes = 0;
799         int i, n;
800
801         if (source == NULL) return source;
802         if (IsEmptyStr(source)) return source;
803         syslog(LOG_DEBUG, "internet_addressing: qp_encode_email_addrs <%s>", source);
804
805         AddrPtr = malloc (sizeof (long) * nAddrPtrMax);
806         AddrUtf8 = malloc (sizeof (long) * nAddrPtrMax);
807         memset(AddrUtf8, 0, sizeof (long) * nAddrPtrMax);
808         *AddrPtr = 0;
809         i = 0;
810         while (!IsEmptyStr (&source[i])) {
811                 if (nColons >= nAddrPtrMax){
812                         long *ptr;
813
814                         ptr = (long *) malloc(sizeof (long) * nAddrPtrMax * 2);
815                         memcpy (ptr, AddrPtr, sizeof (long) * nAddrPtrMax);
816                         free (AddrPtr), AddrPtr = ptr;
817
818                         ptr = (long *) malloc(sizeof (long) * nAddrPtrMax * 2);
819                         memset(&ptr[nAddrPtrMax], 0, sizeof (long) * nAddrPtrMax);
820
821                         memcpy (ptr, AddrUtf8, sizeof (long) * nAddrPtrMax);
822                         free (AddrUtf8), AddrUtf8 = ptr;
823                         nAddrPtrMax *= 2;                               
824                 }
825                 if (((unsigned char) source[i] < 32) || ((unsigned char) source[i] > 126)) {
826                         need_to_encode = 1;
827                         AddrUtf8[nColons] = 1;
828                 }
829                 if (source[i] == '"') {
830                         InQuotes = !InQuotes;
831                 }
832                 if (!InQuotes && source[i] == ',') {
833                         AddrPtr[nColons] = i;
834                         nColons++;
835                 }
836                 i++;
837         }
838         if (need_to_encode == 0) {
839                 free(AddrPtr);
840                 free(AddrUtf8);
841                 return source;
842         }
843
844         SourceLen = i;
845         EncodedMaxLen = nColons * (sizeof(headerStr) + 3) + SourceLen * 3;
846         Encoded = (char*) malloc (EncodedMaxLen);
847
848         for (i = 0; i < nColons; i++) {
849                 source[AddrPtr[i]++] = '\0';
850         }
851         /* TODO: if libidn, this might get larger*/
852         user = malloc(SourceLen + 1);
853         node = malloc(SourceLen + 1);
854         name = malloc(SourceLen + 1);
855
856         nPtr = Encoded;
857         *nPtr = '\0';
858         for (i = 0; i < nColons && nPtr != NULL; i++) {
859                 nmax = EncodedMaxLen - (nPtr - Encoded);
860                 if (AddrUtf8[i]) {
861                         process_rfc822_addr(&source[AddrPtr[i]], user, node, name);
862                         /* TODO: libIDN here ! */
863                         if (IsEmptyStr(name)) {
864                                 n = snprintf(nPtr, nmax, (i==0)?"%s@%s" : ",%s@%s", user, node);
865                         }
866                         else {
867                                 EncodedName = rfc2047encode(name, strlen(name));                        
868                                 n = snprintf(nPtr, nmax, (i==0)?"%s <%s@%s>" : ",%s <%s@%s>", EncodedName, user, node);
869                                 free(EncodedName);
870                         }
871                 }
872                 else { 
873                         n = snprintf(nPtr, nmax, (i==0)?"%s" : ",%s", &source[AddrPtr[i]]);
874                 }
875                 if (n > 0 )
876                         nPtr += n;
877                 else { 
878                         char *ptr, *nnPtr;
879                         ptr = (char*) malloc(EncodedMaxLen * 2);
880                         memcpy(ptr, Encoded, EncodedMaxLen);
881                         nnPtr = ptr + (nPtr - Encoded), nPtr = nnPtr;
882                         free(Encoded), Encoded = ptr;
883                         EncodedMaxLen *= 2;
884                         i--; /* do it once more with properly lengthened buffer */
885                 }
886         }
887         for (i = 0; i < nColons; i++)
888                 source[--AddrPtr[i]] = ',';
889
890         free(user);
891         free(node);
892         free(name);
893         free(AddrUtf8);
894         free(AddrPtr);
895         return Encoded;
896 }
897
898
899 /*
900  * Unfold a multi-line field into a single line, removing multi-whitespaces
901  */
902 void unfold_rfc822_field(char **field, char **FieldEnd) 
903 {
904         int quote = 0;
905         char *pField = *field;
906         char *sField;
907         char *pFieldEnd = *FieldEnd;
908
909         while (isspace(*pField))
910                 pField++;
911         /* remove leading/trailing whitespace */
912         ;
913
914         while (isspace(*pFieldEnd))
915                 pFieldEnd --;
916
917         *FieldEnd = pFieldEnd;
918         /* convert non-space whitespace to spaces, and remove double blanks */
919         for (sField = *field = pField; 
920              sField < pFieldEnd; 
921              pField++, sField++)
922         {
923                 if ((*sField=='\r') || (*sField=='\n'))
924                 {
925                         int offset = 1;
926                         while ( ( (*(sField + offset) == '\r') || (*(sField + offset) == '\n' )) && (sField + offset < pFieldEnd) ) {
927                                 offset ++;
928                         }
929                         sField += offset;
930                         *pField = *sField;
931                 }
932                 else {
933                         if (*sField=='\"') quote = 1 - quote;
934                         if (!quote) {
935                                 if (isspace(*sField)) {
936                                         *pField = ' ';
937                                         pField++;
938                                         sField++;
939                                         
940                                         while ((sField < pFieldEnd) && 
941                                                isspace(*sField))
942                                                 sField++;
943                                         *pField = *sField;
944                                 }
945                                 else *pField = *sField;
946                         }
947                         else *pField = *sField;
948                 }
949         }
950         *pField = '\0';
951         *FieldEnd = pField - 1;
952 }
953
954
955 /*
956  * Split an RFC822-style address into userid, host, and full name
957  *
958  */
959 void process_rfc822_addr(const char *rfc822, char *user, char *node, char *name) {
960         int a;
961
962         strcpy(user, "");
963         strcpy(node, CtdlGetConfigStr("c_fqdn"));
964         strcpy(name, "");
965
966         if (rfc822 == NULL) return;
967
968         /* extract full name - first, it's From minus <userid> */
969         strcpy(name, rfc822);
970         stripout(name, '<', '>');
971
972         /* strip anything to the left of a bang */
973         while ((!IsEmptyStr(name)) && (haschar(name, '!') > 0))
974                 strcpy(name, &name[1]);
975
976         /* and anything to the right of a @ or % */
977         for (a = 0; name[a] != '\0'; ++a) {
978                 if (name[a] == '@') {
979                         name[a] = 0;
980                         break;
981                 }
982                 if (name[a] == '%') {
983                         name[a] = 0;
984                         break;
985                 }
986         }
987
988         /* but if there are parentheses, that changes the rules... */
989         if ((haschar(rfc822, '(') == 1) && (haschar(rfc822, ')') == 1)) {
990                 strcpy(name, rfc822);
991                 stripallbut(name, '(', ')');
992         }
993
994         /* but if there are a set of quotes, that supersedes everything */
995         if (haschar(rfc822, 34) == 2) {
996                 strcpy(name, rfc822);
997                 while ((!IsEmptyStr(name)) && (name[0] != 34)) {
998                         strcpy(&name[0], &name[1]);
999                 }
1000                 strcpy(&name[0], &name[1]);
1001                 for (a = 0; name[a] != '\0'; ++a)
1002                         if (name[a] == 34) {
1003                                 name[a] = 0;
1004                                 break;
1005                         }
1006         }
1007         /* extract user id */
1008         strcpy(user, rfc822);
1009
1010         /* first get rid of anything in parens */
1011         stripout(user, '(', ')');
1012
1013         /* if there's a set of angle brackets, strip it down to that */
1014         if ((haschar(user, '<') == 1) && (haschar(user, '>') == 1)) {
1015                 stripallbut(user, '<', '>');
1016         }
1017
1018         /* strip anything to the left of a bang */
1019         while ((!IsEmptyStr(user)) && (haschar(user, '!') > 0))
1020                 strcpy(user, &user[1]);
1021
1022         /* and anything to the right of a @ or % */
1023         for (a = 0; user[a] != '\0'; ++a) {
1024                 if (user[a] == '@') {
1025                         user[a] = 0;
1026                         break;
1027                 }
1028                 if (user[a] == '%') {
1029                         user[a] = 0;
1030                         break;
1031                 }
1032         }
1033
1034
1035         /* extract node name */
1036         strcpy(node, rfc822);
1037
1038         /* first get rid of anything in parens */
1039         stripout(node, '(', ')');
1040
1041         /* if there's a set of angle brackets, strip it down to that */
1042         if ((haschar(node, '<') == 1) && (haschar(node, '>') == 1)) {
1043                 stripallbut(node, '<', '>');
1044         }
1045
1046         /* If no node specified, tack ours on instead */
1047         if (
1048                 (haschar(node, '@')==0)
1049                 && (haschar(node, '%')==0)
1050                 && (haschar(node, '!')==0)
1051         ) {
1052                 strcpy(node, CtdlGetConfigStr("c_nodename"));
1053         }
1054         else {
1055
1056                 /* strip anything to the left of a @ */
1057                 while ((!IsEmptyStr(node)) && (haschar(node, '@') > 0))
1058                         strcpy(node, &node[1]);
1059         
1060                 /* strip anything to the left of a % */
1061                 while ((!IsEmptyStr(node)) && (haschar(node, '%') > 0))
1062                         strcpy(node, &node[1]);
1063         
1064                 /* reduce multiple system bang paths to node!user */
1065                 while ((!IsEmptyStr(node)) && (haschar(node, '!') > 1))
1066                         strcpy(node, &node[1]);
1067         
1068                 /* now get rid of the user portion of a node!user string */
1069                 for (a = 0; node[a] != '\0'; ++a)
1070                         if (node[a] == '!') {
1071                                 node[a] = 0;
1072                                 break;
1073                         }
1074         }
1075
1076         /* strip leading and trailing spaces in all strings */
1077         striplt(user);
1078         striplt(node);
1079         striplt(name);
1080
1081         /* If we processed a string that had the address in angle brackets
1082          * but no name outside the brackets, we now have an empty name.  In
1083          * this case, use the user portion of the address as the name.
1084          */
1085         if ((IsEmptyStr(name)) && (!IsEmptyStr(user))) {
1086                 strcpy(name, user);
1087         }
1088 }
1089
1090
1091 /*
1092  * convert_field() is a helper function for convert_internet_message().
1093  * Given start/end positions for an rfc822 field, it converts it to a Citadel
1094  * field if it wants to, and unfolds it if necessary.
1095  *
1096  * Returns 1 if the field was converted and inserted into the Citadel message
1097  * structure, implying that the source field should be removed from the
1098  * message text.
1099  */
1100 int convert_field(struct CtdlMessage *msg, const char *beg, const char *end) {
1101         char *key, *value, *valueend;
1102         long len;
1103         const char *pos;
1104         int i;
1105         const char *colonpos = NULL;
1106         int processed = 0;
1107         char user[1024];
1108         char node[1024];
1109         char name[1024];
1110         char addr[1024];
1111         time_t parsed_date;
1112         long valuelen;
1113
1114         for (pos = end; pos >= beg; pos--) {
1115                 if (*pos == ':') colonpos = pos;
1116         }
1117
1118         if (colonpos == NULL) return(0);        /* no colon? not a valid header line */
1119
1120         len = end - beg;
1121         key = malloc(len + 2);
1122         memcpy(key, beg, len + 1);
1123         key[len] = '\0';
1124         valueend = key + len;
1125         * ( key + (colonpos - beg) ) = '\0';
1126         value = &key[(colonpos - beg) + 1];
1127 /*      printf("Header: [%s]\nValue: [%s]\n", key, value); */
1128         unfold_rfc822_field(&value, &valueend);
1129         valuelen = valueend - value + 1;
1130 /*      printf("UnfoldedValue: [%s]\n", value); */
1131
1132         /*
1133          * Here's the big rfc822-to-citadel loop.
1134          */
1135
1136         /* Date/time is converted into a unix timestamp.  If the conversion
1137          * fails, we replace it with the time the message arrived locally.
1138          */
1139         if (!strcasecmp(key, "Date")) {
1140                 parsed_date = parsedate(value);
1141                 if (parsed_date < 0L) parsed_date = time(NULL);
1142
1143                 if (CM_IsEmpty(msg, eTimestamp))
1144                         CM_SetFieldLONG(msg, eTimestamp, parsed_date);
1145                 processed = 1;
1146         }
1147
1148         else if (!strcasecmp(key, "From")) {
1149                 process_rfc822_addr(value, user, node, name);
1150                 syslog(LOG_DEBUG, "internet_addressing: converted to <%s@%s> (%s)", user, node, name);
1151                 snprintf(addr, sizeof(addr), "%s@%s", user, node);
1152                 if (CM_IsEmpty(msg, eAuthor) && !IsEmptyStr(name)) {
1153                         CM_SetField(msg, eAuthor, name, -1);
1154                 }
1155                 if (CM_IsEmpty(msg, erFc822Addr) && !IsEmptyStr(addr)) {
1156                         CM_SetField(msg, erFc822Addr, addr, -1);
1157                 }
1158                 processed = 1;
1159         }
1160
1161         else if (!strcasecmp(key, "Subject")) {
1162                 if (CM_IsEmpty(msg, eMsgSubject))
1163                         CM_SetField(msg, eMsgSubject, value, valuelen);
1164                 processed = 1;
1165         }
1166
1167         else if (!strcasecmp(key, "List-ID")) {
1168                 if (CM_IsEmpty(msg, eListID))
1169                         CM_SetField(msg, eListID, value, valuelen);
1170                 processed = 1;
1171         }
1172
1173         else if (!strcasecmp(key, "To")) {
1174                 if (CM_IsEmpty(msg, eRecipient))
1175                         CM_SetField(msg, eRecipient, value, valuelen);
1176                 processed = 1;
1177         }
1178
1179         else if (!strcasecmp(key, "CC")) {
1180                 if (CM_IsEmpty(msg, eCarbonCopY))
1181                         CM_SetField(msg, eCarbonCopY, value, valuelen);
1182                 processed = 1;
1183         }
1184
1185         else if (!strcasecmp(key, "Message-ID")) {
1186                 if (!CM_IsEmpty(msg, emessageId)) {
1187                         syslog(LOG_WARNING, "internet_addressing: duplicate message id");
1188                 }
1189                 else {
1190                         char *pValue;
1191                         long pValueLen;
1192
1193                         pValue = value;
1194                         pValueLen = valuelen;
1195                         /* Strip angle brackets */
1196                         while (haschar(pValue, '<') > 0) {
1197                                 pValue ++;
1198                                 pValueLen --;
1199                         }
1200
1201                         for (i = 0; i <= pValueLen; ++i)
1202                                 if (pValue[i] == '>') {
1203                                         pValueLen = i;
1204                                         break;
1205                                 }
1206
1207                         CM_SetField(msg, emessageId, pValue, pValueLen);
1208                 }
1209
1210                 processed = 1;
1211         }
1212
1213         else if (!strcasecmp(key, "Return-Path")) {
1214                 if (CM_IsEmpty(msg, eMessagePath))
1215                         CM_SetField(msg, eMessagePath, value, valuelen);
1216                 processed = 1;
1217         }
1218
1219         else if (!strcasecmp(key, "Envelope-To")) {
1220                 if (CM_IsEmpty(msg, eenVelopeTo))
1221                         CM_SetField(msg, eenVelopeTo, value, valuelen);
1222                 processed = 1;
1223         }
1224
1225         else if (!strcasecmp(key, "References")) {
1226                 CM_SetField(msg, eWeferences, value, valuelen);
1227                 processed = 1;
1228         }
1229
1230         else if (!strcasecmp(key, "Reply-To")) {
1231                 CM_SetField(msg, eReplyTo, value, valuelen);
1232                 processed = 1;
1233         }
1234
1235         else if (!strcasecmp(key, "In-reply-to")) {
1236                 if (CM_IsEmpty(msg, eWeferences)) /* References: supersedes In-reply-to: */
1237                         CM_SetField(msg, eWeferences, value, valuelen);
1238                 processed = 1;
1239         }
1240
1241
1242
1243         /* Clean up and move on. */
1244         free(key);      /* Don't free 'value', it's actually the same buffer */
1245         return processed;
1246 }
1247
1248
1249 /*
1250  * Convert RFC822 references format (References) to Citadel references format (Weferences)
1251  */
1252 void convert_references_to_wefewences(char *str) {
1253         int bracket_nesting = 0;
1254         char *ptr = str;
1255         char *moveptr = NULL;
1256         char ch;
1257
1258         while(*ptr) {
1259                 ch = *ptr;
1260                 if (ch == '>') {
1261                         --bracket_nesting;
1262                         if (bracket_nesting < 0) bracket_nesting = 0;
1263                 }
1264                 if ((ch == '>') && (bracket_nesting == 0) && (*(ptr+1)) && (ptr>str) ) {
1265                         *ptr = '|';
1266                         ++ptr;
1267                 }
1268                 else if (bracket_nesting > 0) {
1269                         ++ptr;
1270                 }
1271                 else {
1272                         moveptr = ptr;
1273                         while (*moveptr) {
1274                                 *moveptr = *(moveptr+1);
1275                                 ++moveptr;
1276                         }
1277                 }
1278                 if (ch == '<') ++bracket_nesting;
1279         }
1280
1281 }
1282
1283
1284 /*
1285  * Convert an RFC822 message (headers + body) to a CtdlMessage structure.
1286  * NOTE: the supplied buffer becomes part of the CtdlMessage structure, and
1287  * will be deallocated when CM_Free() is called.  Therefore, the
1288  * supplied buffer should be DEREFERENCED.  It should not be freed or used
1289  * again.
1290  */
1291 struct CtdlMessage *convert_internet_message(char *rfc822) {
1292         StrBuf *RFCBuf = NewStrBufPlain(rfc822, -1);
1293         free (rfc822);
1294         return convert_internet_message_buf(&RFCBuf);
1295 }
1296
1297
1298 struct CtdlMessage *convert_internet_message_buf(StrBuf **rfc822)
1299 {
1300         struct CtdlMessage *msg;
1301         const char *pos, *beg, *end, *totalend;
1302         int done, alldone = 0;
1303         int converted;
1304         StrBuf *OtherHeaders;
1305
1306         msg = malloc(sizeof(struct CtdlMessage));
1307         if (msg == NULL) return msg;
1308
1309         memset(msg, 0, sizeof(struct CtdlMessage));
1310         msg->cm_magic = CTDLMESSAGE_MAGIC;      /* self check */
1311         msg->cm_anon_type = 0;                  /* never anonymous */
1312         msg->cm_format_type = FMT_RFC822;       /* internet message */
1313
1314         pos = ChrPtr(*rfc822);
1315         totalend = pos + StrLength(*rfc822);
1316         done = 0;
1317         OtherHeaders = NewStrBufPlain(NULL, StrLength(*rfc822));
1318
1319         while (!alldone) {
1320
1321                 /* Locate beginning and end of field, keeping in mind that
1322                  * some fields might be multiline
1323                  */
1324                 end = beg = pos;
1325
1326                 while ((end < totalend) && 
1327                        (end == beg) && 
1328                        (done == 0) ) 
1329                 {
1330
1331                         if ( (*pos=='\n') && ((*(pos+1))!=0x20) && ((*(pos+1))!=0x09) )
1332                         {
1333                                 end = pos;
1334                         }
1335
1336                         /* done with headers? */
1337                         if ((*pos=='\n') &&
1338                             ( (*(pos+1)=='\n') ||
1339                               (*(pos+1)=='\r')) ) 
1340                         {
1341                                 alldone = 1;
1342                         }
1343
1344                         if (pos >= (totalend - 1) )
1345                         {
1346                                 end = pos;
1347                                 done = 1;
1348                         }
1349
1350                         ++pos;
1351
1352                 }
1353
1354                 /* At this point we have a field.  Are we interested in it? */
1355                 converted = convert_field(msg, beg, end);
1356
1357                 /* Strip the field out of the RFC822 header if we used it */
1358                 if (!converted) {
1359                         StrBufAppendBufPlain(OtherHeaders, beg, end - beg, 0);
1360                         StrBufAppendBufPlain(OtherHeaders, HKEY("\n"), 0);
1361                 }
1362
1363                 /* If we've hit the end of the message, bail out */
1364                 if (pos >= totalend)
1365                         alldone = 1;
1366         }
1367         StrBufAppendBufPlain(OtherHeaders, HKEY("\n"), 0);
1368         if (pos < totalend)
1369                 StrBufAppendBufPlain(OtherHeaders, pos, totalend - pos, 0);
1370         FreeStrBuf(rfc822);
1371         CM_SetAsFieldSB(msg, eMesageText, &OtherHeaders);
1372
1373         /* Follow-up sanity checks... */
1374
1375         /* If there's no timestamp on this message, set it to now. */
1376         if (CM_IsEmpty(msg, eTimestamp)) {
1377                 CM_SetFieldLONG(msg, eTimestamp, time(NULL));
1378         }
1379
1380         /* If a W (references, or rather, Wefewences) field is present, we
1381          * have to convert it from RFC822 format to Citadel format.
1382          */
1383         if (!CM_IsEmpty(msg, eWeferences)) {
1384                 /// todo: API!
1385                 convert_references_to_wefewences(msg->cm_fields[eWeferences]);
1386         }
1387
1388         return msg;
1389 }
1390
1391
1392 /*
1393  * Look for a particular header field in an RFC822 message text.  If the
1394  * requested field is found, it is unfolded (if necessary) and returned to
1395  * the caller.  The field name is stripped out, leaving only its contents.
1396  * The caller is responsible for freeing the returned buffer.  If the requested
1397  * field is not present, or anything else goes wrong, it returns NULL.
1398  */
1399 char *rfc822_fetch_field(const char *rfc822, const char *fieldname) {
1400         char *fieldbuf = NULL;
1401         const char *end_of_headers;
1402         const char *field_start;
1403         const char *ptr;
1404         char *cont;
1405         char fieldhdr[SIZ];
1406
1407         /* Should never happen, but sometimes we get stupid */
1408         if (rfc822 == NULL) return(NULL);
1409         if (fieldname == NULL) return(NULL);
1410
1411         snprintf(fieldhdr, sizeof fieldhdr, "%s:", fieldname);
1412
1413         /* Locate the end of the headers, so we don't run past that point */
1414         end_of_headers = cbmstrcasestr(rfc822, "\n\r\n");
1415         if (end_of_headers == NULL) {
1416                 end_of_headers = cbmstrcasestr(rfc822, "\n\n");
1417         }
1418         if (end_of_headers == NULL) return (NULL);
1419
1420         field_start = cbmstrcasestr(rfc822, fieldhdr);
1421         if (field_start == NULL) return(NULL);
1422         if (field_start > end_of_headers) return(NULL);
1423
1424         fieldbuf = malloc(SIZ);
1425         strcpy(fieldbuf, "");
1426
1427         ptr = field_start;
1428         ptr = cmemreadline(ptr, fieldbuf, SIZ-strlen(fieldbuf) );
1429         while ( (isspace(ptr[0])) && (ptr < end_of_headers) ) {
1430                 strcat(fieldbuf, " ");
1431                 cont = &fieldbuf[strlen(fieldbuf)];
1432                 ptr = cmemreadline(ptr, cont, SIZ-strlen(fieldbuf) );
1433                 striplt(cont);
1434         }
1435
1436         strcpy(fieldbuf, &fieldbuf[strlen(fieldhdr)]);
1437         striplt(fieldbuf);
1438
1439         return(fieldbuf);
1440 }
1441
1442
1443 /*****************************************************************************
1444  *                      DIRECTORY MANAGEMENT FUNCTIONS                       *
1445  *****************************************************************************/
1446
1447 /*
1448  * Generate the index key for an Internet e-mail address to be looked up
1449  * in the database.
1450  */
1451 void directory_key(char *key, char *addr) {
1452         int i;
1453         int keylen = 0;
1454
1455         for (i=0; !IsEmptyStr(&addr[i]); ++i) {
1456                 if (!isspace(addr[i])) {
1457                         key[keylen++] = tolower(addr[i]);
1458                 }
1459         }
1460         key[keylen++] = 0;
1461
1462         syslog(LOG_DEBUG, "internet_addressing: directory key is <%s>", key);
1463 }
1464
1465
1466 /*
1467  * Return nonzero if the supplied address is in one of "our" domains
1468  */
1469 int IsDirectory(char *addr, int allow_masq_domains) {
1470         char domain[256];
1471         int h;
1472
1473         extract_token(domain, addr, 1, '@', sizeof domain);
1474         striplt(domain);
1475
1476         h = CtdlHostAlias(domain);
1477
1478         if ( (h == hostalias_masq) && allow_masq_domains)
1479                 return(1);
1480         
1481         if (h == hostalias_localhost) {
1482                 return(1);
1483         }
1484         else {
1485                 return(0);
1486         }
1487 }
1488
1489
1490 /*
1491  * Add an Internet e-mail address to the directory for a user
1492  */
1493 int CtdlDirectoryAddUser(char *internet_addr, char *citadel_addr) {
1494         char key[SIZ];
1495
1496         if (IsDirectory(internet_addr, 0) == 0) {
1497                 return 0;
1498         }
1499         syslog(LOG_DEBUG, "internet_addressing: create directory entry: %s --> %s", internet_addr, citadel_addr);
1500         directory_key(key, internet_addr);
1501         cdb_store(CDB_DIRECTORY, key, strlen(key), citadel_addr, strlen(citadel_addr)+1 );
1502         return 1;
1503 }
1504
1505
1506 /*
1507  * Delete an Internet e-mail address from the directory.
1508  *
1509  * (NOTE: we don't actually use or need the citadel_addr variable; it's merely
1510  * here because the callback API expects to be able to send it.)
1511  */
1512 int CtdlDirectoryDelUser(char *internet_addr, char *citadel_addr) {
1513         char key[SIZ];
1514         
1515         syslog(LOG_DEBUG, "internet_addressing: delete directory entry: %s --> %s", internet_addr, citadel_addr);
1516         directory_key(key, internet_addr);
1517         return cdb_delete(CDB_DIRECTORY, key, strlen(key) ) == 0;
1518 }
1519
1520
1521 /*
1522  * Look up an Internet e-mail address in the directory.
1523  * On success: returns 0, and Citadel address stored in 'target'
1524  * On failure: returns nonzero
1525  */
1526 int CtdlDirectoryLookup(char *target, char *internet_addr, size_t targbuflen) {
1527         struct cdbdata *cdbrec;
1528         char key[SIZ];
1529
1530         /* Dump it in there unchanged, just for kicks */
1531         if (target != NULL) {
1532                 safestrncpy(target, internet_addr, targbuflen);
1533         }
1534
1535         /* Only do lookups for addresses with hostnames in them */
1536         if (num_tokens(internet_addr, '@') != 2) return(-1);
1537
1538         /* Only do lookups for domains in the directory */
1539         if (IsDirectory(internet_addr, 0) == 0) return(-1);
1540
1541         directory_key(key, internet_addr);
1542         cdbrec = cdb_fetch(CDB_DIRECTORY, key, strlen(key) );
1543         if (cdbrec != NULL) {
1544                 if (target != NULL) {
1545                         safestrncpy(target, cdbrec->ptr, targbuflen);
1546                 }
1547                 cdb_free(cdbrec);
1548                 return(0);
1549         }
1550
1551         return(-1);
1552 }
1553
1554
1555 /*
1556  * Harvest any email addresses that someone might want to have in their
1557  * "collected addresses" book.
1558  */
1559 char *harvest_collected_addresses(struct CtdlMessage *msg) {
1560         char *coll = NULL;
1561         char addr[256];
1562         char user[256], node[256], name[256];
1563         int is_harvestable;
1564         int i, j, h;
1565         eMsgField field = 0;
1566
1567         if (msg == NULL) return(NULL);
1568
1569         is_harvestable = 1;
1570         strcpy(addr, "");       
1571         if (!CM_IsEmpty(msg, eAuthor)) {
1572                 strcat(addr, msg->cm_fields[eAuthor]);
1573         }
1574         if (!CM_IsEmpty(msg, erFc822Addr)) {
1575                 strcat(addr, " <");
1576                 strcat(addr, msg->cm_fields[erFc822Addr]);
1577                 strcat(addr, ">");
1578                 if (IsDirectory(msg->cm_fields[erFc822Addr], 0)) {
1579                         is_harvestable = 0;
1580                 }
1581         }
1582
1583         if (is_harvestable) {
1584                 coll = strdup(addr);
1585         }
1586         else {
1587                 coll = strdup("");
1588         }
1589
1590         if (coll == NULL) return(NULL);
1591
1592         /* Scan both the R (To) and Y (CC) fields */
1593         for (i = 0; i < 2; ++i) {
1594                 if (i == 0) field = eRecipient;
1595                 if (i == 1) field = eCarbonCopY;
1596
1597                 if (!CM_IsEmpty(msg, field)) {
1598                         for (j=0; j<num_tokens(msg->cm_fields[field], ','); ++j) {
1599                                 extract_token(addr, msg->cm_fields[field], j, ',', sizeof addr);
1600                                 if (strstr(addr, "=?") != NULL)
1601                                         utf8ify_rfc822_string(addr);
1602                                 process_rfc822_addr(addr, user, node, name);
1603                                 h = CtdlHostAlias(node);
1604                                 if (h != hostalias_localhost) {
1605                                         coll = realloc(coll, strlen(coll) + strlen(addr) + 4);
1606                                         if (coll == NULL) return(NULL);
1607                                         if (!IsEmptyStr(coll)) {
1608                                                 strcat(coll, ",");
1609                                         }
1610                                         striplt(addr);
1611                                         strcat(coll, addr);
1612                                 }
1613                         }
1614                 }
1615         }
1616
1617         if (IsEmptyStr(coll)) {
1618                 free(coll);
1619                 return(NULL);
1620         }
1621         return(coll);
1622 }
1623
1624
1625 /*
1626  * Helper function for CtdlRebuildDirectoryIndex()
1627  */
1628 void CtdlRebuildDirectoryIndex_backend(char *username, void *data) {
1629
1630         int j = 0;
1631         struct ctdluser usbuf;
1632
1633         if (CtdlGetUser(&usbuf, username) != 0) {
1634                 return;
1635         }
1636
1637         if ( (!IsEmptyStr(usbuf.fullname)) && (!IsEmptyStr(usbuf.emailaddrs)) ) {
1638                 for (j=0; j<num_tokens(usbuf.emailaddrs, '|'); ++j) {
1639                         char one_email[512];
1640                         extract_token(one_email, usbuf.emailaddrs, j, '|', sizeof one_email);
1641                         CtdlDirectoryAddUser(one_email, usbuf.fullname);
1642                 }
1643         }
1644 }
1645
1646
1647 /*
1648  * Initialize the directory database (erasing anything already there)
1649  */
1650 void CtdlRebuildDirectoryIndex(void) {
1651         syslog(LOG_INFO, "internet_addressing: rebuilding email address directory index");
1652         cdb_trunc(CDB_DIRECTORY);
1653         ForEachUser(CtdlRebuildDirectoryIndex_backend, NULL);
1654 }
1655
1656
1657 /*
1658  * Configure Internet email addresses for a user account, updating the Directory Index in the process
1659  */
1660 void CtdlSetEmailAddressesForUser(char *requested_user, char *new_emailaddrs)
1661 {
1662         struct ctdluser usbuf;
1663         int i;
1664         char buf[SIZ];
1665
1666         if (CtdlGetUserLock(&usbuf, requested_user) != 0) {     // We are relying on the fact that the DirectoryIndex functions don't lock.
1667                 return;                                         // Silently fail here if we can't acquire a lock on the user record.
1668         }
1669
1670         syslog(LOG_DEBUG, "internet_addressing: setting email addresses for <%s> to <%s>", usbuf.fullname, new_emailaddrs);
1671
1672         /* Delete all of the existing directory index records for the user (easier this way) */
1673         for (i=0; i<num_tokens(usbuf.emailaddrs, '|'); ++i) {
1674                 extract_token(buf, usbuf.emailaddrs, i, '|', sizeof buf);
1675                 CtdlDirectoryDelUser(buf, requested_user);
1676         }
1677
1678         strcpy(usbuf.emailaddrs, new_emailaddrs);               // make it official.
1679
1680         /* Index all of the new email addresses (they've already been sanitized) */
1681         for (i=0; i<num_tokens(usbuf.emailaddrs, '|'); ++i) {
1682                 extract_token(buf, usbuf.emailaddrs, i, '|', sizeof buf);
1683                 CtdlDirectoryAddUser(buf, requested_user);
1684         }
1685
1686         CtdlPutUserLock(&usbuf);
1687 }
1688
1689
1690 /*
1691  * Auto-generate an Internet email address for a user account
1692  */
1693 void AutoGenerateEmailAddressForUser(struct ctdluser *user)
1694 {
1695         char synthetic_email_addr[1024];
1696         int i, j;
1697         int u = 0;
1698
1699         for (i=0; u==0; ++i) {
1700                 if (i == 0) {
1701                         // first try just converting the user name to lowercase and replacing spaces with underscores
1702                         snprintf(synthetic_email_addr, sizeof synthetic_email_addr, "%s@%s", user->fullname, CtdlGetConfigStr("c_fqdn"));
1703                         for (j=0; ((synthetic_email_addr[j] != '\0')&&(synthetic_email_addr[j] != '@')); j++) {
1704                                 synthetic_email_addr[j] = tolower(synthetic_email_addr[j]);
1705                                 if (!isalnum(synthetic_email_addr[j])) {
1706                                         synthetic_email_addr[j] = '_';
1707                                 }
1708                         }
1709                 }
1710                 else if (i == 1) {
1711                         // then try 'ctdl' followed by the user number
1712                         snprintf(synthetic_email_addr, sizeof synthetic_email_addr, "ctdl%08lx@%s", user->usernum, CtdlGetConfigStr("c_fqdn"));
1713                 }
1714                 else if (i > 1) {
1715                         // oof.  just keep trying other numbers until we find one
1716                         snprintf(synthetic_email_addr, sizeof synthetic_email_addr, "ctdl%08x@%s", i, CtdlGetConfigStr("c_fqdn"));
1717                 }
1718                 u = CtdlDirectoryLookup(NULL, synthetic_email_addr, 0);
1719                 syslog(LOG_DEBUG, "user_ops: address <%s> lookup returned <%d>", synthetic_email_addr, u);
1720         }
1721
1722         CtdlSetEmailAddressesForUser(user->fullname, synthetic_email_addr);
1723         strncpy(CC->user.emailaddrs, synthetic_email_addr, sizeof(user->emailaddrs));
1724         syslog(LOG_DEBUG, "user_ops: auto-generated email address <%s> for <%s>", synthetic_email_addr, user->fullname);
1725 }