Reworked validate_recipients() and expand_aliases() in preparation for expanding...
[citadel] / citadel / internet_addressing.c
1 /*
2  * This file contains functions which handle the mapping of Internet addresses
3  * to users on the Citadel system.
4  *
5  * Copyright (c) 1987-2021 by the citadel.org team
6  *
7  * This program is open source software; you can redistribute it and/or modify
8  * it under the terms of the GNU General Public License version 3.
9  *
10  * This program is distributed in the hope that it will be useful,
11  * but WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13  * GNU General Public License for more details.
14  */
15
16 #include "sysdep.h"
17 #include <stdlib.h>
18 #include <unistd.h>
19 #include <stdio.h>
20 #include <fcntl.h>
21 #include <ctype.h>
22 #include <signal.h>
23 #include <pwd.h>
24 #include <errno.h>
25 #include <sys/types.h>
26 #include <time.h>
27 #include <sys/wait.h>
28 #include <string.h>
29 #include <limits.h>
30 #include <libcitadel.h>
31 #include "citadel.h"
32 #include "server.h"
33 #include "sysdep_decls.h"
34 #include "citserver.h"
35 #include "support.h"
36 #include "config.h"
37 #include "msgbase.h"
38 #include "internet_addressing.h"
39 #include "user_ops.h"
40 #include "room_ops.h"
41 #include "parsedate.h"
42 #include "database.h"
43 #include "ctdl_module.h"
44 #ifdef HAVE_ICONV
45 #include <iconv.h>
46
47 #if 0
48 /* This is the non-define version in case it is needed for debugging */
49 inline void FindNextEnd (char *bptr, char *end)
50 {
51         /* Find the next ?Q? */
52         end = strchr(bptr + 2, '?');
53         if (end == NULL) return NULL;
54         if (((*(end + 1) == 'B') || (*(end + 1) == 'Q')) && 
55             (*(end + 2) == '?')) {
56                 /* skip on to the end of the cluster, the next ?= */
57                 end = strstr(end + 3, "?=");
58         }
59         else
60                 /* sort of half valid encoding, try to find an end. */
61                 end = strstr(bptr, "?=");
62 }
63 #endif
64
65 #define FindNextEnd(bptr, end) { \
66         end = strchr(bptr + 2, '?'); \
67         if (end != NULL) { \
68                 if (((*(end + 1) == 'B') || (*(end + 1) == 'Q')) && (*(end + 2) == '?')) { \
69                         end = strstr(end + 3, "?="); \
70                 } else end = strstr(bptr, "?="); \
71         } \
72 }
73
74 /*
75  * Handle subjects with RFC2047 encoding such as:
76  * =?koi8-r?B?78bP0s3Mxc7JxSDXz9rE1dvO2c3JINvB0sHNySDP?=
77  */
78 void utf8ify_rfc822_string(char *buf) {
79         char *start, *end, *next, *nextend, *ptr;
80         char newbuf[1024];
81         char charset[128];
82         char encoding[16];
83         char istr[1024];
84         iconv_t ic = (iconv_t)(-1) ;
85         char *ibuf;                     // Buffer of characters to be converted
86         char *obuf;                     // Buffer for converted characters
87         size_t ibuflen;                 // Length of input buffer
88         size_t obuflen;                 // Length of output buffer
89         char *isav;                     // Saved pointer to input buffer
90         char *osav;                     // Saved pointer to output buffer
91         int passes = 0;
92         int i, len, delta;
93         int illegal_non_rfc2047_encoding = 0;
94
95         /* Sometimes, badly formed messages contain strings which were simply
96          * written out directly in some foreign character set instead of
97          * using RFC2047 encoding.  This is illegal but we will attempt to
98          * handle it anyway by converting from a user-specified default
99          * charset to UTF-8 if we see any nonprintable characters.
100          */
101         len = strlen(buf);
102         for (i=0; i<len; ++i) {
103                 if ((buf[i] < 32) || (buf[i] > 126)) {
104                         illegal_non_rfc2047_encoding = 1;
105                         i = len;        // take a shortcut, it won't be more than one.
106                 }
107         }
108         if (illegal_non_rfc2047_encoding) {
109                 const char *default_header_charset = "iso-8859-1";
110                 if ( (strcasecmp(default_header_charset, "UTF-8")) && (strcasecmp(default_header_charset, "us-ascii")) ) {
111                         ctdl_iconv_open("UTF-8", default_header_charset, &ic);
112                         if (ic != (iconv_t)(-1) ) {
113                                 ibuf = malloc(1024);
114                                 isav = ibuf;
115                                 safestrncpy(ibuf, buf, 1024);
116                                 ibuflen = strlen(ibuf);
117                                 obuflen = 1024;
118                                 obuf = (char *) malloc(obuflen);
119                                 osav = obuf;
120                                 iconv(ic, &ibuf, &ibuflen, &obuf, &obuflen);
121                                 osav[1024-obuflen] = 0;
122                                 strcpy(buf, osav);
123                                 free(osav);
124                                 iconv_close(ic);
125                                 free(isav);
126                         }
127                 }
128         }
129
130         /* pre evaluate the first pair */
131         nextend = end = NULL;
132         len = strlen(buf);
133         start = strstr(buf, "=?");
134         if (start != NULL) 
135                 FindNextEnd (start, end);
136
137         while ((start != NULL) && (end != NULL)) {
138                 next = strstr(end, "=?");
139                 if (next != NULL)
140                         FindNextEnd(next, nextend);
141                 if (nextend == NULL)
142                         next = NULL;
143
144                 /* did we find two partitions */
145                 if ((next != NULL) && ((next - end) > 2)) {
146                         ptr = end + 2;
147                         while ((ptr < next) && 
148                                (isspace(*ptr) ||
149                                 (*ptr == '\r') ||
150                                 (*ptr == '\n') || 
151                                 (*ptr == '\t')))
152                                 ptr ++;
153                         /* did we find a gab just filled with blanks? */
154                         if (ptr == next)
155                         {
156                                 memmove (end + 2,
157                                          next,
158                                          len - (next - start));
159
160                                 /* now terminate the gab at the end */
161                                 delta = (next - end) - 2;
162                                 len -= delta;
163                                 buf[len] = '\0';
164
165                                 /* move next to its new location. */
166                                 next -= delta;
167                                 nextend -= delta;
168                         }
169                 }
170                 /* our next-pair is our new first pair now. */
171                 start = next;
172                 end = nextend;
173         }
174
175         // Now we handle foreign character sets properly encoded in RFC2047 format.
176         start = strstr(buf, "=?");
177         FindNextEnd((start != NULL)? start : buf, end);
178         while (start != NULL && end != NULL && end > start) {
179                 extract_token(charset, start, 1, '?', sizeof charset);
180                 extract_token(encoding, start, 2, '?', sizeof encoding);
181                 extract_token(istr, start, 3, '?', sizeof istr);
182
183                 ibuf = malloc(1024);
184                 isav = ibuf;
185                 if (!strcasecmp(encoding, "B")) {       // base64
186                         ibuflen = CtdlDecodeBase64(ibuf, istr, strlen(istr));
187                 }
188                 else if (!strcasecmp(encoding, "Q")) {  // quoted-printable
189                         size_t len;
190                         unsigned long pos;
191                         
192                         len = strlen(istr);
193                         pos = 0;
194                         while (pos < len) {
195                                 if (istr[pos] == '_') istr[pos] = ' ';
196                                 pos++;
197                         }
198                         ibuflen = CtdlDecodeQuotedPrintable(ibuf, istr, len);
199                 }
200                 else {
201                         strcpy(ibuf, istr);             // unknown encoding
202                         ibuflen = strlen(istr);
203                 }
204
205                 ctdl_iconv_open("UTF-8", charset, &ic);
206                 if (ic != (iconv_t)(-1) ) {
207                         obuflen = 1024;
208                         obuf = (char *) malloc(obuflen);
209                         osav = obuf;
210                         iconv(ic, &ibuf, &ibuflen, &obuf, &obuflen);
211                         osav[1024-obuflen] = 0;
212
213                         end = start;
214                         end++;
215                         strcpy(start, "");
216                         remove_token(end, 0, '?');
217                         remove_token(end, 0, '?');
218                         remove_token(end, 0, '?');
219                         remove_token(end, 0, '?');
220                         strcpy(end, &end[1]);
221
222                         snprintf(newbuf, sizeof newbuf, "%s%s%s", buf, osav, end);
223                         strcpy(buf, newbuf);
224                         free(osav);
225                         iconv_close(ic);
226                 }
227                 else {
228                         end = start;
229                         end++;
230                         strcpy(start, "");
231                         remove_token(end, 0, '?');
232                         remove_token(end, 0, '?');
233                         remove_token(end, 0, '?');
234                         remove_token(end, 0, '?');
235                         strcpy(end, &end[1]);
236
237                         snprintf(newbuf, sizeof newbuf, "%s(unreadable)%s", buf, end);
238                         strcpy(buf, newbuf);
239                 }
240
241                 free(isav);
242
243                 /*
244                  * Since spammers will go to all sorts of absurd lengths to get their
245                  * messages through, there are LOTS of corrupt headers out there.
246                  * So, prevent a really badly formed RFC2047 header from throwing
247                  * this function into an infinite loop.
248                  */
249                 ++passes;
250                 if (passes > 20) return;
251
252                 start = strstr(buf, "=?");
253                 FindNextEnd((start != NULL)? start : buf, end);
254         }
255
256 }
257 #else
258 inline void utf8ify_rfc822_string(char *a){};
259
260 #endif
261
262
263 struct trynamebuf {
264         char buffer1[SIZ];
265         char buffer2[SIZ];
266 };
267
268 char *inetcfg = NULL;
269
270 /*
271  * Return nonzero if the supplied name is an alias for this host.
272  */
273 int CtdlHostAlias(char *fqdn) {
274         int config_lines;
275         int i;
276         char buf[256];
277         char host[256], type[256];
278         int found = 0;
279
280         if (fqdn == NULL)                                       return(hostalias_nomatch);
281         if (IsEmptyStr(fqdn))                                   return(hostalias_nomatch);
282         if (!strcasecmp(fqdn, "localhost"))                     return(hostalias_localhost);
283         if (!strcasecmp(fqdn, CtdlGetConfigStr("c_fqdn")))      return(hostalias_localhost);
284         if (!strcasecmp(fqdn, CtdlGetConfigStr("c_nodename")))  return(hostalias_localhost);
285         if (inetcfg == NULL)                                    return(hostalias_nomatch);
286
287         config_lines = num_tokens(inetcfg, '\n');
288         for (i=0; i<config_lines; ++i) {
289                 extract_token(buf, inetcfg, i, '\n', sizeof buf);
290                 extract_token(host, buf, 0, '|', sizeof host);
291                 extract_token(type, buf, 1, '|', sizeof type);
292
293                 found = 0;
294
295                 /* Process these in a specific order, in case there are multiple matches.
296                  * We want localhost to override masq, for example.
297                  */
298
299                 if ( (!strcasecmp(type, "masqdomain")) && (!strcasecmp(fqdn, host))) {
300                         found = hostalias_masq;
301                 }
302
303                 if ( (!strcasecmp(type, "localhost")) && (!strcasecmp(fqdn, host))) {
304                         found = hostalias_localhost;
305                 }
306
307                 // "directory" used to be a distributed version of "localhost" but they're both the same now
308                 if ( (!strcasecmp(type, "directory")) && (!strcasecmp(fqdn, host))) {
309                         found = hostalias_localhost;
310                 }
311
312                 if (found) return(found);
313         }
314         return(hostalias_nomatch);
315 }
316
317
318 /*
319  * Determine whether a given Internet address belongs to the current user
320  */
321 int CtdlIsMe(char *addr, int addr_buf_len)
322 {
323         struct recptypes *recp;
324         int i;
325
326         recp = validate_recipients(addr, NULL, 0);
327         if (recp == NULL) return(0);
328
329         if (recp->num_local == 0) {
330                 free_recipients(recp);
331                 return(0);
332         }
333
334         for (i=0; i<recp->num_local; ++i) {
335                 extract_token(addr, recp->recp_local, i, '|', addr_buf_len);
336                 if (!strcasecmp(addr, CC->user.fullname)) {
337                         free_recipients(recp);
338                         return(1);
339                 }
340         }
341
342         free_recipients(recp);
343         return(0);
344 }
345
346
347 /* If the last item in a list of recipients was truncated to a partial address,
348  * remove it completely in order to avoid choking library functions.
349  */
350 void sanitize_truncated_recipient(char *str)
351 {
352         if (!str) return;
353         if (num_tokens(str, ',') < 2) return;
354
355         int len = strlen(str);
356         if (len < 900) return;
357         if (len > 998) str[998] = 0;
358
359         char *cptr = strrchr(str, ',');
360         if (!cptr) return;
361
362         char *lptr = strchr(cptr, '<');
363         char *rptr = strchr(cptr, '>');
364
365         if ( (lptr) && (rptr) && (rptr > lptr) ) return;
366
367         *cptr = 0;
368 }
369
370
371 /*
372  * This function is self explanatory.
373  * (What can I say, I'm in a weird mood today...)
374  */
375 void remove_any_whitespace_to_the_left_or_right_of_at_symbol(char *name) {
376         char *ptr;
377         if (!name) return;
378
379         for (ptr=name; *ptr; ++ptr) {
380                 while ( (isspace(*ptr)) && (*(ptr+1)=='@') ) {
381                         strcpy(ptr, ptr+1);
382                         if (ptr > name) --ptr;
383                 }
384                 while ( (*ptr=='@') && (*(ptr+1)!=0) && (isspace(*(ptr+1))) ) {
385                         strcpy(ptr+1, ptr+2);
386                 }
387         }
388 }
389
390
391 // values that can be returned by expand_aliases()
392 enum {
393         EA_ERROR,               // Can't send message due to bad address
394         EA_LOCAL,               // Local message, do no network processing
395         EA_INTERNET             // Convert msg and send as Internet mail
396 };
397
398
399 /*
400  * Aliasing for network mail.
401  */
402 int expand_aliases(char *name) {                                /* process alias and routing info for mail */
403         int a;
404         char aaa[SIZ];
405         int at = 0;
406         char node[64];
407
408         char original_name[256];
409         safestrncpy(original_name, name, sizeof original_name);
410
411         striplt(name);
412         remove_any_whitespace_to_the_left_or_right_of_at_symbol(name);
413         stripallbut(name, '<', '>');
414
415         /* Hit the email address directory */
416         if (CtdlDirectoryLookup(aaa, name, sizeof aaa) == 0) {
417                 strcpy(name, aaa);
418         }
419
420         //if (strcasecmp(original_name, name)) {
421                 syslog(LOG_INFO, "internet_addressing: %s is being forwarded to %s", original_name, name);
422         //}
423
424         /* Change "user @ xxx" to "user" if xxx is an alias for this host */
425         for (a=0; name[a] != '\0'; ++a) {
426                 if (name[a] == '@') {
427                         if (CtdlHostAlias(&name[a+1]) == hostalias_localhost) {
428                                 name[a] = 0;
429                                 syslog(LOG_DEBUG, "internet_addressing: changed to <%s>", name);
430                                 break;
431                         }
432                 }
433         }
434
435         /* determine local or remote type, see citadel.h */
436         at = haschar(name, '@');
437         if (at == 0) return(EA_LOCAL);          /* no @'s - local address */
438         if (at > 1) return(EA_ERROR);           /* >1 @'s - invalid address */
439         remove_any_whitespace_to_the_left_or_right_of_at_symbol(name);
440
441         /* figure out the delivery mode */
442         extract_token(node, name, 1, '@', sizeof node);
443
444         /* If there are one or more dots in the nodename, we assume that it
445          * is an FQDN and will attempt SMTP delivery to the Internet.
446          */
447         if (haschar(node, '.') > 0) {
448                 return(EA_INTERNET);
449         }
450
451         /* If we get to this point it's an invalid node name */
452         return (EA_ERROR);
453 }
454
455
456 /*
457  * Validate recipients, count delivery types and errors, and handle aliasing
458  * FIXME check for dupes!!!!!
459  *
460  * Returns 0 if all addresses are ok, ret->num_error = -1 if no addresses 
461  * were specified, or the number of addresses found invalid.
462  *
463  * Caller needs to free the result using free_recipients()
464  */
465 struct recptypes *validate_recipients(const char *supplied_recipients, const char *RemoteIdentifier, int Flags) {
466         struct recptypes *ret;
467         char *recipients = NULL;
468         char *org_recp;
469         char this_recp[256];
470         char this_recp_cooked[256];
471         char append[SIZ];
472         long len;
473         int i, j;
474         int mailtype;
475         int invalid;
476         struct ctdluser tempUS;
477         struct ctdlroom tempQR;
478         struct ctdlroom tempQR2;
479         int err = 0;
480         char errmsg[SIZ];
481         int in_quotes = 0;
482
483         /* Initialize */
484         ret = (struct recptypes *) malloc(sizeof(struct recptypes));
485         if (ret == NULL) return(NULL);
486
487         /* Set all strings to null and numeric values to zero */
488         memset(ret, 0, sizeof(struct recptypes));
489
490         if (supplied_recipients == NULL) {
491                 recipients = strdup("");
492         }
493         else {
494                 recipients = strdup(supplied_recipients);
495         }
496
497         /* Allocate some memory.  Yes, this allocates 500% more memory than we will
498          * actually need, but it's healthier for the heap than doing lots of tiny
499          * realloc() calls instead.
500          */
501         len = strlen(recipients) + 1024;
502         ret->errormsg = malloc(len);
503         ret->recp_local = malloc(len);
504         ret->recp_internet = malloc(len);
505         ret->recp_room = malloc(len);
506         ret->display_recp = malloc(len);
507         ret->recp_orgroom = malloc(len);
508         org_recp = malloc(len);
509
510         ret->errormsg[0] = 0;
511         ret->recp_local[0] = 0;
512         ret->recp_internet[0] = 0;
513         ret->recp_room[0] = 0;
514         ret->recp_orgroom[0] = 0;
515         ret->display_recp[0] = 0;
516
517         ret->recptypes_magic = RECPTYPES_MAGIC;
518
519         /* Change all valid separator characters to commas */
520         for (i=0; !IsEmptyStr(&recipients[i]); ++i) {
521                 if ((recipients[i] == ';') || (recipients[i] == '|')) {
522                         recipients[i] = ',';
523                 }
524         }
525
526         /* Now start extracting recipients... */
527         Array *recp_array = array_new(1024);
528         while (!IsEmptyStr(recipients)) {
529                 for (i=0; i<=strlen(recipients); ++i) {
530                         if (recipients[i] == '\"') in_quotes = 1 - in_quotes;
531                         if ( ( (recipients[i] == ',') && (!in_quotes) ) || (recipients[i] == 0) ) {
532                                 safestrncpy(this_recp, recipients, i+1);
533                                 this_recp[i] = 0;
534                                 if (recipients[i] == ',') {
535                                         strcpy(recipients, &recipients[i+1]);
536                                 }
537                                 else {
538                                         strcpy(recipients, "");
539                                 }
540                                 break;
541                         }
542                 }
543
544                 striplt(this_recp);
545                 if (!IsEmptyStr(this_recp)) {
546                         syslog(LOG_DEBUG, "internet_addressing: evaluating recipient: %s", this_recp);
547                         array_append(recp_array, this_recp);
548                 }
549         }
550
551         for (int r=0; r<array_len(recp_array); ++r) {
552                 strcpy(this_recp, (char *)array_get_element_at(recp_array, r));
553
554                 strcpy(org_recp, this_recp);
555
556
557
558                 // To prevent endless aliasing loops, we will only do this three times.
559                 for (int alias_loop=0; alias_loop<3; ++alias_loop) {
560                         mailtype = expand_aliases(this_recp);
561                 }
562
563
564
565                 // Hmm.  Is this still needed?  It changes underscores to spaces, but maybe we don't
566                 // need it anymore now that we index local user names without alphanumerics.
567                 for (j = 0; !IsEmptyStr(&this_recp[j]); ++j) {
568                         if (this_recp[j]=='_') {
569                                 this_recp_cooked[j] = ' ';
570                         }
571                         else {
572                                 this_recp_cooked[j] = this_recp[j];
573                         }
574                 }
575                 this_recp_cooked[j] = '\0';
576
577
578                 invalid = 0;
579                 errmsg[0] = 0;
580                 switch(mailtype) {
581                 case EA_LOCAL:
582                         if (!strcasecmp(this_recp, "sysop")) {
583                                 ++ret->num_room;
584                                 strcpy(this_recp, CtdlGetConfigStr("c_aideroom"));
585                                 if (!IsEmptyStr(ret->recp_room)) {
586                                         strcat(ret->recp_room, "|");
587                                 }
588                                 strcat(ret->recp_room, this_recp);
589                         }
590                         else if ( (!strncasecmp(this_recp, "room_", 5)) && (!CtdlGetRoom(&tempQR, &this_recp_cooked[5])) ) {
591
592                                 /* Save room so we can restore it later */
593                                 tempQR2 = CC->room;
594                                 CC->room = tempQR;
595                                         
596                                 /* Check permissions to send mail to this room */
597                                 err = CtdlDoIHavePermissionToPostInThisRoom(
598                                         errmsg, 
599                                         sizeof errmsg, 
600                                         RemoteIdentifier,
601                                         Flags,
602                                         0                       /* 0 = not a reply */
603                                 );
604                                 if (err) {
605                                         ++ret->num_error;
606                                         invalid = 1;
607                                 } 
608                                 else {
609                                         ++ret->num_room;
610                                         if (!IsEmptyStr(ret->recp_room)) {
611                                                 strcat(ret->recp_room, "|");
612                                         }
613                                         strcat(ret->recp_room, &this_recp_cooked[5]);
614
615                                         if (!IsEmptyStr(ret->recp_orgroom)) {
616                                                 strcat(ret->recp_orgroom, "|");
617                                         }
618                                         strcat(ret->recp_orgroom, org_recp);
619
620                                 }
621                                         
622                                 /* Restore room in case something needs it */
623                                 CC->room = tempQR2;
624
625                         }
626                         else if (CtdlGetUser(&tempUS, this_recp) == 0) {
627                                 ++ret->num_local;
628                                 strcpy(this_recp, tempUS.fullname);
629                                 if (!IsEmptyStr(ret->recp_local)) {
630                                         strcat(ret->recp_local, "|");
631                                 }
632                                 strcat(ret->recp_local, this_recp);
633                         }
634                         else if (CtdlGetUser(&tempUS, this_recp_cooked) == 0) {
635                                 ++ret->num_local;
636                                 strcpy(this_recp, tempUS.fullname);
637                                 if (!IsEmptyStr(ret->recp_local)) {
638                                         strcat(ret->recp_local, "|");
639                                 }
640                                 strcat(ret->recp_local, this_recp);
641                         }
642                         else {
643                                 ++ret->num_error;
644                                 invalid = 1;
645                         }
646                         break;
647                 case EA_INTERNET:
648                         /* Yes, you're reading this correctly: if the target
649                          * domain points back to the local system,
650                          * the address is invalid.  That's
651                          * because if the address were valid, we would have
652                          * already translated it to a local address by now.
653                          */
654                         if (IsDirectory(this_recp, 0)) {
655                                 ++ret->num_error;
656                                 invalid = 1;
657                         }
658                         else {
659                                 ++ret->num_internet;
660                                 if (!IsEmptyStr(ret->recp_internet)) {
661                                         strcat(ret->recp_internet, "|");
662                                 }
663                                 strcat(ret->recp_internet, this_recp);
664                         }
665                         break;
666                 case EA_ERROR:
667                         ++ret->num_error;
668                         invalid = 1;
669                         break;
670                 }
671                 if (invalid) {
672                         if (IsEmptyStr(errmsg)) {
673                                 snprintf(append, sizeof append, "Invalid recipient: %s", this_recp);
674                         }
675                         else {
676                                 snprintf(append, sizeof append, "%s", errmsg);
677                         }
678                         if ( (strlen(ret->errormsg) + strlen(append) + 3) < SIZ) {
679                                 if (!IsEmptyStr(ret->errormsg)) {
680                                         strcat(ret->errormsg, "; ");
681                                 }
682                                 strcat(ret->errormsg, append);
683                         }
684                 }
685                 else {
686                         if (IsEmptyStr(ret->display_recp)) {
687                                 strcpy(append, this_recp);
688                         }
689                         else {
690                                 snprintf(append, sizeof append, ", %s", this_recp);
691                         }
692                         if ( (strlen(ret->display_recp)+strlen(append)) < SIZ) {
693                                 strcat(ret->display_recp, append);
694                         }
695                 }
696         }
697         free(org_recp);
698
699         if ( (ret->num_local + ret->num_internet + ret->num_room + ret->num_error) == 0) {
700                 ret->num_error = (-1);
701                 strcpy(ret->errormsg, "No recipients specified.");
702         }
703
704         syslog(LOG_DEBUG, "internet_addressing: validate_recipients() = %d local, %d room, %d SMTP, %d error",
705                 ret->num_local, ret->num_room, ret->num_internet, ret->num_error
706         );
707
708         free(recipients);
709         array_free(recp_array);
710
711         return(ret);
712 }
713
714
715 /*
716  * Destructor for recptypes
717  */
718 void free_recipients(struct recptypes *valid) {
719
720         if (valid == NULL) {
721                 return;
722         }
723
724         if (valid->recptypes_magic != RECPTYPES_MAGIC) {
725                 syslog(LOG_ERR, "internet_addressing: attempt to call free_recipients() on some other data type!");
726                 abort();
727         }
728
729         if (valid->errormsg != NULL)            free(valid->errormsg);
730         if (valid->recp_local != NULL)          free(valid->recp_local);
731         if (valid->recp_internet != NULL)       free(valid->recp_internet);
732         if (valid->recp_room != NULL)           free(valid->recp_room);
733         if (valid->recp_orgroom != NULL)        free(valid->recp_orgroom);
734         if (valid->display_recp != NULL)        free(valid->display_recp);
735         if (valid->bounce_to != NULL)           free(valid->bounce_to);
736         if (valid->envelope_from != NULL)       free(valid->envelope_from);
737         if (valid->sending_room != NULL)        free(valid->sending_room);
738         free(valid);
739 }
740
741
742 char *qp_encode_email_addrs(char *source) {
743         char *user, *node, *name;
744         const char headerStr[] = "=?UTF-8?Q?";
745         char *Encoded;
746         char *EncodedName;
747         char *nPtr;
748         int need_to_encode = 0;
749         long SourceLen;
750         long EncodedMaxLen;
751         long nColons = 0;
752         long *AddrPtr;
753         long *AddrUtf8;
754         long nAddrPtrMax = 50;
755         long nmax;
756         int InQuotes = 0;
757         int i, n;
758
759         if (source == NULL) return source;
760         if (IsEmptyStr(source)) return source;
761         syslog(LOG_DEBUG, "internet_addressing: qp_encode_email_addrs <%s>", source);
762
763         AddrPtr = malloc (sizeof (long) * nAddrPtrMax);
764         AddrUtf8 = malloc (sizeof (long) * nAddrPtrMax);
765         memset(AddrUtf8, 0, sizeof (long) * nAddrPtrMax);
766         *AddrPtr = 0;
767         i = 0;
768         while (!IsEmptyStr (&source[i])) {
769                 if (nColons >= nAddrPtrMax){
770                         long *ptr;
771
772                         ptr = (long *) malloc(sizeof (long) * nAddrPtrMax * 2);
773                         memcpy (ptr, AddrPtr, sizeof (long) * nAddrPtrMax);
774                         free (AddrPtr), AddrPtr = ptr;
775
776                         ptr = (long *) malloc(sizeof (long) * nAddrPtrMax * 2);
777                         memset(&ptr[nAddrPtrMax], 0, sizeof (long) * nAddrPtrMax);
778
779                         memcpy (ptr, AddrUtf8, sizeof (long) * nAddrPtrMax);
780                         free (AddrUtf8), AddrUtf8 = ptr;
781                         nAddrPtrMax *= 2;                               
782                 }
783                 if (((unsigned char) source[i] < 32) || ((unsigned char) source[i] > 126)) {
784                         need_to_encode = 1;
785                         AddrUtf8[nColons] = 1;
786                 }
787                 if (source[i] == '"') {
788                         InQuotes = !InQuotes;
789                 }
790                 if (!InQuotes && source[i] == ',') {
791                         AddrPtr[nColons] = i;
792                         nColons++;
793                 }
794                 i++;
795         }
796         if (need_to_encode == 0) {
797                 free(AddrPtr);
798                 free(AddrUtf8);
799                 return source;
800         }
801
802         SourceLen = i;
803         EncodedMaxLen = nColons * (sizeof(headerStr) + 3) + SourceLen * 3;
804         Encoded = (char*) malloc (EncodedMaxLen);
805
806         for (i = 0; i < nColons; i++) {
807                 source[AddrPtr[i]++] = '\0';
808         }
809         /* TODO: if libidn, this might get larger*/
810         user = malloc(SourceLen + 1);
811         node = malloc(SourceLen + 1);
812         name = malloc(SourceLen + 1);
813
814         nPtr = Encoded;
815         *nPtr = '\0';
816         for (i = 0; i < nColons && nPtr != NULL; i++) {
817                 nmax = EncodedMaxLen - (nPtr - Encoded);
818                 if (AddrUtf8[i]) {
819                         process_rfc822_addr(&source[AddrPtr[i]], user, node, name);
820                         /* TODO: libIDN here ! */
821                         if (IsEmptyStr(name)) {
822                                 n = snprintf(nPtr, nmax, (i==0)?"%s@%s" : ",%s@%s", user, node);
823                         }
824                         else {
825                                 EncodedName = rfc2047encode(name, strlen(name));                        
826                                 n = snprintf(nPtr, nmax, (i==0)?"%s <%s@%s>" : ",%s <%s@%s>", EncodedName, user, node);
827                                 free(EncodedName);
828                         }
829                 }
830                 else { 
831                         n = snprintf(nPtr, nmax, (i==0)?"%s" : ",%s", &source[AddrPtr[i]]);
832                 }
833                 if (n > 0 )
834                         nPtr += n;
835                 else { 
836                         char *ptr, *nnPtr;
837                         ptr = (char*) malloc(EncodedMaxLen * 2);
838                         memcpy(ptr, Encoded, EncodedMaxLen);
839                         nnPtr = ptr + (nPtr - Encoded), nPtr = nnPtr;
840                         free(Encoded), Encoded = ptr;
841                         EncodedMaxLen *= 2;
842                         i--; /* do it once more with properly lengthened buffer */
843                 }
844         }
845         for (i = 0; i < nColons; i++)
846                 source[--AddrPtr[i]] = ',';
847
848         free(user);
849         free(node);
850         free(name);
851         free(AddrUtf8);
852         free(AddrPtr);
853         return Encoded;
854 }
855
856
857 /*
858  * Unfold a multi-line field into a single line, removing multi-whitespaces
859  */
860 void unfold_rfc822_field(char **field, char **FieldEnd) 
861 {
862         int quote = 0;
863         char *pField = *field;
864         char *sField;
865         char *pFieldEnd = *FieldEnd;
866
867         while (isspace(*pField))
868                 pField++;
869         /* remove leading/trailing whitespace */
870         ;
871
872         while (isspace(*pFieldEnd))
873                 pFieldEnd --;
874
875         *FieldEnd = pFieldEnd;
876         /* convert non-space whitespace to spaces, and remove double blanks */
877         for (sField = *field = pField; 
878              sField < pFieldEnd; 
879              pField++, sField++)
880         {
881                 if ((*sField=='\r') || (*sField=='\n'))
882                 {
883                         int offset = 1;
884                         while ( ( (*(sField + offset) == '\r') || (*(sField + offset) == '\n' )) && (sField + offset < pFieldEnd) ) {
885                                 offset ++;
886                         }
887                         sField += offset;
888                         *pField = *sField;
889                 }
890                 else {
891                         if (*sField=='\"') quote = 1 - quote;
892                         if (!quote) {
893                                 if (isspace(*sField)) {
894                                         *pField = ' ';
895                                         pField++;
896                                         sField++;
897                                         
898                                         while ((sField < pFieldEnd) && 
899                                                isspace(*sField))
900                                                 sField++;
901                                         *pField = *sField;
902                                 }
903                                 else *pField = *sField;
904                         }
905                         else *pField = *sField;
906                 }
907         }
908         *pField = '\0';
909         *FieldEnd = pField - 1;
910 }
911
912
913 /*
914  * Split an RFC822-style address into userid, host, and full name
915  *
916  */
917 void process_rfc822_addr(const char *rfc822, char *user, char *node, char *name) {
918         int a;
919
920         strcpy(user, "");
921         strcpy(node, CtdlGetConfigStr("c_fqdn"));
922         strcpy(name, "");
923
924         if (rfc822 == NULL) return;
925
926         /* extract full name - first, it's From minus <userid> */
927         strcpy(name, rfc822);
928         stripout(name, '<', '>');
929
930         /* strip anything to the left of a bang */
931         while ((!IsEmptyStr(name)) && (haschar(name, '!') > 0))
932                 strcpy(name, &name[1]);
933
934         /* and anything to the right of a @ or % */
935         for (a = 0; name[a] != '\0'; ++a) {
936                 if (name[a] == '@') {
937                         name[a] = 0;
938                         break;
939                 }
940                 if (name[a] == '%') {
941                         name[a] = 0;
942                         break;
943                 }
944         }
945
946         /* but if there are parentheses, that changes the rules... */
947         if ((haschar(rfc822, '(') == 1) && (haschar(rfc822, ')') == 1)) {
948                 strcpy(name, rfc822);
949                 stripallbut(name, '(', ')');
950         }
951
952         /* but if there are a set of quotes, that supersedes everything */
953         if (haschar(rfc822, 34) == 2) {
954                 strcpy(name, rfc822);
955                 while ((!IsEmptyStr(name)) && (name[0] != 34)) {
956                         strcpy(&name[0], &name[1]);
957                 }
958                 strcpy(&name[0], &name[1]);
959                 for (a = 0; name[a] != '\0'; ++a)
960                         if (name[a] == 34) {
961                                 name[a] = 0;
962                                 break;
963                         }
964         }
965         /* extract user id */
966         strcpy(user, rfc822);
967
968         /* first get rid of anything in parens */
969         stripout(user, '(', ')');
970
971         /* if there's a set of angle brackets, strip it down to that */
972         if ((haschar(user, '<') == 1) && (haschar(user, '>') == 1)) {
973                 stripallbut(user, '<', '>');
974         }
975
976         /* strip anything to the left of a bang */
977         while ((!IsEmptyStr(user)) && (haschar(user, '!') > 0))
978                 strcpy(user, &user[1]);
979
980         /* and anything to the right of a @ or % */
981         for (a = 0; user[a] != '\0'; ++a) {
982                 if (user[a] == '@') {
983                         user[a] = 0;
984                         break;
985                 }
986                 if (user[a] == '%') {
987                         user[a] = 0;
988                         break;
989                 }
990         }
991
992
993         /* extract node name */
994         strcpy(node, rfc822);
995
996         /* first get rid of anything in parens */
997         stripout(node, '(', ')');
998
999         /* if there's a set of angle brackets, strip it down to that */
1000         if ((haschar(node, '<') == 1) && (haschar(node, '>') == 1)) {
1001                 stripallbut(node, '<', '>');
1002         }
1003
1004         /* If no node specified, tack ours on instead */
1005         if (
1006                 (haschar(node, '@')==0)
1007                 && (haschar(node, '%')==0)
1008                 && (haschar(node, '!')==0)
1009         ) {
1010                 strcpy(node, CtdlGetConfigStr("c_nodename"));
1011         }
1012         else {
1013
1014                 /* strip anything to the left of a @ */
1015                 while ((!IsEmptyStr(node)) && (haschar(node, '@') > 0))
1016                         strcpy(node, &node[1]);
1017         
1018                 /* strip anything to the left of a % */
1019                 while ((!IsEmptyStr(node)) && (haschar(node, '%') > 0))
1020                         strcpy(node, &node[1]);
1021         
1022                 /* reduce multiple system bang paths to node!user */
1023                 while ((!IsEmptyStr(node)) && (haschar(node, '!') > 1))
1024                         strcpy(node, &node[1]);
1025         
1026                 /* now get rid of the user portion of a node!user string */
1027                 for (a = 0; node[a] != '\0'; ++a)
1028                         if (node[a] == '!') {
1029                                 node[a] = 0;
1030                                 break;
1031                         }
1032         }
1033
1034         /* strip leading and trailing spaces in all strings */
1035         striplt(user);
1036         striplt(node);
1037         striplt(name);
1038
1039         /* If we processed a string that had the address in angle brackets
1040          * but no name outside the brackets, we now have an empty name.  In
1041          * this case, use the user portion of the address as the name.
1042          */
1043         if ((IsEmptyStr(name)) && (!IsEmptyStr(user))) {
1044                 strcpy(name, user);
1045         }
1046 }
1047
1048
1049 /*
1050  * convert_field() is a helper function for convert_internet_message().
1051  * Given start/end positions for an rfc822 field, it converts it to a Citadel
1052  * field if it wants to, and unfolds it if necessary.
1053  *
1054  * Returns 1 if the field was converted and inserted into the Citadel message
1055  * structure, implying that the source field should be removed from the
1056  * message text.
1057  */
1058 int convert_field(struct CtdlMessage *msg, const char *beg, const char *end) {
1059         char *key, *value, *valueend;
1060         long len;
1061         const char *pos;
1062         int i;
1063         const char *colonpos = NULL;
1064         int processed = 0;
1065         char user[1024];
1066         char node[1024];
1067         char name[1024];
1068         char addr[1024];
1069         time_t parsed_date;
1070         long valuelen;
1071
1072         for (pos = end; pos >= beg; pos--) {
1073                 if (*pos == ':') colonpos = pos;
1074         }
1075
1076         if (colonpos == NULL) return(0);        /* no colon? not a valid header line */
1077
1078         len = end - beg;
1079         key = malloc(len + 2);
1080         memcpy(key, beg, len + 1);
1081         key[len] = '\0';
1082         valueend = key + len;
1083         * ( key + (colonpos - beg) ) = '\0';
1084         value = &key[(colonpos - beg) + 1];
1085 /*      printf("Header: [%s]\nValue: [%s]\n", key, value); */
1086         unfold_rfc822_field(&value, &valueend);
1087         valuelen = valueend - value + 1;
1088 /*      printf("UnfoldedValue: [%s]\n", value); */
1089
1090         /*
1091          * Here's the big rfc822-to-citadel loop.
1092          */
1093
1094         /* Date/time is converted into a unix timestamp.  If the conversion
1095          * fails, we replace it with the time the message arrived locally.
1096          */
1097         if (!strcasecmp(key, "Date")) {
1098                 parsed_date = parsedate(value);
1099                 if (parsed_date < 0L) parsed_date = time(NULL);
1100
1101                 if (CM_IsEmpty(msg, eTimestamp))
1102                         CM_SetFieldLONG(msg, eTimestamp, parsed_date);
1103                 processed = 1;
1104         }
1105
1106         else if (!strcasecmp(key, "From")) {
1107                 process_rfc822_addr(value, user, node, name);
1108                 syslog(LOG_DEBUG, "internet_addressing: converted to <%s@%s> (%s)", user, node, name);
1109                 snprintf(addr, sizeof(addr), "%s@%s", user, node);
1110                 if (CM_IsEmpty(msg, eAuthor) && !IsEmptyStr(name)) {
1111                         CM_SetField(msg, eAuthor, name, -1);
1112                 }
1113                 if (CM_IsEmpty(msg, erFc822Addr) && !IsEmptyStr(addr)) {
1114                         CM_SetField(msg, erFc822Addr, addr, -1);
1115                 }
1116                 processed = 1;
1117         }
1118
1119         else if (!strcasecmp(key, "Subject")) {
1120                 if (CM_IsEmpty(msg, eMsgSubject))
1121                         CM_SetField(msg, eMsgSubject, value, valuelen);
1122                 processed = 1;
1123         }
1124
1125         else if (!strcasecmp(key, "List-ID")) {
1126                 if (CM_IsEmpty(msg, eListID))
1127                         CM_SetField(msg, eListID, value, valuelen);
1128                 processed = 1;
1129         }
1130
1131         else if (!strcasecmp(key, "To")) {
1132                 if (CM_IsEmpty(msg, eRecipient))
1133                         CM_SetField(msg, eRecipient, value, valuelen);
1134                 processed = 1;
1135         }
1136
1137         else if (!strcasecmp(key, "CC")) {
1138                 if (CM_IsEmpty(msg, eCarbonCopY))
1139                         CM_SetField(msg, eCarbonCopY, value, valuelen);
1140                 processed = 1;
1141         }
1142
1143         else if (!strcasecmp(key, "Message-ID")) {
1144                 if (!CM_IsEmpty(msg, emessageId)) {
1145                         syslog(LOG_WARNING, "internet_addressing: duplicate message id");
1146                 }
1147                 else {
1148                         char *pValue;
1149                         long pValueLen;
1150
1151                         pValue = value;
1152                         pValueLen = valuelen;
1153                         /* Strip angle brackets */
1154                         while (haschar(pValue, '<') > 0) {
1155                                 pValue ++;
1156                                 pValueLen --;
1157                         }
1158
1159                         for (i = 0; i <= pValueLen; ++i)
1160                                 if (pValue[i] == '>') {
1161                                         pValueLen = i;
1162                                         break;
1163                                 }
1164
1165                         CM_SetField(msg, emessageId, pValue, pValueLen);
1166                 }
1167
1168                 processed = 1;
1169         }
1170
1171         else if (!strcasecmp(key, "Return-Path")) {
1172                 if (CM_IsEmpty(msg, eMessagePath))
1173                         CM_SetField(msg, eMessagePath, value, valuelen);
1174                 processed = 1;
1175         }
1176
1177         else if (!strcasecmp(key, "Envelope-To")) {
1178                 if (CM_IsEmpty(msg, eenVelopeTo))
1179                         CM_SetField(msg, eenVelopeTo, value, valuelen);
1180                 processed = 1;
1181         }
1182
1183         else if (!strcasecmp(key, "References")) {
1184                 CM_SetField(msg, eWeferences, value, valuelen);
1185                 processed = 1;
1186         }
1187
1188         else if (!strcasecmp(key, "Reply-To")) {
1189                 CM_SetField(msg, eReplyTo, value, valuelen);
1190                 processed = 1;
1191         }
1192
1193         else if (!strcasecmp(key, "In-reply-to")) {
1194                 if (CM_IsEmpty(msg, eWeferences)) /* References: supersedes In-reply-to: */
1195                         CM_SetField(msg, eWeferences, value, valuelen);
1196                 processed = 1;
1197         }
1198
1199
1200
1201         /* Clean up and move on. */
1202         free(key);      /* Don't free 'value', it's actually the same buffer */
1203         return processed;
1204 }
1205
1206
1207 /*
1208  * Convert RFC822 references format (References) to Citadel references format (Weferences)
1209  */
1210 void convert_references_to_wefewences(char *str) {
1211         int bracket_nesting = 0;
1212         char *ptr = str;
1213         char *moveptr = NULL;
1214         char ch;
1215
1216         while(*ptr) {
1217                 ch = *ptr;
1218                 if (ch == '>') {
1219                         --bracket_nesting;
1220                         if (bracket_nesting < 0) bracket_nesting = 0;
1221                 }
1222                 if ((ch == '>') && (bracket_nesting == 0) && (*(ptr+1)) && (ptr>str) ) {
1223                         *ptr = '|';
1224                         ++ptr;
1225                 }
1226                 else if (bracket_nesting > 0) {
1227                         ++ptr;
1228                 }
1229                 else {
1230                         moveptr = ptr;
1231                         while (*moveptr) {
1232                                 *moveptr = *(moveptr+1);
1233                                 ++moveptr;
1234                         }
1235                 }
1236                 if (ch == '<') ++bracket_nesting;
1237         }
1238
1239 }
1240
1241
1242 /*
1243  * Convert an RFC822 message (headers + body) to a CtdlMessage structure.
1244  * NOTE: the supplied buffer becomes part of the CtdlMessage structure, and
1245  * will be deallocated when CM_Free() is called.  Therefore, the
1246  * supplied buffer should be DEREFERENCED.  It should not be freed or used
1247  * again.
1248  */
1249 struct CtdlMessage *convert_internet_message(char *rfc822) {
1250         StrBuf *RFCBuf = NewStrBufPlain(rfc822, -1);
1251         free (rfc822);
1252         return convert_internet_message_buf(&RFCBuf);
1253 }
1254
1255
1256 struct CtdlMessage *convert_internet_message_buf(StrBuf **rfc822)
1257 {
1258         struct CtdlMessage *msg;
1259         const char *pos, *beg, *end, *totalend;
1260         int done, alldone = 0;
1261         int converted;
1262         StrBuf *OtherHeaders;
1263
1264         msg = malloc(sizeof(struct CtdlMessage));
1265         if (msg == NULL) return msg;
1266
1267         memset(msg, 0, sizeof(struct CtdlMessage));
1268         msg->cm_magic = CTDLMESSAGE_MAGIC;      /* self check */
1269         msg->cm_anon_type = 0;                  /* never anonymous */
1270         msg->cm_format_type = FMT_RFC822;       /* internet message */
1271
1272         pos = ChrPtr(*rfc822);
1273         totalend = pos + StrLength(*rfc822);
1274         done = 0;
1275         OtherHeaders = NewStrBufPlain(NULL, StrLength(*rfc822));
1276
1277         while (!alldone) {
1278
1279                 /* Locate beginning and end of field, keeping in mind that
1280                  * some fields might be multiline
1281                  */
1282                 end = beg = pos;
1283
1284                 while ((end < totalend) && 
1285                        (end == beg) && 
1286                        (done == 0) ) 
1287                 {
1288
1289                         if ( (*pos=='\n') && ((*(pos+1))!=0x20) && ((*(pos+1))!=0x09) )
1290                         {
1291                                 end = pos;
1292                         }
1293
1294                         /* done with headers? */
1295                         if ((*pos=='\n') &&
1296                             ( (*(pos+1)=='\n') ||
1297                               (*(pos+1)=='\r')) ) 
1298                         {
1299                                 alldone = 1;
1300                         }
1301
1302                         if (pos >= (totalend - 1) )
1303                         {
1304                                 end = pos;
1305                                 done = 1;
1306                         }
1307
1308                         ++pos;
1309
1310                 }
1311
1312                 /* At this point we have a field.  Are we interested in it? */
1313                 converted = convert_field(msg, beg, end);
1314
1315                 /* Strip the field out of the RFC822 header if we used it */
1316                 if (!converted) {
1317                         StrBufAppendBufPlain(OtherHeaders, beg, end - beg, 0);
1318                         StrBufAppendBufPlain(OtherHeaders, HKEY("\n"), 0);
1319                 }
1320
1321                 /* If we've hit the end of the message, bail out */
1322                 if (pos >= totalend)
1323                         alldone = 1;
1324         }
1325         StrBufAppendBufPlain(OtherHeaders, HKEY("\n"), 0);
1326         if (pos < totalend)
1327                 StrBufAppendBufPlain(OtherHeaders, pos, totalend - pos, 0);
1328         FreeStrBuf(rfc822);
1329         CM_SetAsFieldSB(msg, eMesageText, &OtherHeaders);
1330
1331         /* Follow-up sanity checks... */
1332
1333         /* If there's no timestamp on this message, set it to now. */
1334         if (CM_IsEmpty(msg, eTimestamp)) {
1335                 CM_SetFieldLONG(msg, eTimestamp, time(NULL));
1336         }
1337
1338         /* If a W (references, or rather, Wefewences) field is present, we
1339          * have to convert it from RFC822 format to Citadel format.
1340          */
1341         if (!CM_IsEmpty(msg, eWeferences)) {
1342                 /// todo: API!
1343                 convert_references_to_wefewences(msg->cm_fields[eWeferences]);
1344         }
1345
1346         return msg;
1347 }
1348
1349
1350 /*
1351  * Look for a particular header field in an RFC822 message text.  If the
1352  * requested field is found, it is unfolded (if necessary) and returned to
1353  * the caller.  The field name is stripped out, leaving only its contents.
1354  * The caller is responsible for freeing the returned buffer.  If the requested
1355  * field is not present, or anything else goes wrong, it returns NULL.
1356  */
1357 char *rfc822_fetch_field(const char *rfc822, const char *fieldname) {
1358         char *fieldbuf = NULL;
1359         const char *end_of_headers;
1360         const char *field_start;
1361         const char *ptr;
1362         char *cont;
1363         char fieldhdr[SIZ];
1364
1365         /* Should never happen, but sometimes we get stupid */
1366         if (rfc822 == NULL) return(NULL);
1367         if (fieldname == NULL) return(NULL);
1368
1369         snprintf(fieldhdr, sizeof fieldhdr, "%s:", fieldname);
1370
1371         /* Locate the end of the headers, so we don't run past that point */
1372         end_of_headers = cbmstrcasestr(rfc822, "\n\r\n");
1373         if (end_of_headers == NULL) {
1374                 end_of_headers = cbmstrcasestr(rfc822, "\n\n");
1375         }
1376         if (end_of_headers == NULL) return (NULL);
1377
1378         field_start = cbmstrcasestr(rfc822, fieldhdr);
1379         if (field_start == NULL) return(NULL);
1380         if (field_start > end_of_headers) return(NULL);
1381
1382         fieldbuf = malloc(SIZ);
1383         strcpy(fieldbuf, "");
1384
1385         ptr = field_start;
1386         ptr = cmemreadline(ptr, fieldbuf, SIZ-strlen(fieldbuf) );
1387         while ( (isspace(ptr[0])) && (ptr < end_of_headers) ) {
1388                 strcat(fieldbuf, " ");
1389                 cont = &fieldbuf[strlen(fieldbuf)];
1390                 ptr = cmemreadline(ptr, cont, SIZ-strlen(fieldbuf) );
1391                 striplt(cont);
1392         }
1393
1394         strcpy(fieldbuf, &fieldbuf[strlen(fieldhdr)]);
1395         striplt(fieldbuf);
1396
1397         return(fieldbuf);
1398 }
1399
1400
1401 /*****************************************************************************
1402  *                      DIRECTORY MANAGEMENT FUNCTIONS                       *
1403  *****************************************************************************/
1404
1405 /*
1406  * Generate the index key for an Internet e-mail address to be looked up
1407  * in the database.
1408  */
1409 void directory_key(char *key, char *addr) {
1410         int i;
1411         int keylen = 0;
1412
1413         for (i=0; !IsEmptyStr(&addr[i]); ++i) {
1414                 if (!isspace(addr[i])) {
1415                         key[keylen++] = tolower(addr[i]);
1416                 }
1417         }
1418         key[keylen++] = 0;
1419
1420         syslog(LOG_DEBUG, "internet_addressing: directory key is <%s>", key);
1421 }
1422
1423
1424 /*
1425  * Return nonzero if the supplied address is in one of "our" domains
1426  */
1427 int IsDirectory(char *addr, int allow_masq_domains) {
1428         char domain[256];
1429         int h;
1430
1431         extract_token(domain, addr, 1, '@', sizeof domain);
1432         striplt(domain);
1433
1434         h = CtdlHostAlias(domain);
1435
1436         if ( (h == hostalias_masq) && allow_masq_domains)
1437                 return(1);
1438         
1439         if (h == hostalias_localhost) {
1440                 return(1);
1441         }
1442         else {
1443                 return(0);
1444         }
1445 }
1446
1447
1448 /*
1449  * Add an Internet e-mail address to the directory for a user
1450  */
1451 int CtdlDirectoryAddUser(char *internet_addr, char *citadel_addr) {
1452         char key[SIZ];
1453
1454         if (IsDirectory(internet_addr, 0) == 0) {
1455                 return 0;
1456         }
1457         syslog(LOG_DEBUG, "internet_addressing: create directory entry: %s --> %s", internet_addr, citadel_addr);
1458         directory_key(key, internet_addr);
1459         cdb_store(CDB_DIRECTORY, key, strlen(key), citadel_addr, strlen(citadel_addr)+1 );
1460         return 1;
1461 }
1462
1463
1464 /*
1465  * Delete an Internet e-mail address from the directory.
1466  *
1467  * (NOTE: we don't actually use or need the citadel_addr variable; it's merely
1468  * here because the callback API expects to be able to send it.)
1469  */
1470 int CtdlDirectoryDelUser(char *internet_addr, char *citadel_addr) {
1471         char key[SIZ];
1472         
1473         syslog(LOG_DEBUG, "internet_addressing: delete directory entry: %s --> %s", internet_addr, citadel_addr);
1474         directory_key(key, internet_addr);
1475         return cdb_delete(CDB_DIRECTORY, key, strlen(key) ) == 0;
1476 }
1477
1478
1479 /*
1480  * Look up an Internet e-mail address in the directory.
1481  * On success: returns 0, and Citadel address stored in 'target'
1482  * On failure: returns nonzero
1483  */
1484 int CtdlDirectoryLookup(char *target, char *internet_addr, size_t targbuflen) {
1485         struct cdbdata *cdbrec;
1486         char key[SIZ];
1487
1488         /* Dump it in there unchanged, just for kicks */
1489         if (target != NULL) {
1490                 safestrncpy(target, internet_addr, targbuflen);
1491         }
1492
1493         /* Only do lookups for addresses with hostnames in them */
1494         if (num_tokens(internet_addr, '@') != 2) return(-1);
1495
1496         /* Only do lookups for domains in the directory */
1497         if (IsDirectory(internet_addr, 0) == 0) return(-1);
1498
1499         directory_key(key, internet_addr);
1500         cdbrec = cdb_fetch(CDB_DIRECTORY, key, strlen(key) );
1501         if (cdbrec != NULL) {
1502                 if (target != NULL) {
1503                         safestrncpy(target, cdbrec->ptr, targbuflen);
1504                 }
1505                 cdb_free(cdbrec);
1506                 return(0);
1507         }
1508
1509         return(-1);
1510 }
1511
1512
1513 /*
1514  * Harvest any email addresses that someone might want to have in their
1515  * "collected addresses" book.
1516  */
1517 char *harvest_collected_addresses(struct CtdlMessage *msg) {
1518         char *coll = NULL;
1519         char addr[256];
1520         char user[256], node[256], name[256];
1521         int is_harvestable;
1522         int i, j, h;
1523         eMsgField field = 0;
1524
1525         if (msg == NULL) return(NULL);
1526
1527         is_harvestable = 1;
1528         strcpy(addr, "");       
1529         if (!CM_IsEmpty(msg, eAuthor)) {
1530                 strcat(addr, msg->cm_fields[eAuthor]);
1531         }
1532         if (!CM_IsEmpty(msg, erFc822Addr)) {
1533                 strcat(addr, " <");
1534                 strcat(addr, msg->cm_fields[erFc822Addr]);
1535                 strcat(addr, ">");
1536                 if (IsDirectory(msg->cm_fields[erFc822Addr], 0)) {
1537                         is_harvestable = 0;
1538                 }
1539         }
1540
1541         if (is_harvestable) {
1542                 coll = strdup(addr);
1543         }
1544         else {
1545                 coll = strdup("");
1546         }
1547
1548         if (coll == NULL) return(NULL);
1549
1550         /* Scan both the R (To) and Y (CC) fields */
1551         for (i = 0; i < 2; ++i) {
1552                 if (i == 0) field = eRecipient;
1553                 if (i == 1) field = eCarbonCopY;
1554
1555                 if (!CM_IsEmpty(msg, field)) {
1556                         for (j=0; j<num_tokens(msg->cm_fields[field], ','); ++j) {
1557                                 extract_token(addr, msg->cm_fields[field], j, ',', sizeof addr);
1558                                 if (strstr(addr, "=?") != NULL)
1559                                         utf8ify_rfc822_string(addr);
1560                                 process_rfc822_addr(addr, user, node, name);
1561                                 h = CtdlHostAlias(node);
1562                                 if (h != hostalias_localhost) {
1563                                         coll = realloc(coll, strlen(coll) + strlen(addr) + 4);
1564                                         if (coll == NULL) return(NULL);
1565                                         if (!IsEmptyStr(coll)) {
1566                                                 strcat(coll, ",");
1567                                         }
1568                                         striplt(addr);
1569                                         strcat(coll, addr);
1570                                 }
1571                         }
1572                 }
1573         }
1574
1575         if (IsEmptyStr(coll)) {
1576                 free(coll);
1577                 return(NULL);
1578         }
1579         return(coll);
1580 }
1581
1582
1583 /*
1584  * Helper function for CtdlRebuildDirectoryIndex()
1585  */
1586 void CtdlRebuildDirectoryIndex_backend(char *username, void *data) {
1587
1588         int j = 0;
1589         struct ctdluser usbuf;
1590
1591         if (CtdlGetUser(&usbuf, username) != 0) {
1592                 return;
1593         }
1594
1595         if ( (!IsEmptyStr(usbuf.fullname)) && (!IsEmptyStr(usbuf.emailaddrs)) ) {
1596                 for (j=0; j<num_tokens(usbuf.emailaddrs, '|'); ++j) {
1597                         char one_email[512];
1598                         extract_token(one_email, usbuf.emailaddrs, j, '|', sizeof one_email);
1599                         CtdlDirectoryAddUser(one_email, usbuf.fullname);
1600                 }
1601         }
1602 }
1603
1604
1605 /*
1606  * Initialize the directory database (erasing anything already there)
1607  */
1608 void CtdlRebuildDirectoryIndex(void) {
1609         syslog(LOG_INFO, "internet_addressing: rebuilding email address directory index");
1610         cdb_trunc(CDB_DIRECTORY);
1611         ForEachUser(CtdlRebuildDirectoryIndex_backend, NULL);
1612 }
1613
1614
1615 /*
1616  * Configure Internet email addresses for a user account, updating the Directory Index in the process
1617  */
1618 void CtdlSetEmailAddressesForUser(char *requested_user, char *new_emailaddrs)
1619 {
1620         struct ctdluser usbuf;
1621         int i;
1622         char buf[SIZ];
1623
1624         if (CtdlGetUserLock(&usbuf, requested_user) != 0) {     // We are relying on the fact that the DirectoryIndex functions don't lock.
1625                 return;                                         // Silently fail here if we can't acquire a lock on the user record.
1626         }
1627
1628         syslog(LOG_DEBUG, "internet_addressing: setting email addresses for <%s> to <%s>", usbuf.fullname, new_emailaddrs);
1629
1630         /* Delete all of the existing directory index records for the user (easier this way) */
1631         for (i=0; i<num_tokens(usbuf.emailaddrs, '|'); ++i) {
1632                 extract_token(buf, usbuf.emailaddrs, i, '|', sizeof buf);
1633                 CtdlDirectoryDelUser(buf, requested_user);
1634         }
1635
1636         strcpy(usbuf.emailaddrs, new_emailaddrs);               // make it official.
1637
1638         /* Index all of the new email addresses (they've already been sanitized) */
1639         for (i=0; i<num_tokens(usbuf.emailaddrs, '|'); ++i) {
1640                 extract_token(buf, usbuf.emailaddrs, i, '|', sizeof buf);
1641                 CtdlDirectoryAddUser(buf, requested_user);
1642         }
1643
1644         CtdlPutUserLock(&usbuf);
1645 }
1646
1647
1648 /*
1649  * Auto-generate an Internet email address for a user account
1650  */
1651 void AutoGenerateEmailAddressForUser(struct ctdluser *user)
1652 {
1653         char synthetic_email_addr[1024];
1654         int i, j;
1655         int u = 0;
1656
1657         for (i=0; u==0; ++i) {
1658                 if (i == 0) {
1659                         // first try just converting the user name to lowercase and replacing spaces with underscores
1660                         snprintf(synthetic_email_addr, sizeof synthetic_email_addr, "%s@%s", user->fullname, CtdlGetConfigStr("c_fqdn"));
1661                         for (j=0; ((synthetic_email_addr[j] != '\0')&&(synthetic_email_addr[j] != '@')); j++) {
1662                                 synthetic_email_addr[j] = tolower(synthetic_email_addr[j]);
1663                                 if (!isalnum(synthetic_email_addr[j])) {
1664                                         synthetic_email_addr[j] = '_';
1665                                 }
1666                         }
1667                 }
1668                 else if (i == 1) {
1669                         // then try 'ctdl' followed by the user number
1670                         snprintf(synthetic_email_addr, sizeof synthetic_email_addr, "ctdl%08lx@%s", user->usernum, CtdlGetConfigStr("c_fqdn"));
1671                 }
1672                 else if (i > 1) {
1673                         // oof.  just keep trying other numbers until we find one
1674                         snprintf(synthetic_email_addr, sizeof synthetic_email_addr, "ctdl%08x@%s", i, CtdlGetConfigStr("c_fqdn"));
1675                 }
1676                 u = CtdlDirectoryLookup(NULL, synthetic_email_addr, 0);
1677                 syslog(LOG_DEBUG, "user_ops: address <%s> lookup returned <%d>", synthetic_email_addr, u);
1678         }
1679
1680         CtdlSetEmailAddressesForUser(user->fullname, synthetic_email_addr);
1681         strncpy(CC->user.emailaddrs, synthetic_email_addr, sizeof(user->emailaddrs));
1682         syslog(LOG_DEBUG, "user_ops: auto-generated email address <%s> for <%s>", synthetic_email_addr, user->fullname);
1683 }