* Moved memreadline() to tools.c
[citadel.git] / citadel / internet_addressing.c
1 /*
2  * $Id$
3  *
4  * This file contains functions which handle the mapping of Internet addresses
5  * to users on the Citadel system.
6  */
7
8 #include "sysdep.h"
9 #include <stdlib.h>
10 #include <unistd.h>
11 #include <stdio.h>
12 #include <fcntl.h>
13 #include <ctype.h>
14 #include <signal.h>
15 #include <pwd.h>
16 #include <errno.h>
17 #include <sys/types.h>
18 #include <sys/time.h>
19 #include <sys/wait.h>
20 #include <string.h>
21 #include <limits.h>
22 #include "citadel.h"
23 #include "server.h"
24 #include <time.h>
25 #include "sysdep_decls.h"
26 #include "citserver.h"
27 #include "support.h"
28 #include "config.h"
29 #include "tools.h"
30 #include "msgbase.h"
31 #include "internet_addressing.h"
32 #include "user_ops.h"
33 #include "room_ops.h"
34 #include "parsedate.h"
35
36
37 struct trynamebuf {
38         char buffer1[SIZ];
39         char buffer2[SIZ];
40 };
41
42 char *inetcfg = NULL;
43
44
45
46 /*
47  * Return nonzero if the supplied name is an alias for this host.
48  */
49 int CtdlHostAlias(char *fqdn) {
50         int config_lines;
51         int i;
52         char buf[SIZ];
53         char host[SIZ], type[SIZ];
54
55         if (!strcasecmp(fqdn, config.c_fqdn)) return(hostalias_localhost);
56         if (!strcasecmp(fqdn, config.c_nodename)) return(hostalias_localhost);
57         if (inetcfg == NULL) return(hostalias_nomatch);
58
59         config_lines = num_tokens(inetcfg, '\n');
60         for (i=0; i<config_lines; ++i) {
61                 extract_token(buf, inetcfg, i, '\n');
62                 extract_token(host, buf, 0, '|');
63                 extract_token(type, buf, 1, '|');
64
65                 if ( (!strcasecmp(type, "localhost"))
66                    && (!strcasecmp(fqdn, host)))
67                         return(hostalias_localhost);
68
69                 if ( (!strcasecmp(type, "gatewaydomain"))
70                    && (!strcasecmp(&fqdn[strlen(fqdn)-strlen(host)], host)))
71                         return(hostalias_gatewaydomain);
72
73         }
74
75         return(hostalias_nomatch);
76 }
77
78
79
80
81
82
83
84 /*
85  * Return 0 if a given string fuzzy-matches a Citadel user account
86  *
87  * FIXME ... this needs to be updated to handle aliases.
88  */
89 int fuzzy_match(struct usersupp *us, char *matchstring) {
90         int a;
91
92         if ( (!strncasecmp(matchstring, "cit", 3)) 
93            && (atol(&matchstring[3]) == us->usernum)) {
94                 return 0;
95         }
96
97
98         for (a=0; a<strlen(us->fullname); ++a) {
99                 if (!strncasecmp(&us->fullname[a],
100                    matchstring, strlen(matchstring))) {
101                         return 0;
102                 }
103         }
104         return -1;
105 }
106
107
108 /*
109  * Unfold a multi-line field into a single line, removing multi-whitespaces
110  */
111 void unfold_rfc822_field(char *field) {
112         int i;
113         int quote = 0;
114
115         striplt(field);         /* remove leading/trailing whitespace */
116
117         /* convert non-space whitespace to spaces, and remove double blanks */
118         for (i=0; i<strlen(field); ++i) {
119                 if (field[i]=='\"') quote = 1 - quote;
120                 if (!quote) {
121                         if (isspace(field[i])) field[i] = ' ';
122                         while (isspace(field[i]) && isspace(field[i+1])) {
123                                 strcpy(&field[i+1], &field[i+2]);
124                         }
125                 }
126         }
127 }
128
129
130
131 /*
132  * Split an RFC822-style address into userid, host, and full name
133  *
134  */
135 void process_rfc822_addr(char *rfc822, char *user, char *node, char *name)
136 {
137         int a;
138
139         strcpy(user, "");
140         strcpy(node, config.c_fqdn);
141         strcpy(name, "");
142
143         /* extract full name - first, it's From minus <userid> */
144         strcpy(name, rfc822);
145         for (a = 0; a < strlen(name); ++a) {
146                 if (name[a] == '<') {
147                         do {
148                                 strcpy(&name[a], &name[a + 1]);
149                         } while ((strlen(name) > 0) && (name[a] != '>'));
150                         strcpy(&name[a], &name[a + 1]);
151                 }
152         }
153         /* strip anything to the left of a bang */
154         while ((strlen(name) > 0) && (haschar(name, '!') > 0))
155                 strcpy(name, &name[1]);
156
157         /* and anything to the right of a @ or % */
158         for (a = 0; a < strlen(name); ++a) {
159                 if (name[a] == '@')
160                         name[a] = 0;
161                 if (name[a] == '%')
162                         name[a] = 0;
163         }
164
165         /* but if there are parentheses, that changes the rules... */
166         if ((haschar(rfc822, '(') == 1) && (haschar(rfc822, ')') == 1)) {
167                 strcpy(name, rfc822);
168                 while ((strlen(name) > 0) && (name[0] != '(')) {
169                         strcpy(&name[0], &name[1]);
170                 }
171                 strcpy(&name[0], &name[1]);
172                 for (a = 0; a < strlen(name); ++a) {
173                         if (name[a] == ')') {
174                                 name[a] = 0;
175                         }
176                 }
177         }
178         /* but if there are a set of quotes, that supersedes everything */
179         if (haschar(rfc822, 34) == 2) {
180                 strcpy(name, rfc822);
181                 while ((strlen(name) > 0) && (name[0] != 34)) {
182                         strcpy(&name[0], &name[1]);
183                 }
184                 strcpy(&name[0], &name[1]);
185                 for (a = 0; a < strlen(name); ++a)
186                         if (name[a] == 34)
187                                 name[a] = 0;
188         }
189         /* extract user id */
190         strcpy(user, rfc822);
191
192         /* first get rid of anything in parens */
193         for (a = 0; a < strlen(user); ++a)
194                 if (user[a] == '(') {
195                         do {
196                                 strcpy(&user[a], &user[a + 1]);
197                         } while ((strlen(user) > 0) && (user[a] != ')'));
198                         strcpy(&user[a], &user[a + 1]);
199                 }
200         /* if there's a set of angle brackets, strip it down to that */
201         if ((haschar(user, '<') == 1) && (haschar(user, '>') == 1)) {
202                 while ((strlen(user) > 0) && (user[0] != '<')) {
203                         strcpy(&user[0], &user[1]);
204                 }
205                 strcpy(&user[0], &user[1]);
206                 for (a = 0; a < strlen(user); ++a)
207                         if (user[a] == '>')
208                                 user[a] = 0;
209         }
210         /* strip anything to the left of a bang */
211         while ((strlen(user) > 0) && (haschar(user, '!') > 0))
212                 strcpy(user, &user[1]);
213
214         /* and anything to the right of a @ or % */
215         for (a = 0; a < strlen(user); ++a) {
216                 if (user[a] == '@')
217                         user[a] = 0;
218                 if (user[a] == '%')
219                         user[a] = 0;
220         }
221
222
223         /* extract node name */
224         strcpy(node, rfc822);
225
226         /* first get rid of anything in parens */
227         for (a = 0; a < strlen(node); ++a)
228                 if (node[a] == '(') {
229                         do {
230                                 strcpy(&node[a], &node[a + 1]);
231                         } while ((strlen(node) > 0) && (node[a] != ')'));
232                         strcpy(&node[a], &node[a + 1]);
233                 }
234         /* if there's a set of angle brackets, strip it down to that */
235         if ((haschar(node, '<') == 1) && (haschar(node, '>') == 1)) {
236                 while ((strlen(node) > 0) && (node[0] != '<')) {
237                         strcpy(&node[0], &node[1]);
238                 }
239                 strcpy(&node[0], &node[1]);
240                 for (a = 0; a < strlen(node); ++a)
241                         if (node[a] == '>')
242                                 node[a] = 0;
243         }
244
245         /* If no node specified, tack ours on instead */
246         if (
247                 (haschar(node, '@')==0)
248                 && (haschar(node, '%')==0)
249                 && (haschar(node, '!')==0)
250         ) {
251                 strcpy(node, config.c_nodename);
252         }
253
254         else {
255
256                 /* strip anything to the left of a @ */
257                 while ((strlen(node) > 0) && (haschar(node, '@') > 0))
258                         strcpy(node, &node[1]);
259         
260                 /* strip anything to the left of a % */
261                 while ((strlen(node) > 0) && (haschar(node, '%') > 0))
262                         strcpy(node, &node[1]);
263         
264                 /* reduce multiple system bang paths to node!user */
265                 while ((strlen(node) > 0) && (haschar(node, '!') > 1))
266                         strcpy(node, &node[1]);
267         
268                 /* now get rid of the user portion of a node!user string */
269                 for (a = 0; a < strlen(node); ++a)
270                         if (node[a] == '!')
271                                 node[a] = 0;
272         }
273
274         /* strip leading and trailing spaces in all strings */
275         striplt(user);
276         striplt(node);
277         striplt(name);
278 }
279
280
281
282 /*
283  * Back end for convert_internet_address()
284  * (Compares an internet name [buffer1] and stores in [buffer2] if found)
285  */
286 void try_name(struct usersupp *us, void *data) {
287         struct trynamebuf *tnb;
288         tnb = (struct trynamebuf *)data;
289
290         if (!strncasecmp(tnb->buffer1, "cit", 3))
291                 if (atol(&tnb->buffer1[3]) == us->usernum)
292                         strcpy(tnb->buffer2, us->fullname);
293
294         if (!collapsed_strcmp(tnb->buffer1, us->fullname)) 
295                         strcpy(tnb->buffer2, us->fullname);
296
297         if (us->uid != BBSUID)
298                 if (!strcasecmp(tnb->buffer1, getpwuid(us->uid)->pw_name))
299                         strcpy(tnb->buffer2, us->fullname);
300 }
301
302
303 /*
304  * Convert an Internet email address to a Citadel user/host combination
305  */
306 int convert_internet_address(char *destuser, char *desthost, char *source)
307 {
308         char user[SIZ];
309         char node[SIZ];
310         char name[SIZ];
311         struct quickroom qrbuf;
312         int i;
313         int hostalias;
314         struct trynamebuf tnb;
315         char buf[SIZ];
316         int passes = 0;
317         char sourcealias[1024];
318
319         safestrncpy(sourcealias, source, sizeof(sourcealias) );
320         alias(sourcealias);
321
322 REALIAS:
323         /* Split it up */
324         process_rfc822_addr(sourcealias, user, node, name);
325         lprintf(9, "process_rfc822_addr() converted to <%s@%s> (%s)\n",
326                 user, node, name);
327
328         /* Map the FQDN to a Citadel node name
329          */
330         hostalias =  CtdlHostAlias(node);
331         switch(hostalias) {
332                 case hostalias_localhost:
333                         strcpy(node, config.c_nodename);
334                         break;
335
336                 case hostalias_gatewaydomain:
337                         extract_token(buf, node, 0, '.');
338                         safestrncpy(node, buf, sizeof buf);
339         }
340
341         /* Now try to resolve the name
342          * FIXME ... do the multiple-addresses thing
343          */
344         if (!strcasecmp(node, config.c_nodename)) {
345
346
347                 /* First, see if we hit an alias.  Don't do this more than
348                  * a few times, in case we accidentally hit an alias loop
349                  */
350                 strcpy(sourcealias, user);
351                 alias(user);
352                 if ( (strcasecmp(user, sourcealias)) && (++passes < 3) )
353                         goto REALIAS;
354
355                 /* Try all local rooms */
356                 if (!strncasecmp(user, "room_", 5)) {
357                         strcpy(name, &user[5]);
358                         for (i=0; i<strlen(name); ++i) 
359                                 if (name[i]=='_') name[i]=' ';
360                         if (getroom(&qrbuf, name) == 0) {
361                                 strcpy(destuser, qrbuf.QRname);
362                                 strcpy(desthost, config.c_nodename);
363                                 return rfc822_room_delivery;
364                         }
365                 }
366
367                 /* Try all local users */
368                 strcpy(destuser, user);
369                 strcpy(desthost, config.c_nodename);
370                 strcpy(tnb.buffer1, user);
371                 strcpy(tnb.buffer2, "");
372                 ForEachUser(try_name, &tnb);
373                 if (strlen(tnb.buffer2) == 0) return(rfc822_no_such_user);
374                 strcpy(destuser, tnb.buffer2);
375                 return(rfc822_address_locally_validated);
376         }
377
378         strcpy(destuser, user);
379         strcpy(desthost, node);
380         if (hostalias == hostalias_gatewaydomain)
381                 return(rfc822_address_on_citadel_network);
382         return(rfc822_address_nonlocal);
383 }
384
385
386
387
388 /*
389  * convert_field() is a helper function for convert_internet_message().
390  * Given start/end positions for an rfc822 field, it converts it to a Citadel
391  * field if it wants to, and unfolds it if necessary.
392  *
393  * Returns 1 if the field was converted and inserted into the Citadel message
394  * structure, implying that the source field should be removed from the
395  * message text.
396  */
397 int convert_field(struct CtdlMessage *msg, int beg, int end) {
398         char *rfc822;
399         char *key, *value;
400         int i;
401         int colonpos = (-1);
402         int processed = 0;
403         char buf[SIZ];
404         char user[1024];
405         char node[1024];
406         char name[1024];
407         char addr[1024];
408         time_t parsed_date;
409
410         rfc822 = msg->cm_fields['M'];   /* M field contains rfc822 text */
411         for (i = end; i >= beg; --i) {
412                 if (rfc822[i] == ':') colonpos = i;
413         }
414
415         if (colonpos < 0) return(0);    /* no colon? not a valid header line */
416
417         key = mallok((end - beg) + 2);
418         safestrncpy(key, &rfc822[beg], (end-beg)+1);
419         key[colonpos - beg] = 0;
420         value = &key[(colonpos - beg) + 1];
421         unfold_rfc822_field(value);
422
423         /*
424          * Here's the big rfc822-to-citadel loop.
425          */
426
427         /* Date/time is converted into a unix timestamp.  If the conversion
428          * fails, we replace it with the time the message arrived locally.
429          */
430         if (!strcasecmp(key, "Date")) {
431                 parsed_date = parsedate(value);
432                 if (parsed_date < 0L) parsed_date = time(NULL);
433                 snprintf(buf, sizeof buf, "%ld", parsed_date );
434                 if (msg->cm_fields['T'] == NULL)
435                         msg->cm_fields['T'] = strdoop(buf);
436                 processed = 1;
437         }
438
439         else if (!strcasecmp(key, "From")) {
440                 process_rfc822_addr(value, user, node, name);
441                 lprintf(9, "Converted to <%s@%s> (%s)\n", user, node, name);
442                 snprintf(addr, sizeof addr, "%s@%s", user, node);
443                 if (msg->cm_fields['A'] == NULL)
444                         msg->cm_fields['A'] = strdoop(name);
445                 processed = 1;
446                 if (msg->cm_fields['F'] == NULL)
447                         msg->cm_fields['F'] = strdoop(addr);
448                 processed = 1;
449         }
450
451         else if (!strcasecmp(key, "Subject")) {
452                 if (msg->cm_fields['U'] == NULL)
453                         msg->cm_fields['U'] = strdoop(value);
454                 processed = 1;
455         }
456
457         else if (!strcasecmp(key, "Message-ID")) {
458                 if (msg->cm_fields['I'] != NULL) {
459                         lprintf(5, "duplicate message id\n");
460                 }
461
462                 if (msg->cm_fields['I'] == NULL) {
463                         msg->cm_fields['I'] = strdoop(value);
464
465                         /* Strip angle brackets */
466                         while (haschar(msg->cm_fields['I'], '<') > 0) {
467                                 strcpy(&msg->cm_fields['I'][0],
468                                         &msg->cm_fields['I'][1]);
469                         }
470                         for (i = 0; i<strlen(msg->cm_fields['I']); ++i)
471                                 if (msg->cm_fields['I'][i] == '>')
472                                         msg->cm_fields['I'][i] = 0;
473                 }
474
475                 processed = 1;
476         }
477
478         /* Clean up and move on. */
479         phree(key);     /* Don't free 'value', it's actually the same buffer */
480         return(processed);
481 }
482
483
484 /*
485  * Convert an RFC822 message (headers + body) to a CtdlMessage structure.
486  * NOTE: the supplied buffer becomes part of the CtdlMessage structure, and
487  * will be deallocated when CtdlFreeMessage() is called.  Therefore, the
488  * supplied buffer should be DEREFERENCED.  It should not be freed or used
489  * again.
490  */
491 struct CtdlMessage *convert_internet_message(char *rfc822) {
492
493         struct CtdlMessage *msg;
494         int pos, beg, end, msglen;
495         int done;
496         char buf[SIZ];
497         int converted;
498
499         msg = mallok(sizeof(struct CtdlMessage));
500         if (msg == NULL) return msg;
501
502         memset(msg, 0, sizeof(struct CtdlMessage));
503         msg->cm_magic = CTDLMESSAGE_MAGIC;      /* self check */
504         msg->cm_anon_type = 0;                  /* never anonymous */
505         msg->cm_format_type = FMT_RFC822;       /* internet message */
506         msg->cm_fields['M'] = rfc822;
507
508         lprintf(9, "Unconverted RFC822 message length = %d\n", strlen(rfc822));
509         pos = 0;
510         done = 0;
511
512         while (!done) {
513
514                 /* Locate beginning and end of field, keeping in mind that
515                  * some fields might be multiline
516                  */
517                 beg = pos;
518                 end = (-1);
519
520                 msglen = strlen(rfc822);        
521                 while ( (end < 0) && (done == 0) ) {
522
523                         if ((rfc822[pos]=='\n')
524                            && (!isspace(rfc822[pos+1]))) {
525                                 end = pos;
526                         }
527
528                         /* done with headers? */
529                         if (   ((rfc822[pos]=='\n')
530                               ||(rfc822[pos]=='\r') )
531                            && ( (rfc822[pos+1]=='\n')
532                               ||(rfc822[pos+1]=='\r')) ) {
533                                 end = pos;
534                                 done = 1;
535                         }
536
537                         if (pos >= (msglen-1) ) {
538                                 end = pos;
539                                 done = 1;
540                         }
541
542                         ++pos;
543
544                 }
545
546                 /* At this point we have a field.  Are we interested in it? */
547                 converted = convert_field(msg, beg, end);
548
549                 /* Strip the field out of the RFC822 header if we used it */
550                 if (converted) {
551                         strcpy(&rfc822[beg], &rfc822[pos]);
552                         pos = beg;
553                 }
554
555                 /* If we've hit the end of the message, bail out */
556                 if (pos > strlen(rfc822)) done = 1;
557         }
558
559         /* Follow-up sanity checks... */
560
561         /* If there's no timestamp on this message, set it to now. */
562         if (msg->cm_fields['T'] == NULL) {
563                 snprintf(buf, sizeof buf, "%ld", time(NULL));
564                 msg->cm_fields['T'] = strdoop(buf);
565         }
566
567         lprintf(9, "RFC822 length remaining after conversion = %d\n",
568                 strlen(rfc822));
569         return msg;
570 }
571
572
573
574 /*
575  * Look for a particular header field in an RFC822 message text.  If the
576  * requested field is found, it is unfolded (if necessary) and returned to
577  * the caller.  The field name is stripped out, leaving only its contents.
578  * The caller is responsible for freeing the returned buffer.  If the requested
579  * field is not present, or anything else goes wrong, it returns NULL.
580  */
581 char *rfc822_fetch_field(char *rfc822, char *fieldname) {
582         int pos = 0;
583         int beg, end;
584         int done = 0;
585         int colonpos, i;
586         char *fieldbuf = NULL;
587
588         /* Should never happen, but sometimes we get stupid */
589         if (rfc822 == NULL) return(NULL);
590         if (fieldname == NULL) return(NULL);
591
592         while (!done) {
593
594                 /* Locate beginning and end of field, keeping in mind that
595                  * some fields might be multiline
596                  */
597                 beg = pos;
598                 end = (-1);
599                 for (pos=beg; ((pos<=strlen(rfc822))&&(end<0)); ++pos) {
600                         if ((rfc822[pos]=='\n')
601                            && (!isspace(rfc822[pos+1]))) {
602                                 end = pos;
603                         }
604                         if ( (rfc822[pos]=='\n')        /* done w. headers? */
605                            && ( (rfc822[pos+1]=='\n')
606                               ||(rfc822[pos+1]=='\r'))) {
607                                 end = pos;
608                                 done = 1;
609                         }
610
611                 }
612
613                 /* At this point we have a field.  Is it The One? */
614                 if (end > beg) {
615                         fieldbuf = mallok((end-beg)+3);
616                         if (fieldbuf == NULL) return(NULL);
617                         safestrncpy(fieldbuf, &rfc822[beg], (end-beg)+1);
618                         unfold_rfc822_field(fieldbuf);
619                         colonpos = (-1);
620                         for (i = strlen(fieldbuf); i >= 0; --i) {
621                                 if (fieldbuf[i] == ':') colonpos = i;
622                         }
623                         if (colonpos > 0) {
624                                 fieldbuf[colonpos] = 0;
625                                 if (!strcasecmp(fieldbuf, fieldname)) {
626                                         strcpy(fieldbuf, &fieldbuf[colonpos+1]);
627                                         striplt(fieldbuf);
628                                         return(fieldbuf);
629                                 }
630                         }
631                         phree(fieldbuf);
632                 }
633
634                 /* If we've hit the end of the message, bail out */
635                 if (pos > strlen(rfc822)) done = 1;
636         }
637         return(NULL);
638 }