1
  
2
  
3
  
4
  
5
  
6
  
7
  
8
  
9
  
10
  
11
  
12
  
13
  
14
  
15
  
16
  
17
  
18
  
19
  
20
  
21
  
22
  
23
  
24
  
25
  
26
  
27
  
28
  
29
  
30
  
31
  
32
  
33
  
34
  
35
  
36
  
37
  
38
  
39
  
40
  
41
  
42
  
43
  
44
  
45
  
46
  
47
  
48
  
49
  
50
  
51
  
52
  
53
  
54
  
55
  
56
  
57
  
58
  
59
  
60
  
61
  
62
  
63
  
64
  
65
  
66
  
67
  
68
  
69
  
70
  
71
  
72
  
73
  
74
  
75
  
76
  
77
  
78
  
79
  
80
  
81
  
82
  
83
  
84
  
85
  
86
  
87
  
88
  
89
  
90
  
91
  
92
  
93
  
94
  
95
  
96
  
97
  
98
  
99
  
100
  
101
  
102
  
103
  
104
  
105
  
106
  
107
  
108
  
109
  
110
  
111
  
112
  
113
  
114
  
115
  
116
  
117
  
118
  
119
  
120
  
121
  
122
  
123
  
124
  
125
  
126
  
127
  
128
  
129
  
130
  
131
  
132
  
133
  
134
  
135
  
136
  
137
  
138
  
139
  
#!/usr/local/bin/pike 
/* 
 * $Id: pikedoc2.pike,v 1.3 2000/10/08 18:16:35 grubba Exp $ 
 * 
 * Pike-doc extractor mk II 
 * 
 * Henrik Grubbström 1999-07-08 
 */ 
 
/* Load spider. */ 
#if constant(spider) 
#endif /* constant(spider) */ 
 
array(string) txt_to_wmml(array(string) lines) 
{ 
  array(string) res = allocate(sizeof(lines)+1, ""); 
 
  array(string) a = lines[0]/" "; 
 
  if (!(< "METHOD", "FUNCTION" >)[a[0]]) { 
    werror(sprintf("%O\n" 
                   "Not in txt format!\n", lines[0])); 
    return lines; 
  } 
 
  if (sizeof(a) < 2) { 
    werror(sprintf("%O\n" 
                   "Missing name\n", lines[0])); 
    return res; 
  } 
 
  string type = lower_case(a[0]); 
  string name = a[1]; 
 
  string title; 
 
  if (sizeof(a) > 2) { 
    title = a[2..]*" "; 
  } 
 
  if (title) { 
    res[0] = sprintf("<%s name=%O title=%O>", type, name, title); 
  } else { 
    res[0] = sprintf("<%s name=%O>", type, name); 
  } 
 
  res[-1] = sprintf("</%s>\n", type); 
 
  string current_container; 
  int i; 
  for (i=1; i < sizeof(lines); i++) { 
    if ((lines[i] != "") && (lines[i] == upper_case(lines[i]))) { 
      if (current_container) { 
        res[i-1] += sprintf("\n</man_%s>", current_container); 
      } 
      res[i] = sprintf("<man_%s>", current_container = lower_case(lines[i])); 
    } else { 
      if ((lines[i] != "") && (lines[i][0] == '\t')) { 
        // Remove initial tab. 
        res[i] = lines[i][1..]; 
      } else { 
        res[i] = lines[i]; 
      } 
    } 
  } 
 
  if (current_container) { 
    if (res[-2] == "") { 
      res[-2] = sprintf("</man_%s>", current_container); 
    } else { 
      res[-2] += sprintf("\n</man_%s>", current_container); 
    } 
  } 
 
  return res; 
} 
 
string _extract_pikedoc(string tag, mapping attrs, string contents, 
                        mapping res) 
{ 
  /* NOTE: Drop the first line. */ 
  array(string) s = (contents/"\n")[1..]; 
  int i; 
 
  for(i=0; i < sizeof(s); i++) { 
    int j = search(s[i], "*:"); 
 
    if (j >= 0) { 
      s[i] = s[i][j+2..]; 
      if (sizeof(s[i]) && (s[i][0] == ' ')) { 
        s[i] = s[i][1..]; 
      } 
    } 
  } 
 
  switch(lower_case(attrs->type || "wmml")) { 
  case "wmml": 
    // No need to do anything. 
    break; 
  case "txt": 
    s = txt_to_wmml(s); 
    break; 
  } 
 
  res->res += s*"\n" + "\n"; 
 
  return(""); 
} 
 
string extract_pikedoc(string input, mapping|void res) 
{ 
  res = res || (["res":""]); 
 
  parse_html(input, ([]), (["pikedoc":_extract_pikedoc]), res); 
 
  return(res->res); 
} 
 
int main(int argc, array(string) argv) 
{ 
  if (argc == 1) { 
    string raw = Stdio.stdin->read(); 
 
    write(extract_pikedoc(raw)); 
  } else { 
    foreach(argv[1..], string fname) { 
      string raw = Stdio.File(fname, "r")->read(); 
      mapping res = ([]); 
      extract_pikedoc(raw, res); 
 
      foreach(indices(raw), string group) { 
        // Do something interresting. 
      } 
    } 
  } 
  return(0); 
}