1
  
2
  
3
  
4
  
5
  
6
  
7
  
8
  
9
  
10
  
11
  
12
  
13
  
14
  
15
  
16
  
17
  
18
  
19
  
20
  
21
  
22
  
23
  
24
  
25
  
26
  
27
  
28
  
29
  
30
  
31
  
32
  
33
  
34
  
35
  
36
  
37
  
38
  
39
  
40
  
41
  
42
  
43
  
44
  
45
  
46
  
47
  
48
  
49
  
50
  
51
  
52
  
53
  
54
  
55
  
#!/usr/local/bin/pike 
/* 
 * $Id: pikedoc2.pike,v 1.1 1999/07/08 21:57:23 grubba Exp $ 
 * 
 * Pike-doc extractor mk II 
 * 
 * Henrik Grubbström 1999-07-08 
 */ 
 
/* Load spider. */ 
#if constant(spider) 
#endif /* constant(spider) */ 
 
string _extract_pikedoc(string tag, mapping attrs, string contents, 
                        mapping res) 
{ 
  /* NOTE: Drop the first line. */ 
  array(string) s = (contents/"\n")[1..]; 
  int i; 
 
  for(i=0; i < sizeof(s); i++) { 
    int j = search(s[i], "*:"); 
 
    if (j >= 0) { 
      s[i] = s[i][j+2..]; 
      if (sizeof(s[i]) && (s[i][0] == ' ')) { 
        s[i] = s[i][1..]; 
      } 
    } 
  } 
 
  res->res += s*"\n" + "\n"; 
 
  return(""); 
} 
 
string extract_pikedoc(string input) 
{ 
  mapping res = (["res":""]); 
 
  parse_html(input, ([]), (["pikedoc":_extract_pikedoc]), res); 
 
  return(res->res); 
} 
 
int main(int argc, array(string) argv) 
{ 
  string raw = Stdio.stdin->read(); 
 
  write(extract_pikedoc(raw)); 
 
  return(0); 
}