pike.git / lib / modules / Parser.pmod / Tabular.pike

version» Context lines:

pike.git/lib/modules/Parser.pmod/Tabular.pike:1:   //! This is a parser for line and block oriented data.   //! It provides a flexible yet concise record-description language to parse   //! character/column/delimiter-organised records.   //!   //! @seealso - //! @[Parser.LR] + //! @[Parser.LR], @url{http://www.wikipedia.org/wiki/Comma-separated_values@}, + //! @url{http://www.wikipedia.org/wiki/EDIFACT@}      #pike __REAL_VERSION__      Stdio.FILE _in; -  + int _eol;   private int prefetch=1024; // TODO: Document and make this available    // through compile().   private String.Buffer alread=String.Buffer(prefetch);   private mapping|array fms; - private int eol; +    private Regexp simple=Regexp("^[^[\\](){}<>^$|+*?\\\\]+$");   private Regexp emptyline=Regexp("^[ \t\v\r\x1a]*$");   private mixed severity=1;   private int verb=0;   private int recordcount=1;      //! This function initialises the parser.   //!   //! @param input   //! The input stream or string.
pike.git/lib/modules/Parser.pmod/Tabular.pike:99:    if(!s)    throw(severity);    if(has_value(s,"\r")) // Retrofix \r-only line endings    { array t;    t=s/"\r";    s=t[0];_in->unread(t[1..]*"\n");    }    alread->add(s);alread->putchar('\n');    if(has_suffix(s,"\r"))    s=s[..<1]; -  eol=1; +  _eol=1;    }    return s;   }      private class checkpoint   { private string oldalread;       void create()    { oldalread=alread->get();    }
pike.git/lib/modules/Parser.pmod/Tabular.pike:136:    werror("Backtracking %O\n",back);    }    }    alread->add(oldalread);    }    }   }      #define FETCHAR(c,buf,i) (catch((c)=(buf)[(i)++])?((c)=-1):(c))    - private mapping getrecord(array fmt,int found) - { mapping ret=([]),options; -  if(stringp(fmt[0])) -  { options=(["name":fmt[0]]); -  if(fmt[1]) -  options+=fmt[1]; -  else -  fmt[1]=0; -  } -  else -  options=fmt[0]; -  if(found) -  { if(options->single) -  throw(severity); // early exit, already found one -  } -  else if(options->mandatory) -  severity=2; -  if(verb<0) -  werror("Checking record %d for %O\n",recordcount,options->name); -  eol=0; -  foreach(fmt;int fi;array|mapping m) -  { if(fi<2) -  continue; -  string value; -  if(arrayp(m)) -  { array field=m; -  fmt[fi]=m=(["name":field[0]]); -  mixed nm=field[1]; -  if(!mappingp(nm)) -  { if(arrayp(nm)) -  ret+=getrecord(nm,found); -  else -  m+=([(intp(nm)?"width":(stringp(nm)?"match":"delim")):nm]); -  if(sizeof(field)>2) -  m+=field[2]; -  } -  fmt[fi]=m; -  } -  if(eol) -  throw(severity); -  if(!zero_type(m->width)) -  value=gets(m->width); -  if(m->delim) + string _getdelimword(mapping m)    { multiset delim=m->delim;    int i,pref=m->prefetch || prefetch;    String.Buffer word=String.Buffer(pref);    string buf,skipclass;    skipclass="%[^"+(string)indices(delim)+"\"\r\x1a\n]";    if(sizeof(delim-(<',',';','\t',' '>)))   delimready:    for(;;)    { i=0;    buf=_in->read(pref);
pike.git/lib/modules/Parser.pmod/Tabular.pike:208:    word->add(s);    i+=sizeof(s);    break;    }    case '\n':    FETCHAR(c,buf,i);    switch(c)    { default:i--;    case '\r':case '\x1a':;    } -  eol=1; +  _eol=1;    break delimready;    case '\r':    FETCHAR(c,buf,i);    if(c!='\n')    i--; -  eol=1; +  _eol=1;    break delimready;    case '\x1a':;    }    FETCHAR(c,buf,i);    }    if(!sizeof(buf))    throw(severity);    alread->add(buf);    }    else
pike.git/lib/modules/Parser.pmod/Tabular.pike:238:    { i=0;    buf=_in->read(pref);    int c;    FETCHAR(c,buf,i);    while(c>=0)    { if(delim[c])    { if(!inquotes)    break csvready;    word->putchar(c);    } -  else switch(c) +  else +  switch(c)    { case '"':leadspace=0;    if(!inquotes)    inquotes=1;    else if(FETCHAR(c,buf,i)=='"')    word->putchar(c);    else    { inquotes=0;    continue;    }    break;
pike.git/lib/modules/Parser.pmod/Tabular.pike:265:    i+=sizeof(s);    }    break;    case '\n':    FETCHAR(c,buf,i);    switch(c)    { default:i--;    case '\r':case '\x1a':;    }    if(!inquotes) -  { eol=1; +  { _eol=1;    break csvready;    }    word->putchar('\n');    break;    case '\r':    FETCHAR(c,buf,i);    if(c!='\n')    i--;    if(!inquotes) -  { eol=1; +  { _eol=1;    break csvready;    }    word->putchar('\n');    case '\x1a':;    }    FETCHAR(c,buf,i);    }    if(!sizeof(buf))    throw(severity);    alread->add(buf);    }    }    alread->add(buf[..i-1]);    _in->unread(buf[i..]); -  value=word->get(); +  return word->get();   } -  +  + private mapping getrecord(array fmt,int found) + { mapping ret=([]),options; +  if(stringp(fmt[0])) +  { options=(["name":fmt[0]]); +  if(fmt[1]) +  options+=fmt[1]; +  else +  fmt[1]=0; +  } +  else +  options=fmt[0]; +  if(found) +  { if(options->single) +  throw(severity); // early exit, already found one +  } +  else if(options->mandatory) +  severity=2; +  if(verb<0) +  werror("Checking record %d for %O\n",recordcount,options->name); +  _eol=0; +  foreach(fmt;int fi;array|mapping m) +  { if(fi<2) +  continue; +  string value; +  if(arrayp(m)) +  { array field=m; +  fmt[fi]=m=(["name":field[0]]); +  mixed nm=field[1]; +  if(!mappingp(nm)) +  { if(arrayp(nm)) +  ret+=getrecord(nm,found); +  else +  m+=([(intp(nm)?"width":(stringp(nm)?"match":"delim")):nm]); +  if(sizeof(field)>2) +  m+=field[2]; +  } +  fmt[fi]=m; +  } +  if(_eol) +  throw(severity); +  if(!zero_type(m->width)) +  value=gets(m->width); +  if(m->delim) +  value=_getdelimword(m);    if(m->match)    { Regexp rgx;    if(stringp(m->match))    { if(!value && simple->match(m->match))    { m->width=sizeof(m->match);    value=gets(m->width);    }    m->match=Regexp("^("+m->match+")"+(value?"$":""));    }    rgx=m->match;
pike.git/lib/modules/Parser.pmod/Tabular.pike:331:    }    alread->add(value);    value-="\r";    if(has_suffix(value,"\n"))    value=value[..<1];    }    }    if(!m->drop)    ret[m->name]=value;    } -  if(!eol && gets(0)!="") +  if(!_eol && gets(0)!="")    throw(severity);    severity=1;    if(verb&&verb!=-1)    { array s=({options->name,"::"});    foreach(sort(indices(ret)),string name)    { string value=ret[name];    if(sizeof(value))    { if(verb<-2)    s+=({name,":"});    s+=({value,","});