streamhtmlparser库(网页解析的简单测试)

执行下面操作必须先对streamhtmlparser源码库。

一、

htmlparser.c

#include <stdio.h>  #include <streamhtmlparser/htmlparser.h>    int main(void) {    unsigned int getchar_ret;    htmlparser_ctx *parser = htmlparser_new();      while((getchar_ret = getchar()) != EOF) {      char c = (char)getchar_ret;        /* If we received a '$' character, we output the current tag and attribute       * name to stdout. */      if (c == '$') {        printf("[[ ");        if (htmlparser_tag(parser))          printf("tag=%s ", htmlparser_tag(parser));        if (htmlparser_attr(parser))          printf("attr=%s ", htmlparser_attr(parser));        printf("]]");        /* If we read any other character, we pass it to the parser and echo it to       * stdout. */      } else {        htmlparser_parse_chr(parser, c);        putchar(c);      }    }  }


二、

运行后输入下面数据

<html>    <body $>      <title> $ </title>      <a href="$" alt="$"> url </a>    </body>  </html>


三、

输出数据

<html>    <body [[ tag=body ]]>      <title> [[ tag=title ]] </title>      <a href="[[ tag=a attr=href ]]" alt="[[ tag=a attr=alt ]]"> url </a>    </body>  </html>

你可能感兴趣的:(html,测试)