golang的bufio用于内容解析

golang提供了io.Reader,也就是读内容,可以从很多地方读,譬如:

// from string.
var r io.Reader = strings.NewReader(string("hello, world"))
// from bytes.
var r io.Reader = bytes.NewReader([]byte("hello, world!"))
// from bytes buffer.
var r io.Reader = bytes.NewBuffer([]byte("hello, world"))

这个看起来没有啥稀奇的,就是从字符串或者字节读取呗。最后一个bytes.Buffer是写(Write)时增加到末尾,读(Read)时从头开始读的一个对象,就是个缓冲区。

还有一个比较有用的,带缓冲区的io:

// buffer reader
var r io.Reader = bufio.NewReader(strings.NewReader(string("hello, world")))

这个是和带缓冲区的写入是对应的。这个类是给网络reader用的,譬如协议解析,需要看看下面几个字节是什么,然后再解析之类的(Peek)。或者写入时,不断将小的bytes写入,最后Flush之类。

另外,bufio.Reader还提供了特殊的读法,譬如读取字符串(因为有缓冲区所以能读得出来)。


// ReadString reads until the first occurrence of delim in the input,
// returning a string containing the data up to and including the delimiter.
// If ReadString encounters an error before finding a delimiter,
// it returns the data read before the error and the error itself (often io.EOF).
// ReadString returns err != nil if and only if the returned data does not end in
// delim.
// For simple uses, a Scanner may be more convenient.
func (b *Reader) ReadString(delim byte) (line string, err error) {

对于内容解析,譬如解析下面的json,支持///**/风格的注释,那么就可以用scanner,也就是特定格式的扫描提取:

s := bufio.NewScanner(strings.NewReader("/*block comments*///line comments\n{}"))
s.Split(func(data []byte, atEOF bool) (advance int, token []byte, err error){
    // read more.
    return 0,nil,nil
})
for s.Scan() {
    fmt.Println(s.Text())
}
fmt.Println("err is", s.Err())

只需要判断是否需要的数据是否有满足,譬如//\n是否成对,如果不成对就再读取。这样就大大降低了复杂逻辑了。

具体实现,参考:go-oryx

你可能感兴趣的:(GOLANG)