小菊花。

golang 标准库 - fmt/scan.go 解读

// go/src/fmt/scan.go
// version 1.7


package fmt

import (
	"errors"
	"io"
	"math"
	"os"
	"reflect"
	"strconv"
	"sync"
	"unicode/utf8"
)

// ScanState 将扫描器的状态报告给自定义类型的 Scan 方法。
type ScanState interface {
	// ReadRune 从输入端读取一个字符，如果用在 Scanln 类的扫描器中，
	// 则该方法会在读到第一个换行符之后或读到指定宽度之后返回 EOF。
	// r   ：读取的字符
	// size：字符所占用的字节数
	// err ：遇到的错误信息
	ReadRune() (r rune, size int, err error)
	// UnreadRune 撤消最后一次的 ReadRune 操作，
	// 使下次的 ReadRune 操作得到与前一次 ReadRune 相同的结果。
	// 返回：遇到的错误信息
	UnreadRune() error
	// SkipSpace 为自定义的 Scan 方法提供跳过开头空白的能力。
	// 根据扫描器的不同（Scan 或 Scanln）决定是否跳过换行符。
	SkipSpace()
	// Token 用于从输入端读取符合要求的字符串，准备解析。
	// Token 从输入端读取连续的符合 f(c) 的字符 c。如果 f 为 nil，则使用
	// !unicode.IsSpace(c) 代替 f(c)。
	// skipSpace：是否跳过输入端开头的连续空白（通过 SkipSpace 方法）。
	// token    ：存放读取到的数据。
	// err      ：遇到的错误信息。
	// 注意：token 指向共享的数据，下次的 Token 操作可能会覆盖本次的结果。
	Token(skipSpace bool, f func(rune) bool) (token []byte, err error)
	// Width 返回占位符中指定的宽度值（宽度值是字符个数，不是字节个数）。
	// wid：获取到的宽度值
	// ok ：是否指定了宽度值
	Width() (wid int, ok bool)
	// 因为上面实现了 ReadRune 方法，所以 Read 方法永远不应该被 Scan 方法调用。
	// 一个好的 ScanState 应该让 Read 直接返回相应的错误信息。
	Read(buf []byte) (n int, err error)
}

// Scanner 用于让自定义类型实现自己的扫描过程。
// Scan 方法会从输入端读取数据并将处理结果存入接收端，接收端必须是有效的指针。
// Scan 方法会被扫描器调用，只要对应的 arg 实现了该方法。
type Scanner interface {
	Scan(state ScanState, verb rune) error
}

// Scan 从标准输入中读取字符串（以空白分隔的值的序列）并解析为具体的值，
// 存入参数 a 所提供的变量中（参数 a 必须提供变量的地址）。换行视为空白。
// 当读到 EOF 或所有变量都填写完毕则停止扫描。
// n  ：成功解析的参数数量
// err：解析过程中遇到的错误信息
func Scan(a ...interface{}) (n int, err error) {
	return Fscan(os.Stdin, a...)
}

// Scanln 和 Scan 类似，只不过遇到换行符就停止扫描。
func Scanln(a ...interface{}) (n int, err error) {
	return Fscanln(os.Stdin, a...)
}

// Scanf 从标准输入中读取字符串，并根据格式字符串 format 对读取的数据进行解析，
// 存入参数 a 所提供的变量中（参数 a 必须提供变量的地址）。
// 输入端的换行符必须和格式字符串中的换行符相对应（如果格式字符串中有换行符，则
// 输入端必须输入相应的换行符）。
// 占位符 %c 总是匹配下一个字符，包括空白，比如空格符、制表符、换行符。
// n  ：成功解析的参数数量
// err：解析过程中遇到的错误信息
func Scanf(format string, a ...interface{}) (n int, err error) {
	return Fscanf(os.Stdin, format, a...)
}

// 实现了 Reader 接口的字符串类型
type stringReader string

func (r *stringReader) Read(b []byte) (n int, err error) {
	n = copy(b, *r)
	*r = (*r)[n:]
	if n == 0 {
		err = io.EOF
	}
	return
}

// Sscan 和 Scan 类似，只不过从 str 中读取数据。
func Sscan(str string, a ...interface{}) (n int, err error) {
	return Fscan((*stringReader)(&str), a...)
}

// Sscanln 和 Scanln 类似，只不过从 str 中读取数据。
func Sscanln(str string, a ...interface{}) (n int, err error) {
	return Fscanln((*stringReader)(&str), a...)
}

// Sscanf 和 Scanf 类似，只不过从 str 中读取数据。
func Sscanf(str string, format string, a ...interface{}) (n int, err error) {
	return Fscanf((*stringReader)(&str), format, a...)
}

// Fscan 和 Scan 类似，只不过从 r 中读取数据。
func Fscan(r io.Reader, a ...interface{}) (n int, err error) {
	s, old := newScanState(r, true, false) // 创建扫描器
	n, err = s.doScan(a)                   // 开始扫描
	s.free(old)                            // 回收扫描器
	return
}

// Fscanln 和 Fcanln 类似，只不过从 r 中读取数据。
func Fscanln(r io.Reader, a ...interface{}) (n int, err error) {
	s, old := newScanState(r, false, true) // 创建扫描器
	n, err = s.doScan(a)                   // 开始扫描
	s.free(old)                            // 回收扫描器
	return
}

// Fscanf 和 Scanf 类似，只不过从 r 中读取数据。
func Fscanf(r io.Reader, format string, a ...interface{}) (n int, err error) {
	s, old := newScanState(r, false, false) // 创建扫描器
	n, err = s.doScanf(format, a)           // 开始扫描
	s.free(old)                             // 回收扫描器
	return
}

// scanError 声明本地错误类型，用于 recover 时辨别 panic 是否由本地代码产生的。
type scanError struct {
	err error
}

// 本地代码用 -1 表示遇到 EOF
const eof = -1

// ss 是扫描器，整个扫描过程都是由它完成的。
// 它从 rs 中读取数据并进行解析。
type ss struct {
	rs    io.RuneScanner // 输入端
	buf   buffer         // 缓冲区
	count int            // 已读取的字符数
	atEOF bool           // 是否读到 EOF
	ssave                // 一些需要经常复位的字段
}

// ssave 是 ss 的一部分，存储一些需要经常复位的字段
type ssave struct {
	validSave bool // 平时用不上，递归时使用
	nlIsEnd   bool // 是否在换行符之后停止读取
	nlIsSpace bool // 是否将换行符视为空白
	argLimit  int  // 已读的字符数不能超过 argLimit（argLimit <= limit）
	limit     int  // 已读的字符数不能超过 limit（好像就当做常量在使用，用于复位 argLimit）
	maxWid    int  // 存储占位符中指定的宽度值
}

// 实现 ScanState 接口
// Read 方法仅用于 ScanState 以满足 io.Reader 接口。
// 在内部永远不会调用它，所以没有必要让它有任何动作。
func (s *ss) Read(buf []byte) (n int, err error) {
	return 0, errors.New("ScanState's Read should not be called. Use ReadRune")
}

// 实现 ScanState 接口
func (s *ss) ReadRune() (r rune, size int, err error) {
	// 读到 EOF 或超出读取限制，则返回 0 0 nil
	if s.atEOF || s.count >= s.argLimit {
		err = io.EOF
		return
	}
	r, size, err = s.rs.ReadRune()
	if err == nil {
		s.count++ // 统计被读出的字符数
		if s.nlIsEnd && r == '\n' {
			s.atEOF = true // 拒绝再次 ReadRune
		}
	} else if err == io.EOF {
		s.atEOF = true // 拒绝再次 ReadRune
	}
	return
}

// 实现 ScanState 接口
func (s *ss) Width() (wid int, ok bool) {
	if s.maxWid == hugeWid { //	hugeWid 是常量 1 << 30
		return 0, false
	}
	return s.maxWid, true
}

// 读取一个字符，如果遇到 EOF 则返回 eof（即 -1）
// 如果遇到其它错误，则中止整个扫描过程，返回 err。
func (s *ss) getRune() (r rune) {
	r, _, err := s.ReadRune()
	if err != nil {
		if err == io.EOF {
			return eof
		}
		s.error(err)
	}
	return
}

// 功能同 getRune，只不过遇到 EOF 也中止整个扫描过程，返回 err。
func (s *ss) mustReadRune() (r rune) {
	r = s.getRune()
	if r == eof {
		s.error(io.ErrUnexpectedEOF)
	}
	return
}

// 实现 ScanState 接口
func (s *ss) UnreadRune() error {
	s.rs.UnreadRune()
	s.atEOF = false // 允许再次 ReadRune
	s.count--       // 统计被读出的字符数
	return nil      // UnreadRune 可以反复调用，不返回错误信息。
}

// 将错误信息转换为 panic。
// 用于配合 recover 快速结束函数调用链，避免过多的返回值判断。
// 类似于 break label 的用法。
func (s *ss) error(err error) {
	panic(scanError{err})
}

// 作用同上面的 error 方法
func (s *ss) errorString(err string) {
	panic(scanError{errors.New(err)})
}

// 实现 ScanState 接口
func (s *ss) Token(skipSpace bool, f func(rune) bool) (tok []byte, err error) {
	// 遇到本地错误则仅仅返回 err 信息。
	// 遇到其它错误则 panic。
	defer func() {
		if e := recover(); e != nil {
			if se, ok := e.(scanError); ok {
				err = se.err
			} else {
				panic(e)
			}
		}
	}()
	// 确定审查函数
	if f == nil {
		f = notSpace
	}
	// 准备缓冲区给 s.token 用
	s.buf = s.buf[:0]
	tok = s.token(skipSpace, f)
	return
}

// space 是 unicode.White_Space 的拷贝，避免包的深度依赖。
// 这些都是空白字符的 Unicode 码点范围
var space = [][2]uint16{
	{0x0009, 0x000d},
	{0x0020, 0x0020},
	{0x0085, 0x0085},
	{0x00a0, 0x00a0},
	{0x1680, 0x1680},
	{0x2000, 0x200a},
	{0x2028, 0x2029},
	{0x202f, 0x202f},
	{0x205f, 0x205f},
	{0x3000, 0x3000},
}

// 判断 r 是否为空白字符
func isSpace(r rune) bool {
	// 空白字符的码点不会超过 2 个字节
	if r >= 1<<16 {
		return false
	}
	// 开始判断
	rx := uint16(r)
	for _, rng := range space {
		if rx < rng[0] {
			return false
		}
		if rx <= rng[1] {
			return true
		}
	}
	return false
}

// notSpace 是 Token 中的默认审查函数。
func notSpace(r rune) bool {
	return !isSpace(r)
}

// 实现 ScanState 接口
func (s *ss) SkipSpace() {
	s.skipSpace(false)
}

// readRune 用于将 io.Reader 包装成 io.RuneScanner
type readRune struct {
	reader   io.Reader         // 被包装的 io.Reader
	buf      [utf8.UTFMax]byte // 仅在 ReadRune 方法中使用
	pending  int               // pendBuf 中存放的字节数，遇到无效 UTF8 编码时使用。
	pendBuf  [utf8.UTFMax]byte // 存放读取的无效 UTF-8 编码，一次处理不完，留着下次处理
	peekRune rune              // 用于 UnreadRune 存放撤销的字符。
}

// readByte 读取一个字节
// 它可能是上次 ReadRune 时未处理完的不完整 UTF8 编码。
func (r *readRune) readByte() (b byte, err error) {
	// 如果之前的 ReadRune 有未处理完的字节，则重新读出这些字节。
	if r.pending > 0 {
		// 读出一个字节
		b = r.pendBuf[0]
		// 剩下的字节向前移动一格
		copy(r.pendBuf[0:], r.pendBuf[1:])
		r.pending--
		return
	}
	// 如果没有未处理的字节，则从输入端读出一个字节
	n, err := io.ReadFull(r.reader, r.pendBuf[:1])
	if n != 1 {
		return 0, err
	}
	return r.pendBuf[0], err
}

// 实现 io.RuneScanner 接口
func (r *readRune) ReadRune() (rr rune, size int, err error) {
	// 之前 UnreadRune 撤销的字符，存在 peekRune 中，有则直接取出。
	if r.peekRune >= 0 {
		rr = r.peekRune
		// 将 peekRune 取反为负数，表示允许 UnreadRune 执行撤销操作
		r.peekRune = ^r.peekRune
		size = utf8.RuneLen(rr)
		return
	}
	// 没有撤销的字符，则从输入端读取一个
	r.buf[0], err = r.readByte()
	if err != nil {
		return
	}
	// 如果读出的是一个单字节字符，则读取完毕。
	if r.buf[0] < utf8.RuneSelf {
		rr = rune(r.buf[0])
		size = 1
		// 将读出的内容写入 peekRune 后取反，以便 UnreadRune 可以撤销。
		r.peekRune = ^rr
		return
	}
	// 读出的不是单字节字符
	var n int
	// FullRune 的功能不太好理解，总的来说，就是判断首字符的编码长度是否完整，
	// 如果不完整则返回 false，其它情况都返回 true（包括无效编码）。
	// 循环直到 r.buf[:n] 是完整的 UTF-8 编码（或无效编码）
	for n = 1; !utf8.FullRune(r.buf[:n]); n++ {
		// 如果字符编码长度不够，则再读出一个字节，继续判断
		r.buf[n], err = r.readByte()
		if err != nil {
			if err == io.EOF {
				err = nil // 之前有读出的字节未处理，跳出去处理
				break
			}
			return
		}
	}
	// 解码刚读出的 UTF-8 序列
	rr, size = utf8.DecodeRune(r.buf[:n])
	if size < n {
		// 遇到错误，保存未处理的字节，用于下一次读取。
		copy(r.pendBuf[r.pending:], r.buf[size:n])
		r.pending += n - size
	}
	// 将读出的内容写入 peekRune 后取反，以便 UnreadRune 可以撤销。
	r.peekRune = ^rr
	return
}

// 实现 io.RuneScanner 接口
func (r *readRune) UnreadRune() error {
	// 之前执行过 UnreadRune，不能重复执行。
	// 只有 UnreadRune 才能让 peekRune 大于 0。
	if r.peekRune >= 0 {
		return errors.New("fmt: scanning called UnreadRune with no rune available")
	}
	// 开始撤销
	// 反转 peekRune 中的二进制位，使其成为有效的字符。
	r.peekRune = ^r.peekRune
	return nil
}

// 临时对象池
var ssFree = sync.Pool{
	New: func() interface{} { return new(ss) },
}

// 创建扫描器，或从临时对象池中获取一个。
func newScanState(r io.Reader, nlIsSpace, nlIsEnd bool) (s *ss, old ssave) {
	// 从临时对象池中获取一个扫描器
	s = ssFree.Get().(*ss)
	// 如果参数 r 不是一个 RuneScanner，则将其包装成 RuneScanner 再赋值给 s.rs
	if rs, ok := r.(io.RuneScanner); ok {
		s.rs = rs
	} else {
		// 注意：r 只有 Read 方法，没有撤销方法，所以这里包装的 readRune 对象
		// 无法将 UnreadRune 所撤销的内容返回到 r 中。也就是说，尽量为 r 提供
		// RuneScanner，否则可能造成 r 中的数据丢失。
		s.rs = &readRune{reader: r, peekRune: -1}
	}
	// 复位参数
	s.nlIsSpace = nlIsSpace
	s.nlIsEnd = nlIsEnd
	s.atEOF = false
	s.limit = hugeWid
	s.argLimit = hugeWid
	s.maxWid = hugeWid
	s.validSave = true
	s.count = 0
	return
}

// 回收扫描器，避免再次分配。
func (s *ss) free(old ssave) {
	// 如果扫描器被递归使用，则只需要恢复旧状态，然后继续使用。
	if old.validSave {
		s.ssave = old
		return
	}
	// 不回收缓冲区太大的扫描器，避免内存浪费。
	if cap(s.buf) > 1024 {
		return
	}
	// 复位并存入
	s.buf = s.buf[:0]
	s.rs = nil
	ssFree.Put(s)
}

// 用于实现 ScanState 接口
func (s *ss) skipSpace(stopAtNewline bool) {
	for {
		r := s.getRune()
		if r == eof {
			return
		}
		// \r\n 当 \n 处理
		// peek 判断即将读取的字符是否在字符串 "\n" 中（只判断不读取）。
		if r == '\r' && s.peek("\n") {
			continue
		}
		if r == '\n' {
			if stopAtNewline { // 换行符之后停止读取
				break
			}
			if s.nlIsSpace { // 换行符当空白处理
				continue
			}
			// 换行符当非空白字符处理
			// 在这里不允许，所以中止整个扫描过程，返回 err。
			s.errorString("unexpected newline")
			return
		}
		// 非空白字符，撤销读取并返回。
		if !isSpace(r) {
			s.UnreadRune()
			break
		}
	}
}

// 用于实现 ScanState 接口
func (s *ss) token(skipSpace bool, f func(rune) bool) []byte {
	if skipSpace {
		s.skipSpace(false)
	}
	// 循环读取直到不满足 f(r) 或遇到 EOF
	for {
		r := s.getRune()
		if r == eof {
			break
		}
		if !f(r) {
			s.UnreadRune()
			break
		}
		s.buf.WriteRune(r)
	}
	return s.buf
}

var complexError = errors.New("syntax error scanning complex number")
var boolError = errors.New("syntax error scanning boolean")

// 返回 r 在 s 中的字符序号（不是字节下标）
func indexRune(s string, r rune) int {
	for i, c := range s {
		if c == r {
			return i
		}
	}
	return -1
}

// 判断即将读取的字符是否在 ok 中。
// 如果 accept 为 flase 则读取并丢弃该字符，无论结果如何。
// 如果 accept 为 true，则根据结果做进一步处理：
// 结果为 true ：将字符读入 s.buf 中
// 结果为 false：不读取该字符
func (s *ss) consume(ok string, accept bool) bool {
	r := s.getRune()
	if r == eof {
		return false
	}
	// r 在 ok 中
	if indexRune(ok, r) >= 0 {
		if accept {
			s.buf.WriteRune(r)
		}
		return true
	}
	// r 不在 ok 中（上面已经判断过 r == eof，所以这里没必要再次判断）
	if r != eof && accept {
		s.UnreadRune() // 不读取该字符
	}
	return false
}

// 判断即将读取的字符是否在 ok 中，但不读取该字符。
func (s *ss) peek(ok string) bool {
	r := s.getRune()
	if r != eof {
		s.UnreadRune()
	}
	// 在 ok 中查找 r 的下标，判断您是否 >= 0
	return indexRune(ok, r) >= 0
}

// 判断输入端是否有数据可读
// 如果没有数据可读，则中止整个扫描过程，返回 err。
func (s *ss) notEOF() {
	if r := s.getRune(); r == eof {
		panic(io.EOF)
	}
	s.UnreadRune()
}

// 判断即将读取的字符是否在 ok 中，如果在，则将其读入 s.buf 中，
// 并返回 true，否则不读取，并返回 false。
func (s *ss) accept(ok string) bool {
	return s.consume(ok, true)
}

// 判断 verb 是否在 okVerbs 中，
// 如果在，则返回 true。如果不在，则中止整个扫描过程，返回 err。
// 没有返回 false 的情况。typ 用于在 err 中指示类型信息。
func (s *ss) okVerb(verb rune, okVerbs, typ string) bool {
	for _, v := range okVerbs {
		if v == verb {
			return true
		}
	}
	s.errorString("bad verb '%" + string(verb) + "' for " + typ)
	return false
}

// 从输入端读取一个布尔值，verb 必须为 t 或 v，否则读取失败。
// 可探测 0、1、t、f、true、false，忽略大小写。
func (s *ss) scanBool(verb rune) bool {
	// 跳过行首空白（包括换行符）
	s.skipSpace(false)
	// 输入端必须有内容可读
	s.notEOF()
	// 动词不是 t 或 v，不符合布尔型的要求
	if !s.okVerb(verb, "tv", "boolean") {
		return false
	}
	// 布尔型的语法检测很讨厌，我们不做严格要求。
	// 如果遇到不完整的 tr、tru 或 fa、fal、fals 则中止整个扫描过程，返回 err。
	switch s.getRune() {
	case '0':
		return false
	case '1':
		return true
	case 't', 'T':
		if s.accept("rR") && (!s.accept("uU") || !s.accept("eE")) {
			s.error(boolError)
		}
		return true
	case 'f', 'F':
		if s.accept("aA") && (!s.accept("lL") || !s.accept("sS") || !s.accept("eE")) {
			s.error(boolError)
		}
		return false
	}
	return false
}

// 数值元素
const (
	binaryDigits      = "01"
	octalDigits       = "01234567"
	decimalDigits     = "0123456789"
	hexadecimalDigits = "0123456789aAbBcCdDeEfF"
	sign              = "+-"
	period            = "."
	exponent          = "eEp"
)

// 返回 verb 所代表的进位制，及其字符范围（即上面的常量）
func (s *ss) getBase(verb rune) (base int, digits string) {
	// 判断 verb 是否符合整型要求。
	// 如果不符合，则中止整个扫描过程，返回 err。
	s.okVerb(verb, "bdoUxXv", "integer")
	base = 10 // 默认为十进制
	digits = decimalDigits
	switch verb {
	case 'b': // 二进制
		base = 2
		digits = binaryDigits
	case 'o': // 八进制
		base = 8
		digits = octalDigits
	case 'x', 'X', 'U': // 十六进制
		base = 16
		digits = hexadecimalDigits
	}
	return
}

// 从输入端读取数值字符串到 s.buf 中。
// digits 是可接收的字符范围（不同进位制有不同的字符范围）
// haveDigits 表示 s.buf 中是否已经有数值存在，
// 如果没有，则本方法必须读出数值，否则中止整个扫描过程，返回 err。
func (s *ss) scanNumber(digits string, haveDigits bool) string {
	if !haveDigits {
		// 输入端必须有内容可读
		s.notEOF()
		if !s.accept(digits) {
			// 如果没有读到指定进制的字符，则中止整个扫描过程，返回 err。
			s.errorString("expected integer")
		}
	}
	// 继续读取合格的字符，存入 s.buf 中
	for s.accept(digits) {
	}
	// 返回读出的字符串
	return string(s.buf)
}

// 功能同 ReadRune，只不过通过 bitSize 限制读取字符的位宽。
// 如果读出的字符在指定位宽内，则返回，否则中止整个扫描过程，返回 err。
func (s *ss) scanRune(bitSize int) int64 {
	s.notEOF()
	r := int64(s.getRune())
	n := uint(bitSize)
	// 位宽判断
	x := (r << (64 - n)) >> (64 - n)
	if x != r {
		s.errorString("overflow on character value " + string(r))
	}
	return r
}

// 根据输入端的前导符 0 或 0x 判断进位制并返回，同时返回字符范围。
// found 表示检测到前导符。只有当动词是 %v 的时候才会被调用。
func (s *ss) scanBasePrefix() (base int, digits string, found bool) {
	// 如果不是以 0 开头，表示是十进制数
	if !s.peek("0") {
		return 10, decimalDigits, false
	}
	// 如果是 0 开头，则将其读入 s.buf 中
	s.accept("0")
	found = true // 已经读出一个 0，如果前导符后面没有数值，将使用该 0 值。
	// 继续判断是八进制还是十六进制
	base, digits = 8, octalDigits
	if s.peek("xX") {
		s.consume("xX", false) // 丢弃匹配的 x 或 X 字符
		base, digits = 16, hexadecimalDigits
	}
	return
}

// 读取一个 int64 整数。bitSize 用于限制整数的位宽。
// 如果读出的整数在指定位宽内，则返回，否则中止整个扫描过程，返回 err。
func (s *ss) scanInt(verb rune, bitSize int) int64 {
	// 只需要读取一个字符
	if verb == 'c' {
		return s.scanRune(bitSize)
	}
	s.skipSpace(false)
	s.notEOF()
	// 根据不同的动词获取进位制信息
	base, digits := s.getBase(verb)
	haveDigits := false // 是否已经读出数值
	if verb == 'U' {
		// 丢弃前导符 U+
		// 如果没有读取到 U+ 则中止整个扫描过程，返回 err。
		if !s.consume("U", false) || !s.consume("+", false) {
			s.errorString("bad unicode format ")
		}
	} else {
		// sign 是常量 +-，如果能读取到符号，则将其存入 s.buf 中。
		s.accept(sign)
		if verb == 'v' {
			// 根据输入端的前导符 0 或 0x 确定进位制
			// 如果有前导符，则已经读出一个 0，前导符后面可以没有数值。
			base, digits, haveDigits = s.scanBasePrefix()
		}
	}
	// 读出数值字符串，如果读取失败，则中止整个扫描过程，返回 err。
	tok := s.scanNumber(digits, haveDigits)
	// 转换为整型
	i, err := strconv.ParseInt(tok, base, 64)
	if err != nil {
		s.error(err)
	}
	// 位宽判断
	n := uint(bitSize)
	x := (i << (64 - n)) >> (64 - n)
	if x != i {
		s.errorString("integer overflow on token " + tok)
	}
	return i
}

// 功能同 scanInt，只不过返回的是无符号整数。
func (s *ss) scanUint(verb rune, bitSize int) uint64 {
	if verb == 'c' {
		return uint64(s.scanRune(bitSize))
	}
	s.skipSpace(false)
	s.notEOF()
	base, digits := s.getBase(verb)
	haveDigits := false
	if verb == 'U' {
		if !s.consume("U", false) || !s.consume("+", false) {
			s.errorString("bad unicode format ")
		}
	} else if verb == 'v' {
		base, digits, haveDigits = s.scanBasePrefix()
	}
	tok := s.scanNumber(digits, haveDigits)
	i, err := strconv.ParseUint(tok, base, 64)
	if err != nil {
		s.error(err)
	}
	n := uint(bitSize)
	x := (i << (64 - n)) >> (64 - n)
	if x != i {
		s.errorString("unsigned integer overflow on token " + tok)
	}
	return i
}

// 读取一个浮点数，如果指定了宽度值，则不会超过宽度值。
// 没有检查“只有指数没有小数”的情况，但是 Atof 会进行检查。
func (s *ss) floatToken() string {
	s.buf = s.buf[:0]
	// 非数值 NAN
	if s.accept("nN") && s.accept("aA") && s.accept("nN") {
		return string(s.buf)
	}
	// 符号 +-
	s.accept(sign)
	// 无穷大 INF
	if s.accept("iI") && s.accept("nN") && s.accept("fF") {
		return string(s.buf)
	}
	// 整数部分
	for s.accept(decimalDigits) {
	}
	// 小数点
	if s.accept(period) {
		// 小数部分
		for s.accept(decimalDigits) {
		}
	}
	// 指数标志
	if s.accept(exponent) {
		// 指数符号
		s.accept(sign)
		// 指数值
		for s.accept(decimalDigits) {
		}
	}
	return string(s.buf)
}

// 读出一个虚数的实部和虚部。
// 虚数可以加上括号，虚数格式必须为 N+Ni，N 必须是浮点数，中间不能有空格。
func (s *ss) complexTokens() (real, imag string) {
	// TODO: 未实现纯实部和纯虚部的读取
	parens := s.accept("(") // 登记是否以 "(" 开头
	real = s.floatToken()   // 读取实部
	s.buf = s.buf[:0]
	// 虚部必须有符号
	if !s.accept("+-") { // 读取符号到 s.buf
		s.error(complexError)
	}
	imagSign := string(s.buf) // 取出符号
	imag = s.floatToken()     // 读取虚部
	if !s.accept("i") {       // 虚部后面必须为 i
		s.error(complexError)
	}
	// 如果以 "(" 开头，则必须以 ")" 结尾。
	if parens && !s.accept(")") {
		s.error(complexError)
	}
	return real, imagSign + imag
}

// 将一个字符串转换为 float64 类型的值。
// str 要转换的字符串，n：要转换出的浮点数类型（32 或 64）
// 如果转换失败，则中止整个扫描过程，返回 err。
func (s *ss) convertFloat(str string, n int) float64 {
	// Atof 不处理以 2 为底的指数，但是它们很容易计算。
	if p := indexRune(str, 'p'); p >= 0 {
		// 获取小数部分
		f, err := strconv.ParseFloat(str[:p], n)
		if err != nil {
			if e, ok := err.(*strconv.NumError); ok {
				e.Num = str
			}
			s.error(err)
		}
		// 获取指数部分
		m, err := strconv.Atoi(str[p+1:])
		if err != nil {
			//
			if e, ok := err.(*strconv.NumError); ok {
				e.Num = str
			}
			s.error(err)
		}
		// 算出结果：f * (2 的 m 次方)
		return math.Ldexp(f, m)
	}
	// 普通浮点数直接转换
	f, err := strconv.ParseFloat(str, n)
	if err != nil {
		s.error(err)
	}
	return f
}

// 读取一个 complex128 类型的值。
func (s *ss) scanComplex(verb rune, n int) complex128 {
	// 检查 verb 的有效性（floatVerbs 是常量 "beEfFgGv"）
	if !s.okVerb(verb, floatVerbs, "complex") {
		return 0
	}
	s.skipSpace(false)
	s.notEOF()
	// 读取实部和虚部
	sreal, simag := s.complexTokens()
	real := s.convertFloat(sreal, n/2)
	imag := s.convertFloat(simag, n/2)
	return complex(real, imag)
}

// 读取一个字符串。
func (s *ss) convertString(verb rune) (str string) {
	// 检查 verb 的有效性
	if !s.okVerb(verb, "svqxX", "string") {
		return ""
	}
	s.skipSpace(false)
	s.notEOF()
	switch verb {
	case 'q': // 带引号字符串
		str = s.quotedString()
	case 'x', 'X': // 十六进制格式的字符串
		str = s.hexString()
	default:
		// %s 和 %v 仅返回连续的非空白字符
		str = string(s.token(true, notSpace))
	}
	return
}

// 读取双引号或反引号字符串。
func (s *ss) quotedString() string {
	s.notEOF()
	quote := s.getRune()
	switch quote {
	case '`':
		// 读取直到遇到下一个反引号或 EOF
		for {
			r := s.mustReadRune()
			if r == quote {
				break
			}
			s.buf.WriteRune(r)
		}
		return string(s.buf)
	case '"':
		s.buf.WriteByte('"')
		for {
			r := s.mustReadRune()
			s.buf.WriteRune(r)
			if r == '\\' {
				// strconv.Unquote 会处理转义字符，这里只需要写入。
				s.buf.WriteRune(s.mustReadRune())
			} else if r == '"' {
				break
			}
		}
		result, err := strconv.Unquote(string(s.buf))
		if err != nil {
			s.error(err)
		}
		return result
	default:
		s.errorString("expected quoted string")
	}
	return ""
}

// hexDigit 返回十六进制字符所代表的十进制值
func hexDigit(d rune) (int, bool) {
	digit := int(d)
	switch digit {
	case '0', '1', '2', '3', '4', '5', '6', '7', '8', '9':
		return digit - '0', true
	case 'a', 'b', 'c', 'd', 'e', 'f':
		return 10 + digit - 'a', true
	case 'A', 'B', 'C', 'D', 'E', 'F':
		return 10 + digit - 'A', true
	}
	return -1, false
}

// 读取两个十六进制字符，并返回其所表示的字节。
// b ：读取的字节
// ok：是否读取成功
// 如果缺少后一个字符，则中止整个扫描过程，返回 err。
func (s *ss) hexByte() (b byte, ok bool) {
	// 处理第一个字符
	rune1 := s.getRune()
	if rune1 == eof {
		return
	}
	value1, ok := hexDigit(rune1)
	if !ok {
		s.UnreadRune()
		return
	}
	// 处理第二个字符
	value2, ok := hexDigit(s.mustReadRune())
	if !ok {
		s.errorString("illegal hex digit")
		return
	}
	// 转换为十进制数值
	return byte(value1<<4 | value2), true
}

// 读取十六进制字符串，并返回其所表示的内容
// 两个十六进制字符表示一个字节
// 读取失败则中止整个扫描过程，返回 err。
func (s *ss) hexString() string {
	s.notEOF()
	for {
		// 读取两个十六进制字符所表示的一个字节
		b, ok := s.hexByte()
		if !ok {
			break
		}
		s.buf.WriteByte(b)
	}
	if len(s.buf) == 0 {
		s.errorString("no hex data for %x string")
		return ""
	}
	return string(s.buf)
}

const (
	floatVerbs = "beEfFgGv"

	hugeWid = 1 << 30

	intBits     = 32 << (^uint(0) >> 63)
	uintptrBits = 32 << (^uintptr(0) >> 63)
)

// 处理一个 arg。
// 遇到错误则中止整个扫描过程，返回 err。
func (s *ss) scanOne(verb rune, arg interface{}) {
	s.buf = s.buf[:0]
	var err error
	// 如果参数有它自己的 Scan 方法，则调用它。
	if v, ok := arg.(Scanner); ok {
		err = v.Scan(s, verb)
		if err != nil {
			if err == io.EOF {
				err = io.ErrUnexpectedEOF
			}
			s.error(err)
		}
		return
	}

	// 根据不同的 arg 类型选择不同的解析方法。
	switch v := arg.(type) {
	case *bool:
		*v = s.scanBool(verb)
	case *complex64:
		*v = complex64(s.scanComplex(verb, 64))
	case *complex128:
		*v = s.scanComplex(verb, 128)
	case *int:
		*v = int(s.scanInt(verb, intBits))
	case *int8:
		*v = int8(s.scanInt(verb, 8))
	case *int16:
		*v = int16(s.scanInt(verb, 16))
	case *int32:
		*v = int32(s.scanInt(verb, 32))
	case *int64:
		*v = s.scanInt(verb, 64)
	case *uint:
		*v = uint(s.scanUint(verb, intBits))
	case *uint8:
		*v = uint8(s.scanUint(verb, 8))
	case *uint16:
		*v = uint16(s.scanUint(verb, 16))
	case *uint32:
		*v = uint32(s.scanUint(verb, 32))
	case *uint64:
		*v = s.scanUint(verb, 64)
	case *uintptr:
		*v = uintptr(s.scanUint(verb, uintptrBits))
	case *float32:
		if s.okVerb(verb, floatVerbs, "float32") {
			s.skipSpace(false)
			s.notEOF()
			*v = float32(s.convertFloat(s.floatToken(), 32))
		}
	case *float64:
		if s.okVerb(verb, floatVerbs, "float64") {
			s.skipSpace(false)
			s.notEOF()
			*v = s.convertFloat(s.floatToken(), 64)
		}
	case *string:
		*v = s.convertString(verb)
	case *[]byte:
		// 先扫描成字符串，然后再转换为 []byte，所以得到的是一个副本，
		// 如果我们扫描成 []byte，那么结果将指向缓冲区。
		*v = []byte(s.convertString(verb))
	default:
		val := reflect.ValueOf(v)
		ptr := val
		// arg 必须是一个指针，就像其它 arg 那样
		if ptr.Kind() != reflect.Ptr {
			s.errorString("type not a pointer: " + val.Type().String())
			return
		}
		// 接下来的流程和上面一样
		switch v := ptr.Elem(); v.Kind() {
		case reflect.Bool:
			v.SetBool(s.scanBool(verb))
		case reflect.Int, reflect.Int8, reflect.Int16, reflect.Int32, reflect.Int64:
			v.SetInt(s.scanInt(verb, v.Type().Bits()))
		case reflect.Uint, reflect.Uint8, reflect.Uint16, reflect.Uint32, reflect.Uint64, reflect.Uintptr:
			v.SetUint(s.scanUint(verb, v.Type().Bits()))
		case reflect.String:
			v.SetString(s.convertString(verb))
		case reflect.Slice:
			typ := v.Type()
			// 对于切片，只能处理 []byte 的别名类型。
			if typ.Elem().Kind() != reflect.Uint8 {
				s.errorString("can't scan type: " + val.Type().String())
			}
			// 解析出字符串
			str := s.convertString(verb)
			// 转换为字节切片返回
			v.Set(reflect.MakeSlice(typ, len(str), len(str)))
			for i := 0; i < len(str); i++ {
				v.Index(i).SetUint(uint64(str[i]))
			}
		case reflect.Float32, reflect.Float64:
			s.skipSpace(false)
			s.notEOF()
			v.SetFloat(s.convertFloat(s.floatToken(), v.Type().Bits()))
		case reflect.Complex64, reflect.Complex128:
			v.SetComplex(s.scanComplex(verb, v.Type().Bits()))
		default:
			s.errorString("can't scan type: " + val.Type().String())
		}
	}
}

// 将本地引发的 panic（scanError 类型）和 EOF panic 转换为 error。
func errorHandler(errp *error) {
	if e := recover(); e != nil {
		// 本地 panic 转换为 error
		if se, ok := e.(scanError); ok {
			*errp = se.err
			// EOF panic 也转换为 error
		} else if eof, ok := e.(error); ok && eof == io.EOF {
			*errp = eof
		} else {
			panic(e)
		}
	}
}

// 扫描器的扫描过程
func (s *ss) doScan(a []interface{}) (numProcessed int, err error) {
	defer errorHandler(&err)

	// 循环处理所有 arg
	for _, arg := range a {
		s.scanOne('v', arg)
		numProcessed++
	}

	// 所有参数扫描结束

	// 检查是否以换行符或 EOF 结尾（Scanln 等需要这个错误信息）
	if s.nlIsEnd {
		for {
			r := s.getRune()
			if r == '\n' || r == eof {
				break
			}
			// 跳过空白字符后再次判断
			if !isSpace(r) {
				s.errorString("expected newline")
				break
			}
		}
	}
	return
}

// 处理非占位字符串，返回已处理的字节数。处理结果分为以下几种情况：
// 遇到占位符               ：返回 % 之前的字节数
// 不匹配                   ：返回 -1
// 完全匹配（format 被读完）：返回 len(foramt)
// 输入端被读完             ：强行中止扫描
// advance 的逻辑比较复杂，要配合 doScanf 理解，很难完全理解。
func (s *ss) advance(format string) (i int) {
	// 这里的 format 不是完整的格式字符串，而是由 doScanf 提供的
	// 未处理部分的格式字符串。doScanf 处理完一个占位符后，就把
	// 剩下的格式字符串交给 advance 处理。
	for i < len(format) {
		// 解码一个待处理字符
		fmtc, w := utf8.DecodeRuneInString(format[i:])

		// 1、处理遇到的 % 号

		if fmtc == '%' {
			// 不能以 % 结尾
			if i+w == len(format) {
				s.errorString("missing verb: % at end of format string")
			}
			nextc, _ := utf8.DecodeRuneInString(format[i+w:])
			// 遇到单独的 %（占位符）则返回 % 的下标 i（即 % 之前已处理的字节数）
			if nextc != '%' {
				return
			}
			// %% 被解析为一个 %，当做普通字符，交给后面处理
			i += w // 跳过 %% 中的前一个 %
		}

		// 2、处理 format 中的连续空白字符

		sawSpace := false   // 是否遇到连续的空白字符（包括换行符）
		wasNewline := false // 是否遇到换行符

		// 跳过连续的空白符
		for isSpace(fmtc) && i < len(format) {
			if fmtc == '\n' {
				if wasNewline {
					// 一次只处理一个换行符，之后的换行符交给后面处理
					break
				}
				// 登记遇到换行符
				wasNewline = true
			}
			// 登记遇到空白字符
			sawSpace = true
			i += w // 跳过已处理的空白字符
			// 更新待处理字符
			fmtc, w = utf8.DecodeRuneInString(format[i:])
		}

		// 到此，表示没有连续空白或已跳过连续空白，
		// 此时 i 指向非空白字符或换行符（即前面遇到的未处理的换行符）。

		// 3、对比输入端的连续空白字符

		if sawSpace {
			inputc := s.getRune()
			if inputc == eof {
				// 输入端被读空，返回已处理的字节数。
				// 返回后，在 doScanf 中继续判断 format 是否也被读完。
				return
			}
			// 输入端未遇到空白字符，匹配失败，中止整个扫描过程，返回 err。
			if !isSpace(inputc) {
				s.errorString("expected space in input to match format")
			}
			// 输入端也遇到空白字符，跳过空白部分。
			for inputc != '\n' && isSpace(inputc) {
				inputc = s.getRune()
			}
			// 此时 inputc 有可能为 eof
			// 输入端遇到换行符
			if inputc == '\n' {
				// format 中未遇到换行符，匹配失败，中止整个扫描过程，返回 err。
				if !wasNewline {
					s.errorString("newline in input does not match format")
				}

				// 到此，输入端和 format 中都遇到换行符，匹配成功。

				// 输入端换行符之后的空白没有继续处理，而 format 中却处理了，
				// 这将导致 "\n a %d" 无法匹配 "\n a 1"。使用的时候要注意。

				// 匹配完毕，返回已处理的字节数
				// 这里把 \n 当做一次扫描结束，这种行为类似于 Scanln。
				return
			}

			// 输入端空白字符处理完毕，未遇到换行符，则读取的应该是非空白字符。

			// 撤销对非空白字符的读取，交给下一轮去处理。
			// 如果之前读取的是 eof 则 UnreadRune 不会撤销任何内容。
			s.UnreadRune()
			// format 中遇到换行符，与输入端不匹配
			if wasNewline {
				s.errorString("newline in format does not match input")
			}
			// 空白部分（第二个换行符之前的）全部匹配成功，继续下一轮，处理后面的字符。
			continue
		}

		// 到此，表示 format 中没遇到空白字符或空白字符已经处理完毕。

		// 4、处理 format 中的非空白字符

		// 使用 mustReadRune 而不是 getRune 表示如果读取失败（EOF），
		// 则中止整个扫描过程，返回 err。
		inputc := s.mustReadRune()

		// 非空白字符匹配失败，撤销对 input 的读取，并返回 -1
		if fmtc != inputc {
			// 匹配失败，应该不需要再做什么了，不过 advance 作为一个独立的功能函数，
			// 还是要严谨一些，执行 s.UnreadRune 是为了保证输入端中已处理的内容与 
			// format 中 i 的位置对齐。
			s.UnreadRune()
			return -1
		}
		// 非空白字符匹配成功，继续处理下一个字符。
		i += w
	}
	// 全部处理完毕，返回 len(format)
	return
}

// 扫描器的格式化扫描过程
func (s *ss) doScanf(format string, a []interface{}) (numProcessed int, err error) {
	// 消化本地 panic，结束整个扫描过程。
	defer errorHandler(&err)
	end := len(format) - 1
	for i := 0; i <= end; {
		// 先处理 format 中的非占位符部分。
		w := s.advance(format[i:])
		// 循环直到遇到 % 字符
		if w > 0 {
			i += w
			continue
			// 这里有一个作用，就是当 i == len(format) 时，
			// 会终止循环，不会继续在后面访问 format[i]
		}

		// 到这里，表示 format 没有处理完，而且应该处理占位符了。

		// 没有遇找到占位符，看看是什么原因
		if format[i] != '%' {
			// 非空白字符匹配失败
			if w < 0 {
				s.errorString("input does not match format")
			}
			// 到此，表示遇到 EOF

			// 不过代码不会执行到这里，因为在 advance 中 EOF 会引发 panic
			// 为了逻辑的严谨，这里还是需要添加一个 break，以防 advance 发生改变。
			break
		}

		i++ // 跳过 % 号

		// 读取占位符中的宽度信息
		var widPresent bool
		s.maxWid, widPresent, i = parsenum(format, i, end)
		// 如果没有设置宽度信息，则将宽度设置为默认值 hugeWid
		if !widPresent {
			s.maxWid = hugeWid // hugeWid 是常量 1 << 30
		}
		// 获取动词
		c, w := utf8.DecodeRuneInString(format[i:])
		i += w // 跳过动词

		// 如果动词不是 c，则跳过输入端开头的空白
		if c != 'c' {
			s.SkipSpace()
		}

		// 默认读取限制
		s.argLimit = s.limit
		// 根据占位符中的宽度信息设置输入端允许读出的最大字符数
		if f := s.count + s.maxWid; f < s.argLimit {
			s.argLimit = f
		}

		// arg 太少，占位符太多，数量不匹配。
		if numProcessed >= len(a) {
			s.errorString("too few operands for format '%" + format[i-w:] + "'")
			break
		}
		arg := a[numProcessed]

		s.scanOne(c, arg) // 处理一个 arg
		numProcessed++    // 跳过已处理的 arg
		// 恢复默认读取限制
		s.argLimit = s.limit
	}
	// arg 太多，占位符太少，数量不匹配。
	if numProcessed < len(a) {
		s.errorString("too many operands")
	}
	return
}

你可能感兴趣的:(go,go,golang,标准库,scan)

Go语言的数据结构 2401_90032081 包罗万象 golang 开发语言后端
Go语言的数据结构Go语言（也称为Golang）是一种由谷歌开发的开源编程语言，以其简单性、高效性和并发性而受到欢迎。作为一门现代语言，Go语言在处理数据时提供了丰富的数据结构，这些数据结构不仅可以帮助开发者管理复杂的数据关系，还能提高程序的性能和可读性。本文将详细探讨Go语言中的各种数据结构，包括数组、切片、映射、链表、树以及它们的使用场景与实现细节。一、数组1.1数组的定义在Go语言中，数组是
Logo语言的学习路线滕若岚包罗万象 golang 开发语言后端
学习Logo语言的路线图引言在计算机编程领域，有许多种编程语言可以选择，Logo语言因其独特的教育理念和简单性而受到广泛欢迎。Logo语言的设计初衷是为了给学生和初学者提供一个轻松愉快的编程学习体验，让他们在学习编程的过程中培养逻辑思维能力和创造力。本文将为您提供一条系统的Logo学习路线，使您能够从基础知识起步，逐渐掌握这门语言。一、Logo语言基础1.1什么是Logo语言？Logo语言最早是在
利用pprof对golang进行性能分析忍界英雄 go学习笔记 golang
利用pprof进行性能分析pprof性能分析的5个方面一、性能分析的五个核心维度CPU分析-剖析程序的CPU使用情况，定位高耗时函数内存分析-追踪内存分配与泄露，优化内存使用模式IO分析-监控文件/网络IO操作，发现瓶颈资源Goroutine分析-检测协程泄露与异常堆栈并发问题分析-诊断死锁及通过racedetector检测数据竞争数据采集时间生产环境采集：选择业务低峰期进行采样（凌晨2-4点）测
go面试必问，什么是中间件? 走，我们去吹风中间件 golang 面试服务器后端
中间件用过么？Middleware是Web的重要组成部分，中间件（通常）是一小段代码，它们接受一个请求，对其进行处理，每个中间件只处理一件事情，完成后将其传递给另一个中间件或最终处理程序，这样就做到了程序的解耦。全局中间件所有的请求都要经过此中间件packagemainimport("fmt""time""github.com/gin-gonic/gin")//定义中间funcMiddleWare
自我学习: Django-用户登录+中间件 yzybang django 中间件学习
以form来做，因为form没有写入能力，比较安全fromdjango.shortcutsimportrender,HttpResponse,redirectfromapp01importmodelsfromdjangoimportformsfromapp01.utils.encryptimportmd5#form需自己定义“字段”classLoginForm(forms.Form):name=f
基于Django中间件的权限认证组件特仑苏纯酸奶 Django permission
用户权限认证组件包括权限model类和中间件类model类介绍Permission权限类权限基本信息包括title：权限名称url：权限具体urlRole角色类角色类包括title：角色名称permission：角色的权限权限和角色多对多关系用户类需要对Role类设置多对多映射Whitelist白名单类白名单包括title：权限名称url：权限具体url白名单内存放的是系统放行不进行权限校验的ur
Go 中间件学习 qq_17280559 golang 中间件学习 go
文章目录1.设计中间件接口2.创建中间件函数3.使用中间件4.中间件链5.使用第三方框架6.定义自定义中间件7.使用自定义中间件应用到整个路由组应用到单个路由8.访问上下文中的信息9.控制流程总结在Go中，中间件（Middleware）是一种设计模式，常用于在请求处理的各个阶段添加通用功能，如日志记录、身份验证、异常处理等。中间件通常应用于HTTP服务器（如net/http包或第三方框架如Gin）
88.Django中间件的说明与使用方法想成为数据分析师的开发工程师 Python_Django框架 django 中间件 python web 后端
1.概述AOP（AspectOrientedProgramming），面向切面编程，是对业务逻辑的各个部分进行隔离，从而使得业务逻辑各部分之间的耦合度降低，提高程序的可重用性，同时提高了开发的效率。可以实现在不修改源代码的情况下给程序动态统一添加功能的一种技术。面向切面编程，就是将交叉业务逻辑封装成切面，利用AOP的功能将切面织入到主业务逻辑中。所谓交叉业务逻辑是指，通用的，与主业务逻辑无关的代码
Go语言中间件（Middleware）欣欣子的摸爬滚打实习记录 go 中间件
首先，什么是Handler？简单来说，goWeb通过http.HandleFunc（）来注册默认路由，将传入URL匹配到相应的Handler。它的函数原型为：http.HandleFunc(patternstring,handlerfunc(ResponseWriter,*Request))其中，Handler是我们处理请求和生成返回信息逻辑处理函数。什么是中间件呢？中间件（MiddleWare）
django中间件说明 LCY133 #django项目实战2023 django 中间件 python
Django中间件是一种在请求和响应处理过程中介入的机制，允许你在视图处理请求之前或之后执行自定义代码。中间件适用于处理全局性任务，如身份验证、日志记录、内容修改等。以下是Django中间件的详细说明和使用方法：一、中间件的核心概念作用阶段：•请求阶段：在路由到视图之前处理请求（如身份验证）。•视图阶段：在调用视图前后执行操作（如权限检查）。•响应阶段：在返回响应前修改内容（如添加HTTP头）。•
架构设计与模式之：容器化与云原生架构设计模式 AI天才研究院 Python实战 DeepSeek R1 &大数据AI人工智能大模型大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术1.简介当今，企业越来越依赖云计算服务来获得快速、经济和弹性伸缩的能力。云原生架构正逐渐成为主流，而容器技术也已经在为企业提供更灵活、更高效的开发环境。本文将从云原生架构和容器技术的角度出发，结合实际应用场景，系统全面剖析容器化及云原生架构的设计模式及优缺点，并为读者提供参考指导。2.背景介绍什么是云原生？云原生（CloudNative）的概念源于Google在Kube
nodejs+mysql分页查询 m0_67987829 mysql 前端 node.js
router:（参数page,size）goodsRouter.get("/getList",getGoodsList)controllerasyncgetGoodsList(ctx,next){const{page,size}=ctx.query;//获取查询参数//将page和size转换为数字类型constparsedPage=parseInt(page);constparsedSize=p
sequelize + Nodejs + MySQL 的简单用法小公鸡卡哇伊呀~ mysql 数据库
HowtoUseSequelizeORMinNodeJS-Tutorial1Sequlize简介Sequelize是最流行的可以与Nodejs一起使用的一种关系数据库ORM(Object-relationalmapping对象关系映射)，Mongoose是MongoDB的ORM.Sequelize的作用，简单地说，就是避免在代码里写原生SQL语句，而是将这种语句改成JavaScript：不必再写类
【APM】Loki日志多行显示运维归一 DevOps APM loki 日志并行
上一篇文章我们搭建了Alertmanager和Loki，接下来我们来实现日志并行显示专栏：https://blog.csdn.net/zhanremo3062/category_12552674.html我们只需要修改Promtail服务的配置文件即可multiline:#RE2正则表达式，如果匹配将开始一个新的多行日志块#这个表达式必须被提供firstline:#解析的最大等待时间（Godura
【最佳实践】Go 状态模式 worxfr Go 设计模式 golang 状态模式 ui
设计思路状态模式的核心在于将对象的行为封装在特定的状态类中，使得对象在不同的状态下表现出不同的行为。每个状态实现同一个接口，允许对象在运行时通过改变其内部状态对象来改变其行为。状态模式使得状态转换更加明确，并且易于扩展新的状态和行为。场景描述假设我们有一个简单的文档编辑器，文档可以处于不同的编辑状态：草稿、审核、发布。每个状态对应不同的行为，比如在草稿状态下可以编辑内容，在审核状态下可以提交审核，
2025年机械工程、船舶与材料工程国际会议(ICMESME 2025) 投稿、参会咨询理科材料工程机械工程国际会议
2025InternationalConferenceonMechanicalEngineering,ShipandMaterialsEngineering一、大会信息会议简称：ICMESME2025大会地点：中国·桂林收录检索：提交EiCompendex,CPCI,CNKI,GoogleScholar等二、会议简介2025年机械工程、船舶与材料工程国际会议（简称ICMEMSE2025）即将在风景
Python学习第十九天 Leo来编程 Python学习学习 python
Django-分页后端分页Django提供了Paginator类来实现后端分页。Paginator类可以将一个查询集（QuerySet）分成多个页面，每个页面包含指定数量的对象。fromdjango.shortcutsimportrender,redirect,get_object_or_404from.modelsimportUserfrom.formsimportUserFormfromdja
【go从入门到精通】探秘struct结构体转json为什么需要首字母大写？前网易架构师-高司机 golang从入门到精通 golang json go 结构体首字母大写 golang从入门到精通 go从入门到精通
目录作者简介：问题抛出分析结论作者简介：高科，先后在IBMPlatformComputing从事网格计算，淘米网，网易从事游戏服务器开发，拥有丰富的C++，go等语言开发经验，mysql，mongo，redis等数据库，设计模式和网络库开发经验，对战棋类，回合制，moba类页游，手游有丰富的架构设计和开发经验。并且深耕深度学习和数据集训练，提供商业化的视觉人工智能检测和预警系统（煤矿，工厂，制造业
linux下使用curl访问多参数url 耘田 Linux curl linux url 多参数
curl-ihttp://marsoffset.goforandroid.com/GoSmsMarService/abc?a=116.397428&b=39.90923[1]8741[jb-xccheng@usa-ip-12~]$HTTP/1.1500InternalServerErrorServer:nginx/1.2.0Date:Wed,20Jun201204:16:21GMTContent-
【go语言】Gin框架介绍和使用加油，旭杏 Go语言 gin
一、简单使用Gin框架搭建一个服务器packagemainimport("github.com/gin-gonic/gin")funcmain(){//创建一个默认的路由引擎r:=gin.Default()//GET请求方法r.GET("/hello",func(c*gin.Context){//c.JSON返回的是JSON格式的数据c.JSON(200,gin.H{"message":"hell
@Component—@Autowired—@Mapper—@Bean 追JAVA的小菜鸟零碎知识点 bean java mybatis spring component
注解详解一、@Component二、@Autowired注解支持context:annotation-config——手动注入beancontext:component-scanbase-package="zy.pojo"——扫描包并自动注入总结三、@Mapper@Mapper与@Repository四、@Bean@Bean与@Component区别一、@Component作用：表明了此类为一个组
在使用selenium进行爬虫时， add_experimental_optio(),add_argument()的用法数据牧马人 selenium 爬虫测试工具
driver.add_experimental_option('excludeSwitches',['enable-automation'])是在使用SeleniumWebDriver与浏览器交互时设置的一行代码。这行代码用于禁用浏览器中的自动化检测。具体来说，当你在使用SeleniumWebDriver与浏览器交互时，有些浏览器（例如GoogleChrome）可能会检测到自动化行为（例如，通过检
云原生：K8s（Kubernetes）高频典型面试题汇总老舅的火箭爱扫地云原生 kubernetes 容器
1.简述etcd及其特点？答：etcd是CoreOS团队发起的开源项目，是一个管理配置信息和服务发现（servicediscovery）的项目，它的目标是构建一个高可用的分布式键值（key-value）数据库，基于Go语言实现。特点：l简单：支持REST风格的HTTP+JSONAPIl安全：支持HTTPS方式的访问l快速：支持并发1k/s的写操作l可靠：支持分布式结构，基于Raft的一致性算法，R
批量检查微信小程序是否被封的Go代码微信微信小程序
概述：这段Go代码通过请求接口https://api.52an.fun/xcx/checkxcx.php?appid={appid}，批量检查多个微信小程序是否被封禁。接口返回的JSON数据中包含code字段，code为1表示小程序正常，code为0表示小程序被封禁，并且会返回封禁原因。程序会根据返回结果输出每个小程序的状态。Go代码示例：packagemainimport("encoding/j
去除Dialog出现时背景变暗效果的方法 Shawn_LX
在样式XML文件下添加自定义Dialog样式，继承自android:Theme.Dialog主题样式true@android:color/transparentfalse加入以上属性后重写onCreateDialog()方法：@OverrideprotectedDialogonCreateDialog(intid){//TODOAuto-generatedmethodstubif(id==1){D
【C语言】C语言数据类型和变量练习巩固 ChiaWei Lee C语言 c语言开发语言
1、关于scanf函数说法正确的是？A.scanf中也有占位符，占位符和后边的参数提供的地址一一对应。B.scanf()处理所有占位符时，会自动过滤起首的空白字符，包括空格、制表符、换行符C.scanf的占位符%s表示读取一个字符串，遇到空白字符也全部读取D.scanf是库函数，库函数不需要包含头文件正确答案：AB：scanf()处理数值占位符时，会自动过滤空白字符，包括空格、制表符、换行符，sc
从零到精通：用go+vue语言打造高效多语言博客系统的完整指南程序员爱钓鱼 golang vue.js 开发语言
后端部分(Go)首先创建文章相关的数据模型packagemodelimport(“gorm.io/gorm”)//Article文章主表typeArticlestruct{gorm.ModelStatusuint8json:"status"gorm:"default:1"//状态：0-禁用1-启用Sortintjson:"sort"gorm:"default:0"//排序AuthorIduintj
初识C语言之函数(上) 乞丐1469 C语言学习 c语言学习开发语言
一.函数的概念1.函数的定义:在C语言中函数就是一个完成某项特定任务的一小段代码。2.函数的作用:一个大的计算机任务可以分为若干个较小的函数来完成。(同一个函数如果能完成某项特定任务的话，这个函数就可以重复使用，从而提高开发软件的效率)3.函数的分类:①库函数:由C语言库直接提供②自定义函数:由自己创造的函数二.库函数标准库和头文件:库函数的相关信息主要详见于下方链接http://zh.cppre
DeepSeek 在代码生成方面的优势解析草莓屁屁我不吃人工智能 ai chatgpt
在AI代码生成领域，DeepSeek通过其DeepSeek-Coder模型展现出强大的能力，与OpenAI的Codex、Meta的CodeLlama、Google的AlphaCode等国际领先模型同台竞争。文章将详细解析DeepSeek在代码生成方面的优势，包括模型架构、数据训练、优化策略、编程语言支持、推理效率等核心技术点。1.DeepSeek-Coder的模型架构优化DeepSeek-Code
Google Gemini 大模型技术架构剖析 musicml 人工智能
▼最近直播超级多，预约保你有收获近期直播：《从原理到实践教你做出一个Gemini/ChatGPT》—1—Gemini技术架构剖析Google新的多模态模型家族Gemini，它在文本、图像、音频、视频等方面具有卓越的能力。Gemini系列包括Ultra、Pro和Nano三种尺寸，适用于从复杂的推理任务到设备内存受限的应用场景。GeminiUltra是最强大的模型，可在各种高度复杂的任务（包括推理和多
Java序列化进阶篇 g21121 java序列化
1.transient 类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。
escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函
ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.
Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a) 成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu
全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
移动互联网时代来了！ App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程
Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C
SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.
[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可
document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");
关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这
NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value
Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目
【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p
Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so
java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.
读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {
SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再
JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而
vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时
shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w
高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国
hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。有时候我们需要查询返回DTO对象，因为DTO
Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th
Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一
关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w
不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M
自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举
Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit
利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =