yshuise

ghostscript源码分析之 scan_token()函数 (词法分析器iscan.c)

scan_token()函数很重要，ghostscript写得比较琐碎难懂，里面有些有英文解释。

我只对我关注的部分加了些中文注释。当然不是所有的都理解了。但是功能还是清楚了的，像某些函数接口。

如果让我写的话，我一定比他写得更清晰。哈哈，当然他的scan_token基本的框架

设计还是很赞同的。同时另外一个很困难的interp函数也给我这种感觉，很琐碎。但思想比较好，比纯递归高明些。

/* * Read a token from a stream. Return 0 if an ordinary token was read, * >0 for special situations (see iscan.h). * If the token required a terminating character (i.e., was a name or * number) and the next character was whitespace, read and discard * that character. Note that the state is relevant for e_VMerror * as well as for scan_Refill. */ int scan_token(i_ctx_t *i_ctx_p, ref * pref, scanner_state * pstate) { stream *const s = pstate->s_file.value.pfile; ref *myref = pref; int retcode = 0; int c; /* #define s_declare_inline(s, cp, ep)/ register const byte *cp;/ const byte *ep #define s_begin_inline(s, cp, ep)/ cp = (s)->srptr, ep = (s)->srlimit #define s_end_inline(s, cp, ep)/ (s)->srptr = cp #define sputback_inline(s, cp, ep)/ --cp */ s_declare_inline(s, sptr, endptr); #define scan_begin_inline() s_begin_inline(s, sptr, endptr) #define scan_getc() sgetc_inline(s, sptr, endptr) #define scan_putback() sputback_inline(s, sptr, endptr) #define scan_end_inline() s_end_inline(s, sptr, endptr) const byte *newptr; byte *daptr; #define sreturn(code)/ { retcode = gs_note_error(code); goto sret; } #define if_not_spush1()/ if ( osp < ostop ) osp++;/ else if ( (retcode = ref_stack_push(&o_stack, 1)) >= 0 )/ ;/ else #define spop1()/ if ( osp >= osbot ) osp--;/ else ref_stack_pop(&o_stack, 1) int max_name_ctype = (recognize_btokens()? ctype_name : ctype_btoken); /*用于数字*/ #define scan_sign(sign, ptr)/ switch ( *ptr ) {/ case '-': sign = -1; ptr++; break;/ case '+': sign = 1; ptr++; break;/ default: sign = 0;/ } /*回滚nback字符*/ #define refill2_back(styp,nback)/ BEGIN sptr -= nback; scan_type = styp; goto pause; END #define ensure2_back(styp,nback)/ if ( sptr >= endptr ) refill2_back(styp,nback) #define ensure2(styp) ensure2_back(styp, 1) #define refill2(styp) refill2_back(styp, 1) byte s1[2]; const byte *const decoder = scan_char_decoder; int status; int sign; const bool check_only = (pstate->s_options & SCAN_CHECK_ONLY) != 0; const bool PDFScanRules = (i_ctx_p->scanner_options & SCAN_PDF_RULES) != 0; /* * The following is a hack so that ^D will be self-delimiting in PS files * (to compensate for bugs in some PostScript-generating applications) * but not in strings (to match CPSI on the CET) or PDF. */ const int ctrld = (pstate->s_options & SCAN_FROM_STRING || PDFScanRules ? 0x04 : 0xffff); scanner_state sstate; #define pstack sstate.s_pstack #define pdepth sstate.s_pdepth #define scan_type sstate.s_scan_type #define da sstate.s_da #define name_type sstate.s_ss.s_name.s_name_type #define try_number sstate.s_ss.s_name.s_try_number sptr = endptr = NULL; /* Quiet compiler */ if (pstate->s_pstack != 0) { if_not_spush1() return retcode; myref = osp; } /* Check whether we are resuming after an interruption. */ if (pstate->s_scan_type != scanning_none) { sstate = *pstate; if (!da.is_dynamic && da.base != da.buf) { /* The da contains some self-referencing pointers. */ /* Fix them up now. */ uint next = da.next - da.base; uint limit = da.limit - da.base; da.base = da.buf; da.next = da.buf + next; da.limit = da.buf + limit; } daptr = da.next; switch (scan_type) { case scanning_binary: retcode = (*sstate.s_ss.binary.cont) (i_ctx_p, myref, &sstate); scan_begin_inline(); if (retcode == scan_Refill) goto pause; goto sret; case scanning_comment: scan_begin_inline(); goto cont_comment; case scanning_name: goto cont_name; case scanning_string: goto cont_string; default: return_error(e_Fatal); } } /* Fetch any state variables that are relevant even if */ /* scan_type == scanning_none. */ pstack = pstate->s_pstack; pdepth = pstate->s_pdepth; ref_assign(&sstate.s_file, &pstate->s_file); sstate.s_options = pstate->s_options; SCAN_INIT_ERROR(&sstate); scan_begin_inline(); /* * Loop invariants: * If pstack != 0, myref = osp, and *osp is a valid slot. */ top:c = scan_getc(); if_debug1('S', (c >= 32 && c <= 126 ? "`%c'" : c >= 0 ? "`//%03o'" : "`%d'"), c); switch (c) { case ' ': case '/f': case '/t': case char_CR: case char_EOL: case char_NULL: /* 上面这些字符被跳过 */ goto top; case 0x04: /* see ctrld above */ if (c == ctrld) /* treat as ordinary name char */ goto begin_name; case '[': case ']': /* [......] 的解析方式和 {......}的解析方式是不同的。 []中的每个元素都要经过执行，也就是要经过interp函数解析；而{}中的元素是不需要执行，而是直接压栈。 ']' 操作符的执行是由两个操作符构成:zcounttomark ,array */ s1[0] = (byte) c; /*查找字符是否在表中？如果不在就加入。并让它和对象关联，这个对象关联最重要的是要执行的函数，将在interp执行*/ retcode = name_ref(imemory, s1, 1, myref, 1); /* can't fail */ r_set_attrs(myref, a_executable); break; /* Strings: As hexadecimal data, enclosed in < and > As ASCII base-85 data, enclosed in <~ and ~> Dictionaries: << key1 value1 key2 value2 … keyn valuen >> */ case '<': if (scan_enable_level2) { ensure2(scanning_none); c = scan_getc(); switch (c) { case '<'://字典的操作符“<<......>>” scan_putback(); name_type = 0; try_number = false; goto try_funny_name; case '~': //处理 ASCII85 <~.......~> s_A85D_init_inline(&sstate.s_ss.a85d); sstate.s_ss.st.template = &s_A85D_template; goto str; } scan_putback(); } s_AXD_init_inline(&sstate.s_ss.axd); sstate.s_ss.st.template = &s_AXD_template; str:scan_end_inline(); dynamic_init(&da, imemory); cont_string:for (;;) { stream_cursor_write w; w.ptr = da.next - 1; w.limit = da.limit - 1; //处理字符串调用s_PSSD_process() status = (*sstate.s_ss.st.template->process) (&sstate.s_ss.st, &s->cursor.r, &w, s->end_status == EOFC); if (!check_only) da.next = w.ptr + 1; switch (status) { case 0: status = s->end_status; if (status < 0) { if (status == EOFC) { if (check_only) { retcode = scan_Refill; scan_type = scanning_string; goto suspend; } else sreturn(e_syntaxerror); } break; } s_process_read_buf(s); continue; case 1: if (!check_only) { retcode = dynamic_grow(&da, da.next, max_string_size); if (retcode == e_VMerror) { scan_type = scanning_string; goto suspend; } else if (retcode < 0) sreturn(retcode); } continue; } break; } scan_begin_inline(); switch (status) { default: /*case ERRC: */ sreturn(e_syntaxerror); case INTC: case CALLC: scan_type = scanning_string; goto pause; case EOFC: ; } retcode = dynamic_make_string(i_ctx_p, myref, &da, da.next); if (retcode < 0) { /* VMerror */ sputback(s); /* rescan ) */ scan_type = scanning_string; goto suspend; } break; case '(': sstate.s_ss.pssd.from_string = ((pstate->s_options & SCAN_FROM_STRING) != 0) && !scan_enable_level2; s_PSSD_partially_init_inline(&sstate.s_ss.pssd); sstate.s_ss.st.template = &s_PSSD_template; goto str; case '{': /* 比较 {} 和 [] 的执行方式不同 */ if (pstack == 0) { /* outermost procedure */ if_not_spush1() { scan_putback(); scan_type = scanning_none; goto pause_ret; } pdepth = ref_stack_count_inline(&o_stack); } make_int(osp, pstack); pstack = ref_stack_count_inline(&o_stack); if_debug3('S', "[S{]d=%d, s=%d->%d/n", pdepth, (int)osp->value.intval, pstack); goto snext; case '>': if (scan_enable_level2) { ensure2(scanning_none); name_type = 0; try_number = false; goto try_funny_name; } /* falls through */ case ')': /* 在处理'('的时候，处理了 ')' */ sreturn(e_syntaxerror); case '}': if (pstack == 0) sreturn(e_syntaxerror); osp--; { uint size = ref_stack_count_inline(&o_stack) - pstack; ref arr; if_debug4('S', "[S}]d=%d, s=%d->%d, c=%d/n", pdepth, pstack, (pstack == pdepth ? 0 : ref_stack_index(&o_stack, size)->value.intval), size + pstack); myref = (pstack == pdepth ? pref : &arr); if (check_only) { make_empty_array(myref, 0); ref_stack_pop(&o_stack, size); } else if (ref_array_packing.value.boolval) { retcode = make_packed_array(myref, &o_stack, size, idmemory, "scanner(packed)"); if (retcode < 0) { /* must be VMerror */ osp++; scan_putback(); scan_type = scanning_none; goto pause_ret; } r_set_attrs(myref, a_executable); } else { /* 分配一个数组*/ retcode = ialloc_ref_array(myref, a_executable + a_all, size, "scanner(proc)"); if (retcode < 0) { /* must be VMerror */ osp++; scan_putback(); scan_type = scanning_none; goto pause_ret; }//ref_stack_store 这步非常重要：把o_stack中size个对象拷贝到myref中。 retcode = ref_stack_store(&o_stack, myref, size, 0, 1, false, idmemory, "scanner"); if (retcode < 0) { ifree_ref_array(myref, "scanner(proc)"); sreturn(retcode); } ref_stack_pop(&o_stack, size); } if (pstack == pdepth) { /* This was the top-level procedure. */ spop1(); pstack = 0; } else { if (osp < osbot) ref_stack_pop_block(&o_stack); pstack = osp->value.intval; *osp = arr; goto snext; } } break; case '/': /* * If the last thing in the input is a '/', don't try to read * any more data. */ /* name要分两种形式：/name, //name */ if (sptr >= endptr && s->end_status != EOFC) { refill2(scanning_none); } c = scan_getc(); if (!PDFScanRules && (c == '/')) { name_type = 2; c = scan_getc(); } else name_type = 1; try_number = false; switch (decoder[c]) { case ctype_name: default: goto do_name; case ctype_btoken: if (!recognize_btokens()) goto do_name; /* otherwise, an empty name */ case ctype_exception: case ctype_space: /* * Amazingly enough, the Adobe implementations don't accept * / or // followed by [, ], <<, or >>, so we do the same. * (Older versions of our code had a ctype_other case here * that handled these specially.) */ case ctype_other: if (c == ctrld) /* see above */ goto do_name; da.base = da.limit = daptr = 0; da.is_dynamic = false; goto nx; } case '%': /*处理注释*/ { /* Scan as much as possible within the buffer. */ const byte *base = sptr; const byte *end; while (++sptr < endptr) /* stop 1 char early */ switch (*sptr) { case char_CR: end = sptr; if (sptr[1] == char_EOL) sptr++; cend: /* Check for externally processed comments. */ retcode = scan_comment(i_ctx_p, myref, &sstate, base, end, false); if (retcode != 0) goto comment; goto top; case char_EOL: case '/f': end = sptr; goto cend; } /* * We got to the end of the buffer while inside a comment. * If there is a possibility that we must pass the comment * to an external procedure, move what we have collected * so far into a private buffer now. */ #define comment_line da.buf --sptr; comment_line[1] = 0; { /* Could be an externally processable comment. */ uint len = sptr + 1 - base; if (len > sizeof(comment_line)) len = sizeof(comment_line); memcpy(comment_line, base, len); daptr = comment_line + len; } da.base = comment_line; da.is_dynamic = false; } /* Enter here to continue scanning a comment. */ /* daptr must be set. */ cont_comment:for (;;) { switch ((c = scan_getc())) { default: if (c < 0) switch (c) { case INTC: case CALLC: da.next = daptr; scan_type = scanning_comment; goto pause; case EOFC: /* * One would think that an EOF in a comment * should be a syntax error, but there are * quite a number of files that end that way. */ goto end_comment; default: sreturn(e_syntaxerror); } if (daptr < comment_line + max_comment_line) *daptr++ = c; continue; case char_CR: case char_EOL: case '/f': end_comment: retcode = scan_comment(i_ctx_p, myref, &sstate, comment_line, daptr, true); if (retcode != 0) goto comment; goto top; } } #undef comment_line /*NOTREACHED */ case EOFC: if (pstack != 0) { if (check_only) goto pause; sreturn(e_syntaxerror); } retcode = scan_EOF; break; case ERRC: sreturn(e_ioerror); /* Check for a Level 2 funny name (<< or >>). */ /* c is '<' or '>'. We already did an ensure2. */ try_funny_name: { int c1 = scan_getc(); if (c1 == c) { s1[0] = s1[1] = c; name_ref(imemory, s1, 2, myref, 1); /* can't fail */ goto have_name; } scan_putback(); } sreturn(e_syntaxerror); /* Handle separately the names that might be a number. */ case '0': case '1': case '2': case '3': case '4': case '5': case '6': case '7': case '8': case '9': case '.': sign = 0; nr: /* * Skip a leading sign, if any, by conditionally passing * sptr + 1 rather than sptr. Also, if the last character * in the buffer is a CR, we must stop the scan 1 character * early, to be sure that we can test for CR+LF within the * buffer, by passing endptr rather than endptr + 1. */ /*以数字开头的有可能是name*/ retcode = scan_number(sptr + (sign & 1), endptr /*(*endptr == char_CR ? endptr : endptr + 1) */ , sign, myref, &newptr, i_ctx_p->scanner_options); if (retcode == 1 && decoder[newptr[-1]] == ctype_space) {//如果不是返回代码为1和以空格结束，那么再按name处理：goto do_name sptr = newptr - 1; /*数字应该进入这个流程*/ if (*sptr == char_CR && sptr[1] == char_EOL) sptr++; retcode = 0; ref_mark_new(myref); break; } /*2222_ ,以数字开头name的情况*/ name_type = 0; try_number = true; goto do_name; case '+': sign = 1; goto nr; case '-': sign = -1; goto nr; /* Check for a binary object */ #define case4(c) case c: case c+1: case c+2: case c+3 case4(128): case4(132): case4(136): case4(140): case4(144): case4(148): case4(152): case4(156): #undef case4 if (recognize_btokens()) { scan_end_inline(); retcode = scan_binary_token(i_ctx_p, myref, &sstate); scan_begin_inline(); if (retcode == scan_Refill) goto pause; break; } /* Not a binary object, fall through. */ /* The default is a name. */ default: if (c < 0) { dynamic_init(&da, name_memory(imemory)); /* da state must be clean */ scan_type = scanning_none; goto pause; } /* Populate the switch with enough cases to force */ /* simple compilers to use a dispatch rather than tests. */ case '!': case '"': case '#': case '$': case '&': case '/'': case '*': case ',': case '=': case ':': case ';': case '?': case '@': case 'A': case 'B': case 'C': case 'D': case 'E': case 'F': case 'G': case 'H': case 'I': case 'J': case 'K': case 'L': case 'M': case 'N': case 'O': case 'P': case 'Q': case 'R': case 'S': case 'T': case 'U': case 'V': case 'W': case 'X': case 'Y': case 'Z': case '//': case '^': case '_': case '`': case 'a': case 'b': case 'c': case 'd': case 'e': case 'f': case 'g': case 'h': case 'i': case 'j': case 'k': case 'l': case 'm': case 'n': case 'o': case 'p': case 'q': case 'r': case 's': case 't': case 'u': case 'v': case 'w': case 'x': case 'y': case 'z': case '|': case '~': begin_name: /* Common code for scanning a name. */ /* try_number and name_type are already set. */ /* We know c has ctype_name (or maybe ctype_btoken, */ /* or is ^D) or is a digit. */ name_type = 0; try_number = false; do_name: /* Try to scan entirely within the stream buffer. */ /* We stop 1 character early, so we don't switch buffers */ /* looking ahead if the name is terminated by /r/n. */ da.base = (byte *) sptr; da.is_dynamic = false; { const byte *endp1 = endptr - 1; do { if (sptr >= endp1) /* stop 1 early! */ goto dyn_name; } while (decoder[*++sptr] <= max_name_ctype || *sptr == ctrld); /* digit or name */ } /* Name ended within the buffer. */ daptr = (byte *) sptr; c = *sptr; goto nx; dyn_name: /* Name extended past end of buffer. */ scan_end_inline(); /* Initialize the dynamic area. */ /* We have to do this before the next */ /* sgetc, which will overwrite the buffer. */ da.limit = (byte *)++ sptr; da.memory = name_memory(imemory); retcode = dynamic_grow(&da, da.limit, name_max_string); if (retcode < 0) { dynamic_save(&da); if (retcode != e_VMerror) sreturn(retcode); scan_type = scanning_name; goto pause_ret; } daptr = da.next; /* Enter here to continue scanning a name. */ /* daptr must be set. */ cont_name:scan_begin_inline(); while (decoder[c = scan_getc()] <= max_name_ctype || c == ctrld) { if (daptr == da.limit) { retcode = dynamic_grow(&da, daptr, name_max_string); if (retcode < 0) { dynamic_save(&da); if (retcode != e_VMerror) sreturn(retcode); scan_putback(); scan_type = scanning_name; goto pause_ret; } daptr = da.next; } *daptr++ = c; } nx:switch (decoder[c]) { case ctype_other: if (c == ctrld) /* see above */ break; case ctype_btoken: scan_putback(); break; case ctype_space: /* Check for /r/n */ if (c == char_CR) { if (sptr >= endptr) { /* ensure2 *//* We have to check specially for */ /* the case where the very last */ /* character of a file is a CR. */ if (s->end_status != EOFC) { sptr--; goto pause_name; } } else if (sptr[1] == char_EOL) sptr++; } break; case ctype_exception: switch (c) { case INTC: case CALLC: goto pause_name; case ERRC: sreturn(e_ioerror); case EOFC: break; } } /* Check for a number */ if (try_number) { const byte *base = da.base; scan_sign(sign, base); retcode = scan_number(base, daptr, sign, myref, &newptr, i_ctx_p->scanner_options); if (retcode == 1) { ref_mark_new(myref); retcode = 0; } else if (retcode != e_syntaxerror) { dynamic_free(&da); if (name_type == 2) sreturn(e_syntaxerror); break; /* might be e_limitcheck */ } } if (da.is_dynamic) { /* We've already allocated the string on the heap. */ uint size = daptr - da.base; // 这儿很重要，上面scan_number()能识别数字，但是这儿size还是能确定是否是数字？或是name // 比如：2222_,是一个name,而非数字，但是解析器处理起来很冗余。 retcode = name_ref(imemory, da.base, size, myref, -1); if (retcode >= 0) { dynamic_free(&da); } else { retcode = dynamic_resize(&da, size); if (retcode < 0) { /* VMerror */ if (c != EOFC) scan_putback(); scan_type = scanning_name; goto pause_ret; } retcode = name_ref(imemory, da.base, size, myref, 2); } } else { retcode = name_ref(imemory, da.base, (uint) (daptr - da.base), myref, !s->foreign); } /* Done scanning. Check for preceding /'s. */ if (retcode < 0) { if (retcode != e_VMerror) sreturn(retcode); if (!da.is_dynamic) { da.next = daptr; dynamic_save(&da); } if (c != EOFC) scan_putback(); scan_type = scanning_name; goto pause_ret; } have_name:switch (name_type) { case 0: /* ordinary executable name */ /* /name0 这种形式 */ if (r_has_type(myref, t_name)) /* i.e., not a number */ r_set_attrs(myref, a_executable); case 1: /* quoted name */ break; case 2: /* immediate lookup */ /* //name0 这种形式需要立即在字典里查找 */ { ref *pvalue; if (!r_has_type(myref, t_name) || (pvalue = dict_find_name(myref)) == 0) { ref_assign(&sstate.s_error.object, myref); r_set_attrs(&sstate.s_error.object, a_executable); /* Adobe compatibility */ sreturn(e_undefined); } if (pstack != 0 && r_space(pvalue) > ialloc_space(idmemory) ) sreturn(e_invalidaccess); ref_assign_new(myref, pvalue); } } } sret:if (retcode < 0) { scan_end_inline(); pstate->s_error = sstate.s_error; if (pstack != 0) { if (retcode == e_undefined) *pref = *osp; /* return undefined name as error token */ ref_stack_pop(&o_stack, ref_stack_count(&o_stack) - (pdepth - 1)); } return retcode; } /* If we are at the top level, return the object, */ /* otherwise keep going. */ if (pstack == 0) { scan_end_inline(); return retcode; } snext:if_not_spush1() { scan_end_inline(); scan_type = scanning_none; goto save; } myref = osp; goto top; /* Pause for an interrupt or callout. */ pause_name: /* If we're still scanning within the stream buffer, */ /* move the characters to the private buffer (da.buf) now. */ da.next = daptr; dynamic_save(&da); scan_type = scanning_name; pause: retcode = scan_Refill; pause_ret: scan_end_inline(); suspend: if (pstack != 0) osp--; /* myref */ save: *pstate = sstate; return retcode; /* Handle a scanned comment. */ comment: if (retcode < 0) goto sret; scan_end_inline(); scan_type = scanning_none; goto save; }

82.RadioButton的选中处理逻辑 C#例子 WPF例子军训猫猫头 c#开发语言 wpf
privatevoidRadioButton_Click(objectsender,RoutedEventArgse){//确保sender是RadioButton类型if(senderisRadioButtonradioButton&&radioButton.IsChecked==true){//获取RadioButton的内容if(radioButton.Contentisstringcont
java实现二叉树的深度优先遍历开往1982 深度优先算法 java
深度优先三种遍历方法1.先序遍历2.中序遍历3.后序遍历1.定义树节点（这里我重构了tostring方法）packagecom.data.tree;publicclassNode{intvalue;Nodeleft;Noderight;publicNode(intval){value=val;}@OverridepublicStringtoString(){return"Node[value="+
使用 Redis 实现手机号验证码登陆功能，实际开发中使用 Token 实现登录校验又是如何做的？程序猿ZhangSir Java Spring全家桶微服务 java bootstrap 开发语言
目录一.使用Redis实现短信登陆功能1.1前言1.2简要分析短信登陆的业务流程1.3代码书写1.4页面展示效果1.5代码优化1.6优化之后的代码二.登录Token2.1JWT简介2.2JWT的使用方式2.3返回token2.4JWT的校验方式一.使用Redis实现短信登陆功能1.1前言对于我们用户来讲，我们在登陆一个APP的时候，有很多种登陆方式，比如"微信扫码"、"手机号登陆"、"支付宝扫码"
基于BClinux8部署Ceph 19.2(squid)集群磐基Stack专业服务团队 ceph
#作者：闫乾苓文章目录1.版本选择Ceph版本发布历史目前官方在维护的版本2.部署方法3.服务器规划4.前置配置4.1系统更新4.2配置hostscat>>/etc/hosts>/etc/hosts/etc/chrony.conf/etc/chrony.conf/etc/os-release<
前端 Blob 详解 yqcoder 前端 javascript 开发语言
前端Blob详解1.什么是Blob？Blob（BinaryLargeObject）表示二进制大对象，用于存储二进制数据。在前端开发中，Blob常用于处理文件、图像、视频等二进制数据。2.创建Blob可以通过Blob构造函数创建Blob对象。constblob=newBlob(array,options);array:数组，包含要放入Blob的数据。可以是字符串、ArrayBuffer、ArrayB
python反爬虫处理--处理验证码（Tesseract 库）的安装与使用范哥来了 python 爬虫开发语言
处理验证码是反爬虫策略中常见的挑战之一。在Python中，可以采用多种方法来解决这一问题，具体取决于验证码的类型（如文本、图像或滑块验证等）。以下是一些常用的解决方案：对于简单的文字或数字验证码：如果网站使用的是相对简单的验证码形式，您可以尝试使用OCR(OpticalCharacterRecognition,光学字符识别)技术来自动识别这些验证码。Python中有一个叫做Tesseract的库，
KV 缓存简介 dev.null AI 缓存
以下是关于KV缓存（Key-ValueCache）的简介，涵盖其定义、原理、作用及优化意义：1.什么是KV缓存？KV缓存是Transformer架构（如GPT、LLaMA等大模型）在自回归生成任务（如文本生成）中，用于加速推理过程的核心技术。其本质是：在生成序列时，缓存历史token的Key和Value矩阵，避免重复计算，从而显著减少计算量。2.为什么需要KV缓存？传统自注意力计算的问题在生成第t
如何针对大Excel做文件读取？ F_windy excel
针对大Excel文件（如超过百万行）的读取，传统的一次性加载到内存的方式会导致内存溢出（OOM），需采用流式读取（Streaming）或分块读取（Chunk）的策略。以下是具体方案及优化建议：一、核心解决方案1.使用ApachePOI的SAX模式（事件驱动）适用场景：处理.xlsx文件（不支持.xls），逐行解析避免内存溢出。代码示例（Java）：importorg.apache.poi.open
Java常用API EmbodiedTech Java架构栈 java dubbo 开发语言
一、今日内容介绍、API概述常用API（全称是ApplicationProgramInterface应用程序接口），说人话就是：别人写好的一些程序，给咱们程序员直接拿去调用。Java官方其实已经给我们写好了很多很多类，每一个类中又提供了一系列方法来解决与这个类相关的问题。比如String类，表示字符串，提供的方法全都是对字符串操作的。比如ArrayList类，表示一个容器，提供的方法都是对容器中的
Java8中如何使用Stream对列表进行去重？上官美丽 java java
在现代Java开发中，Java8引入的StreamAPI给我们带来了许多便利，尤其是在处理集合数据时。去重是数据处理中一个常见的需求，今天我们就来聊聊如何使用Stream对列表进行去重。这个过程其实并不复杂，只要掌握一些基本的操作，就能轻松实现。首先，大家可能会问，什么是Stream？Stream是一种对集合的抽象，可以让我们以声明性方式处理集合数据，比如过滤、映射、归约等。Stream的一个重要
Windows 图形显示驱动开发-WDDM 3.0功能- IOMMU DMA 重新映射（二）程序员王马 windows图形显示驱动开发驱动开发
地址描述符列表为了同时支持物理和逻辑访问模式，并在运行时无缝切换这两种模式，Dxgkrnl提供了一个描述地址描述符列表(ADL)的DXGK_ADL结构。此数据结构类似于MDL，但描述了一个可以是物理或逻辑的页面数组。由于这些页可以是逻辑页，因此不能将ADL描述的地址映射到虚拟地址以直接访问CPU。DxgkddiBuildpagingbuffer的DXGK_OPERATION_MAP_APERTUR
C++ 类和对象友元内部类 this指针默认成员函数初始化列表…… azaz_plus C++c++类和对象 this指针默认成员函数友元初始化列表内部类
1.类和对象的基本概念类：用户自定义的数据类型，包含数据成员（属性）和成员函数（方法）。对象：类的实例，占用内存空间，具有类中定义的属性和方法。示例：classDog{//定义类public:std::stringname;//属性intage;voidbark(){//方法std::coutdraw();//输出：Drawingacircle（多态）deleteshape;return0;}4.
文件的输出与读写 2.0 大力水手偷吃菠菜变成米老鼠 c语言
一、文章内容概述（一）知识要点文件操作函数概述：介绍了C语言中用于文件操作的一系列函数，这些函数是实现文件读写功能的基础工具。文件流概念定义与分类：FILE*stream这种定义方式包含了各种各样的流。流是一种用于在程序和外部设备（如文件、控制台、网络等）之间进行数据传输的抽象概念。具体类型文件流：用于读取与写入在磁盘上的文件。例如，通过文件流可以从硬盘上的文本文件中读取数据，并将其显示在程序中，
智能小程序 Ray 开发界面 API —— 交互 API 合集 IoT砖家涂拉拉前端 javascript 开发语言小程序 API SDK 物联网
showModal显示模态对话框引入import{showModal}from'@ray-js/ray';需引入BaseKit，且在>=1.2.10版本才可使用参数Objectobject属性类型默认值必填说明titlestring是提示的标题contentstring否提示的内容showCancelboolean否是否显示取消按钮cancelTextstring否取消按钮的文字，最多4个字符ca
Dify知识库构建流程及示例 cqbelt ai 笔记 AI应用
总体流程1.数据预处理清洗：去除噪声、特殊字符、标准化格式。分词/标记化：拆分文本为单词或子词单元（如使用Tokenizer）。元数据关联：附加来源、时间戳等信息，支持多维度检索。2.文本分块固定长度分块：按字符或Token数切分，简单高效。语义分块：基于句子边界或主题分割（如NLP模型识别段落主旨）。重叠策略：相邻块间部分重叠，避免上下文断裂。3.向量化（Embedding）嵌入模型：调用预训练
python nginx部署_nginx部署python应用 weixin_39611070 python nginx部署
2.nginx配置文件如下：#位于/nginx/conf/nginx.conf#usernobody;worker_processes1;events{worker_connections1024;}http{includemime.types;default_typeapplication/octet-stream;sendfileon;keepalive_timeout185;server{l
qt读取数据库数据并验证_qt 数据库操作总结 NewbeeSmart qt读取数据库数据并验证
qt数据库操作总结整理一下QT操作数据库的一些要点，以备以后的查询学习(主要是操作mysql)。首先，要查询相关的驱动是否已经装好了，可以用以下的程序进行验证：#include#include#include#includeintmain(intargc,char*argv[]){QCoreApplicationa(argc,argv);qDebug()
大疆无人机航点飞行KMZ文件提取航点坐标程序员南飞无人机 macos java spring
一、需要插件jaxenjaxen1.1.4dom4jdom4j1.6.1二、KMZ解压成KMLpackagecom.dji.sample.common.util;importorg.dom4j.Document;importorg.dom4j.io.SAXReader;importjava.io.File;importjava.io.FileInputStream;importjava.io.In
Java删除特定下标数组元素程序员南飞 Java 数组删除元素字符串遍历
15:16:06publicstaticvoidmain(String[]args){//数组创建以后长度不变，定义新的数组添加长度//删除特定下标数组String[]array1=newString[]{"a","b","b","c","d"};//删除第二个bintkey=2;String[]array2=newString[array1.length-1];for(inti=0;i=key)
Qt选择文件路径，并写入文件水瓶丫头站住 Qt qt 开发语言
以下是使用Qt的QFile和QFileDialog选择路径并写入文件的示例代码：#include#include#include#includevoidwriteFileExample(){//1.获取保存路径QStringfileName=QFileDialog::getSaveFileName(nullptr,//父窗口"保存文件",//对话框标题QDir::homePath(),//默认目录
JAVA：网络编程 Socket 的技术指南拾荒的小海螺 JAVA java 网络开发语言
1、简述JavaNIO（Non-blockingI/O）是一种基于通道（Channel）和缓冲区（Buffer）的I/O模型，支持非阻塞通信和多路复用，适合高并发场景。相比传统的阻塞I/O（BIO），NIO更高效，因为它避免了线程被阻塞，降低了系统资源消耗。代码样例：https://gitee.com/lhdxhl/springboot-example.git核心组件：Channel（通道）：数据
WPF 打开文件、文件夹，另存为文件 BeanGo WPF wpf c#开发语言
打开文件代码：OpenFileDialogopenFileDialog=newOpenFileDialog();openFileDialog.Title="选择数据源文件";openFileDialog.Filter="txt文件|*.txt";openFileDialog.FileName=string.Empty;openFileDialog.FilterIndex=1;openFileDia
Linux 常用命令 - tail 【显示文件最后几行内容】 WKJay_ Linux 常用命令 linux 运维服务器
简介tail这个命令源自英文单词“尾巴”，它的主要功能是显示文件的最后几行内容。通过使用tail，用户可以查看文件的最新添加内容，特别是对于监控日志文件来说非常有用。tail命令默认显示文件的最后10行，但这可以通过参数调整。使用方式tail[参数]...[文件]...常用选项-c,--bytes=[+]NUM：输出每个文件的最后NUM个字节的数据；或者使用-c+NUM来输出从文件NUM个字节开始
如何绕开浏览器批量下载的限制露露在前端前端 javascript html 状态模式学习面试 vue.js
前言最近遇到一个需求，需要将批量选择的图片，批量一个个下载。触发单个下载在浏览器中触发下载，我们可以借用a元素来触发。constdownloadFile=async(url:string,name:string)=>{constres=awaitfetch(url);constblob=awaitres.blob();conststrList=url.split('.');consttype=st
CAS单点登录-微信企业号单点登录（二十）悟空_ cas 微信企业号单点登录 sso
CAS单点登录-微信企业号登录（二十）背景在企业号得开发中，无法避免登录的问题，多个系统前端交互可能会设计到单点登录，若多系统已单点登录，那sso如何支持呢？概述查看企业号开发者接口文档我们看完文档后总结如下：1.企业号接口采用密码认证获取access_token2.企业号认证后通过code以及access_token获取用户信息，并不是两个标准的oauth2认证，也不是通过双方的access_t
蓝易云 - 【C++STL基础入门】string类的基础使用蓝易云 c++java linux okhttp 开发语言架构
C++的STL（标准模板库）中的string类是用于操作字符串的重要工具。以下是string类的基础使用方法：包含头文件：首先，要使用string类，需要包含头文件。定义和初始化：可以通过以下方式定义和初始化string对象：stringstr1;//默认构造函数，创建空字符串stringstr2="Hello,world!";//使用字符串字面量初始化stringstr3(str2);//使用另
在NET6项目中报错，未能在命名空间System.Data.SqlClient中找到类型名SqlCommand，解决办法 luckyext c#后端 .net visual studio asp.net sql 前端
在NET6项目中报错，未能在命名空间System.Data.SqlClient中找到类型名SqlCommand问题：NET6项目编译时报错如下未能在命名空间“System.Data.SqlClient”中找到类型名“SqlCommand”。此类型已转发到程序集“System.Data.SqlClient,Version=0.0.0.0,Culture=neutral,PublicKeyToken=
Java入门第72课——String字符串基本操作猴子学编程 Java零基础课程 Java字符串 String StringBuilder
1.1String及其常用API1.1.1String是不可变对象·java.lang.String使用了final修饰，不能被继承；·字符串底层封装了字符数组及针对字符数组的操作算法；·字符串一旦创建，对象永远无法改变，但字符串引用可以重新赋值；·Java字符串在内存中采用Unicode编码方式，任何一个字符对应两个字节的定长编码。1.1.2String常量池·Java为了提高性能，静态字符串(
Java Stream 流的介绍吱屋猪_ java
介绍在Java8中，引入了StreamAPI，它为处理集合（如List、Set等）提供了一种更简洁、声明式的方式。Stream流的设计目标是支持对数据集合的高效操作，尤其是能够进行链式操作、并行处理等，极大地提升了代码的可读性和可维护性。本文将介绍JavaStream流的基础概念、常用操作以及如何利用Stream进行集合数据处理。1.什么是Stream流Stream是Java8引入的一个新的类，它
oracle cdc logminer与oracle xstream 24k小善 java 大数据 flink
以下为OracleCDC技术中XStream与LogMiner的核心差异解析，结合技术背景、实现原理、性能表现等维度进行系统化对比。一、技术背景与定位差异LogMiner：官方日志分析工具的非正式应用最初设计用于数据库管理员（DBA）审计和分析历史日志，非专为CDC场景优化[1][9][16]。通过解析归档日志（ArchiveLog）或在线日志（OnlineRedoLog）提取变更记录，采用轮询机
C/C++Win32编程基础详解视频下载择善Zach 编程 C++Win32
课题视频：C/C++Win32编程基础详解视频知识：win32窗口的创建 windows事件机制主讲：择善Uncle老师学习交流群：386620625 验证码：625 --
Guava Cache使用笔记 bylijinnan java guava cache
1.Guava Cache的get/getIfPresent方法当参数为null时会抛空指针异常我刚开始使用时还以为Guava Cache跟HashMap一样，get(null)返回null。实际上Guava整体设计思想就是拒绝null的，很多地方都会执行com.google.common.base.Preconditions.checkNotNull的检查。 2.Guava
解决ora-01652无法通过128（在temp表空间中） 0624chenhong oracle
解决ora-01652无法通过128（在temp表空间中）扩展temp段的过程一个sql语句后，大约花了10分钟，好不容易有一个结果，但是报了一个ora-01652错误，查阅了oracle的错误代码说明：意思是指temp表空间无法自动扩展temp段。这种问题一般有两种原因：一是临时表空间空间太小，二是不能自动扩展。分析过程：既然是temp表空间有问题，那当
Struct在jsp标签不懂事的小屁孩 struct
非UI标签介绍：控制类标签： 1：程序流程控制标签 if elseif else <s:if test="isUsed"> <span class="label label-success">True</span> </
按对象属性排序换个号韩国红果果 JavaScript 对象排序
利用JavaScript进行对象排序，根据用户的年龄排序展示 <script> var bob={ name;bob, age:30 } var peter={ name;peter, age:30 } var amy={ name;amy, age:24 } var mike={ name;mike, age:29 } var john={
大数据分析让个性化的客户体验不再遥远蓝儿唯美数据分析
顾客通过多种渠道制造大量数据，企业则热衷于利用这些信息来实现更为个性化的体验。分析公司Gartner表示，高级分析会成为客户服务的关键，但是大数据分析的采用目前仅局限于不到一成的企业。挑战在于企业还在努力适应结构化数据，疲于根据自身的客户关系管理（CRM）系统部署有效的分析框架，以及集成不同的内外部信息源。然而，面对顾客通过数字技术参与而产生的快速变化的信息，企业需要及时作出反应。要想实
java笔记4 a-john java
操作符 1，使用java操作符操作符接受一个或多个参数，并生成一个新值。参数的形式与普通的方法调用不用，但是效果是相同的。加号和一元的正号（+）、减号和一元的负号（-）、乘号（*）、除号（/）以及赋值号（=）的用法与其他编程语言类似。操作符作用于操作数，生成一个新值。另外，有些操作符可能会改变操作数自身的
从裸机编程到嵌入式Linux编程思想的转变------分而治之：驱动和应用程序 aijuans 嵌入式学习
笔者学习嵌入式Linux也有一段时间了，很奇怪的是很多书讲驱动编程方面的知识，也有很多书将ARM9方面的知识，但是从以前51形式的（对寄存器直接操作，初始化芯片的功能模块）编程方法，和思维模式，变换为基于Linux操作系统编程，讲这个思想转变的书几乎没有，让初学者走了很多弯路，撞了很多难墙。笔者因此写上自己的学习心得，希望能给和我一样转变
在springmvc中解决FastJson循环引用的问题 asialee 循环引用 fastjson
我们先来看一个例子： package com.elong.bms; import java.io.OutputStream; import java.util.HashMap; import java.util.Map; import co
ArrayAdapter和SimpleAdapter技术总结百合不是茶 android SimpleAdapter ArrayAdapter 高级组件基础
ArrayAdapter比较简单，但它只能用于显示文字。而SimpleAdapter则有很强的扩展性，可以自定义出各种效果 ArrayAdapter;的数据可以是数组或者是队列 // 获得下拉框对象 AutoCompleteTextView textview = (AutoCompleteTextView) this
九封信 bijian1013 人生励志
有时候，莫名的心情不好，不想和任何人说话，只想一个人静静的发呆。有时候，想一个人躲起来脆弱，不愿别人看到自己的伤口。有时候，走过熟悉的街角，看到熟悉的背影，突然想起一个人的脸。有时候，发现自己一夜之间就长大了。 2014，写给人
Linux下安装MySQL Web 管理工具phpMyAdmin sunjing PHP Install phpMyAdmin
PHP http://php.net/ phpMyAdmin http://www.phpmyadmin.net Error compiling PHP on CentOS x64 一、安装Apache 请参阅http://billben.iteye.com/admin/blogs/1985244 二、安装依赖包 sudo yum install gd
分布式系统理论 bit1129 分布式
FLP One famous theory in distributed computing, known as FLP after the authors Fischer, Lynch, and Patterson, proved that in a distributed system with asynchronous communication and process crashes,
ssh2整合(spring+struts2+hibernate)-附源码白糖_ eclipse spring Hibernate mysql 项目管理
最近抽空又整理了一套ssh2框架，主要使用的技术如下： spring做容器，管理了三层(dao,service,actioin)的对象 struts2实现与页面交互(MVC)，自己做了一个异常拦截器，能拦截Action层抛出的异常 hibernate与数据库交互 BoneCp数据库连接池，据说比其它数据库连接池快20倍，仅仅是据说 MySql数据库项目用eclipse
treetable bug记录 braveCS table
// 插入子节点删除再插入时不能正常显示。修改： //不知改后有没有错，先做个备忘 Tree.prototype.removeNode = function(node) { // Recursively remove all descendants of +node+ this.unloadBranch(node); // Remove
编程之美-电话号码对应英语单词 bylijinnan java 算法编程之美
import java.util.Arrays; public class NumberToWord { /** * 编程之美电话号码对应英语单词 * 题目： * 手机上的拨号盘，每个数字都对应一些字母，比如2对应ABC，3对应DEF.........，8对应TUV，9对应WXYZ， * 要求对一段数字，输出其代表的所有可能的字母组合
jquery ajax读书笔记 chengxuyuancsdn jQuery ajax
1、jsp页面 <%@ page language="java" import="java.util.*" pageEncoding="GBK"%> <% String path = request.getContextPath(); String basePath = request.getScheme()
JWFD工作流拓扑结构解析伪码描述算法 comsci 数据结构算法工作活动 J#
对工作流拓扑结构解析感兴趣的朋友可以下载附件，或者下载JWFD的全部代码进行分析 /* 流程图拓扑结构解析伪码描述算法 public java.util.ArrayList DFS(String graphid, String stepid, int j)
oracle I/O 从属进程 daizj oracle
I/O 从属进程　　I/O从属进程用于为不支持异步I/O的系统或设备模拟异步I/O.例如，磁带设备(相当慢)就不支持异步I/O.通过使用I/O 从属进程，可以让磁带机模仿通常只为磁盘驱动器提供的功能。就好像支持真正的异步I/O 一样，写设备的进程(调用者)会收集大量数据，并交由写入器写出。数据成功地写出时，写入器(此时写入器是I/O 从属进程，而不是操作系统)会通知原来的调用者，调用者则会
高级排序:希尔排序 dieslrae 希尔排序
public void shellSort(int[] array){ int limit = 1; int temp; int index; while(limit <= array.length/3){ limit = limit * 3 + 1;
初二下学期难记忆单词 dcj3sjt126com english word
kitchen 厨房 cupboard 厨柜 salt 盐 sugar 糖 oil 油 fork 叉；餐叉 spoon 匙；调羹 chopsticks 筷子 cabbage 卷心菜；洋白菜 soup 汤 Italian 意大利的 Indian 印度的 workplace 工作场所 even 甚至；更 Italy 意大利 laugh 笑 m
Go语言使用MySQL数据库进行增删改查 dcj3sjt126com mysql
目前Internet上流行的网站构架方式是LAMP，其中的M即MySQL, 作为数据库，MySQL以免费、开源、使用方便为优势成为了很多Web开发的后端数据库存储引擎。MySQL驱动Go中支持MySQL的驱动目前比较多，有如下几种，有些是支持database/sql标准，而有些是采用了自己的实现接口,常用的有如下几种: http://code.google.c...o-mysql-dri
git命令 shuizhaosi888 git
---------------设置全局用户名： git config --global user.name "HanShuliang" //设置用户名 git config --global user.email "[email protected]" //设置邮箱 ---------------查看环境配置 git config --li
qemu-kvm 网络 nat模式 (四) haoningabc kvm qemu
qemu-ifup-NAT #!/bin/bash BRIDGE=virbr0 NETWORK=192.168.122.0 GATEWAY=192.168.122.1 NETMASK=255.255.255.0 DHCPRANGE=192.168.122.2,192.168.122.254 TFTPROOT= BOOTP= function check_bridge()
不要让未来的你，讨厌现在的自己 jingjing0907 生活奋斗工作梦想
故事one 　23岁，他大学毕业，放弃了父母安排的稳定工作，独闯京城，在家小公司混个小职位，工作还算顺手，月薪三千，混了混，混走了一年的光阴。　　　　24岁，有了女朋友，从二环12人的集体宿舍搬到香山民居，一间平房，二人世界，爱爱爱。偶然约三朋四友，打扑克搓麻将，日子快乐似神仙；　　　　25岁，出了几次差，调了两次岗，薪水涨了不过百，生猛狂飙的物价让现实血淋淋，无力为心爱银儿购件大牌
枚举类型详解一路欢笑一路走 enum 枚举详解 enumset enumMap
枚举类型详解一.Enum详解 1.1枚举类型的介绍 JDK1.5加入了一个全新的类型的”类”—枚举类型，为此JDK1.5引入了一个新的关键字enum,我们可以这样定义一个枚举类型。 Demo:一个最简单的枚举类 public enum ColorType { RED
第11章动画效果（上） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Eclipse中jsp、js文件编辑时，卡死现象解决汇总 ljf_home eclipse jsp卡死 js卡死
使用Eclipse编辑jsp、js文件时，经常出现卡死现象，在网上百度了N次，经过N次优化调整后，卡死现象逐步好转，具体那个方法起到作用，不太好讲。将所有用过的方法罗列如下： 1、取消验证 windows–>perferences–>validation 把除了manual 下面的全部点掉，build下只留 classpath dependency Valida
MySQL编程中的6个重要的实用技巧 tomcat_oracle mysql
每一行命令都是用分号(;)作为结束对于MySQL，第一件你必须牢记的是它的每一行命令都是用分号(;)作为结束的，但当一行MySQL被插入在PHP代码中时，最好把后面的分号省略掉，例如： mysql_query("INSERT INTO tablename(first_name,last_name)VALUES('$first_name',$last_name')");
zoj 3820 Building Fire Stations(二分+bfs) 阿尔萨斯 Build
题目链接：zoj 3820 Building Fire Stations 题目大意：给定一棵树，选取两个建立加油站，问说所有点距离加油站距离的最大值的最小值是多少，并且任意输出一种建立加油站的方式。解题思路：二分距离判断，判断函数的复杂度是o(n)，这样的复杂度应该是o(nlogn)，即使常数系数偏大，但是居然跑了4.5s，也是醉了。判断函数里面做了3次bfs，但是每次bfs节点最多

ghostscript源码分析之 scan_token()函数 (词法分析器iscan.c)

你可能感兴趣的:(String,Stream,buffer,token,character,byte)