pi9nc

c缺陷与陷阱

分类： C 2013-07-25 18:12 398人阅读评论(0) 收藏举报

   c缺陷与陷阱 C C++ 笔记 
 

目录(?)[+]

《c陷阱与缺陷》笔记

-- chap.1 --

1. 字符和字符串

[cpp]  view plain copy print ? 
      
     
 'a' //字符，实际上代表一个整数，对应ASCII中的编码值  
 "a" //字符串，代表一个指向无名数组起始字符的指针，末尾带有结束字符'\0'。因此"abcd"[i]是合理的。  
 char *ptr = 'c'; //错误，'c'不是一个指针字符，而是一个数值！  

’yes‘与"yes"的表达通常都会编译通过，只不过编译器在处理前者时采用忽略或覆盖的策略。但无论怎样，’yes‘表示的依旧是数值。

2. 防御性编程

任何编译器都无法捕捉到所有错误，况且C语言的安全系数较低（较Cpp），因此编程时采取一些防御措施是很好的习惯。

[cpp]  view plain copy print ? 
      
     
 if (c == '\t') //容易发生if (c = '\t')的误写，编译器不会报错。  
 if ('\t' == c) //防御性高，因为对常量复制('\t' = c)是非法的  

3. 嵌套注释

c语言标准里是不允许嵌套注释的（matlab可以），两种好玩的判断方法：

[cpp]  view plain copy print ? 
      
     
 // way - 1  
 int  a = /*/*/0*/**/1; //允许嵌套注释的话，a == 1, 否则a == 0*1  
 // way - 2  
 string a = /*/**/"*/"/*"/**/; //允许嵌套的话，a == "/*", 否则a == "*/"  

4. 词法分析的“大嘴原则”

c语言在词法分析上有一个很简单的规则，即每一个符号应该包括尽可能都的字符。

比如：a+++++b会被分解成((a++)++)+b，但a++不能作为左值，因此a+++++b是非法的。

-- chap.2 --

1.* 函数指针

1）可以在声明符中任意使用括号，如float ((f))的含义是((f))是浮点类型，由此可推知f为浮点类型。

2）函数指针的调用。声明一个函数指针float (*p)()，注意我们平常缩写的调用p()只是一个简写，完整的为(*p)()。

3）在已经声明了一个给定类型的变量，那么该类型的类型转换符可这样得到：把声明中的变量和声明尾部的分号去掉，将剩余部分用一个括号“封装”起来。

比如：float a; => (float)，很常见的显示float类型转换；稍复杂一点的float (*h)() => (float (*)())，表示一个“指向返回值为浮点类型的函数的指针”的类型转换符；

4）一个再复杂点的函数调用的例子：

[cpp]  view plain copy print ? 
      
 (*(void (*)()) 0)();

分析：注意到内层为“ (void (*)()) ”，是一个“指向返回值为void类型的函数指针”的类型转换符FuncType；外层为“ (* (FuncType) 0)(); ”，即把操作数0强制转换成FuncType，然后进行函数调用（末尾分号）。该函数的功能：调用首地址为0位置的子例程（实际中能不能调用暂且不管），可以这样理解：“ (* (FuncType) f)() ”中的函数指针f的值代表了函数的地址，显式的将地址值指明为0并进行类型转换后，便起到了函数调用的作用。注意，如果不进行类型转换，这种写法是非法的，因为c语言并不认为0是一个合理的函数指针操作数。也可以用typedef来重写：

[cpp]  view plain copy print ? 
      
     
 typedef void (*FuncType)();  
 (* (FuncType) 0)();   

这里还引申出来一个有趣的问题，即语句“ f(); ”进行了函数调用，而语句“ f; ”表面上不会有任何动作，但实际它计算了函数f()的地址。

5）案例分析：库函数signal的声明

[cpp]  view plain copy print ? 
      
 void (*signal(int, void(*)(int))) (int);

分析：signal函数接受两个参数，一是int型的被捕获信号，二是指向用户提供的处理该信号的函数指针；返回先前处理信号的函数指针（书里写的有问题，不是返回void，见这里）。理解：传递两个参数调用signal函数“ signal(int, void(*)(int) ”，该函数返回一个函数指针f，传递一个int参数调用该函数指针“ (*f) (int) ”，声明该函数指针的返回值为void型“ void (*f) (int) ”。利用typedef 重写：

[cpp]  view plain copy print ? 
      
     
 typedef void (*FuncType) (int);  
 FuncType signal(int, FuncType);  

2.* 运算符优先级

-- chap.3 --

1. 指针与数组

1）c语言中只有一维数组，数组大小必须在编译期作为一个常数确定下来。由于数组元素可以是任意类型，所以可以间接模拟出多维数组。如" int a[2][3] "表示a是一个包含两个元素的数组，每个元素都是一个拥有3个int型元素的数组。

2）数组名是下标为0的元素的指针，除了sizeof（sizeof(a)表示数组a的大小），一切有关数组的操作（哪怕看起来是对下标运算）实际上都是通过指针进行的。也就是说，任何一个数组下标的运算都等同一个对应的指针运算。例如，对于一个数组的元素a[i]，由于a+i和i+a表达的意思相同，因此a[i]也可以写成i[a]。

3）使用指针时注意左右类型的匹配，即区别好指向数组的指针与指向整形变量的指针，这也是很多问题来回倒腾的根本之处。

4）分析这样一个例子：

[cpp]  view plain copy print ? 
      
 int (*a)[31];

分解开来，(*a)表示一个拥有31个整形元素的数组，进一步，a表示指向这样一个数组的指针，即 数组指针。（注意不是a不是拥有31个int*型元素的数组，int *a[31]才是，即 指针数组。）可以结合运算符优先级来分析，前一种表达形式的“*”是来修饰a的，即a是一个指针；后一种是来修饰"a[31]"的，即a[31]（中的每个元素）是int型指针。

2. 不对称边界原则

1）看这样一个例子：

[cpp]  view plain copy print ? 
      
     
 int i, a[10];  
 for(i = 1; i <= 10; i++)  
     a[i] = 0;  

分析：可能会发生死循环。因为栈区通常在虚拟内存中从高逻辑地址向低逻辑地址给变量分配内存，在一些不进行边界保护的系统中，上述代码中的a[10]所处的位置恰巧与i重合，造成了变量i每次都会被置为0，重新开始循环。（在c++里运行时会报错“Stack around the variable 'a' was corrupet”）。

2）在ANSI C标准中允许访问数组出界点元素（即上例中的a[10]），但只能用于赋值和比较，不能引用。（c++里只有取地址是被允许的，不能查看内容）

3）问题1：将长度无规律的输入数据送到缓冲区（能够容纳N个字符），每当这块内存被填满时，就将缓冲区中的内容写出。

[cpp]  view plain copy print ? 
      
     
 #define N 1024  
 static char buffer[N];  
 static char *bufptr = buffer;  
   
 void bufwrite(char *p, int n)  
 {  
     while(n > 0)  
     {  
         int k, rem;  
         if(bufptr = &buffer[N])  
             flushbuffer();  
         rem = N - (bufptr - buffer);  
         k = rem > n? n:rem;  
         memcpy(bufptr, p, k);  
         n -= k;  
         p += k;  
     }  
 }  
   
 //c语言中的memcpy()函数通常使用汇编来写的（为了加快速度）  
 void memcpy(char *dest, char *source, int k)  
 {  
     while(--k>=0)  
         *dest++ = *source++;  
 }  

采用了先赋值后自增的方式，利用“不对称边界原则”进行判断，每次操作结束后，bufptr指针都指向当前元素的下一个内存地址，这样实现起来的代码简练不易出错。

4）问题2：存在一个程序，该程序按一定顺序生成一些整数，并将这些整数按列输出，填充完一页后可以翻页。要求从左到右打印每个输出行，一行被打印后就不能被撤销或更改，print函数可以缓冲（不缓冲也做不了）。

[cpp]  view plain copy print ? 
      
     
 //缓冲区大小最小要这么大，  
 //否则永远不能按照要求把最后一列的元素与其对应行元素整合  
 #define BUFSIZE (NROWS*(NCOLS-1))  
 static int buffer[BUFSIZE];  
 static int *bufptr = buffer;  
   
 //按要求打印每个元素  
 void print(int n)  
 {  
     if(bufptr == &buffer[BUFSIZE])  
     {  
         static int row = 0;  
         int *p;  
         for(p = buffer + row; p < bufptr; p += NROWS)  
             printnum(*p); //打印当前row位置p的数值  
   
         printnum(n); //打印当前row最后一列的数值  
         printline(); //打印换行符  
   
         if(++row == NROWS)  
         {  
             bufptr = buffer;  
             row = 0;  
             printpage(); //打印分页符  
         }  
     }  
     else  
         *bufptr++ = n;  
 }  
   
 //处理尾部文件，将最后的的未满BUFSIZE的内容全部打出  
 //只遍历出现的列数  
 void flush()  
 {  
     int row;  
     int k = bufptr - buffer;  
     k = k > NROWS? NROWS:k;  
     if(k > 0)  
     {  
         for(row = 0; row < k; row++)  
         {  
             int *p;  
             for(p = buffer + row; p < bufptr; p += NROWS)  
                 printnum(*p);  
               
             printline();  
         }  
         printpage();  
     }  
 }  

3. 操作符求值顺序

只有四个操作符存在求值顺序的问题："&&"、"||"、"?:"和","。具体不再详记。

4. 整数溢出

只有在两个操作符都为有符号数时才有可能发生“溢出”，其他情况会发生隐式转换（一方有符号，另一方无符号时）。

假设a和b都是非负整型常量，检测a+b是否溢出的方法：

[cpp]  view plain copy print ? 
      
     
 if(a + b < 0) //naive, 有的机器寄存器存在四种状态：正、负、零、溢出，此时if判断失败  
 if((unsigned)a + (unsigned)b > INT_MAX) //good  
 if(a > INT_MAX - b) //good  

-- chap.4 --

1.scanf("%d",&c)出错防不胜防

[cpp]  view plain copy print ? 
       
      
 #include<stdio.h>  
   
 int main()  
 {  
     freopen("Example.in","r",stdin);  
       
     int i;  
     char c;  
     for( i = 0; i < 5; ++i)  
     {  
         scanf("%d",&c);  
         printf("%d ",i);  
     }  
       
     return 0;  
 }  

为什么呢？问题的关键在于，这里c被声明为char类型，而不是int类型。当程序要求scanf 读入一个整数，应该传递给它一个指向整数的指针。而程序中scanf 函数得到的却是一个指向字符的指针，scanf 函数并不能分辨这种情况，它只能将这个指向字符的指针作为指向整数的指针而接受，并且在指针指向的位置存储一个整数。因为整数所占的存储空间要大于字符所占的存储空间，所以字符c附近的内存将被覆盖。

字符c附近的内存中存储是由编译器决定的，本例中它存放的是整数i的低端部分。因此，每次读入一个数值到c时，都会将i的低端部分覆盖为0，循环将一直进行。当达到文件的结束位置后，scanf 函数不再试图读入新的数值到c。这使，i 才可以正常地递增，最后循环结束。

2. 外部类型的检查

这样对吗？

在一个文件包含定义： char filename[] = "/etc/passwd";

在另个文件包含声明： extern char * filename；

尽管数组与指针非常相似，但它们毕竟不同。

字符数组filename的内存布局如图：

指针字符filename的内存布局如图：

更正本例：

既可以：

char filename[[ = "/etc/passwd'; /* 文件1*/

extern char filename[];/* 文件2*/

也可以：

char * filename = "/etc/passwd';/* 文件1*/

extern char * filename; /* 文件2*/

-- chap.5 --

1.fread和fwrite中间必须加入fseek，因为读写操作都改写了读取的位置，都是然后面移动的，而且读写不是实时进行的，会有缓存区，用fseek可以清空缓存，防止读写错误。

[cpp]  view plain copy print ? 
       
      
 #include <stdio.h>  
   
 struct tm  
 {  
     long c;  
     int  i;  
 }st;  
   
 int main()  
 {  
     FILE *fp = fopen("Example.in","r+");  
       
     while(fread(&st,sizeof(st),1,fp) == 1)  
     {  
         /* st 执行某些操作 */  
         if(/* rec 必须重新写入 */)  
         {  
             fseek(fp,-(long)sizeof(st),1);  
             fwrite(&st,sizeof(st),1,fp);  
         }  
     }  
     fclose(fp);  
     return 0;  
 }  

这段代码看上去毫无问题，sizeof(rec)被转换为长整形（sizeof返回unsigned值，必须先转换为long型，再取反），这段代码的错误之处在fwrite之后缺少了一个fseek函数调用，所以改写为：

[cpp]  view plain copy print ? 
       
      
 #include <stdio.h>  
   
 struct tm  
 {  
     long c;  
     int  i;  
 }st;  
   
 int main()  
 {  
     FILE *fp = fopen("Example.in","r+");  
       
     while(fread(&st,sizeof(st),1,fp) == 1)  
     {  
         /* st 执行某些操作 */  
         if(/* rec 必须重新写入 */)  
         {  
             fseek(fp,-(long)sizeof(st),1);  
             fwrite(&st,sizeof(st),1,fp);  
             fseek(fp,0L,1);//增添的  
         }  
     }  
     fclose(fp);  
     return 0;  
 }  

2.缓冲区输出与内存分配

设置缓冲区：setbuf(stdout, buf) // buf是自己定义的一个大小合适的数组，一般用系统头文件<stdio.h> BUFSIZ定义的大小

该语句通知输入/输出库，所有写入到stdout的输出都应该使用buf作为输出缓冲区，直到buf缓冲区被填满或者程序员直接调用fflush

看下面的程序：

[cpp]  view plain copy print ? 
       
      
 #include<stdio.h>  
   
 int main()  
 {  
     int c;  
     char buf[BUFSIZ];  
       
     setbuf(stdout,buf);  
       
     while((c = getchar()) != EOF)  
     {  
         putchar(c);  
     }         
 }  

该函数错误之处是buf的申请，该main函数结束后才清空缓冲区，此时buf都被释放了，找不到了。

解决的方法：

1. static char buf[BUFSIZ]

2. 声明为全局变量

3. setbuf(stdout, malloc(BUFSIZ)); //这里不用管malloc是否分配空间成功，不成功返回NULL，此时系统认为不需要缓冲区

3.使用erron检测错误

在调用库函数是，首先检测作为错误提示的返回值，确定程序执行是否失败，然后再检查erron，搞清楚出错的原因，不能只凭erron不为零来断定错误。

[cpp]  view plain copy print ? 
       
      
 /* 调用库函数 */  
 if(返回的错误值)  
 {  
       /* 检查 erron */  
 }  

4.库函数 signal

该函数作为捕获异步事件的一种方式，调用方法 signal( signal type, handler function); //其中 type 是系统头文件的常量，handler function 处理事件发生时需要调用的函数

注意：handler function 函数不要调用malloc、longjmp等不安全的函数，切记！！

-- chap.6 --

/* 略过 */

-- chap.7 --

1.移位运算符

如果保证n为非负数的情况下，n >> 2 比 n/2 执行速度快点多。

2.除法运算时发生的截断

假定a除以b，商为q，余数为r：

q = a / b;

r = a % b; (b > 0)

必定满足 q*b + r == a, 还有就是余数r可能是负数（比如：-3 % 2 = -1 商为1，而不是余数为 1 商为2，切记）

而且如果 b为负数的话，比如 -3 % -2 == -1，商为1，所以应该保证 a/ b 与 -a / b 的绝对值是相同的原则上考虑余数。

在通过除法得到哈希条目n的情况：

h = n % HASHSIZE; // 如果n有可能为负数的时候，一定要检测结果的正负

if（h < 0） h += HASHSIZE;

create-react-app创建的项目中设置webpack配置沃野_juededa react.js webpack 前端
create-react-app创建的项目默认使用的是react-scripts（存在于node_modules文件夹中）来处理开发服务器和构建，它内置了一些webpack相关配置。一般不会暴露出来给开发者，但是在有些情况下我们需要修改下webpack默认配置，如修改outputPath、sourcemap方案等，但由于eject是不可逆的，所以craco插件应运而生，为我们提供了更好的解决方案。
http 从请求到响应的过程中发生了什么沃野_juededa http 网络协议网络
‌DNS域名解析‌：当用户在浏览器地址栏输入网址时，浏览器首先会尝试从自身的DNS缓存中查找域名的IP地址。如果缓存中没有找到，浏览器会向系统DNS缓存、hosts文件以及本地DNS服务器发起查询请求，最终获取到域名的IP地址‌。‌TCP三次握手‌：浏览器与服务器建立TCP连接，这个过程称为三次握手。服务器监听端口，客户端发送SYN包请求连接，服务器响应SYN+ACK包，客户端再次发送ACK包确认
element ui 封装Table组件沃野_juededa ui
1.首先npmielement-ui-S安装element-ui2.引入Element在main.js中写入以下内容：importVuefrom'vue';importElementUIfrom'element-ui';import'element-ui/lib/theme-chalk/index.css';importAppfrom'./App.vue';Vue.use(ElementUI);n
echarts graph搭配lines形成动效关系图沃野_juededa echarts javascript 前端
import*asechartsfrom'echarts';exportdefault{mounted(){this.initChart();},methods:{initChart(){constchart=echarts.init(this.$refs.chart);letdataMap=newMap();constdata={nodes:[{name:'Node1'},{name:'Node
C++ 中的explicit关键字张太行_ c++开发语言
在C++中，explicit是一个用于修饰构造函数的关键字，它主要用于防止隐式类型转换，下面从多个方面详细介绍它。基本语法explicit关键字只能用于修饰类的构造函数，其语法形式如下：classClassName{public://带有explicit修饰的构造函数explicitClassName(parameter_list);};隐式类型转换问题在没有explicit关键字时，单参数的构造
CAN 调试总结张太行_ arm 网络协议
1.查看CAN设备状态命令：ifconfig~#ifconfigcan0Linkencap:UNSPECHWaddr00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00UPRUNNINGNOARPMTU:16Metric:1RXpackets:2165errors:0dropped:0overruns:0frame:0TXpackets:0errors:0
ip link 命令总结张太行_ tcp/ip 网络网络协议
link表示linklayer的意思，即链路层。该命令用于管理和查看网络接口。iplinksetiplinksetDEVICE{up|down|arp{on|off}|nameNEWNAME|addressLLADDR}选项说明：devDEVICE：指定要操作的设备名upanddown：启动或停用该设备arponorarpoff：启用或禁用该设备的arp协议nameNAME：修改指定设备的名称，建
银河麒麟登录输入密码提示启动会话失败张太行_ ubuntu linux 运维 kylin
银河麒麟系统使用过程中，因执行了update，在启动设备登录时，出现输入密码登录登录时，提示“启动会话失败”，而无法进入桌面。解决方法：1、ctrl+alt+f1切换到tty1（或使用ssh等远程工具登录到设备，此时ssh是可以正常登录的）；2、登录；3、联网状态下输入命令：sudoaptinstallmate-session-manager--reinstall4、reboot重启。在解决这个问
Python列表与元组的深度剖析 jijihusong006 程序 python windows 开发语言
Python列表与元组的深度剖析：从底层实现到应用场景的全方位对比一、核心差异概览Python教程https://pan.quark.cn/s/7cefe3163f45传送代资料库https://link3.cc/aa99特性列表(List)元组(Tuple)可变性可变(Mutable)不可变(Immutable)语法表示方括号[]圆括号()内存占用较大(动态数组结构)较小(静态数组结构)哈希支持
推荐开源项目：Tower - 网络服务构建利器劳治亮
推荐开源项目：Tower-网络服务构建利器towerasyncfn(Request)->Result项目地址:https://gitcode.com/gh_mirrors/to/towerTower是一个为构建强大、模块化和可重用的网络客户端和服务端组件库。这个库以其高效且易于使用的特性，为开发者提供了一种便捷的方式去构建可靠的网络应用。项目介绍Tower面向的是那些希望简化网络通信复杂性的开发者
推荐项目：yaml-pro，提升你的YAML编辑体验余靖年Veronica
推荐项目：yaml-pro，提升你的YAML编辑体验项目地址:https://gitcode.com/gh_mirrors/ya/yaml-pro在日常的开发工作中，YAML作为配置文件的宠儿，其简洁明了的语法深受开发者喜爱。然而，当面对复杂或庞大的YAML文件时，高效的编辑工具就显得至关重要。因此，我们强烈推荐一款专为Emacs用户设计的开源神器——yaml-pro，它利用tree-sitter
探索电商大数据的艺术：TBBKAnalysis深度解读与应用推荐洪显彦Lawyer
探索电商大数据的艺术：TBBKAnalysis深度解读与应用推荐TBBKAnalysis关于淘宝“爆款”数据爬取与分析。具体分析见—项目地址:https://gitcode.com/gh_mirrors/tb/TBBKAnalysis在数字化时代的数据洪流中，每一个细微的数据点都蕴含着洞察未来的机遇。今天，我们要探讨的是一个独特且极具启发性的开源项目——TBBKAnalysis。该项目源自知乎上一
使用 DashVector 进行高效的矢量检索和自查询检索器演示 bavDHAUO python
在当代AI应用中，向量数据的管理和检索是至关重要的部分。DashVector是一个完全托管的向量数据库服务，提供了对高维稠密和稀疏向量的支持，允许实时插入和过滤搜索。这个服务基于DAMOAcademy自研的高效向量引擎Proxima核心构建，具备云原生和横向扩展能力，能够快速适应不同应用需求。在本篇文章中，我们将演示如何使用DashVector和SelfQueryRetriever来高效地进行矢量
SAP-ABAP：SAP外网接口调用技术全景指南爱喝水的鱼丶 VIP详情查看专栏 SAP业务学习捷径 SAP-ABAP开发基础详解 SAP ABAP ERP 开发运维运维 HTTP 接口调用
SAP外网接口调用技术全景指南1.核心调用方式对比矩阵方法类型协议支持适用场景开发复杂度维护成本典型应用案例HTTPClientREST/HTTP通用API集成★★☆低调用第三方支付接口SOAPProxySOAP/WSDL标准化Web服务★★★中银行系统对接ODataClientODataSAP生态集成★★☆低Fiori应用数据扩展PI/PO中间件多协议转换企业级复杂集成★★★★高跨系统业务流程编
SAP-ABAP：SAP采购模块（MM-PUR）学习指南爱喝水的鱼丶 VIP详情查看专栏 SAP业务学习捷径 SAP-ABAP开发基础详解 ABAP SAP ERP 运维 SAP采购业务学习
Ⅰ.模块全景图采购管理需求计划供应商协同采购执行财务集成采购申请/MRP供应商评估/合同订单/收货/发票应付账款Ⅱ.核心配置矩阵2.1组织结构配置对象事务码配置关系业务影响示例值采购组织OX01分配公司代码跨法人采购1000-US工厂OX18链接采购组织库存管理2000-CH采购组OME9指定采购专家责任划分PG01-IT采购2.2单据类型配置单据类型配置路径关键字段审批策略应用场景标准采购订单M
【H2O2 | 软件开发】前端深拷贝的实现过期的H2O2 【H2O2】全栈面试题 javascript 开发语言 ecmascript 前端
目录前言开篇语准备工作正文概述JSON方法递归其他结束语前言开篇语本系列为短篇，每次讲述少量知识点，无需一次性灌输太多的新知识点。该主题文章主要是围绕前端、全栈开发相关面试常见问题撰写的，希望对诸位有所帮助。如果您需要为面试八股文做准备，笔者建议重点关注加粗强调部分，它们是概念中的关键词。准备工作软件：【参考版本】VisualStudioCode系统版本：Win10/11正文概述概括地来说，前端实
嵌入式知识笔记1——C++面试复习（3） Yuanyingbian 嵌入式学习资料笔记 c++算法
四、关键字库函数4.1sizeof和strlen的区别strlen是头文件中的函数，sizeof是C++中的运算符。strlen测量的是字符串的实际长度（其源代码如下），以\0结束。而sizeof测量的是字符数组的分配大小。strlen本身是库函数，因此在程序运行过程中，计算长度；而sizeof在编译时，计算长度；sizeof的参数可以是类型，也可以是变量；strlen的参数必须是char*类型的
vue中ref解析肉肉不吃肉 vue.js javascript 前端
在Vue项目中，ref是一个非常重要的概念，用于创建对DOM元素或组件实例的引用。它在多种场景下都非常有用，特别是在需要直接操作DOM或与子组件进行交互时。ref的作用1.获取DOM元素使用ref可以获取到模板中的DOM元素，并对其进行操作。创建了一个对组件的引用，可以在脚本中通过loginForm.value访问该元素。示例：constloginForm=ref(null)//在setup函数中
什么是Apache Avro？ maozexijr apache
什么是ApacheAvro？ApacheAvro是一个开源的数据序列化框架，主要用于高效的数据交换和存储。它由ApacheHadoop项目开发，广泛应用于大数据生态系统中（如Hadoop、Kafka等）。Avro提供了一种紧凑、快速的二进制数据格式，同时支持丰富的数据结构和模式演化。核心特性跨语言支持Avro支持多种编程语言（如Java、Python、C++、Go等），使得不同语言之间的数据交换变
A SURVEY ON POST-TRAINING OF LARGE LANGUAGE MODELS——大型语言模型的训练后优化综述——第9部分——应用王金-太想进步了语言模型人工智能自然语言处理
应用尽管预训练为大型语言模型（LLMs）赋予了强大的基础能力，但在部署于专业领域时，LLMs仍经常遇到持续的限制，包括上下文长度受限、容易产生幻觉（hallucination）、推理能力欠佳和固有的偏见。在现实世界的应用中，这些不足显得尤为重要，因为在这些场景中，精确性、可靠性和伦理一致性是至关重要的。这些问题引发了一些根本性的探讨：(1)如何系统地提高LLM的表现以满足特定领域的需求？(2)在实
Apache Storm：实时数据处理的闪电战 Aaron_945 Java apache storm 大数据
文章目录ApacheStorm原理拓扑结构数据流处理容错机制官网链接基础使用安装与配置编写拓扑提交与运行高级使用状态管理窗口操作多语言支持优点高吞吐量低延迟可扩展性容错性总结ApacheStorm是一个开源的分布式实时计算系统，它允许你以极高的吞吐量处理无界数据流。Storm被广泛用于实时分析、在线机器学习、连续计算等多种场景。本文将深入探讨ApacheStorm的原理、基础使用、高级特性及其优点
能否在编辑器中一键导入Word文档？ 2501_90646763 umeditor粘贴word ueditor粘贴word ueditor复制word ueditor上传word图片 ueditor导入word ueditor导入pdf ueditor导入ppt
要求：开源，免费，技术支持编辑器：百度ueditor前端：vue2,vue3,vue-cli,react,html5用户体验：Ctrl+V快捷键操作功能：导入Word,导入Excel,导入PPT(PowerPoint),导入PDF,复制粘贴word,导入微信公众号内容,web截屏平台：Windows,macOS,Linux,RedHat,CentOS,Ubuntu,中标麒麟,银河麒麟,统信UOS,
计算机毕业设计之基于Hadoop的热点新闻分析系统的设计与实现微信bishe69 课程设计 python django mysql
近些年来，随着科技的飞速发展，互联网的普及逐渐延伸到各行各业中，给人们生活带来了十分的便利，热点新闻分析系统利用计算机网络实现信息化管理，使整个热点新闻分析的发展和服务水平有显著提升。本文拟采用PyCharm开发工具，django框架、Python语言、Hadoop大数据处理技术进行开发，后台使用MySQL数据库进行信息管理，设计开发的热点新闻分析系统。通过调研和分析，系统拥有管理员和用户两个模块
Ubuntu连接到SSH（live server和desktop版本同样适用）适用于20-24各个版本郑梓妍 Linux系统运维 ubuntu ssh linux
SSH（SecureShell）是一种网络协议，用于在客户端和服务器之间建立加密连接。在Ubuntu系统中，通过SSH远程连接可以方便地执行管理任务，如文件传输和系统维护。以下是在Ubuntu中设置SSH远程连接的步骤。安装和启动SSH服务首先，需要在Ubuntu系统上安装openssh-server包。可以通过以下命令进行安装：sudoaptupdatesudoaptinstallopenssh
css3选择器详解丸子猪的dady css3 前端 css html
CSS3选择器我们之前学过CSS的选择器，比如：div标签选择器.box类名选择器#boxid选择器divp后代选择器div.box交集选择器div,p,span并集选择器div>p子代选择器*:通配符div+p:选中div后面相邻的第一个pdiv~p:选中的div后面所有的p属性选择器属性选择器的标志性符号是[]。匹配含义：^：开头$：结尾*：包含格式：E[title]选中页面的E元素，并且E存
css动画详解丸子猪的dady css 前端 html
过渡：transitiontransition的中文含义是过渡。过渡是CSS3中具有颠覆性的一个特征，可以实现元素不同状态间的平滑过渡（补间动画），经常用来制作动画效果。transition包括以下属性：transition-property:all;如果希望所有的属性都发生过渡，就使用all。transition-property:width，意思是只让盒子的宽度在变化时进行过渡transiti
HTMl详解丸子猪的dady html 前端
拖拽目标元素的事件监听：（应用于目标元素）ondragenter当拖拽元素进入时调用ondragover当拖拽元素停留在目标元素上时，就会连续一直触发（不管拖拽元素此时是移动还是不动的状态）ondrop当在目标元素上松开鼠标时调用ondragleave当鼠标离开目标元素时调用.box{width:200px;height:200px;background-color:green;}//绑定拖拽事件
计算机技术：哈佛架构 InnoLink_1024 操作系统嵌入式架构
1.哈佛架构简介哈佛架构（HarvardArchitecture）是一种计算机设计模型，与冯诺伊曼架构不同，其核心特征是将程序指令和数据分开存储和传输。这一架构最早起源于哈佛大学的MarkI计算机，因此得名。2.核心特点独立的存储器哈佛架构中，指令存储器和数据存储器是分开的。这意味着：指令和数据各自拥有独立的存储空间。它们通过不同的总线进行传输，不共享带宽。独立的总线哈佛架构采用两套总线系统：一条
B/S架构（Browser/Server）与C/S架构（Client/Server）张太行_ 服务器运维
基本概念B/S架构（Browser/Server）：即浏览器/服务器架构。在这种架构中，用户通过浏览器（如Chrome、Firefox、Safari等）访问服务器上的应用程序。服务器端负责处理业务逻辑、存储数据等核心功能，浏览器主要用于向用户展示数据和接收用户输入。例如，一个在线邮箱系统，用户在浏览器中输入邮箱网址，登录后就可以收发邮件。服务器会处理邮件的发送、接收、存储等操作，而浏览器则将邮件的
计算机网络丸子猪的dady 计算机网络计算机网络发展史 OSI参考模型 TCP/IP通用协议计算机网络分类计算机网络节点计算机网络的定义组成及其功能
计算机网络计算机网络发展史有4个阶段在第3阶段：OSI开放式系统互联架构，确立了TCP/IP作为通用协议。OSI参考模型应用层表示层会话层传输层网络层数据链路层物理层TCP/IP通用协议组成：参考了OSI的七层模型，但简化为四层：应用层、传输层、网络层和链路层应用层：直接为应用进程提供服务，常见协议有HTTP、FTP、SMTP等。传输层：提供端到端的通信服务，主要协议有TCP和UDP。TCP是面向
关于旗正规则引擎规则中的上传和下载问题何必如此文件下载压缩 jsp 文件上传
文件的上传下载都是数据流的输入输出，大致流程都是一样的。一、文件打包下载 1.文件写入压缩包 string mainPath="D:\upload\"; 下载路径 string tmpfileName=jar.zip; &n
【Spark九十九】Spark Streaming的batch interval时间内的数据流转源码分析 bit1129 Stream
以如下代码为例（SocketInputDStream）： Spark Streaming从Socket读取数据的代码是在SocketReceiver的receive方法中，撇开异常情况不谈(Receiver有重连机制，restart方法，默认情况下在Receiver挂了之后，间隔两秒钟重新建立Socket连接)，读取到的数据通过调用store(textRead)方法进行存储。数据
spark master web ui 端口8080被占用解决方法 daizj 8080 端口占用 spark master web ui
spark master web ui 默认端口为8080，当系统有其它程序也在使用该接口时，启动master时也不会报错，spark自己会改用其它端口，自动端口号加1，但为了可以控制到指定的端口，我们可以自行设置，修改方法： 1、cd SPARK_HOME/sbin 2、vi start-master.sh 3、定位到下面部分
oracle_执行计划_谓词信息和数据获取周凡杨 oracle 执行计划
oracle_执行计划_谓词信息和数据获取(上) 一：简要说明在查看执行计划的信息中，经常会看到两个谓词filter和access，它们的区别是什么，理解了这两个词对我们解读Oracle的执行计划信息会有所帮助。简单说，执行计划如果显示是access，就表示这个谓词条件的值将会影响数据的访问路径（表还是索引），而filter表示谓词条件的值并不会影响数据访问路径，只起到
spring中datasource配置 g21121 dataSource
datasource配置有很多种，我介绍的一种是采用c3p0的，它的百科地址是： http://baike.baidu.com/view/920062.htm  <bean name="propertiesConfig" class="org.springframework.b
web报表工具FineReport使用中遇到的常见报错及解决办法（三）老A不折腾 finereport FAQ 报表软件
这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、repeated column width is largerthan paper width：这个看这段话应该是很好理解的。比如做的模板页面宽度只能放
mysql 用户管理墙头上一根草 linux mysql user
1.新建用户 //登录MYSQL@>mysql -u root -p@>密码//创建用户mysql> insert into mysql.user(Host,User,Password) values(‘localhost’,'jeecn’,password(‘jeecn’));//刷新系统权限表mysql>flush privileges;这样就创建了一个名为：
关于使用Spring导致c3p0数据库死锁问题 aijuans spring Spring 入门 Spring 实例 Spring3 Spring 教程
这个问题我实在是为整个 springsource 的员工蒙羞如果大家使用 spring 控制事务，使用 Open Session In View 模式， com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.
百度词库联想 annan211 百度
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>RunJS</title&g
int数据与byte之间的相互转换实现代码百合不是茶位移 int转byte byte转int 基本数据类型的实现
在BMP文件和文件压缩时需要用到的int与byte转换,现将理解的贴出来; 主要是要理解;位移等概念 http://baihe747.iteye.com/blog/2078029 int转byte; byte转int; /** * 字节转成int,int转成字节 * @author Administrator *
简单模拟实现数据库连接池 bijian1013 java thread java多线程简单模拟实现数据库连接池
简单模拟实现数据库连接池实例1： package com.bijian.thread; public class DB { //private static final int MAX_COUNT = 10; private static final DB instance = new DB(); private int count = 0; private i
一种基于Weblogic容器的鉴权设计 bijian1013 java weblogic
服务器对请求的鉴权可以在请求头中加Authorization之类的key，将用户名、密码保存到此key对应的value中，当然对于用户名、密码这种高机密的信息，应该对其进行加砂加密等，最简单的方法如下： String vuser_id = "weblogic"; String vuse
【RPC框架Hessian二】Hessian 对象序列化和反序列化 bit1129 hessian
任何一个对象从一个JVM传输到另一个JVM，都要经过序列化为二进制数据(或者字符串等其他格式，比如JSON)，然后在反序列化为Java对象，这最后都是通过二进制的数据在不同的JVM之间传输(一般是通过Socket和二进制的数据传输)，本文定义一个比较符合工作中。 1. 定义三个POJO Person类 package com.tom.hes
【Hadoop十四】Hadoop提供的脚本的功能 bit1129 hadoop
1. hadoop-daemon.sh 1.1 启动HDFS ./hadoop-daemon.sh start namenode ./hadoop-daemon.sh start datanode 通过这种逐步启动的方式，比start-all.sh方式少了一个SecondaryNameNode进程，这不影响Hadoop的使用，其实在 Hadoop2.0中，SecondaryNa
中国互联网走在“灰度”上 ronin47 管理灰度
中国互联网走在“灰度”上（转）文/孕峰第一次听说灰度这个词，是任正非说新型管理者所需要的素质。第二次听说是来自马化腾。似乎其他人包括马云也用不同的语言说过类似的意思。灰度这个词所包含的意义和视野是广远的。要理解这个词，可能同样要用“灰度”的心态。灰度的反面，是规规矩矩，清清楚楚，泾渭分明，严谨条理，是决不妥协，不转弯，认死理。黑白分明不是灰度，像彩虹那样
java-51-输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。 bylijinnan java
public class PrintMatrixClockwisely { /** * Q51.输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。例如：如果输入如下矩阵： 1 2 3 4 5 6 7 8 9
mongoDB 用户管理开窍的石头 mongoDB用户管理
1:添加用户第一次设置用户需要进入admin数据库下设置超级用户（use admin） db.addUsr({user:'useName',pwd:'111111',roles:[readWrite,dbAdmin]}); 第一个参数用户的名字第二个参数
[游戏与生活]玩暗黑破坏神3的一些问题 comsci 生活
暗黑破坏神3是有史以来最让人激动的游戏。。。。但是有几个问题需要我们注意玩这个游戏的时间，每天不要超过一个小时，且每次玩游戏最好在白天结束游戏之后，最好在太阳下面来晒一下身上的暗黑气息，让自己恢复人的生气 &nb
java 二维数组如何存入数据库 cuiyadll java
using System; using System.Linq; using System.Text; using System.Windows.Forms; using System.Xml; using System.Xml.Serialization; using System.IO; namespace WindowsFormsApplication1 {
本地事务和全局事务Local Transaction and Global Transaction(JTA) darrenzhu java spring local global transaction
Configuring Spring and JTA without full Java EE http://spring.io/blog/2011/08/15/configuring-spring-and-jta-without-full-java-ee/ Spring doc -Transaction Management http://docs.spring.io/spri
Linux命令之alias - 设置命令的别名，让 Linux 命令更简练 dcj3sjt126com linux alias
用途说明设置命令的别名。在linux系统中如果命令太长又不符合用户的习惯，那么我们可以为它指定一个别名。虽然可以为命令建立“链接”解决长文件名的问题，但对于带命令行参数的命令，链接就无能为力了。而指定别名则可以解决此类所有问题【1】。常用别名来简化ssh登录【见示例三】，使长命令变短，使常用的长命令行变短，强制执行命令时询问等。常用参数格式：alias 格式：ali
yii2 restful web服务[格式响应] dcj3sjt126com PHP yii2
响应格式当处理一个 RESTful API 请求时，一个应用程序通常需要如下步骤来处理响应格式：确定可能影响响应格式的各种因素，例如媒介类型，语言，版本，等等。这个过程也被称为 content negotiation。资源对象转换为数组，如在 Resources 部分中所描述的。通过 [[yii\rest\Serializer]]
MongoDB索引调优（2）——[十] eksliang mongodb MongoDB索引优化
转载请出自出处：http://eksliang.iteye.com/blog/2178555 一、概述上一篇文档中也说明了，MongoDB的索引几乎与关系型数据库的索引一模一样，优化关系型数据库的技巧通用适合MongoDB，所有这里只讲MongoDB需要注意的地方二、索引内嵌文档可以在嵌套文档的键上建立索引，方式与正常
当滑动到顶部和底部时，实现Item的分离效果的ListView gundumw100 android
拉动ListView，Item之间的间距会变大，释放后恢复原样； package cn.tangdada.tangbang.widget; import android.annotation.TargetApi; import android.content.Context; import android.content.res.TypedArray; import andr
程序员用HTML5制作的爱心树表白动画 ini JavaScript jquery Web html5 css
体验效果：http://keleyi.com/keleyi/phtml/html5/31.htmHTML代码如下： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"><head><meta charset="UTF-8" > <ti
预装windows 8 系统GPT模式的ThinkPad T440改装64位 windows 7旗舰版 kakajw ThinkPad 预装改装 windows 7 windows 8
该教程具有普遍参考性，特别适用于联想的机器，其他品牌机器的处理过程也大同小异。该教程是个人多次尝试和总结的结果，实用性强，推荐给需要的人！缘由小弟最近入手笔记本ThinkPad T440，但是特别不能习惯笔记本出厂预装的Windows 8系统，而且厂商自作聪明地预装了一堆没用的应用软件，消耗不少的系统资源（本本的内存为4G，系统启动完成时，物理内存占用比
Nginx学习笔记 mcj8089 nginx
一、安装nginx 1、在nginx官方网站下载一个包，下载地址是： http://nginx.org/download/nginx-1.4.2.tar.gz 2、WinSCP(ftp上传工
mongodb 聚合查询每天论坛链接点击次数 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 18 */ { "_id" : ObjectId("5596414cbe4d73a327e50274"), "msgType" : "text", "sendTime" : ISODate("2015-07-03T08:01:16.000Z"
java术语（PO/POJO/VO/BO/DAO/DTO） Luob. DAO POJO DTO po VO BO
PO(persistant object) 持久对象在o/r 映射的时候出现的概念,如果没有o/r映射,就没有这个概念存在了.通常对应数据模型(数据库),本身还有部分业务逻辑的处理.可以看成是与数据库中的表相映射的java对象.最简单的PO就是对应数据库中某个表中的一条记录,多个记录可以用PO的集合.PO中应该不包含任何对数据库的操作. VO(value object) 值对象通
算法复杂度 Wuaner Algorithm
Time Complexity & Big-O： http://stackoverflow.com/questions/487258/plain-english-explanation-of-big-o http://bigocheatsheet.com/ http://www.sitepoint.com/time-complexity-algorithms/