hello world 1

大数查找排序总结——好东西

问题:假设一个文件中有9亿条不重复的9位整数，现在要求对这个文件进行排序。

一般解题思路:
1、将数据导入到内存中
2、将数据进行排序　（比如插入排序、快速排序）
3、将排序好的数据存入文件

难题:
一个整数为4个字节
即使使用数组也需要900,000,000 * 4byte = 3.4G内存
对于32位系统，访问2G以上的内存非常困难，而且一般设备也没有这么多的物理内存
将数据完全导入到内存中的做法不现实

其他解决办法:
1、导入数据库运算
2、分段排序运算
3、使用bit位运算

解决方案一:数据库排序
将文本文件导入到数据库，让数据库进行索引排序操作后提取数据到文件

优点：操作简单
缺点：运算速度慢，而且需要数据库设备。

解决方案二:分段排序
操作方式：
规定一个内存大小，比如200M，200M可以记录(200*1024*1024/4) = 52428800条记录，我们可以每次提取5000万条记录到文件进行排序，要装满9位整数需要20次，所以一共要进行20次排序，需要对文件进行20次读操作

缺点：
编码复杂，速度也慢(至少20次搜索)

关键步骤：
先将整个9位整数进行分段，亿条数据进行分成20段，每段5000万条
在文件中依次搜索0~5000万，50000001~1亿……
将排序的结果存入文件

解决方案三:bit位操作
思考下面的问题:
一个最大的9位整数为999999999
这9亿条数据是不重复的
可不可以把这些数据组成一个队列或数组，让它有0~999999999(10亿个)元素
数组下标表示数值，节点中用0表示这个数没有，1表示有这个数
判断0或1只用一个bit存储就够了

声明一个可以包含9位整数的bit数组(10亿)，一共需要10亿/8=120M内存
把内存中的数据全部初始化为0, 读取文件中的数据，并将数据放入内存。比如读到一个数据为341245909这个数据，那就先在内存中找到341245909这个bit，并将bit值置为1遍历整个bit数组，将bit为1的数组下标存入文件

关键代码
检查是某一个char里面(first)的第second位中存储的数据是否为1

bool CompareBit (unsigned char first, int second)
{
const static int mark_buf[] = {0x1, 0x2, 0x4, 0x8, 0x10, 0x20, 0x40, 0x80};
if (second > .8)
return false;

return (first & mark_buf[second]) == mark_buf[second];
}

将某一个char(Desc)中的第source位置为1

bool WriteToBit (unsigned char *Desc, int source)
{
const static int mark_buf[] = {0x1, 0x2, 0x4, 0x8, 0x10, 0x20, 0x40, 0x80};

if (source > .8)
return false;

Desc[0] |= mark_buf[source];

return true;
}

案例
在某个项目中，我们需要对2亿条手机号码删除重复记录(过滤号码黑名单同样有效)

工作难点就在于如何处理这2亿条电话号码,直接用哈希表存放手机号码不大现实,即使经过优化,用一个unsigned int存放一条记录,那也得需要2亿*4=8亿byte,远超过32位系统的寻址能力

解决方案:
将电话号码由12位单个数字组成的字符串转换为一个unsigned int型数据(这个完全可能,手机号码由前三位数字和后面八位数字组成,后面八位需要占到1~1000万的空间,而前面用0~100的数字存储已经足够)为简单起见,默认为0~4G的数字都有可能分布号码,为此我们分配4G/32=512M的内存将这2亿个号码整理成unsigned int类型后按上述办法存放在这块内存中(比如13512345678我们整理后为112345678,我们找到内存中112345678bit的下标,并将此bit值设为1)遍历整个bit数组,记录下所有的号码,这些号码即是不重复的手机号码

总结
建立一个足够大的bit数组当作hash表
以bit数组的下标来表示一个整数
以bit位中的0或1来表示这个整数是否在这个数组中存在
适用于无重复原始数据的搜索
原来每个整数需要4byte空间变为1bit，空间压缩率为32倍
扩展后可实现其他类型（包括重复数据）的搜索 < xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" />

主题：3000w数据的表，取某项字段前50项数据，内存2G

偶然看到这个题，就想了一下怎么做，大体实现思路是这样子的，3000w的数据划分为1000段，也就是1-3w为一段，30001-6w项为第二段，依次类推，从每3w的数据中提取出前50条数据（这个根据sql排序就能取出来，2个g的内存够了），最后1000个50就会产生5w个数据，最后提取出来的5w的数据放置到ArrayList中去，最后5w的数据统一排序，取出前50条。5w*5w的对比与交换是可以搞定的。具体实现，等最近的项目完了用多线程试试！

主题：【探讨】给你1G内存，如何从3000万个手机号码中检索出你要的号码，要求每秒检索>1000次

主题：3亿数据快速检索实现

上周有个需求，就是要做一个检索库：
　　１　３亿个手机号码，并且每个号码２０个左右的属性例：地区，订阅等信息。
　　２　在最短的时候内select出来（５分钟，１０分钟）[最重要]
　　３　允许更新。对这些号码进行发送信息后，状态改变。[可以让他慢慢更新]
　　和几个同事讨论了一下，具体要注意以下几点：
　　１　如果发送下去状态改变，但是只发送一半，但状态改变了如何办？
　　２　如果多个产品线一起下发，状态会不会混乱。
　　解决以上第二个问题，决定采用，队列等待的方式。第一个问题没想到好的解决办法，回滚也想过了，但感觉不是很现实！

　　解决方案：
　　经过实验500w条的数据在用plsql直接select，只需要０.２秒，所以总体采用分表的方式，每500w条分一个表，然后同时查询！
-----------------------------------------重新描述一下需求-------------------------------
很多人说需求不是很的清楚，这里重新整理了一下！
不过要注意的是数据库里已经有3亿个手机基数了！
一．号码入库。
不定期会有新的号码需要入库，入库需要记录号码的常规属性，如：手机号，省份，城市，入库时间，手机卡类型，是否支持彩信，号码来源情况等。
二．入库手机号源文件管理
入库手机号源文件要以文件形式保存在服务器上。
三．按需要提取号码（最关键部分）
要按照需求提取所需的号码。

例如：
提号要求：
1.此号码非黑名单用户。
2.此号码为的订购和退订用户。
3.此号码2个月内没有活动。
4.省份要求：辽宁，云南，广东
5.号段要求：137和138和139号段
6.数量要求：每个省10w
7.是否支持彩信：是（是，否，忽略三种情况）
……

最后，符合条件的号码，按照固定格式（每个手机号占一行），形成文本文件，将此文件测试号码，是否需要状态报告等信息形成最终可发送文件并提供下载功能，同时记录本次提取信息（发送时间，发送标识等）
注：文件格式如下：
139***85185#09#0
139***71283
139***33190
第1列：手机号
第2列：产品类型（#09）
第3列：是否需要状态报告（#0）

四．统计功能
一．号码情况统计
1.统计当前号码总量。
2.按照2个基本要求，统计现在库中可以使用的号码数量。
注：统计需要显示，全国总量，各省总量，各省省会总量，各省去除省会总量，各省7天未下发总量（省会与其他城市分开显示），各省可以发送总量（省会与其他城市分开显示，所以单独列出来）。

二．发送产品统计
1.按时间段、业务线等统计发送产品的情况，如：发送时间，最终发送文件等

五．黑名单及特殊号码管理
1. 添加黑名单
2. 去除黑名单
3. 过滤黑名单
4. 查询黑名单

以上除黑名单外都是迫切需要的，黑名单功能可以以后完善。

现在有一万（1-10000）的个数，从中拿掉一个数，还剩9999个数，现在用一个数组来存储这9999个数，问怎么才能找出拿掉的数？

用10000个数的数组循环匹配9999个数，匹配成功，从9999数组中去除，不成功就是该数。

大家还有什么好的思路没有？

问题:假设一个文件中有9亿条不重复的9位整数，现在要求对这个文件进行排序。

一般解题思路: 1、将数据导入到内存中 2、将数据进行排序　（比如插入排序、快速排序） 3、将排序好的数据存入文件

难题: 一个整数为4个字节即使使用数组也需要900,000,000 * 4byte = 3.4G内存对于32位系统，访问2G以上的内存非常困难，而且一般设备也没有这么多的物理内存将数据完全导入到内存中的做法不现实。

其他解决办法: 1、导入数据库运算 2、分段排序运算 3、使用bit位运算

解决方案一:数据库排序 将文本文件导入到数据库，让数据库进行索引排序操作后提取数据到文件

优点：操作简单缺点：运算速度慢，而且需要数据库设备。

解决方案二:分段排序 操作方式：规定一个内存大小，比如200M，200M可以记录52428800条记录，我们可以每次提取5000万条记录到文件进行排序，要装满9位整数需要20次，所以一共要进行20次排序，需要对文件进行20次读操作

缺点： 编码复杂，速度也慢(至少20次搜索)

关键步骤：先将整个9位整数进行分段，亿条数据进行分成20段，每段5000万条，在文件中依次搜索0~5000万，50000001~1亿…… 将排序的结果存入文件

解决方案三:bit位操作 思考下面的问题: 一个最大的9位整数为999999999 这9亿条数据是不重复的，可不可以把这些数据组成一个队列或数组，让它有0~999999999(10亿个)元素数组下标表示数值，节点中用0表示这个数没有，1表示有这个数，判断0或1只用一个bit存储就够了

声明一个可以包含9位整数的bit数组(10亿)，一共需要10亿/8=120M内存，把内存中的数据全部初始化为0 ，读取文件中的数据，并将数据放入内存。比如读到一个数据为341245909这个数据，那就先在内存中找到341245909这个bit，并将bit值置为1 ，遍历整个bit数组，将bit为1的数组下标存入文件

关键代码 检查是某一个char里面(first)的第second位中存储的数据是否为1

bool CompareBit (unsigned char first, int second)

{

const static int mark_buf[] = {0x1, 0x2, 0x4, 0x8, 0x10, 0x20, 0x40, 0x80};

if (second > 8) return false;

return (first & mark_buf[second]) == mark_buf[second];

}

将某一个char(Desc)中的第source位置为1

bool WriteToBit (unsigned char *Desc, int source)

{

const static int mark_buf[] = {0x1, 0x2, 0x4, 0x8, 0x10, 0x20, 0x40, 0x80};

if (source > 8) return false;

Desc[0] |= mark_buf[source];

return true;

}

案例在某个项目中，我们需要对2亿条手机号码删除重复记录(过滤号码黑名单同样有效)

工作难点就在于如何处理这2亿条电话号码,直接用哈希表存放手机号码不大现实,即使经过优化,用一个unsigned int存放一条记录,那也得需要2亿*4=8亿byte,远超过32位系统的寻址能力

解决方案: 将电话号码由12位单个数字组成的字符串转换为一个unsigned int型数据(这个完全可能,手机号码由前三位数字和后面八位数字组成，后面八位需要占到1~1000万的空间,而前面用0~100的数字存储已经足够) ，为简单起见，默认为0~4G的数字都有可能分布号码，为此我们分配4G/32=512M的内存，将这2亿个号码整理成unsigned int类型后按上述办法存放在这块内存中(比如13512345678我们整理后为112345678,我们找到内存中112345678bit的下标,并将此bit值设为1) ，遍历整个bit数组,记录下所有的号码,这些号码即是不重复的手机号码

总结建立一个足够大的bit数组当作hash表，以bit数组的下标来表示一个整数，以bit位中的0或1来表示这个整数是否在这个数组中存在，适用于无重复原始数据的搜索，原来每个整数需要4byte空间变为1bit，空间压缩率为32倍，扩展后可实现其他类型（包括重复数据）的搜索

注意由于操作系统和编程语言本身的限制，有可能内存足够，但无法分配一块连续大内存的情况，这样的话可以申请多块稍微小一点的内存，然后用链表或其他的方式连接起来使用

关于海量数据处理

常用的数据结构：

1.Bloom Filter

大致思想是这样，把一个数据通过N个哈希函数映射到一个长度为M的数组的一位上，将hash函数对应的值的位数组置1，查找时如果发现所有hash函数对应位都是1说明该数据的存在。但不能保证完全正确性，但是此方法无比高效。

【实例】给你A,B两个文件，各存放50亿条URL，每条URL占用64字节，内存限制是4G，让你找出A,B文件共同的URL。如果是三个乃至n个文件呢？

2.哈希法

这个简单，无非是通过一些哈希函数把元素搞到一个指定的位置，简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。这个很一般啊感觉。无非就是分类查找么，完全不如1猛。

3.最大或最小堆

就是一个完全的最大或最小二叉树，用途，比如:1)100w个数中找最大的前100个数。用一个100个元素大小的最小堆即可。感觉还是不错的。

4.Bit-map

所谓的Bit-map就是用一个bit位来标记某个元素对应的Value，而Key即是该元素。由于采用了Bit为单位来存储数据，因此在存储空间方面，可以大大节省。

【问题实例】

1)已知某个文件内包含一些电话号码，每个号码为8位数字，统计不同号码的个数。

8位最多99 999 999，大概需要99M个bit，大概10几m字节的内存即可。（可以理解为从0-99 999 999的数字，每个数字对应一个Bit位，所以只需要99M个Bit==1.2MBytes，这样，就用了小小的1.2M左右的内存表示了所有的8位数的电话）

2)2.5亿个整数中找出不重复的整数的个数，内存空间不足以容纳这2.5亿个整数。

将bit-map扩展一下，用2bit表示一个数即可，0表示未出现，1表示出现一次，2表示出现2次及以上，在遍历这些数的时候，如果对应位置的值是0，则将其置为1；如果是1，将其置为2；如果是2，则保持不变。或者我们不用2bit来进行表示，我们用两个bit-map即可模拟实现这个2bit-map，都是一样的道理。

公司的一道考试题算法分析——大数据量整数排序

    题目大意：移动公司需要对已经发放的所有139段的号码进行统计排序，已经发放的139号码段的文件都存放在一个文本文件中（原题是放在两个文件中），一个号码一行，现在需要将文件里的所有号码进行排序，并写入到一个新的文件中；号码可能会有很多，最多可能有一亿个不同的号码（所有的139段号码），存入文本文件中大概要占1.2G的空间；jvm最大的内存在300以内，程序要考虑程序的可执行性及效率；只能使用Java标准库，不得使用第三方工具。
    这是个典型的大数据量的排序算法问题，首先要考虑空间问题，一下把1.2G的数据读入内存是不太可能的，就算把1一亿条数据，转都转换成int类型存储也要占接近400M的空间。当时做个题目我并没有想太多的执行效率问题，主要就考虑了空间，而且习惯性的想到合并排序，基本思想是原文件分割成若干个小文件并排序，再将排序好的小文件合并得到最后结果，算法大概如下：

    1.顺序读取存放号码文件的中所有号码，并取139之后的八位转换为int类型；每读取号码数满一百万个，（这个数据可配置）将已经读取的号码排序并存入新建的临时文件。
    2.将所有生成的号码有序的临时文件合并存入结果文件。

    这个算法虽然解决了空间问题，但是运行效率极低，由于IO读写操作太多，加上步骤1中的排序的算法（快速排序）本来效率就不高（对于电话排序这种特殊情况来说），导致1亿条数据排序运行3个小时才有结果。

    如果和能够减少排序的时间呢？首当其冲的减少IO操作，另外如果能够有更加好排序算法也行。前天无聊再看这个题目时突然想到大三时看《编程珠玑》时上面也有个问题的需求这个这个题目差不多，记得好像使用是位向量（实际上就是一个bit数组），用电话作为index，心中大喜，找到了解决此问题的最完美方案啦：用位向量存储电话号码，一个号码占一个bit，一亿个电话号码也只需要大概12M的空间；算法大概如下：
      1.初始化bits[capacity]；
      2.顺序所有读入电话号码，并转换为int类型，修改位向量值：bits[phoneNum]=1；
      3.遍历bits数组，如果bits[index]=1，转换index为电话号码输出。
    Java中没有bit类型，一个boolean值占空间为1byte（感兴趣的可以自己写程序验证），我自己写个用int模拟bit数组的类，代码如下：

Java代码< xmlnamespace prefix ="v" ns ="urn:schemas-microsoft-com:vml" />

public class BitArray {
private int[] bits = null;
private int length;
//用于设置或者提取int类型的数据的某一位(bit)的值时使用
private final static int[] bitValue = {
0x80000000,//10000000 00000000 00000000 00000000
0x40000000,//01000000 00000000 00000000 00000000
0x20000000,//00100000 00000000 00000000 00000000
0x10000000,//00010000 00000000 00000000 00000000
0x08000000,//00001000 00000000 00000000 00000000
0x04000000,//00000100 00000000 00000000 00000000
0x02000000,//00000010 00000000 00000000 00000000
0x01000000,//00000001 00000000 00000000 00000000
0x00800000,//00000000 10000000 00000000 00000000
0x00400000,//00000000 01000000 00000000 00000000
0x00200000,//00000000 00100000 00000000 00000000
0x00100000,//00000000 00010000 00000000 00000000
0x00080000,//00000000 00001000 00000000 00000000
0x00040000,//00000000 00000100 00000000 00000000
0x00020000,//00000000 00000010 00000000 00000000
0x00010000,//00000000 00000001 00000000 00000000
0x00008000,//00000000 00000000 10000000 00000000
0x00004000,//00000000 00000000 01000000 00000000
0x00002000,//00000000 00000000 00100000 00000000
0x00001000,//00000000 00000000 00010000 00000000
0x00000800,//00000000 00000000 00001000 00000000
0x00000400,//00000000 00000000 00000100 00000000
0x00000200,//00000000 00000000 00000010 00000000
0x00000100,//00000000 00000000 00000001 00000000
0x00000080,//00000000 00000000 00000000 10000000
0x00000040,//00000000 00000000 00000000 01000000
0x00000020,//00000000 00000000 00000000 00100000
0x00000010,//00000000 00000000 00000000 00010000
0x00000008,//00000000 00000000 00000000 00001000
0x00000004,//00000000 00000000 00000000 00000100
0x00000002,//00000000 00000000 00000000 00000010
0x00000001 //00000000 00000000 00000000 00000001
};
public BitArray(int length) {
if(length < 0){
throw new IllegalArgumentException("length必须大于零！");
}
bits = new int[length / 32 + (length % 32 > 0 ? 1 : 0)];
this.length = length;
}
//取index位的值
public int getBit(int index){
if(index <0 || index > length){
throw new IllegalArgumentException("length必须大于零小于" + length);
}
int intData = bits[index/32];
return (intData & bitValue[index%32]) >>> (32 - index%32 -1);
}
//设置index位的值，只能为0或者1
public void setBit(int index,int value){
if(index <0 || index > length){
throw new IllegalArgumentException("length必须大于零小于" + length);
}
if(value!=1&&value!=0){
throw new IllegalArgumentException("value必须为0或者1");
}
int intData = bits[index/32];
if(value == 1){
bits[index/32] = intData | bitValue[index%32];
}else{
bits[index/32] = intData & ~bitValue[index%32];
}
}
public int getLength(){
return length;
}
}

    bit数组有了，剩下就是算法代码，核心代码如下：

Java代码

bitArray = new BitArray(100000000);
//顺序读取所有的手机号码
while((phoneNum = bufferedReader.readLine())!=null){
phoneNum = phoneNum.trim().substring(3);//13573228432
//取139后8位转换为int类型
phoneNumAsInt = Integer.valueOf(phoneNum);
//设置对应bit值为1
bitArray.setBit(phoneNumAsInt, 1);
}
//遍历bit数组输出所有存在的号码
for(int i = 0;i
if(bitArray.getBit(i)==1){
writer.write("139" + leftPad(String.valueOf(i + sortUnit*times), 8));
writer.newLine();
}
}
writer.flush();

    经测试，修改后的算法排序时只需要20多M的内存，一亿条电话号码排序只要10分钟（时间主要花在IO上），看来效果还是很明显的。 
    这个算法很快，不过也有他的局限性： 
    1.只能用于整数的排序，或者可以准确映射到正整数（对象不同对应的正整数也不相同）的数据的排序。 
    2.不能处理重复的数据，重复的数据排序后只有一条（如果有这种需求可以在这个算法的基础上修改，给出现次数大于1的数据添加个计数器，然后存入Map中） 
    3.对于数据量极其大的数据处理可能还是比较占用空间，这种情况可配合多通道排序算法解决。

Julia语言的学习路线樟松包罗万象 golang 开发语言后端
Julia语言学习路线指南引言在编程语言层出不穷的今天，Julia作为一门新兴的高级编程语言，以其出色的性能和易用性逐渐获得了越来越多的关注。特别是在科学计算、数据分析和机器学习等领域，Julia的表现十分出色，成为研究人员和开发者的热门选择。本文将为希望学习Julia语言的读者提供一条详细的学习路线，包括基础知识、工具、库、项目和实践经验等，帮助大家有效地掌握这门语言。一、了解Julia语言在开
基于Mosquitto和Paho，在C++中使用MQTT 牛魔王的小怪兽 MQTT c++开发语言网络协议
基于Mosquitto和Paho，使用C++进行MQTT相关应用的开发文章目录基于Mosquitto和Paho，使用C++进行MQTT相关应用的开发1.什么是MQTT2.MQTT的应用场景3.基于Paho，在C++中使用MQTT3.1.下载Paho库3.2.发布消息的代码示例3.3.订阅消息的代码示例3.4.综合示例3.4.1.LinuxC++发布端代码3.4.2.LinuxC++订阅端代码4.基
《C++ primer》第六章鱼不如渔 C++Primer第五版——读书笔记 c++开发语言
一、函数基础函数的定义包括：返回类型、函数名、形参列表、函数体/*编写函数*/intfact(intval){intret=1;while(val>1)ret*=val--;returnret;}/*调用函数*/intmain(void){intj=fact(5);cout#includeusingnamespacestd;intmain(intargc,char*argv[]){//检查是否提供
C++泛型编程鱼不如渔 C++Primer第五版——读书笔记 c++开发语言
感谢哔哩哔哩UP”开发者LaoJ“，以下是听课记录~模板是C++实现泛型编程的手段，同一段代码逻辑可以接受多个类型的参数无论是函数模板还是类模板，在编码后，需要分文件时，将其声明和定义放进.hpp文件中。不要将声明放.h，定义放.cpp，会报错一、函数模板对于函数模板，使用不同的类型对其进行实例化时，会生成多个不同的函数当没有调用函数模板时，不会被实例化(延迟实例化)1.1、接受类型参数#incl
【C++】继承月亮有痕迹诶 C++c++开发语言
目录前言一、继承的概念及定义1.1继承的概念1.2继承的定义1.2.1定义格式1.2.2继承关系和访问限定符1.2.3继承基类成员访问方式的变化二、基类和派生类对象复制转换三、继承中的作用域四、派生类的默认成员函数五、继承与友元六、继承与静态成员七、复杂的菱形继承及菱形虚拟继承八、继承的总结和反思总结前言随着面向对象编程（OOP）在现代软件开发中的广泛应用，继承作为其核心机制之一，成为了代码复用和
Qt 设置窗体透明 Qt开发老杰 qt 数据库开发语言 c++c语言
一、前言在音频开发中，窗体多半为半透明、圆角窗体，如下为Qt5.5VS2013实现半透明方法总结。二、半透明方法设置1、窗体及子控件都设置为半透明1）setWindowOpacity(0.8);//参数范围为0-1.0，通过QSlider控件做成透明度控制条本文福利，莬费领取Qt开发学习资料包、技术视频，内容包括（C++语言基础，Qt编程入门，QT信号与槽机制，QT界面开发-图像绘制，QT网络，Q
自立自强的江铃集团新能源，用科技创新实力圈粉微视资讯汽车
汽车行业正在经历从价格竞争和配置堆砌，向技术回归的深刻转型。消费者对“冰箱、彩电、大沙发”式的噱头已经逐渐失去兴趣，取而代之的是对核心技术和安全性能的理性关注。在这样的背景下，江铃集团新能源凭借深厚的技术积累和创新能力迅速赢得市场认可。作为拥有56年造车经验的企业，江铃集团新能源在整车研发、智能制造、智能网联、三电技术和车身轻量化等领域全面突破，不仅成功定位于纯电市场，还通过前瞻性的创新战略实现了
从零开始探索C++游戏开发：性能、控制与无限可能南玖yy C++游戏开发 c
一、为何选择C++开发游戏？在虚幻引擎5渲染的次世代画面背后，在《巫师3》的庞大开放世界中，在《毁灭战士》的丝滑60帧战斗里，C++始终扮演着核心技术角色。这门诞生于1983年的语言，至今仍占据着游戏引擎开发语言使用率榜首（根据2023年GameDev调查数据）。其核心竞争力体现在：硬件级控制：手动内存管理允许精确控制资源分配，这对需要管理数百万多边形和4K纹理的3A游戏至关重要零成本抽象：模板元
rapidocr-onnxruntime库及在open-webui上传PDF 图像处理 (使用 OCR)应用原野AI 大模型部署 pdf ocr 深度学习 open-webui
背景rapidocr-onnxruntime是一个跨平台的OCR库，基于ONNXRuntime推理框架。目前已知运行速度最快、支持最广，完全开源免费并支持离线快速部署的多平台多语言OCR。缘起：百度paddle工程化不是太好，为了方便大家在各种端上进行ocr推理，我们将它转换为onnx格式，使用Python/C++/Java/Swift/C#将它移植到各个平台。名称来源：轻快好省并智能。基于深度学
C++面向对象三大特性 CodeCuriosity C++c++开发语言
一、封装封装是将数据和操作数据的函数捆绑在一起形成类，通过访问控制限定符（如private、protected、public）隐藏对象的内部细节，仅对外提供必要接口，以此增强代码的安全性和可维护性。#includeclassBankAccount{private:doublebalance;//私有成员变量，外部无法直接访问public://构造函数，用于初始化账户余额BankAccount(do
2025年国内UWB的企业排行榜人员安全定位物联网
截至2024年，中国UWB（超宽带）领域的企业在技术研发、市场应用和行业影响力方面表现突出。以下是一个基于技术实力、市场份额和行业影响力的国内UWB企业排行榜，供参考：1.品铂科技（Pinpoint）核心优势：专注于UWB高精度定位技术，定位精度可达厘米级。在工业、电厂、司法、监狱管理等领域有丰富的应用经验。应用领域：智慧工业、矿山、物流、司法监狱管理、智慧化工等。提供完整的UWB解决方案，涵盖硬
c++调用python代码，使用gpu AI改变视界 c++python 开发语言
c++调用python，使用gpu加速1、首先要配置cuda和cudnn的环境1、cmd窗口下nvidia-smi，查看电脑可以支持的最高cuda版本。如果nvidia-smi报错，那么需要去配置一下环境，网上有类似案例。或者通过NVIDIA控制面板/系统信息/组件里查看cuda_xxxx.dll，上面有版本号。2、保证安装的cuda版本要小于电脑支持的版本号。我电脑最大支持cuda11，但是安装
如何编写vscode的配置文件c_cpp_properties.json 小秋slam实战从零开始学SLAM vscode
文章目录配置`c_cpp_properties.json`文件改变VScode中空格长度VSCode中C/C++无法跳转到定义c_cpp_properties.json安装插件配置c_cpp_properties.json文件假设你已经安装了GCC和G++编译器，{"configurations":[{"name":"Linux","includePath":
C++学习：类和对象（一）随便取个六字 c++
一、面向过程与面向对象编程1.什么是面向过程编程？面向过程编程（ProceduralProgramming）是一种以过程（或函数）为中心的编程范式。程序被视为一系列按顺序执行的步骤，主要通过函数对数据进行操作特点：执行顺序明确：程序按照代码书写的顺序执行侧重算法：重视具体的操作步骤和实现流程代码重用性低：相似的功能需要重复编写代码代码示例：计算数组元素的平均值#includeusingnamesp
AI大模型测试用例生成平台王根生测试开发测试用例质量保障 AI编程 nlp 测试管理软件测试
AI测试用例生成平台项目背景技术栈业务描述项目展示项目重难点项目背景针对传统接口测试用例设计高度依赖人工经验、重复工作量大、覆盖场景有限等行业痛点，基于大语言模型技术实现接口测试用例智能生成系统。技术栈LangChain框架+GLM-4模型+PromptEngineering+Flask+Python+Bootstrap+jQuery业务描述用户在该平台上传Markdown形式的接口文档，点击生成
【C++基础八】类和对象—末(初始化列表、友元和匿名对象) Pacify_The_North C++c++开发语言 windows visualstudio
【C++基础八】类和对象—末1.初始化列表1.1初始化列表的使用1.2初始化列表的细节2.static成员3.友元3.1友元函数3.2友元类4.类的匿名对象5.explicit1.初始化列表构造函数中,为一个成员赋值，只能说对此成员赋初始值，不能称之为初始化，初始化列表才是真正初始化成员变量的地方1.1初始化列表的使用例：classDate{public:Date(intyear,intmonth
数据结构（C\C++）——算法复杂度飞鸟吟数据结构数据结构 c语言 c++
算法复杂度前言1.数据结构前言1.1数据结构1.2算法1.3如何学好数据结构和算法2.算法效率2.1复杂度的概念2.2复杂度的重要性3.时间复杂度3.1定义3.2大O的渐进表示法3.3时间复杂度计算示例3.3.1示例13.3.2示例23.3.3示例33.3.4示例43.3.5示例5冒泡排序时间复杂度3.3.6示例63.3.7示例74.空间复杂度4.1空间复杂度计算示例4.1.1示例14.1.2示例
每日总结3.13 labubu12 c语言
第十五届蓝桥杯c++省赛大学B组1.小球反弹问题（√）（镜像扩展空间，没有碰撞反弹，小球一直前进，到达出发点镜像后的点）#includeusingnamespacestd;intmain(){longlongx=343720,y=233333;longlongdx=15,dy=17;longlongt=1;while(1){if((t*dx)%x==0&&(t*dy)%y==0){break;}t
《侯捷 C++ 系列精品课学习之旅：知识盛宴与成长感悟》一朵忧伤的蔷薇 c++学习 jvm
一、初遇C++：基础与语法的探索课程伊始，侯捷老师以深入浅出的方式，为我们讲解了C++的基础语法。从变量、数据类型到控制结构，每一个知识点都被剖析得细致入微。我印象尤为深刻的是老师对指针的讲解。指针作为C++的核心概念之一，向来以其抽象和复杂而让初学者望而却步。然而，侯老师通过生动形象的比喻和丰富的示例，将指针的原理和应用讲解得通俗易懂。他将指针比作地址，就像现实生活中的门牌号，通过它我们可以准确
VIM使用小技巧 ka__ka__ 工具技巧 vim
VIM的优势如果做LinuxC/C++开发，经常ssh到Linux服务器编辑各种文件，那么熟练使用VIM绝对可以提高工作效率。VIM的高效体现在多模式，可以很方便快速的对文件进行各种编辑修改，而这恰恰是在软件开发中经常遇到的场景。VIM流行这么多年，很多操作都是经过多年沉淀下来的高效操作，熟练的VIM操作可以让编辑与思维尽可能同步，快速的反复修改，把代码写成想要的样子。并且，在Linux上很多的操
STM32入门教程——CAN驱动经验文档单片机的码农 STM32入门教程 stm32 单片机嵌入式硬件
##1.引言-简述STM32F407微控制器及其在工业和汽车应用中的CAN通讯重要性。-阐明文档的目标，即分享STM32F407CAN驱动的开发经验和最佳实践。##2.STM32F407CAN硬件特性-详细介绍STM32F407的CAN硬件特性，包括消息RAM、工作模式、消息过滤等。-讨论STM32F407的CAN外设时钟配置和中断管理。##3.开发环境搭建-推荐并指导安装必要的软件工具，如STM
程序编译生成的文件石油人单挑所有 Linux系统编程算法
目录.i文件.s文件.o文件总结在C++编程中，.i、.s和.o文件是编译过程中生成的不同阶段的文件，它们代表不同的含义：.i文件全称：预处理后的文件（IntermediateFile）。含义：.i文件是源代码文件（如.cpp文件）经过预处理阶段生成的文件。预处理阶段主要处理源代码中的预处理指令，如#include、#define等。.i文件包含了经过预处理后的代码，即所有头文件被展开，宏被替换，
大模型在招聘场景下的应用 IT猫仔人工智能 ai 学习
大模型在招聘场景下的应用具有广泛的可能性。一、简历自动化筛选与匹配应用：大模型能够自动分析大量简历，根据职位要求筛选出合适的候选人，并按匹配度排序。Prompt写法：请对以下简历进行筛选，找出符合【职位名称】职位要求的候选人。职位要求包括【具体要求】。请提供筛选结果，并按照匹配度从高到低排序。举例：请对以下简历进行筛选，找出符合“产品经理”职位要求的候选人。职位要求包括具备3年以上产品经验、熟悉用
高级线程管理_第九章_《C++并发编程实战》笔记郭涤生 #并发线程 c/c++c++并发编程
高级线程管理1.线程池（ThreadPool）1.1线程池结构要素1.2线程池实现步骤2.线程中断（InterruptibleThreads）2.1中断机制实现多选题多选题答案设计题目设计题目答案1.线程池（ThreadPool）核心目的：避免频繁创建/销毁线程，复用固定数量的线程处理任务队列。1.1线程池结构要素任务队列：存储待执行的任务（函数对象）工作线程集合：执行任务的线程同步机制：互斥锁（
Visual Studio Code (VS Code) – C/C++ 入门
——基于VisualStudioCode官方文档的全面的、具体的入门级教程请移步至https://blog.csdn.net/m0_73287396/article/details/128635316
Java：AI 浪潮中的隐形支柱 —— 探秘 Java 在人工智能领域的独特地位琢磨先生David 人工智能
引言在人工智能技术席卷全球的今天，当人们谈论AI开发时，Python、R语言、C++等工具总是最先被提及。然而在这个充满创新的领域，有一个"老兵"正悄然发挥着不可替代的作用——自1995年诞生至今的Java语言，凭借其独特的工程化基因，正在构建起AI世界的底层基础设施。本文将揭示Java如何在大数据、机器学习、企业级AI系统等领域持续创造价值。一、Java的AI基因解码跨平台优势的现代意义"一次编
正则表达式大神乔伊工具正则表达式
前言如果你学会了，可以忽略本文章，或去项目经验地图寻找更多答案原则1.找规律2.不要追求完美3.思考：什么开头？什么结束？什么类型？多少位数？什么范围？出现次数？语法一：对象写法letreg=newRegExp(/\d{5}/)letreg=newRegExp("\\d{5}")letstr='我的号码是12345'console.log(reg.test(str))//true二：字面量方式：l
C++程序设计语言笔记——抽象机制：泛型程序设计钺不言 C++笔记 c++笔记开发语言经验分享
0模板可传递实参类型而不丢失信息。在C++中，模板传递实参类型时保留所有类型信息的关键在于正确使用引用和转发机制。以下是几种常见场景的解决方案：1.使用万能引用（UniversalReference）和完美转发通过T&&捕获任意类型的引用（左值/右值），结合std::forward保留原始类型信息：templatevoidwrapper(T&&arg){//完美转发，保留所有类型信息（包括cons
c++成绩排名 vir02 c++c++算法
编写一个学生类，包含学号(string)、姓名(string)和成绩(double)三个私有属性，以及设置姓名、学号和成绩值，获得成绩值，输出姓名、学号和成绩等的公有成员函数。根据输入的人数，定义学生类对象数组，并读入学生信息，然后按照成绩由高低顺序排序并输出。输入格式:第1行输入学生人数n（0#includeusingnamespacestd;classStudent{public:string
独立开发经验谈：我是如何借助 Docker 环境变量让客户 1 分钟上线客服系统的
我在业余时间开发了一款自己的独立产品：升讯威在线客服与营销系统。陆陆续续开发了几年，从一开始的偶有用户尝试，到如今线上环境和私有化部署均有了越来越多的稳定用户，在这个过程中，我也积累了不少如何开发运营一款独立产品的经验。我之前写过一篇文章，介绍如何用Docker让潜在客户快速体验你的独立产品。有朋友看到这篇文章之后，试用了产品并且给了我新的建议：用Docker环境变量让试用更方便。在此感谢这位xj
html 周华华 html
js 1，数组的排列 var arr=[1,4,234,43,52,]; for(var x=0;x<arr.length;x++){ for(var y=x-1;y<arr.length;y++){ if(arr[x]<arr[y]){ &
【Struts2 四】Struts2拦截器 bit1129 struts2拦截器
Struts2框架是基于拦截器实现的，可以对某个Action进行拦截，然后某些逻辑处理，拦截器相当于AOP里面的环绕通知，即在Action方法的执行之前和之后根据需要添加相应的逻辑。事实上，即使struts.xml没有任何关于拦截器的配置，Struts2也会为我们添加一组默认的拦截器，最常见的是，请求参数自动绑定到Action对应的字段上。 Struts2中自定义拦截器的步骤是：
make:cc 命令未找到解决方法 daizj linux 命令未知 make cc
安装rz sz程序时，报下面错误： [root@slave2 src]# make posix cc -O -DPOSIX -DMD=2 rz.c -o rz make: cc：命令未找到 make: *** [posix] 错误 127 系统：centos 6.6 环境：虚拟机错误原因：系统未安装gcc，这个是由于在安
Oracle之Job应用周凡杨 oracle job
最近写服务，服务上线后，需要写一个定时执行的SQL脚本，清理并更新数据库表里的数据，应用到了Oracle 的 Job的相关知识。在此总结一下。一：查看相关job信息 1、相关视图 dba_jobs all_jobs user_jobs dba_jobs_running 包含正在运行
多线程机制朱辉辉33 多线程
转至http://blog.csdn.net/lj70024/archive/2010/04/06/5455790.aspx 程序、进程和线程：程序是一段静态的代码，它是应用程序执行的蓝本。进程是程序的一次动态执行过程，它对应了从代码加载、执行至执行完毕的一个完整过程，这个过程也是进程本身从产生、发展至消亡的过程。线程是比进程更小的单位，一个进程执行过程中可以产生多个线程，每个线程有自身的
web报表工具FineReport使用中遇到的常见报错及解决办法（一）老A不折腾 web报表 finereport java报表报表工具
FineReport使用中遇到的常见报错及解决办法（一）这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、address pool is full：含义：地址池满，连接数超过并发数上
mysql rpm安装后没有my.cnf 林鹤霄没有my.cnf
Linux下用rpm包安装的MySQL是不会安装/etc/my.cnf文件的，至于为什么没有这个文件而MySQL却也能正常启动和作用，在这儿有两个说法，第一种说法，my.cnf只是MySQL启动时的一个参数文件，可以没有它，这时MySQL会用内置的默认参数启动，第二种说法，MySQL在启动时自动使用/usr/share/mysql目录下的my-medium.cnf文件，这种说法仅限于r
Kindle Fire HDX root并安装谷歌服务框架之后仍无法登陆谷歌账号的问题 aigo root
原文：http://kindlefireforkid.com/how-to-setup-a-google-account-on-amazon-fire-tablet/ Step 4: Run ADB command from your PC On the PC, you need install Amazon Fire ADB driver and instal
javascript 中var提升的典型实例 alxw4616 JavaScript
// 刚刚在书上看到的一个小问题,很有意思.大家一起思考下吧 myname = 'global'; var fn = function () { console.log(myname); // undefined var myname = 'local'; console.log(myname); // local }; fn() // 上述代码实际上等同于以下代码 m
定时器和获取时间的使用百合不是茶时间的转换定时器
定时器:定时创建任务在游戏设计的时候用的比较多 Timer();定时器 TImerTask();Timer的子类由 Timer 安排为一次执行或重复执行的任务。定时器类Timer在java.util包中。使用时，先实例化，然后使用实例的schedule(TimerTask task, long delay)方法，设定
JDK1.5 Queue bijian1013 java thread java多线程 Queue
JDK1.5 Queue LinkedList： LinkedList不是同步的。如果多个线程同时访问列表，而其中至少一个线程从结构上修改了该列表，则它必须保持外部同步。（结构修改指添加或删除一个或多个元素的任何操作；仅设置元素的值不是结构修改。）这一般通过对自然封装该列表的对象进行同步操作来完成。如果不存在这样的对象，则应该使用 Collections.synchronizedList 方
http认证原理和https bijian1013 http https
一.基础介绍在URL前加https://前缀表明是用SSL加密的。你的电脑与服务器之间收发的信息传输将更加安全。 Web服务器启用SSL需要获得一个服务器证书并将该证书与要使用SSL的服务器绑定。 http和https使用的是完全不同的连接方式，用的端口也不一样,前者是80，后
【Java范型五】范型继承 bit1129 java
定义如下一个抽象的范型类，其中定义了两个范型参数，T1，T2 package com.tom.lang.generics; public abstract class SuperGenerics<T1, T2> { private T1 t1; private T2 t2; public abstract void doIt(T
【Nginx六】nginx.conf常用指令(Directive) bit1129 Directive
1. worker_processes 8; 表示Nginx将启动8个工作者进程，通过ps -ef|grep nginx,会发现有8个Nginx Worker Process在运行 nobody 53879 118449 0 Apr22 ? 00:26:15 nginx: worker process
lua 遍历Header头部 ronin47 lua header 遍历　
local headers = ngx.req.get_headers() ngx.say("headers begin", "<br/>") ngx.say("Host : ", he
java-32.通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小(两数组的差最小)。 bylijinnan java
import java.util.Arrays; public class MinSumASumB { /** * Q32.有两个序列a,b，大小都为n,序列元素的值任意整数，无序. * * 要求：通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小。 * 例如: * int[] a = {100,99,98,1,2,3
redis 开窍的石头 redis
在redis的redis.conf配置文件中找到# requirepass foobared 把它替换成requirepass 12356789 后边的12356789就是你的密码打开redis客户端输入config get requirepass 返回 redis 127.0.0.1:6379> config get requirepass 1) "require
[JAVA图像与图形]现有的GPU架构支持JAVA语言吗？ comsci java语言
无论是opengl还是cuda，都是建立在C语言体系架构基础上的，在未来，图像图形处理业务快速发展，相关领域市场不断扩大的情况下，我们JAVA语言系统怎么从这么庞大，且还在不断扩大的市场上分到一块蛋糕，是值得每个JAVAER认真思考和行动的事情
安装ubuntu14.04登录后花屏了怎么办 cuiyadll ubuntu
这个情况，一般属于显卡驱动问题。可以先尝试安装显卡的官方闭源驱动。按键盘三个键：CTRL + ALT + F1 进入终端，输入用户名和密码登录终端：安装amd的显卡驱动 sudo apt-get install fglrx 安装nvidia显卡驱动 sudo ap
SSL 与数字证书的基本概念和工作原理 darrenzhu 加密 ssl 证书密钥签名
SSL 与数字证书的基本概念和工作原理 http://www.linuxde.net/2012/03/8301.html SSL握手协议的目的是或最终结果是让客户端和服务器拥有一个共同的密钥，握手协议本身是基于非对称加密机制的，之后就使用共同的密钥基于对称加密机制进行信息交换。 http://www.ibm.com/developerworks/cn/webspher
Ubuntu设置ip的步骤 dcj3sjt126com ubuntu
在单位的一台机器完全装了Ubuntu Server，但回家只能在XP上VM一个，装的时候网卡是DHCP的，用ifconfig查了一下ip是192.168.92.128,可以ping通。转载不是错： Ubuntu命令行修改网络配置方法 /etc/network/interfaces打开后里面可设置DHCP或手动设置静态ip。前面auto eth0，让网卡开机自动挂载. 1. 以D
php包管理工具推荐 dcj3sjt126com PHP Composer
http://www.phpcomposer.com/ Composer是 PHP 用来管理依赖（dependency）关系的工具。你可以在自己的项目中声明所依赖的外部工具库（libraries），Composer 会帮你安装这些依赖的库文件。中文文档入门指南下载安装包列表 Composer 中国镜像
Gson使用四（TypeAdapter） eksliang json gson Gson自定义转换器 gsonTypeAdapter
转载请出自出处：http://eksliang.iteye.com/blog/2175595 一.概述 Gson的TypeAapter可以理解成自定义序列化和返序列化二、应用场景举例例如我们通常去注册时（那些外国网站），会让我们输入firstName，lastName,但是转到我们都
JQM控件之Navbar和Tabs gundumw100 html xml css
在JQM中使用导航栏Navbar是简单的。只需要将data-role="navbar"赋给div即可： <div data-role="navbar"> <ul> <li><a href="#" class="ui-btn-active&qu
利用归并排序算法对大文件进行排序 iwindyforest java 归并排序大文件分治法 Merge sort
归并排序算法介绍，请参照Wikipeida zh.wikipedia.org/wiki/%E5%BD%92%E5%B9%B6%E6%8E%92%E5%BA%8F 基本思想：大文件分割成行数相等的两个子文件，递归（归并排序）两个子文件，直到递归到分割成的子文件低于限制行数低于限制行数的子文件直接排序两个排序好的子文件归并到父文件直到最后所有排序好的父文件归并到输入
iOS UIWebView URL拦截啸笑天 UIWebView
本文译者：candeladiao，原文：URL filtering for UIWebView on the iPhone说明：译者在做app开发时，因为页面的javascript文件比较大导致加载速度很慢，所以想把javascript文件打包在app里，当UIWebView需要加载该脚本时就从app本地读取，但UIWebView并不支持加载本地资源。最后从下文中找到了解决方法，第一次翻译，难免有
索引的碎片整理SQL语句 macroli sql
SET NOCOUNT ON DECLARE @tablename VARCHAR (128) DECLARE @execstr VARCHAR (255) DECLARE @objectid INT DECLARE @indexid INT DECLARE @frag DECIMAL DECLARE @maxfrag DECIMAL --设置最大允许的碎片数量,超过则对索引进行碎片
Angularjs同步操作http请求with $promise qiaolevip 每天进步一点点学习永无止境 AngularJS 纵观千象
// Define a factory app.factory('profilePromise', ['$q', 'AccountService', function($q, AccountService) { var deferred = $q.defer(); AccountService.getProfile().then(function(res) {
hibernate联合查询问题 sxj19881213 sql Hibernate HQL 联合查询
最近在用hibernate做项目，遇到了联合查询的问题，以及联合查询中的N+1问题。针对无外键关联的联合查询，我做了HQL和SQL的实验，希望能帮助到大家。（我使用的版本是hibernate3.3.2） 1 几个常识：（1）hql中的几种join查询，只有在外键关联、并且作了相应配置时才能使用。（2）hql的默认查询策略，在进行联合查询时，会产
struts2.xml wuai struts
<?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache

大数查找排序总结——好东西

问题:假设一个文件中有9亿条不重复的9位整数，现在要求对这个文件进行排序。

你可能感兴趣的:(经验,C++)