爱听歌的周童鞋

7.3.tensorRT高级(2)-future、promise、condition_variable

前言

杜老师推出的 tensorRT从零起步高性能部署课程，之前有看过一遍，但是没有做笔记，很多东西也忘了。这次重新撸一遍，顺便记记笔记。

本次课程学习 tensorRT 高级-future、promise、condition_variable

课程大纲可看下面的思维导图

1. 生产者消费者模式

这节我们继续学习多线程知识

在深度学习模型部署中，我们通常采用生产者消费者模型对算法进行包装，然后交给其他团队使用

所以我们有必要对生产者消费者模型进行学习和了解，在这里我们拿一个具体问题来分析，即队列溢出问题，生产太快，消费太慢。如何实现溢出限制？生产者如何拿到消费反馈？

接下来我们来看代码，我们先写一个最简单版本的消费者和生产者模式，代码如下所示：

#include 
#include 
#include 
#include 
#include 
#include 

using namespace std;

queue<string> qjobs_;

void video_capture(){

    int img_id = 0;
    while(true){
        
        char name[100];
        sprintf(name, "PIC-%d", img_id++);
        printf("生产了一个新图片: %s\n", name);
        qjobs_.push(name);
        this_thread::sleep_for(chrono::milliseconds(1000));
    }
}

void infer_worker(){
    
    while(true){
        
        if(!qjobs_.empty()){
            auto img = qjobs_.front();
            qjobs_.pop();
            
            printf("消费掉一个图片: %s\n", img.c_str());
            this_thread::sleep_for(chrono::milliseconds(1000));
        }
        this_thread::yield();
    }
}

int main(){
    
    thread t0(video_capture);
    thread t1(infer_worker);

    t0.join();
    t1.join();
    return 0;
}

这段代码展示了一个简单的生产者-消费者模式的示例，模拟了模型推理过程中的数据生产和消费过程。下面是对代码的详细分析：

1. queue qjobs_;：定义了一个队列，用于存储生产者生成的图片任务。

2. void video_capture()：这是生产者线程函数，模拟图片的采集过程。在一个无限循环中，不断生成新的图片名，并将图片名压入队列 qjobs_ 中，表示生成了一个新的图片任务。每个图片任务之间通过 this_thread::sleep_for 函数模拟间隔一秒的采集时间。

3. void infer_worker()：这是消费者线程函数，模拟模型的推理过程。在一个无限循环中，不断检查队列 qjobs_ 是否为空，如果不为空，则从队列中取出一个图片任务，表示消费了一个图片。每个图片任务之间通过 this_thread::sleep_for 函数模拟模型推理的耗时过程，这里设置为一秒。

4. int main()：在 main 函数中，通过创建两个线程 t0 和 t1 分别启动生产者线程video_capture和消费者线程infer_worker。

t0.join();和t1.join();：在main函数中，使用join函数等待两个线程的完成，这样保证了主线程等待生产者和消费者线程都完成后再退出。

上述代码模拟了生产者-消费者模式的应用场景，其中生产者线程负责不断生成新的图片任务，将其放入队列中，而消费者线程则负责从队列中获取图片任务并进行处理。通过这种方式，使得图片采集和模型推理过程可以并行进行，提高了系统的吞吐量和效率。

执行效果如下：

图1-1 简单的生产者消费者示例程序

可以看到确实是生产一个消费一个，这时候就引入了第一个问题：共享资源访问问题

由于 STL 中的 queue 对象不是线程安全，因此要对其资源访问加上，这是我们日常会遇到的问题，现在由于是 1s 一次，没有问题，但是当频次高时势必会崩溃，所以一定要加，修改后的代码如下：

#include 
#include 
#include 
#include 
#include 
#include 

using namespace std;

queue<string> qjobs_;
mutex lock_;

void video_capture(){

    int img_id = 0;
    while(true){
        {
            lock_guard<mutex> l(lock_);
            char name[100];
            sprintf(name, "PIC-%d", img_id++);
            printf("生产了一个新图片: %s\n", name);
            qjobs_.push(name);
        }
        this_thread::sleep_for(chrono::milliseconds(1000));
    }
}

void infer_worker(){
    
    while(true){
        
        if(!qjobs_.empty()){
            {
                lock_guard<mutex> l(lock_);
                auto img = qjobs_.front();
                qjobs_.pop();
                
                printf("消费掉一个图片: %s\n", img.c_str());
            }
            this_thread::sleep_for(chrono::milliseconds(1000));
        }
        this_thread::yield();
    }
}

int main(){
    
    thread t0(video_capture);
    thread t1(infer_worker);

    t0.join();
    t1.join();

    return 0;
}

上述代码中使用的锁是 std::mutex，它是一个互斥锁。当一个线程获得这个锁时，其他所有线程都必须等待直到锁被释放。

lock_guard 是一个辅助对象，它在构造时自动锁定给定的互斥量，并在析构时自动解锁。这意味着，当控制流离开lock_guard 的作用域时，锁会被自动释放，无论是正常离开还是因为异常。

在代码中：

在 video_capture 函数中，您在向队列添加元素之前锁定了 lock_。这确保了在添加元素时，没有其他线程（如 infer_worker 线程）可以同时访问队列。
在 infer_worker 函数中，您首先检查队列是否为空，然后再次锁定 lock_ 以从队列中取出并处理元素。这确保了在消费队列中的元素时，video_capture 线程不会同时向队列中添加新元素。

这种加锁策略确保了队列的完整性和数据的一致性。

这个时候程序就是一个线程安全的操作了，这个时候就没有资源冲突问题了，

我们来看第二个问题：队列溢出问题，即生产太快，消费太慢

我们将生产时间修改为 0.5s，消费时间不变，修改后的代码如下：

#include 
#include 
#include 
#include 
#include 
#include 

using namespace std;

queue<string> qjobs_;
mutex lock_;

void video_capture(){

    int img_id = 0;
    while(true){
        {
            lock_guard<mutex> l(lock_);
            char name[100];
            sprintf(name, "PIC-%d", img_id++);
            printf("生产了一个新图片: %s, qjobs_.size = %d\n", name, qjobs_.size());
            qjobs_.push(name);
        }
        this_thread::sleep_for(chrono::milliseconds(500));
    }
}

void infer_worker(){
    
    while(true){
        
        if(!qjobs_.empty()){
            {
                lock_guard<mutex> l(lock_);
                auto img = qjobs_.front();
                qjobs_.pop();
                
                printf("消费掉一个图片: %s\n", img.c_str());
            }
            this_thread::sleep_for(chrono::milliseconds(1000));
        }
        this_thread::yield();
    }
}

int main(){
    
    thread t0(video_capture);
    thread t1(infer_worker);

    t0.join();
    t1.join();

    return 0;
}

执行效果如下：

图1-2 队列溢出问题

可以看到如果生产频率高于消费频率，则队列出现堆积现象，在目前场景，队列中是 string，所以堆积无所谓，但是在实际工作中队列中往往是一张图片，图片本身内存大，而程序需要长期运行，当显存/内存消耗殆尽时，程序会崩溃。

我们该如何实现溢出限制呢？其实就是设置一个上限，当队列中的数据达到一定上限时就不要再生产了，等着就行

我们要解决这个问题，需要引入一个新的知识点，即 condition_variable，

我们要实现的效果是如果队列满了，我不生产，我去等待队列有空间再生产，如下面的伪代码所示：

if(qjobs_.size() > limit)
    wait();

我们还要考虑一件事，就是 wait 等待没问题，但是当队列中可再生产时你得告诉我，也就是通知的问题，如何通知到 wait，让它即时的可以退出

想要达到上述效果，可以使用 condition_variable 很优雅的做到这个事情

代码如下：

#include 
#include 
#include 
#include 
#include 
#include 
#include 

using namespace std;

queue<string> qjobs_;
mutex lock_;
condition_variable cv_;
const int limit_ = 5;

void video_capture(){

    int img_id = 0;
    while(true){
        {
            unique_lock<mutex> l(lock_);
            char name[100];
            sprintf(name, "PIC-%d", img_id++);
            printf("生产了一个新图片: %s, qjobs_.size = %d\n", name, qjobs_.size());

            cv_.wait(l, [](){
                // return false，表示继续等待
                // return true，表示不等待，跳出wait
                return qjobs_.size() < limit_;
            });
            
            // 如果队列满了，我不生产，我去等待队列有空间再生产
            // 通知的问题，如何通知到 wait，让它即时的可以退出
            qjobs_.push(name);
        }
        this_thread::sleep_for(chrono::milliseconds(500));
    }
}

void infer_worker(){
    
    while(true){
        
        if(!qjobs_.empty()){
            {
                lock_guard<mutex> l(lock_);
                auto img = qjobs_.front();
                qjobs_.pop();
                
                // 消费掉一个，就可以通知 wait，去跳出等待
                cv_.notify_one();
                printf("消费掉一个图片: %s\n", img.c_str());
            }
            this_thread::sleep_for(chrono::milliseconds(1000));
        }
        this_thread::yield();
    }
}

int main(){
    
    thread t0(video_capture);
    thread t1(infer_worker);

    t0.join();
    t1.join();

    return 0;
}

在我们的代码使用了条件变量（std::condition_variable）来同步生产者和消费者，以确保队列的大小不超过给定的限制。当生产者试图添加到队列时，如果队列已满，它会等待直到消费者从队列中取出一张图片。

首先我们声明了一个条件变量 cv_ 和一个常量 limit_，表示队列的最大大小

然后在生产者线程中，使用了 cv_.wait() 方法。这个方法会阻塞当前线程直到满足给定的条件。

cv_.wait() 接受两个参数：

l 是一个 unique_lock，它用于保护条件变量和相关资源（在这种情况下是队列 qjobs_）。
Lambda 函数作为条件，当此函数返回 true 时，wait() 会返回并允许线程继续执行。如果条件不满足（返回 false），wait() 会自动释放锁并阻塞当前线程，直到条件变量被通知。

在代码中，条件检查队列的大小是否小于 limit_。如果队列已满（qjobs_.size() >= limit），生产者线程会被阻塞直到队列中有空间。

最后在消费者线程中，每次从队列中取出一张图片后，都会调用 cv_.notify_one()。这会唤醒一个（如果有的话）等待在条件变量上的线程。在这种情况下，它会唤醒生产者线程，如果生产者线程因为队列已满而被阻塞的话。

执行效果如下：

图1-3 condition_variable实现溢出限制

可以看到当队列中的数据等于 5 时，消费者和生产者达到了同频，达到了我们的预期

需要注意的是，wait 的流程是，一旦进入 wait 则解锁，一旦退出 wait 则加锁

这个问题解决了之后，我们来看下个问题：生产者如何拿到消费者的反馈

什么意思呢？就是说我消费者在拿到图片时是对图片做了处理的，比如说进行了模型推理，那拿到的推理结果我该如何送到生产者线程中呢？

那你可能会想，为什么要把它送回到生产者中去呢？送回去的意义是什么？

因为这符合我们实际的开发，正常来说 video_capture 把图片给消费者线程进行推理，我们希望拿到推理的结果，然后跟推理之前的图像一起进行画框，然后走下面的流程

那你可以又有疑问？为什么需要先把图片给消费者线程推理，然后把结果送回来去画框，这不多此一举吗？为什么不直接把模型推理一起放在生产者线程呢？

因为通常来说我们有多个模型，infer_worker 有多个，比如目标检测、目标分割、人脸检测、人脸识别等等，所以你会发现你有多个消费者，意味着你有多个队列，但是你又希望程序性能尽可能的好，如果你全部放在 video_capture 一个个去做的话，你会发现这个模式是串行的，性能很差，是同步模式。而如果你按照前面的做法则是异步模式，如下所示：

// 同步模式
// detection -> infer
// face -> infer
// feature -> infer

// 异步模式
// detection -> push
// face -> push
// feature -> push

同步模式下你要一个个模型推理，而异步模式下你只需要将图片一个个 push 就行，异步模式的优点在于你可以一次进行 3 个结果的回收，然后进行处理。同步模式还有个缺点，就是它对一个线程的负担很大，使得这个线程很"重"，当需要调用你这个线程/算法时，由于你这个线程太"重"了，会使得它的性能比较差，使得每个操作都非常"重"，因为你的线程上下文是需要初始化的，线程里面有很多内容是需要分配资源的。

因此如果说我调用的逻辑和推理的逻辑不在一个线程里面，就会使得我的调用非常的轻便，性能非常的好，接口也更简单，因此我们比较推荐第二种模式，即异步模式，也是我们后面高性能的保证，它是一个基础

废话少说，我们来看怎么把我们的结果从消费者线程返回到生产者线程，这个时候我们就引入下一个概念，即 future、promise

代码如下：

#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 

using namespace std;

struct Job{
    shared_ptr<promise<string>> pro;
    string input;
};

queue<Job> qjobs_;
mutex lock_;
condition_variable cv_;
const int limit_ = 5;

void video_capture(){

    int img_id = 0;
    while(true){
        Job job;
        {
            unique_lock<mutex> l(lock_);
            char name[100];
            sprintf(name, "PIC-%d", img_id++);
            printf("生产了一个新图片: %s\n", name);

            cv_.wait(l, [](){
                // return false，表示继续等待
                // return true，表示不等待，跳出wait
                return qjobs_.size() < limit_;
            });
            
            // 如果队列满了，我不生产，我去等待队列有空间再生产
            // 通知的问题，如何通知到 wait，让它即时的可以退出
            job.pro.reset(new promise<string>());
            job.input = name;
            qjobs_.push(job);

            // 等待这个 job 处理完毕，拿结果
            // job.pro->get_future() 返回的其实是 future 对象
            // .get 过后，实现等待，直到 promise->set_value 被执行了，这里的返回值就是 result
            // 拿到推理结果，跟推理之前的图像一起进行画框，然后走下面的流程
        }
        auto result = job.pro->get_future().get();
        printf("Job %s -> %s\n", job.input.c_str(), result.c_str());

        this_thread::sleep_for(chrono::milliseconds(500));
    }
}

void infer_worker(){
    
    while(true){
        
        if(!qjobs_.empty()){
            {
                lock_guard<mutex> l(lock_);
                auto pjob = qjobs_.front();
                qjobs_.pop();
                
                // 消费掉一个，就可以通知 wait，去跳出等待
                cv_.notify_one();
                printf("消费掉一个图片: %s\n", pjob.input.c_str());

                auto result = pjob.input + " --- infer";

                // new_pic 送回到生产者，怎么办
                pjob.pro->set_value(result);
            }
            this_thread::sleep_for(chrono::milliseconds(1000));
        }
        this_thread::yield();
    }
}

int main(){
    
    thread t0(video_capture);
    thread t1(infer_worker);

    t0.join();
    t1.join();

    return 0;
}

在上述代码中我们使用了 std::promise 和 std::future 来实现线程之间传递数据，并同步它们的执行。

首先我们定义了一个结构体 Job

struct Job{
    shared_ptr<promise<string>> pro;
    string input;
}

每个 Job 都包含一个指向 promise 的 shared_ptr 智能指针和一个输入，这个输入模拟的是要处理的图片，而 promise 将被用来在消费者线程中设置结果，并在生产者线程中获取这个结果

然后我们在生产者线程中，为每个新的 Job 创建了一个新的 promise 对象。然后，将这个 Job 添加到队列中，等待消费者线程处理它。

job.pro.reset(new promise<string>());
...
auto result = job.pro->get_future().get();
printf("Job %s -> %s\n", job.input.c_str(), result.c_str());

当消费者线程处理完一个 Job 并设置了结果后，生产者线程使用 job.pro->get_future().get() 来等待这个结果。这会阻塞生产者线程，直到消费者线程设置了 promise 的值。

在消费者线程中，处理了一个 Job 后，它创建一个结果字符串，模拟模型推理的结果，并使用 pjob.pro->set_value(result); 设置 promise 的值。这会立即解锁在生产者线程中等待这个 promise 的任何 future，并允许它继续执行。

这种方式在线程间传递数据非常有效，因为它允许生产者线程异步地等待消费者线程处理的结果，而不必使用复杂的同步机制。而且，由于 promise 和 future 之间的紧密关系，这种方法也是线程安全的。

运行效果如下：

图1-4 promise和future实现线程数据共享

可以看到符合我们的预期，我们成功的在生产者线程中拿到了消费者推理的结果

OK！生产者消费者模式我们就讲到这里。我们要合理的使用 future、promise、condition_variable，在实际的多线程任务中传递各种数据，去做各种封装，使得我们的性能足够友好，后面我们的封装课程中会大量使用 future、promise、condition_variable 这些东西

2. 问答环节

博主对多线程相关的知识不怎么了解，因此疯狂询问 chatGPT，故此做个记录方便下次查看，以下内容来自于博主和 chatGPT 之间的对话

问题1：我有一个疑问，在最开始的消费者生产者示例代码中，主程序在 main 函数中是自上而下执行的，因此代码先会去执行 t0.join() 再去执行 t1.join()，按理来说 t0.join() 会等待 t0 线程，而 t0 线程是一个生产者线程，会一直循环生产图片，并没有结束或者退出，那么为什么程序会执行到 t1.join() 呢？这个 join() 等待线程执行到底是等待线程执行结束还是说有别的含义呢？

回答：您的代码中确实创建了两个线程：t0 和 t1，分别对应于 video_capture 和 infer_worker 函数。当您在 main 函数中调用 thread t0(video_capture); 和 thread t1(infer_worker);，这两个线程会立即开始运行。它们会并行执行，与主线程无关。

当主线程执行到 t0.join();，它会等待 t0 线程（即 video_capture 函数）完成。但这并不意味着 t1 线程（即 infer_worker 函数）不会运行。实际上，t1 会在后台并行执行，即使主线程被 t0.join(); 阻塞。

这意味着 video_capture 会定期生成图像，并将其放入队列中，而 infer_worker 会检查队列并处理图像。因为这两个线程是并行的，所以您会看到交替的"生产"和"消费"消息。

总之，尽管 t0.join(); 会阻塞主线程，但它不会阻止其他线程（如 t1）的执行。因此，video_capture 和 infer_worker 会并行运行，直到它们自己结束或程序被外部中断。

问题2：我还是有疑问，正常来说创建线程并不意味着启动线程吧，只有 join 才表示启动了线程，而按照你的说法 t0.join() 会阻塞主线程，它难道不会导致主线程即 main 程序无法向下运行吗？也就是 t1.join() 无法执行，即 t1 线程无法开启

回答：很抱歉，我明白您的疑虑，但这里有些误解。

在 C++ 的 std::thread 中，线程在其对象创建时就开始执行。当您创建一个 std::thread 对象并传入一个函数，该函数在新的线程上立即开始执行。这与某些其他线程库的行为可能不同，但这确实是 C++ 标准库的行为。

在您的代码中，当执行以下代码时：
thread t0(video_capture);
thread t1(infer_worker);
两个线程 t0 和 t1 就已经开始并行执行了。主线程继续执行，而不必等待这两个线程。

关于 join()，这个方法并不是用来启动线程的。它的作用是等待关联的线程完成执行。当您调用一个线程对象的 join() 方法时，当前线程（在这个例子中是主线程）会被阻塞，直到被 join() 的线程完成执行。

所以，在您的代码中：
t0.join();
t1.join();
当执行 t0.join(); 时，主线程会等待 t0 完成。但是，由于 video_capture 函数有一个无限循环，t0 实际上永远不会完成，所以主线程在这里被永久阻塞。但这并不影响 t0 和 t1 的执行，它们会继续并行执行。

为了更清晰地说明，您可以将 join() 方法视为一个同步点，它确保主线程等待其他线程完成执行，但它不启动或停止线程。线程的启动是在其对象创建时自动完成的。

问题3：为什么 STL 中的 queue 对象不是线程安全的呢？

回答：大部分 STL 容器，包括 std::queue，都不是线程安全的。线程安全意味着多个线程可以同时访问一个对象而不需要外部同步。但在实际设计中，为了保持容器的高效性和灵活性，STL 容器通常不提供内置的线程安全机制。

如果两个或多个线程试图同时修改 std::queue（或其他 STL 容器），可能会出现未定义的行为。这意味着你可能会遇到如数据损坏、程序崩溃或其他不可预测的错误等问题。

问题4：lock_guard 是什么呢？它的功能是什么？

回答：lock_guard 是一个 RAII (Resource Acquisition Is Initialization) 工具，它的设计目的是确保资源（在这种情况下是锁）在其生命周期内被适当地管理。当 lock_guard 对象被构造时，它会尝试获取传递给它的锁。当 lock_guard 对象超出其作用域或被销毁时，它会自动释放锁。

在代码中：
{
   lock_guard<mutex> l(lock_);
   char name[100];
   sprintf(name, "PIC-%d", img_id++);
   printf("生产了一个新图片: %s\n", name);
   qjobs_.push(name);
}
当控制流进入花括号 { 时，lock_guard 对象 l 被构造，并尝试获取 lock_ 锁。整个花括号内的代码都在锁的保护之下运行。当控制流离开花括号 } 时，lock_guard 对象 l 被销毁，导致 lock_ 锁被释放。

这种方法的优势是，即使在受保护的代码块中发生异常，lock_guard 的析构函数也会确保锁被正确释放，从而避免了潜在的死锁。

问题5：在利用条件变量解决队列溢出问题时，我们为什么在生产者线程中不再使用 lock_guard 而是使用 unique_lock？二者有什么区别吗？

回答：是的，当与 std::condition_variable 一起使用时，通常选择 std::unique_lock 而不是 std::lock_guard。这两者都可以用来管理互斥锁，但它们在功能上有所不同，尤其是在与条件变量一起使用时。

以下是它们之间的主要区别：

1. 锁的灵活性：

std::lock_guard：当 lock_guard 对象被创建时，它会自动锁定关联的互斥量。一旦锁定，不能再解锁，除非 lock_guard 对象被销毁。

std::unique_lock：提供了更加灵活的锁管理。您可以明确地锁定和解锁关联的互斥量。这对于条件变量特别有用，因为 cv.wait() 在等待时需要临时解锁互斥量。

2. 与 std::condition_variable 的交互：

std::lock_guard 不能与 std::condition_variable 一起使用，因为 std::condition_variable::wait() 需要能够临时解锁其关联的互斥量，而 lock_guard 不支持这个操作。

std::unique_lock 可以与 std::condition_variable 一起使用，因为它支持锁的解锁和重新锁定。当调用 cv.wait() 时，互斥量会被临时解锁，并在返回之前重新锁定。

3. 性能开销：

std::lock_guard 通常比 std::unique_lock 轻量，因为它只提供了基本的锁管理功能。

std::unique_lock 更为灵活，但可能带来额外的性能开销（尽管在实际应用中这种开销通常可以忽略不计）。

总之，当您需要基本的锁管理并且不需要与 std::condition_variable 交互时，std::lock_guard 是一个简单而高效的选择。但当您需要更多的灵活性，特别是与条件变量一起使用时，std::unique_lock 是更合适的选择。

问题6：在利用 future 和 promise 解决线程间数据传递问题的代码中，我有注意到 promise 包装了一层 shared_ptr，这么做的优点在哪？为什么要多套一层，直接使用 promise 难道不行吗？

回答：使用 shared_ptr 包装 promise 有几个可能的原因。虽然在代码示例中这种用法可能不是绝对必要的，但在某些场景下，使用 shared_ptr 对于管理对象的生命周期是有益的。以下是其中的一些理由：

1. 对象生命周期管理：使用 shared_ptr 可以确保 promise 的生命周期跨越多个作用域或函数调用，特别是在对象可能在多个地方被引用的情况下。当所有对应的 shared_ptr 都超出范围或被销毁时，promise 也会自动被销毁。

2. 线程安全的引用计数：shared_ptr 是线程安全的（至少在引用计数的更新上）。这意味着多个线程可以同时创建或销毁指向同一个对象的 shared_ptr 实例，而不会出现数据竞争。

3. 避免对象复制：std::promise 本身是不可复制的，但可以移动。如果您想在多个地方持有对同一个 promise 的引用，使用 shared_ptr 是有道理的，因为这样可以避免对象的移动操作，并确保多个地方都引用同一个 promise。

4. 与其他数据结构一起使用：一些数据结构，如标准库中的容器，需要其元素是可复制或可移动的。如果您打算将 promise 存储在这样的容器中，而又想避免移动操作，那么使用 shared_ptr 是有意义的。

在示例代码中，使用 shared_ptr 主要是为了便于管理和传递 promise，尤其是在多线程环境下。然而，如果您可以保证 promise 的生命周期，并确保只在一个地方使用它，那么直接使用 promise 也是可以的。

问题7：我不太能理解第四点，能详细解释下吗？

回答：当然可以。让我们更深入地探讨第四点。

在 C++ 的 STL 容器中，许多操作可能会导致容器内元素的复制或移动。例如，当你向一个 std::vector 添加元素，超出其当前的容量时，它可能需要重新分配内存并移动其当前元素到新的内存位置。

考虑以下例子：
std::vector<std::promise<int>> promises;
如果我们尝试将 std::promise 对象添加到此向量，可能会遇到问题。因为 std::promise 是不可复制的，当容器需要重新调整其大小或在其他情况下移动其元素时，我们不能简单地复制 promise。

那么，我们可以移动 promise 到容器中吗？尽管 std::promise 是可移动的，但这意味着原始的 promise 对象将不再是有效的，任何对其的进一步操作都是未定义的。如果我们的代码逻辑需要在添加到容器后继续使用原始的 promise 对象，这就会成为一个问题。

使用 shared_ptr 可以解决这个问题。当你有一个 shared_ptr>，你实际上是复制指针而不是它指向的对象。因此，无论容器如何复制或移动这些指针，指向的实际 promise 对象都保持不变，并且可以在容器外部安全地访问。
std::vector<std::shared_ptr<std::promise<int>>> promises;
上面的容器包含指向 promise 的智能指针，而不是实际的 promise 对象。这意味着我们可以在容器重新分配或移动其内容时复制这些指针，而不用担心移动或使原始 promise 对象无效。

总之，第四点的核心思想是：使用 shared_ptr 可以避免直接在容器中复制或移动不可复制的对象（如 std::promise），而是复制指向这些对象的指针，这样可以确保对象的稳定性和持续可用性。

总结

本次课程我们学习了生产者和消费者模式，这在我们模型推理过程中非常常见，生产者线程负责读取图片，拿到推理结果进行画框可视化，消费者线程负责模型推理，将结果返回到生产者线程。我们在学习生产者和消费者模式过程中，解决了三个问题：

首先是共享资源访问问题，由于生产者和消费者线程要去队列中 push 和 pop 图片，而队列 queue 对象又不是线程安全的，因此我们要加上，在这里我们使用的是互斥锁 mutex，同时我们使用了 lock_guard 这个 RAII 工具确保了互斥量在进入作用域的时候加锁，离开作用域的时候解锁，防止程序忘记解锁而造成死锁的情况

其次是队列溢出问题，我们常常会遇到生产者太快，消费太慢的问题，我们创建了一个队列限制，限定队列最多可填充的图片数量，超过这个数量则等待消费者线程消费，而这里又涉及到生产者线程等待以及消费者线程通知的问题，我们是通过 condition_variable 来完成的，值得注意的是，在生产者线程中我们不再使用 lock_guard 而是要使用 unique_lock，因为我们在条件变量等待期间需要临时解锁，unique_lock 可以做到这件事而 lock_guard 对象一旦上锁除非离开作用域否则无法解锁。

最后是生产者如何拿到消费者的反馈问题，我们在考虑高性能的时候常常是异步模式，即生产者线程生成图片、画框，消费者线程推理出结果，这个时候生产者线程是需要拿到消费者线程的推理结果去画框的，我们采用 future 和 promise 来实现线程间数据共享的，在消费者线程通过 promise.set_value() 去设置值，在生成者线程中通过 future 对象的 get 方法去等待消费者线程的结果，值得注意的是，为了便于管理和传递，我们使用 shared_ptr 智能指针套了一层

你可能感兴趣的:(模型部署,tensorRT,CUDA,高性能)

LLM大模型部署实战指南：部署简化流程汀、人工智能 AI Agent LLM工业级落地实践人工智能
LLM大模型部署实战指南：Ollama简化流程，OpenLLM灵活部署，LocalAI本地优化，Dify赋能应用开发1.Ollama部署的本地模型()Ollama是一个开源框架，专为在本地机器上便捷部署和运行大型语言模型（LLM）而设计。，这是Ollama的官网地址：https://ollama.com/以下是其主要特点和功能概述：简化部署：Ollama目标在于简化在Docker容器中部署大型语言
3DGS.cpp：高性能跨平台高斯泼溅实现张涓曦Sea
3DGS.cpp：高性能跨平台高斯泼溅实现3DGS.cppAcross-platform,highperformancerendererforGaussianSplattingusingVulkanCompute.Supports✅Windows,Linux,macOS,iOS,andvisionOS项目地址:https://gitcode.com/gh_mirrors/3d/3DGS.cpp项目
YOLOv11目标检测模型部署到微信小程序上小阿技术 YOLO 目标跟踪人工智能微信小程序目标检测计算机视觉 python
1.效果YOLOv11目标检测模型部署到微信小程序上2.后端主要代码importosimporttimeimportnumpyasnpimporttorchfromflaskimportFlask,request,send_fileimportcv2fromultralyticsimportYOLO#导入YOLOv11模型，需要提前安装ultralytics库#初始化Flask应用app=Flas
探秘ARMv7-M架构：打造高效嵌入式系统指南嵇影钰
探秘ARMv7-M架构：打造高效嵌入式系统指南【下载地址】ARMv7-M架构参考手册及应用指南分享本资源包包含：-**ARMv7-MArchitectureReferenceManual**：这是ARM官方发布的权威文档，全面深入地介绍了ARMv7-M架构的核心概念、指令集、内存模型和编程模型等，是开发高性能、低功耗嵌入式系统的理论基础。-**ARMv7-MApplicationLevelRefe
ARM架构参考手册（ARMv7-A和ARMv7-R版）童伶影Bertha
ARM架构参考手册（ARMv7-A和ARMv7-R版）【下载地址】ARM架构参考手册ARMv7-A和ARMv7-R版分享ARMv7-A和ARMv7-R架构是ARM处理器家族中的关键成员，广泛应用于智能手机、嵌入式系统、汽车电子和实时操作系统等领域的高性能计算设备中。A系列面向应用程序处理器，支持丰富的操作系统如Android和Linux；而R系列则专为实时系统设计，保证了高可靠性和响应速度项目地址
ARMv7-M架构参考手册及应用指南董鉴勃
ARMv7-M架构参考手册及应用指南【下载地址】ARMv7-M架构参考手册及应用指南分享本资源包包含：-**ARMv7-MArchitectureReferenceManual**：这是ARM官方发布的权威文档，全面深入地介绍了ARMv7-M架构的核心概念、指令集、内存模型和编程模型等，是开发高性能、低功耗嵌入式系统的理论基础。-**ARMv7-MApplicationLevelReference
美团大规模 KV 存储挑战与架构实践思维导图-java架构用心去追梦架构 java 开发语言
美团作为一家大型互联网公司，其业务系统面临着处理海量数据和高并发访问的需求。特别是对于KV（键值）存储系统来说，它需要支持快速读写、高效的数据检索以及良好的可扩展性。以下是一个关于美团大规模KV存储挑战与架构实践的思维导图结构，旨在展示如何应对这些挑战并实现高性能的KV存储系统。美团大规模KV存储挑战与架构实践│├───挑战│├───高并发读写││└───大量用户同时进行订单创建、查询等操作。│├
fps游戏服务器架构设计你一身傲骨怎能输游戏服务器运维
FPS（First-PersonShooter，第一人称射击游戏）服务器的架构设计需要考虑到游戏性能、实时性、可扩展性和安全性等多方面的需求。以下是一个基本的FPS游戏服务器架构设计：客户端-服务器模型：采用客户端-服务器模型，游戏客户端负责呈现游戏画面、获取用户输入、播放音效等，游戏服务器负责处理游戏逻辑、同步玩家状态、检测作弊等。客户端和服务器通过网络进行实时通信。高性能网络通信：FPS游戏对
DOTS Unity.Physics物理引擎碰撞事件处理 Unity_RAIN unity 游戏引擎
最近DOTS发布了正式的版本,同时基于DOTS的理念实现了一套高性能的物理引擎，今天我们给大家分享和介绍一下这个物理引擎的碰撞事件处理以及核心相关概念。Unity.Physics物理引擎的主要流程与PipelineUnity.Physics物理引擎做仿真迭代计算的时候主要通过以下步骤来执行:step1:从entity里面的ECS组件中获取我们当前的物体的状态数据;step2:做粗略的broadph
高并发交易场景下业务系统性能不足？体验构建高性能秒杀系统！完成任务可领取锦鲤抱枕！数据库阿里云
「技术解决方案-构建高性能秒杀系统」上线了！秒杀活动因其高流量和用户参与度，已成为电商平台的重要营销方式。本方案详细介绍如何利用阿里云产品构建高性能秒杀系统，通过ALB、ECS、Tair和PolarDB，实现高并发处理。ALB分发请求到多个ECS实例，确保计算资源充足；Tair加速数据访问，PolarDB提供高效存储，以实现高并发处理，确保系统稳定和快速响应，从而为用户提供流畅的抢购体验。完成在线
泛型入门与C#编程精进_第23讲一曲歌长安
本文还有配套的精品资源，点击获取简介：本教程详细介绍了C#语言中泛型的概念、优势和应用场景。泛型通过类型参数提供延迟指定数据类型的功能，从而增强代码复用性、确保类型安全并提高性能。教程涵盖泛型类、接口、方法、约束、委托、事件以及泛型的继承与多态性，并通过实例讲解如何在.NET4平台中有效运用泛型来优化开发过程。1.泛型的基本概念与重要性泛型是现代编程语言中不可或缺的特性，它在编译时期提供类型安全，
深度学习模型开发文档 Ares代码行者深度学习
深度学习模型开发文档1.简介2.深度学习模型开发流程3.数据准备3.1数据加载3.2数据可视化4.构建卷积神经网络(CNN)5.模型训练5.1定义损失函数和优化器5.2训练过程6.模型评估与优化6.1模型评估6.2超参数调优7.模型部署8.总结参考资料1.简介深度学习是人工智能的一个分支，利用多层神经网络从数据中提取特征并进行学习。它被广泛应用于图像识别、自然语言处理、语音识别等领域。本文将以构建
手把手教会你Disruptor的常用使用场景！(含详细代码示例) 后端
Disruptor常见使用场景与代码示例1.引言上期介绍到Disruptor是一个高性能的无锁并发队列，适用于需要极低延迟和高吞吐量的应用场景。它通过环形缓冲区（RingBuffer）和高效的事件处理机制，显著减少了CPU缓存失效和上下文切换的开销。今天介绍Disruptor的几个常见使用场景：事件处理、日志记录、消息传递、实时数据分析和并发任务调度，让你进一步加深对它的印象，下期将介绍Disru
高并发系统的艺术：如何在流量洪峰中游刃有余京东云开发者京东云
作者：京东物流赵勇萍前言我们常说的三高，高并发、高可用、高性能，这些技术是构建现代互联网应用程序所必需的。对于京东618备战来说，所有的中台系统服务，无疑都是围绕着三高来展开的。而对于京东庞大的客户群体，高并发的要求尤为重要。用户对在线服务的需求和期望不断提高，系统的并发处理能力成为衡量其性能和用户体验的关键指标之一。高并发系统不仅仅是大型互联网企业的专利，对于任何希望在市场中占据一席之地的公司来
Redis 7.0 新特性助力：小红书利用 I/O 多线程模型应对高并发挑战真想骂* redis 数据库缓存
在当今的互联网环境中，高并发问题一直是众多平台开发者和技术运维人员面临的重大挑战。特别是在像小红书这样的社交电商平台上，用户访问量巨大，数据交互频繁，如何在高并发场景下保持系统的稳定性和高效性，成为了一项至关重要的任务。Redis作为一款轻量级、高性能的键值对存储系统，凭借其独特的特性和不断优化的新版本，成为了小红书应对高并发挑战的得力助手。本文将深入探讨Redis7.0的新特性——I/O多线程模
Redis 秋枫博客 redis redis
redisRedis是什么是一个高性能的key-value形式的数据库常常被用于缓存Redis有什么优势内存数据库，速度快，也支持数据的持久化，可以将内存中的数据保存在磁盘中，重启的时候可以再次加载进行使用。Redis读的速度是110000次/s,写的速度是81000次/s，且是单台服务器的Redis不仅仅支持简单的key-value类型的数据，同时还提供list，set，zset，hash等数据
几个导致DeepFaceLab训练速度较慢的原因 AlphaFinance 多媒体AI技术人工智能 python 机器学习
可能有几个原因导致DeepFaceLab训练速度较慢：复杂度：DeepFaceLab的算法和模型较为复杂，需要处理大量数据和计算复杂的数学运算，这可能导致训练速度较慢。硬件配置：DeepFaceLab需要较高的计算机配置才能运行，包括较大的内存、高性能的GPU、快速的存储器等。如果你的计算机配置不够高，可能会导致训练速度较慢。数据量：DeepFaceLab需要大量的训练数据来训练模型，如果你的数据
Nginx 缓存机制与优化策略计算机毕设定制辅导-无忧学长 #Nginx nginx 缓存
一、引言在当今数字化时代，Web应用的性能和用户体验至关重要。Nginx作为一款广泛应用的高性能Web服务器和反向代理服务器，凭借其卓越的稳定性、高效的并发处理能力以及丰富的功能模块，在Web服务器领域占据着举足轻重的地位。根据W3Techs的统计数据，Nginx在全球Web服务器市场份额中名列前茅，被众多知名网站和企业广泛采用。在Web应用的运行过程中，服务器需要频繁地处理大量的请求。如果每次请
C++项目设计：构建高性能、线程安全的日志系统泡沫o0 C++项目设计：理论实践与创新 c++linux 开发语言 c语言设计模式
C++项目设计：构建高性能、线程安全的日志系统一、引言（Introduction）1.1日志系统的重要性（ImportanceofLoggingSystem）1.2日志系统的基本要求（BasicRequirementsofLoggingSystem）1.2.1高性能（HighPerformance）1.2.2线程安全（ThreadSafety）1.2.3易用性（EaseofUse）1.2.4可扩展
华为E9000刀箱（HWE9000V2）服务器硬件监控指标解读 MXsoft618 运维管理智能运维管理平台运维软件服务器运维
随着数据中心规模的不断扩大，服务器的稳定性和可靠性变得尤为重要。华为E9000刀箱（HWE9000V2）作为一款高性能的服务器设备，其硬件状态的实时监控对于保障业务的连续性和系统的稳定运行至关重要。监控易作为一款专业的IT基础设施监控软件，为华为E9000刀箱提供了全面的硬件监控解决方案。本文将基于监控易对华为E9000刀箱的监控指标进行解读，帮助运维团队更好地理解和应用这些监控功能。一、监控易简
从MySQL迁移到PostgreSQL的完整指南 m0_74825718 面试学习路线阿里巴巴 mysql postgresql 数据库
1.引言在现代数据库管理中，选择合适的数据库系统对业务的成功至关重要。随着企业数据量的增长和对性能要求的提高，许多公司开始考虑从MySQL迁移到PostgreSQL。这一迁移的主要原因包括以下几个方面：1.1性能和扩展性PostgreSQL以其高性能和优秀的扩展能力而闻名。它支持复杂的查询优化和并发控制，能够更高效地处理大规模数据。与MySQL相比，PostgreSQL在处理复杂查询和大数据集时表
半导体、芯片、人工智能、智能驾驶汽车的趋势不爱原创的Yoga 人工智能汽车
1.市场增长与需求汽车半导体市场：预计到2025年，中国汽车半导体市场仍将保持稳健增长态势，AI和能源将成为未来最重要的两大变革因素。2023年中国汽车电子芯片行业市场规模约为820.8亿元，预计2024年有望增至905.4亿元左右。随着新能源汽车和智能化的快速发展，一些新的半导体技术在中国汽车领域迅速应用，如集中式架构和高性能处理器需求正日益增加。AI芯片市场：随着AI技术的不断普及和应用场景的
语义缓存：提升 RAG 性能的关键策略大模型之路 RAG 缓存 RAG 检索增强生成 LLM 大模型
检索增强生成（Retrieval-AugmentedGeneration，简称RAG）（RAG综述：探索检索增强生成技术的多样性与代码实践）技术已经成为构建高性能AI模型的重要基石。RAG通过结合先进的语言模型与外部知识检索，能够生成既准确又富含上下文的响应。然而，尽管RAG功能强大，但它也伴随着一系列挑战，如高令牌消耗（tokenconsumption）、运营成本的增加以及响应时间的延长。这些问
Net6中使用Ocelot .NET构建微服务网关 XwyMysql .net 微服务架构 .NET
微服务架构已经成为现代应用程序开发中常见的架构模式之一。在一个典型的微服务架构中，应用程序被拆分成多个小型、独立的服务，每个服务负责处理特定的业务功能。然而，当应用程序的规模不断增大时，管理和调用这些微服务变得复杂。为了解决这个问题，我们可以引入一个微服务网关来统一管理和路由请求。Ocelot.NET是一个开源的.NET库，可以帮助我们构建高性能的微服务网关。它提供了丰富的功能，包括路由、负载均衡
小土堆学习笔记10（利用GPU训练于模型验证）干啥都是小小白 pytorch学习——小土堆学习笔记深度学习
1.利用GPU训练GPU可优化操作如下操作方法1方法2数据获取判断是否可以使用GPU，如果可以直接model.cuda()先设定device，用的时候直接model.to（“device”）损失函数1.1利用以前实战模型训练（经过完整测试最高到70%左右的正确率）实战模型如下：小土堆学习笔记5（sequential与小实战）-CSDN博客具体代码如下：classmymodel(Module):de
Flutter中的异步和多进程 flutter
Flutter是一个用于创建高性能、高保真度移动应用的框架，它使用Dart编程语言。在Flutter中，异步和多进程是两种不同的概念，用于解决不同的问题。异步(Asynchronous)异步编程是一种编程范式，允许代码在等待操作完成（如网络请求、文件I/O）时继续执行其他任务，而不是阻塞主线程。Dart是单线程执行的，但它提供了异步编程的方式，主要通过Future和StreamAPI，以及asyn
【STM32F1例程5】RT-THREAD实验不会计算机的g_c__b 嵌入式开发 stm32 嵌入式硬件单片机
解释说明这个概念还是想唠叨一下（个人总结，仅供参考）！！！RT-Thread是一个开源的、中英文双语的、面向嵌入式系统领域的实时操作系统（RTOS）。它具备以下特点：1.轻量级：RT-Thread的内核非常小，整个内核的代码量不足3K，可以运行在各种资源受限的嵌入式硬件上。2.可伸缩性：RT-Thread可以运行在从几百字节内存的8051到大型的ARM7以及更高性能的处理器上。3.实时性：作为一个
Mellanox ConnectX 系列网卡的双驱动架构：以太网与 InfiniBand 的协同设计 109702008 #linux系统编程网络网络人工智能 linux
在现代数据中心和高性能计算（HPC）环境中，网络硬件的性能和功能至关重要。MellanoxConnectX系列网卡以其卓越的性能和多功能性而闻名，支持从传统的以太网到高性能的InfiniBand网络协议。这种多功能性使得Mellanox网卡能够满足不同应用场景的需求，从常规的数据中心网络到需要低延迟和高带宽的HPC环境。为了实现这种多功能性，Mellanox采用了独特的双驱动架构，分别由drive
蓝易云 - 针对CPU的NGINX配置优化教程蓝易云 nginx 运维 linux mysql 服务器
当针对CPU的优化NGINX配置时，主要目标是最大限度地利用CPU资源，提高性能并减少资源浪费。以下是针对CPU的NGINX配置优化教程：1.启用NGINX的多核支持确保您的NGINX版本已启用多核支持。通常情况下，编译安装的NGINX版本会自动启用多核支持，但您可以通过以下命令来确认：nginx-V在输出中查找--with-threads参数是否存在，以及--with-http_stub_st
服务治理导论 daiwei-dave 服务治理 java 分布式数据库
一、服务治理背景1.高并发带来的问题1.io压力过大连接池只有这么多连接资源，短时间大量请求，资源很快会耗尽，那么其他连接请求就只有被阻塞等待了。2.cpu压力过大一个线程处理的内容运算量比较大，一直占用着CPU，如果短时间成百上千的请求同时占用CPU，那么CPU压力也好比较大。2.服务雪崩1.导致雪崩的常见原因1.大流量请求2.硬件故障3.缓存击穿3.高性能之道高性能程序就是高效的利用CPU、内
js动画html标签（持续更新中） 843977358 html js 动画 media opacity
1.jQuery 效果 - animate() 方法改变 "div" 元素的高度： $(".btn1").click(function(){ $("#box").animate({height:"300px
springMVC学习笔记 caoyong springMVC
1、搭建开发环境 a>、添加jar文件，在ioc所需jar包的基础上添加spring-web.jar,spring-webmvc.jar b>、在web.xml中配置前端控制器 <servlet> &nbs
POI中设置Excel单元格格式 107x poi style 列宽合并单元格自动换行
引用：http://apps.hi.baidu.com/share/detail/17249059 POI中可能会用到一些需要设置EXCEL单元格格式的操作小结：先获取工作薄对象: HSSFWorkbook wb = new HSSFWorkbook(); HSSFSheet sheet = wb.createSheet(); HSSFCellStyle setBorder = wb.
jquery 获取A href 触发js方法的this参数无效的情况一炮送你回车库 jquery
html如下： <td class=\"bord-r-n bord-l-n c-333\"> <a class=\"table-icon edit\" onclick=\"editTrValues(this);\">修改</a> </td>" j
md5 3213213333332132 MD5
import java.security.MessageDigest; import java.security.NoSuchAlgorithmException; public class MDFive { public static void main(String[] args) { String md5Str = "cq
完全卸载干净Oracle11g sophia天雪 orale数据库卸载干净清理注册表
完全卸载干净Oracle11g A、存在OUI卸载工具的情况下：第一步：停用所有Oracle相关的已启动的服务；第二步：找到OUI卸载工具：在“开始”菜单中找到“oracle_OraDb11g_home”文件夹中 &
apache 的access.log 日志文件太大如何解决 darkranger apache
CustomLog logs/access.log common 此写法导致日志数据一致自增变大。直接注释上面的语法 #CustomLog logs/access.log common 增加： CustomLog "|bin/rotatelogs.exe -l logs/access-%Y-%m-d.log
Hadoop单机模式环境搭建关键步骤 aijuans 分布式
Hadoop环境需要sshd服务一直开启，故，在服务器上需要按照ssh服务，以Ubuntu Linux为例，按照ssh服务如下： sudo apt-get install ssh sudo apt-get install rsync 编辑HADOOP_HOME/conf/hadoop-env.sh文件，将JAVA_HOME设置为Java
PL/SQL DEVELOPER 使用的一些技巧 atongyeye java sql
1 记住密码这是个有争议的功能，因为记住密码会给带来数据安全的问题。但假如是开发用的库，密码甚至可以和用户名相同，每次输入密码实在没什么意义，可以考虑让PLSQL Developer记住密码。位置：Tools菜单－－Preferences－－Oracle－－Logon HIstory－－Store with password 2 特殊Copy 在SQL Window
PHP：在对象上动态添加一个新的方法 bardo 方法动态添加闭包
有关在一个对象上动态添加方法，如果你来自Ruby语言或您熟悉这门语言，你已经知道它是什么...... Ruby提供给你一种方式来获得一个instancied对象，并给这个对象添加一个额外的方法。好！不说Ruby了，让我们来谈谈PHP PHP未提供一个“标准的方式”做这样的事情，这也是没有核心的一部分... 但无论如何，它并没有说我们不能做这样
ThreadLocal与线程安全 bijian1013 java java多线程 threadLocal
首先来看一下线程安全问题产生的两个前提条件： 1.数据共享，多个线程访问同样的数据。 2.共享数据是可变的，多个线程对访问的共享数据作出了修改。实例：定义一个共享数据： public static int a = 0;
Tomcat 架包冲突解决征客丶 tomcat Web
环境： Tomcat 7.0.6 win7 x64 错误表象：【我的冲突的架包是：catalina.jar 与 tomcat-catalina-7.0.61.jar 冲突，不知道其他架包冲突时是不是也报这个错误】严重: End event threw exception java.lang.NoSuchMethodException: org.apache.catalina.dep
【Scala三】分析Spark源代码总结的Scala语法一 bit1129 scala
Scala语法 1. classOf运算符 Scala中的classOf[T]是一个class对象，等价于Java的T.class,比如classOf[TextInputFormat]等价于TextInputFormat.class 2. 方法默认值 defaultMinPartitions就是一个默认值，类似C++的方法默认值
java 线程池管理机制 BlueSkator java线程池管理机制
编辑 Add Tools jdk线程池一、引言第一：降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。第二：提高响应速度。当任务到达时，任务可以不需要等到线程创建就能立即执行。第三：提高线程的可管理性。线程是稀缺资源，如果无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性，使用线程池可以进行统一的分配，调优和监控。
关于hql中使用本地sql函数的问题（问-答） BreakingBad HQL 存储函数
转自于：http://www.iteye.com/problems/23775 问：我在开发过程中，使用hql进行查询（mysql5）使用到了mysql自带的函数find_in_set()这个函数作为匹配字符串的来讲效率非常好，但是我直接把它写在hql语句里面（from ForumMemberInfo fm,ForumArea fa where find_in_set(fm.userId,f
读《研磨设计模式》-代码笔记-迭代器模式-Iterator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.Arrays; import java.util.List; /** * Iterator模式提供一种方法顺序访问一个聚合对象中各个元素，而又不暴露该对象内部表示 * * 个人觉得，为了不暴露该
常用SQL chenjunt3 oracle sql C++c C#
--NC建库 CREATE TABLESPACE NNC_DATA01 DATAFILE 'E:\oracle\product\10.2.0\oradata\orcl\nnc_data01.dbf' SIZE 500M AUTOEXTEND ON NEXT 50M EXTENT MANAGEMENT LOCAL UNIFORM SIZE 256K ; CREATE TABLESPA
数学是科学技术的语言 comsci 工作活动领域模型
从小学到大学都在学习数学，从小学开始了解数字的概念和背诵九九表到大学学习复变函数和离散数学，看起来好像掌握了这些数学知识，但是在工作中却很少真正用到这些知识，为什么？最近在研究一种开源软件-CARROT2的源代码的时候，又一次感觉到数学在计算机技术中的不可动摇的基础作用，CARROT2是一种用于自动语言分类（聚类）的工具性软件，用JAVA语言编写，它
Linux系统手动安装rzsz 软件包 daizj linux sz rz
1、下载软件 rzsz-3.34.tar.gz。登录linux，用命令 wget http://freeware.sgi.com/source/rzsz/rzsz-3.48.tar.gz下载。 2、解压 tar zxvf rzsz-3.34.tar.gz 3、安装 cd rzsz-3.34 ; make posix 。注意：这个软件安装与常规的GNU软件不
读源码之:ArrayBlockingQueue dieslrae java
ArrayBlockingQueue是concurrent包提供的一个线程安全的队列,由一个数组来保存队列元素.通过 takeIndex和 putIndex来分别记录出队列和入队列的下标,以保证在出队列时不进行元素移动. //在出队列或者入队列的时候对takeIndex或者putIndex进行累加,如果已经到了数组末尾就又从0开始,保证数
C语言学习九枚举的定义和应用 dcj3sjt126com c
枚举的定义 # include <stdio.h> enum WeekDay { MonDay, TuesDay, WednesDay, ThursDay, FriDay, SaturDay, SunDay }; int main(void) { //int day; //day定义成int类型不合适 enum WeekDay day = Wedne
Vagrant 三种网络配置详解 dcj3sjt126com vagrant
Forwarded port Private network Public network Vagrant 中一共有三种网络配置，下面我们将会详解三种网络配置各自优缺点。端口映射(Forwarded port)，顾名思义是指把宿主计算机的端口映射到虚拟机的某一个端口上，访问宿主计算机端口时，请求实际是被转发到虚拟机上指定端口的。Vagrantfile中设定语法为： c
16.性能优化-完结 frank1234 性能优化
性能调优是一个宏大的工程，需要从宏观架构(比如拆分，冗余，读写分离，集群，缓存等)，软件设计（比如多线程并行化，选择合适的数据结构），数据库设计层面（合理的表设计，汇总表，索引，分区，拆分，冗余等）以及微观（软件的配置，SQL语句的编写，操作系统配置等）根据软件的应用场景做综合的考虑和权衡，并经验实际测试验证才能达到最优。性能水很深，笔者经验尚浅，赶脚也就了解了点皮毛而已，我觉得
Word Search hcx2013 search
Given a 2D board and a word, find if the word exists in the grid. The word can be constructed from letters of sequentially adjacent cell, where "adjacent" cells are those horizontally or ve
Spring4新特性——Web开发的增强 jinnianshilongnian spring spring mvc spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装配置tengine并设置开机启动 liuxingguome centos
yum install gcc-c++ yum install pcre pcre-devel yum install zlib zlib-devel yum install openssl openssl-devel Ubuntu上可以这样安装 sudo aptitude install libdmalloc-dev libcurl4-opens
第14章工具函数（上） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Xelsius 2008 and SAP BW at a glance blueoxygen BO Xelsius
Xelsius提供了丰富多样的数据连接方式，其中为SAP BW专属提供的是BICS。那么Xelsius的各种连接的优缺点比较以及Xelsius是如何直接连接到BEx Query的呢？以下Wiki文章应该提供了全面的概览。 http://wiki.sdn.sap.com/wiki/display/BOBJ/Xcelsius+2008+and+SAP+NetWeaver+BW+Co
oracle表空间相关 tongsh6 oracle
在oracle数据库中，一个用户对应一个表空间，当表空间不足时，可以采用增加表空间的数据文件容量，也可以增加数据文件，方法有如下几种： 1.给表空间增加数据文件 ALTER TABLESPACE "表空间的名字" ADD DATAFILE '表空间的数据文件路径' SIZE 50M; &nb
.Net framework4.0安装失败 yangjuanjava .net windows
上午的.net framework 4.0，各种失败，查了好多答案，各种不靠谱，最后终于找到答案了和Windows Update有关系，给目录名重命名一下再次安装，即安装成功了！下载地址：http://www.microsoft.com/en-us/download/details.aspx?id=17113 方法： 1.运行cmd，输入net stop WuAuServ 2.点击开

7.3.tensorRT高级(2)-future、promise、condition_variable

目录

前言

1. 生产者消费者模式

2. 问答环节

总结

你可能感兴趣的:(模型部署,tensorRT,CUDA,高性能)