cbNotes

并行计算简介和多核CPU编程Demo

tag:多线程,并行计算,OpenMP,多核编程,工作线程池

( 2008.01.19 更新鉴于读者反映代码阅读困难，重新改写了文章和实现，使文章更易读 )

( 2007.09.04 更新把用事件控制的线程启动更新为临界区的实现 )

2006年是双核的普及年，双核处理器出货量开始超过单核处理器出货量；2006年的11月份Intel开始供货4核；AMD今年也将发布4核，并计划今年下半年发布8核；
按照Intel一个文档所说:"假定22纳米处理时帧上有一枚13毫米大小的处理器，其上有40亿个晶体管、48MB高速缓存，功耗为100W。利用如此数量的晶体管，我们可设计拥有12个较大内核、48个（多核）中型内核、或144个小型内核（许多个内核）的处理器。"
而且Intel已经开发完成了一款80核心处理器原型，速度达到每秒一万亿次浮点运算。

随着个人多核CPU的普及，充分利用多核CPU的性能优势摆在了众多开发人员的面前；
以前的CPU升级，很多时候软件性能都能够自动地获得相应提升，而面对多核CPU，免费的午餐没有了，开发人员必须手工的完成软件的并行化，以从爆炸性增长的CPU性能中获益；
(ps:我想，以后的CPU很可能会集成一些专门用途的核(很可能设计成比较通用的模式)，比如GPU的核、图象处理的核、向量运算的核、加解密编解码的核、FFT计算的核、物理计算的核、神经网络计算的核等等:D )

先来看一下单个CPU上的并行计算:
单CPU上常见的并行计算：多级流水线(提高CPU频率的利器)、超标量执行(多条流水线并同时发送多条指令)、乱序执行(指令重排)、单指令流多数据流SIMD、超长指令字处理器(依赖于编译器分析)等

并行计算简介
并行平台的通信模型: 共享数据(POSIX、windows线程、OpenMP)、消息交换(MPI、PVM)
并行算法模型: 数据并行模型、任务依赖图模型、工作池模型、管理者-工作者模型、消费者模型
对于并行计算一个任务可能涉及到的问题：任务分解、任务依赖关系、任务粒度分配、并发度、任务交互
并行算法性能的常见度量值：并行开销、加速比、效率(加速比/CPU数)、成本(并行运行时间*CPU数)

A:一个简单的计算Demo
演示中主要完成的工作在Sum0函数(工作本身没有什么意义，主要是消耗一些时间来代表需要做的工作:),然后分别用OpenMP工具(vc和icc编译器支持)和一个自己手工写的线程工具来并行化该函数，来看看多核优化后的效果；我测试用的编译器是vc2005;CPU是双核的AMD64x2 4200+(2.37G)；内存2G双通道DDR2 677MHz；

原始代码如下:

#include <stdio.h>
#include <stdlib.h>
#include <time.h>
#include <math.h>

//一个简单的耗时任务
double Sum0(double* data,long data_count);

int main()
{
    long data_count=200000 ;
    double* data=new double [data_count];
    long i;

    //初始化测试数据
    for (i=0;i<data_count;++ i)
        data[i]=(double)(rand()*(1.0/ RAND_MAX));

    const long test_count=200*2;//为了能够测量出代码执行的时间，让函数执行多次
    double sumresult=0 ;
    double runtime=(double )clock();
    for( i=0; i<test_count; ++ i )
    {
        sumresult+= Sum0(data,data_count);
    }
    runtime=((double)clock()-runtime)/ CLOCKS_PER_SEC;
    printf ("< Sum0 >  " );
    printf ("  最后结果     = %10.4f  " ,sumresult);
    printf ("  执行时间(秒) = %f  " ,runtime);

    delete [] data;
    return 0 ;
}

double Sum0(double* data,long data_count)
{
    double result=0 ;
    for (long i=0;i<data_count;++ i)
    {
        data[i]=(double )sin(cos(data[i]));
        result+= data[i];
    }
    return   result;
}

在我的电脑上运行输出如下:

< Sum0 >
最后结果 = 55590743.4039
执行时间(秒) = 6.156000

B:使用OpenMP来优化(并行化)Sum0函数

OpenMP是基于编译器命令的并行编程标准，使用的共享数据模型，现在可以用在C/C++、Fortan中；OpenMP命令提供了对并发、同步、数据读写的支持；

(需要在项目属性中打开多线程和OpenMP支持,并要在多核CPU上执行才可以看到多CPU并行的优势)
OpenMP的实现如下:

#include <stdio.h>
#include <stdlib.h>
#include <time.h>
#include <math.h>

//需要在项目属性中打开多线程和OpenMP支持
#include <omp.h>

//用OpenMP实现
double Sum_OpenMP(double* data,long data_count);

int main()
{
    long data_count=200000 ;
    double* data=new double [data_count];
    long i;

    //初始化测试数据
    for (i=0;i<data_count;++ i)
        data[i]=(double)(rand()*(1.0/ RAND_MAX));

    const long test_count=200*2;//为了能够测量出代码执行的时间，让函数执行多次
    double sumresult=0 ;
    double runtime=(double )clock();
    for( i=0; i<test_count; ++ i )
    {
        sumresult+= Sum_OpenMP(data,data_count);
    }
    runtime=((double)clock()-runtime)/ CLOCKS_PER_SEC;
    printf ("< Sum_OpenMP >  " );
    printf ("  最后结果     = %10.4f  " ,sumresult);
    printf ("  执行时间(秒) = %f  " ,runtime);

    delete [] data;
    return 0 ;
}

double Sum_OpenMP(double* data,long data_count)
{
    double result=0 ;
    #pragma omp parallel for schedule(static) reduction(+: result)
     for (long i=0;i<data_count;++ i)
    {
        data[i]=(double )sin(cos(data[i]));
        result+= data[i];
    }
    return   result;
}

Sum_OpenMP函数相对于Sum0函数只是增加了一句"#pragma omp parallel for schedule(static) reduction(+: result)" ; 它告诉编译器并行化下面的for循环，并将多个result变量值用+合并；(更多的OpenMP语法请参阅相关资料)；

程序运行输出如下:

< Sum_OpenMP >
最后结果 = 55590743.4039
执行时间(秒) = 3.078000

在我的双核电脑上，OpenMP优化的并行代码使程序速度提高了约100%！

C:利用多线程来并行化Sum0函数(使用了我的CWorkThreadPool多线程工具类,完整源代码在后面)

需要在项目属性中打开多线程支持；多线程并行实现如下:

#include <stdio.h>
#include <stdlib.h>
#include <time.h>
#include <math.h>
#include <vector>
#include "WorkThreadPool.h" //使用CWorkThreadPool类

double Sum_WorkThreadPool(double* data,long data_count);

int main()
{
    long data_count=200000 ;
    double* data=new double [data_count];
    long i;

    //初始化测试数据
    for (i=0;i<data_count;++ i)
        data[i]=(double)(rand()*(1.0/ RAND_MAX));

    const long test_count=200*2;//为了能够测量出代码执行的时间，让函数执行多次
    double sumresult=0 ;
    double runtime=(double )clock();
    for( i=0; i<test_count; ++ i )
    {
        sumresult+= Sum_WorkThreadPool(data,data_count);
    }
    runtime=((double)clock()-runtime)/ CLOCKS_PER_SEC;
    printf ("< Sum_WorkThreadPool >  " );
    printf ("  最后结果     = %10.4f  " ,sumresult);
    printf ("  执行时间(秒) = %f  " ,runtime);

    delete [] data;
    return 0 ;
}

double Sum0(double* data,long data_count)
{
    double result=0 ;
    for (long i=0;i<data_count;++ i)
    {
        data[i]=(double )sin(cos(data[i]));
        result+= data[i];
    }
    return   result;
}

struct TWorkData
{
    double* part_data;
    long     part_data_count;
    double   result;
};

void sum_callback(TWorkData* wd)
{
    wd->result=Sum0(wd->part_data,wd-> part_data_count);
}

double Sum_WorkThreadPool(double* data,long data_count)
{
    long work_count= CWorkThreadPool::best_work_count();
    std::vector<TWorkData>    work_list(work_count);
    std::vector<TWorkData*>   pwork_list(work_count);
    long i;

    //给线程分配任务
    long part_data_count=data_count/ work_count;
    for (i=0;i<work_count;++ i)
    {
        work_list[i].part_data=&data[part_data_count* i];
        work_list[i].part_data_count= part_data_count;
    }
    work_list[work_count-1].part_data_count=data_count-part_data_count*(work_count-1 );
    for (i=0;i<work_count;++ i)
        pwork_list[i]=& work_list[i];

    //利用多个线程执行任务  阻塞方式的调用
    CWorkThreadPool::work_execute((TThreadCallBack)sum_callback,(void**)&pwork_list[0 ],pwork_list.size());

    double result=0 ;
    for (i=0;i<work_count;++ i)
        result+= work_list[i].result;

    return result;
}

用多线程来把代码并行化从而利用多个CPU核的计算能力,这种方式具有比OpenMP更好的灵活性；但容易看出这种方式没有OpenMP的实现简便； Sum_WorkThreadPool函数更多的代码在处理将计算任务分解成多个独立任务，然后将这些任务交给CWorkThreadPool执行；程序执行输出如下:

< Sum_WorkThreadPool >
最后结果 = 55590743.4039
执行时间(秒) = 3.063000

在我的双核电脑上，多线程优化的并行代码使程序速度提高了约101%！

D: 附录: CWorkThreadPool类的完整源代码

(欢迎改进CWorkThreadPool类的代码，使它满足各种各样的并行需求)

//CWorkThreadPool的声明文件 WorkThreadPool.h

//WorkThreadPool.h
/////////////////////////////////////////////////////////////
// 工作线程池 CWorkThreadPool
// 用于把一个任务拆分成多个线程任务,从而可以使用多个CPU
//[email protected]
////////////////////////////
// todo:改成任务领取模式
// 要求：1.任务分割时分割的任务量比较接近
//       2.任务也不要太小，否则线程的开销可能会大于并行的收益
//      3.任务数最好是CPU数的倍数

#ifndef _WorkThreadPool_H_
#define _WorkThreadPool_H_

typedef void (*TThreadCallBack)(void * pData);

class CWorkThreadPool
{
public :
    static long best_work_count();  //返回最佳工作分割数,现在的实现为返回CPU个数
    static void work_execute(const TThreadCallBack work_proc,void** word_data_list,int work_count);  //并行执行工作，并等待所有工作完成
    static void work_execute_multi(const TThreadCallBack* work_proc_list,void** word_data_list,int work_count); //同上，但不同的work调用不同的函数
    static void work_execute_single_thread(const TThreadCallBack work_proc,void** word_data_list,int work_count)  //单线程执行工作，并等待所有工作完成;用于调试等
    {
        for (long i=0;i<work_count;++ i)
        work_proc(word_data_list[i]);
    }
    static void work_execute_single_thread_multi(const TThreadCallBack* work_proc_list,void** word_data_list,int work_count)  //单线程执行工作，并等待所有工作完成;用于调试等
    {
        for (long i=0;i<work_count;++ i)
        work_proc_list[i](word_data_list[i]);
    }
};

#endif //_WorkThreadPool_H_

//CWorkThreadPool的实现文件 WorkThreadPool.cpp

/////////////////////////////////////////////////////////////
//工作线程池 TWorkThreadPool

#include <process.h>
#include <vector>
#include "windows.h"
#include "WorkThreadPool.h"

// #define _IS_SetThreadAffinity_
//定义该标志则执行不同的线程绑定到不同的CPU，减少线程切换开销；不鼓励

class TCriticalSection
{
private :
    RTL_CRITICAL_SECTION m_data;
public :
    TCriticalSection()  { InitializeCriticalSection(& m_data); }
    ~TCriticalSection() { DeleteCriticalSection(& m_data); }
    inline void Enter() { EnterCriticalSection(& m_data); }
    inline void Leave() { LeaveCriticalSection(& m_data); }
};

class TWorkThreadPool;

//线程状态
enum TThreadState{ thrStartup=0 , thrReady,  thrBusy, thrTerminate, thrDeath };

class TWorkThread
{
public :
    volatile HANDLE             thread_handle;
    volatile enum TThreadState  state;
    volatile TThreadCallBack    func;
    volatile void *             pdata;  //work data
     TCriticalSection*   CriticalSection;
     TCriticalSection*   CriticalSection_back;
    TWorkThreadPool*             pool;
    volatile DWORD              thread_ThreadAffinityMask;

    TWorkThread() { memset(this,0,sizeof (TWorkThread));  }
};

void do_work_end(TWorkThread* thread_data);

void __cdecl thread_dowork(TWorkThread* thread_data) //void __stdcall thread_dowork(TWorkThread* thread_data)
{
    volatile TThreadState& state=thread_data-> state;
    #ifdef _IS_SetThreadAffinity_
        SetThreadAffinityMask(GetCurrentThread(),thread_data-> thread_ThreadAffinityMask);
    #endif
    state = thrStartup;

    while(true )
    {
        thread_data->CriticalSection-> Enter();
        thread_data->CriticalSection-> Leave();
        if(state == thrTerminate)
            break ;

        state = thrBusy;
        volatile TThreadCallBack& func=thread_data-> func;
        if (func!=0 )
            func((void *)thread_data-> pdata);
        do_work_end(thread_data);
    }
    state = thrDeath;
    _endthread();
    //ExitThread(0);
}

class TWorkThreadPool
{
private :
    std::vector<TCriticalSection*>   CriticalSections;
    std::vector<TCriticalSection*>   CriticalSections_back;
    std::vector<TWorkThread>        work_threads;
    mutable long                    cpu_count;
    inline long get_cpu_count() const {
        if (cpu_count>0) return cpu_count;

        SYSTEM_INFO SystemInfo;
        GetSystemInfo(& SystemInfo);
        cpu_count= SystemInfo.dwNumberOfProcessors;
        return cpu_count;
    }
    inline long passel_count() const { return (long)work_threads.size()+1 ; }
    void inti_threads()
    {
        long best_count = get_cpu_count();

        long newthrcount=best_count - 1 ;
        work_threads.resize(newthrcount);
        CriticalSections.resize(newthrcount);
        CriticalSections_back.resize(newthrcount);
        long i;
        for( i= 0; i < newthrcount; ++ i)
        {
            CriticalSections[i]=new TCriticalSection();
            CriticalSections_back[i]=new TCriticalSection();
            work_threads[i].CriticalSection= CriticalSections[i];
            work_threads[i].CriticalSection_back= CriticalSections_back[i];
            CriticalSections[i]-> Enter();
            CriticalSections_back[i]-> Enter();
            work_threads[i].state = thrTerminate;
            work_threads[i].pool=this ;
            work_threads[i].thread_ThreadAffinityMask=1<<(i+1 );
            work_threads[i].thread_handle =(HANDLE)_beginthread((void (__cdecl *)(void *))thread_dowork, 0, (void*)& work_threads[i]);
            // CreateThread(0, 0, (LPTHREAD_START_ROUTINE)thread_dowork,(void*) &work_threads[i], 0, &thr_id);
            //todo: _beginthread 的错误处理
        }
        #ifdef _IS_SetThreadAffinity_
            SetThreadAffinityMask(GetCurrentThread(),0x01 );
        #endif
         for(i = 0; i < newthrcount; ++ i)
        {
            while(true ) {
                if (work_threads[i].state == thrStartup) break ;
                else Sleep(0 );
            }
            work_threads[i].state = thrReady;
        }
    }
    void free_threads(void )
    {
        long thr_count=(long )work_threads.size();
        long i;
        for(i = 0; i <thr_count; ++ i)
        {
            while(true ) {
                if (work_threads[i].state == thrReady) break ;
                else Sleep(0 );
            }
            work_threads[i].state= thrTerminate;
        }
        for (i=0;i<thr_count;++ i)
        {
            CriticalSections[i]-> Leave();
            CriticalSections_back[i]-> Leave();
        }
        for(i = 0; i <thr_count; ++ i)
        {
            while(true ) {
                if (work_threads[i].state == thrDeath) break ;
                else Sleep(0 );
            }
        }
        work_threads.clear();
        for (i=0;i<thr_count;++ i)
        {
            delete CriticalSections[i];
            delete CriticalSections_back[i];
        }
        CriticalSections.clear();
        CriticalSections_back.clear();
    }
    void passel_work(const TThreadCallBack* work_proc,int work_proc_inc,void** word_data_list,int work_count)    {
        if (work_count==1 )
            (*work_proc)(word_data_list[0 ]);
        else
        {
             const TThreadCallBack* pthwork_proc= work_proc;
            pthwork_proc+= work_proc_inc;

            long i;
            long thr_count=(long )work_threads.size();
            for(i = 0; i < work_count-1; ++ i)
            {
                work_threads[i].func  = * pthwork_proc;
                work_threads[i].pdata  =word_data_list[i+1 ];
                work_threads[i].state = thrBusy;
                pthwork_proc+= work_proc_inc;
            }
            for(i =  work_count-1; i < thr_count; ++ i)
            {
                work_threads[i].func  = 0 ;
                work_threads[i].pdata  =0 ;
                work_threads[i].state = thrBusy;
            }
            for (i=0;i<thr_count;++ i)
                CriticalSections[i]-> Leave();

            //current thread do a work
            (*work_proc)(word_data_list[0 ]);

            //wait for work finish
            for(i = 0; i <thr_count; ++ i)
            {
                while(true ) {
                    if (work_threads[i].state == thrReady) break ;
                    else Sleep(0 );
                }
            }
            CriticalSections.swap(CriticalSections_back);
            for (i=0;i<thr_count;++ i)
                CriticalSections_back[i]-> Enter();
        }
    }
    void private_work_execute(TThreadCallBack* pwork_proc,int work_proc_inc,void** word_data_list,int work_count)    {
     while (work_count>0 )
        {
            long passel_work_count;
            if (work_count>= passel_count())
                passel_work_count= passel_count();
            else
                passel_work_count = work_count;

            passel_work(pwork_proc,work_proc_inc,word_data_list,passel_work_count);

            pwork_proc+=(work_proc_inc* passel_work_count);
            word_data_list=& word_data_list[passel_work_count];
            work_count-= passel_work_count;
        }
    }
public :
   explicit TWorkThreadPool():work_threads(),cpu_count(0 ) {   inti_threads();    }
    ~ TWorkThreadPool() {  free_threads(); }
    inline long best_work_count() const { return passel_count(); }
    inline void DoWorkEnd(TWorkThread* thread_data){
        thread_data->func=0 ;
        thread_data->state = thrReady;
        std::swap(thread_data->CriticalSection,thread_data-> CriticalSection_back);
    }

    inline void work_execute_multi(TThreadCallBack* pwork_proc,void** word_data_list,int work_count)    {
        private_work_execute(pwork_proc,1 ,word_data_list,work_count);
    }
    inline void work_execute(TThreadCallBack work_proc,void** word_data_list,int work_count)    {
        private_work_execute(&work_proc,0 ,word_data_list,work_count);
    }
};
void do_work_end(TWorkThread* thread_data)
{
    thread_data->pool-> DoWorkEnd(thread_data);
}

//TWorkThreadPool end;
////////////////////////////////////////

TWorkThreadPool g_work_thread_pool; //工作线程池

long CWorkThreadPool::best_work_count() {  return g_work_thread_pool.best_work_count();  }

void CWorkThreadPool::work_execute(const TThreadCallBack work_proc,void** word_data_list,int work_count)
{
    g_work_thread_pool.work_execute(work_proc,word_data_list,work_count);
}

void CWorkThreadPool::work_execute_multi(const TThreadCallBack* work_proc_list,void** word_data_list,int work_count)
{
    g_work_thread_pool.work_execute_multi((TThreadCallBack* )work_proc_list,word_data_list,work_count);
}

java八股之redis面试题 MinusZXX 八股文-redis java redis 开发语言面试
目录1、redis是单线程还是多线程2、Redis为什么那么快3、Redis底层数据是如何用跳表来存储的4、RedisKey过期了为什么内存没释放（附删除策略）5、Redis没设置key的过期时间，为什么被Redis主动删除了（淘汰策略）6、Redis主从、哨兵、集群架构优缺点比较7、Redis集群数据分片8、Redis主从切换导致缓存雪崩9、Redis持久化RDB、AOF和混合持久化AOF4.0
如何用AI轻松制作完美PPT，节省时间又提升效率 HUIPPT剑盾ai 人工智能 powerpoint 软件 aigc 科技
如何用AI轻松制作完美PPT，节省时间又提升效率！在这个快节奏的时代，做PPT成了大家工作和学习的必备技能。无论是准备一场重要的商务演讲，还是一份课题报告，PPT的质量往往决定了成败。然而，传统制作PPT的方式费时又费力，如何快速、高效地制作出吸引人的PPT呢？别担心，AI的出现为我们提供了全新的解决方案！AI制作PPT，让你摆脱繁琐的排版如今你只需提供一些基础的内容，剩下的工作交给AI。AI制作
全面解析条形码、二维码与RFID技术的区别及应用场景爱码字的小印条形码经验分享
在生活中，我们常见的条形码、二维码，甚至RFID技术，早已成了日常识别的小帮手。从超市结账到包裹追踪，再到门禁通行，它们无处不在。然而，看似都能识别信息，这三者的背后其实有着各自独特的工作原理和适用场景。到底条形码、二维码和RFID有什么不同？它们各自适用于哪些行业？今天，我们就来揭开这三种技术的奥秘，帮您找到最适合自己业务的识别方案！一、条形码技术：传统而稳定的识别方式条形码（Barcode）是
电子工程师转战汽车OEM主机厂之路上层精灵的赞美诗行业杂谈汽车单片机嵌入式硬件 eclipse mcu
文章目录1电子工程师2汽车系统工程师第一篇分享一个笔者2018年的一个心得文章，回头想想从事汽车行业也小8年了，从懵懂稚嫩到所谓的老油条，也是难忘的经历，希望我的经历对从事电子行业和汽车行业的小伙伴有所帮助。1电子工程师2013年电气工程及其自动化专业毕业，由于家里条件的原因，我不能选择继续读研深造，所以本科毕业必须出来工作，由于本科生的就业压力也是非常大的，所以当时想，在大学的时候要学习一些真正
基于百度翻译的python爬虫示例魂万劫 python 爬虫开发语言百度翻译
(今年java工作真难找啊，有广州java高级岗位招人的好心人麻烦推一下，拜谢。。）花了一周时间，从零基础开始学习了python，学有所获之后，就总想爬些什么，不然感觉不得劲，所以花了一天时间整出了个百度翻译的爬虫示例，主要卡点花在了找token、sign以及调试请求上。代码有点乱，毕竟是demo，但是功能是实现了的。importrequestsimportjs2pyimportrefromurl
Cookies 详解：工作原理、使用方法及安全性才华是浅浅的耐心 python java javascript
1.什么是Cookie？Cookie是存储在用户浏览器中的小型文本数据，通常用于保存用户会话信息、个性化设置以及跨页面的数据共享。它是Web服务器与客户端浏览器之间的一种状态管理机制，常用于爬虫的会话凭证。查看方式：打开网站-登录-打开开发正工具-点击网络-刷新-点击一个包-查看表头（有的需要禁用缓存才能看见）2.Cookie的作用会话管理：如用户登录状态的保持。个性化设置：存储用户偏好，如主题、
纳米尺度仿真软件：Quantum Espresso_（21）.并行计算与性能优化 kkchenjj 分子动力学2 性能优化模拟仿真分子动力学仿真模拟
并行计算与性能优化在纳米尺度仿真中，计算资源的需求往往非常庞大。为了提高计算效率和缩短计算时间，并行计算和性能优化成为不可或缺的技术手段。QuantumEspresso作为一个开源的量子力学仿真软件，提供了多种并行计算的机制和性能优化的方法。本节将详细介绍如何在QuantumEspresso中实现并行计算和性能优化，以提升仿真任务的效率。并行计算的基本概念并行计算是指同时使用多个计算资源（如多核处
高级java每日一道面试题-2025年3月03日-微服务篇[Eureka篇]-Eureka自我保护机制是什么? java我跟你拼了 java每日一道面试题 java 微服务 eureka SpringCloud SpringBoot 自我保护机制出发条件
如果有遗漏,评论区告诉我进行补充面试官:Eureka自我保护机制是什么?我回答:在Java高级面试中，Eureka的自我保护机制（Self-PreservationMode）是一个非常重要且常被提及的话题。理解这一机制的工作原理及其应用场景对于构建高可用性的微服务架构至关重要。以下是结合提供的内容对Eureka自我保护机制的详细解析和综合概述：自我保护机制的概念Eureka的自我保护机制是一种容错
如何轻松爬取 TikTok 评论？手把手教你高效采集数据！ pzhyy 大数据数据分析数据挖掘内容运营新媒体运营
引言随着TikTok的全球火爆，越来越多的数据分析师、营销人员和研究人员希望获取TikTok视频评论，以分析用户反馈、市场趋势或热门内容。然而，手动整理TikTok评论既耗时又低效，因此，使用一款高效的TikTok采集器成为刚需。Tapicker是一款功能强大的TikTok采集软件，可以帮助用户自动爬取TikTok评论，省去繁琐的手工整理工作。本文将详细介绍如何使用Tapicker爬取TikTok
DeepSeek 大模型落地成都高新区：科技赋能警务的创新变革 AGI大模型学习科技人工智能 DeepSeek 大模型 chatgpt 大模型应用 AI大模型
在科技飞速发展的当下，人工智能正以前所未有的速度融入各个领域，深刻改变着人们的生活与工作方式。公安领域也不例外，积极拥抱科技创新，成为提升警务效能、维护社会稳定的关键路径。全国第一例警用DeepSeek大模型落地成都高新区，这一突破性举措在警务智能化发展进程中具有里程碑意义，为公安工作带来了全方位的革新。一、警用DeepSeek大模型落地的时代背景近年来，国产AI蓬勃发展，不断涌现出令人瞩目的成果
如何实现一个apply函数？风茫 Javascript javascript apply
在JavaScript中，apply是一个非常有用的方法，它允许你调用一个函数，并显式地指定该函数内部的this值。与call方法不同，apply方法接受参数的方式是一个数组或类数组对象。我们将手动实现一个类似apply的函数，以深入理解其工作原理。实现步骤1.定义myApply方法首先，我们需要在Function.prototype上定义一个新的方法myApply，这样所有的函数都可以调用它。F
C++多线程 -- std::thread的基本用法 qzy0621 C++多线程 c++
依赖头文件：#include用法：std::thread和join或detach一起用std::threadt1(调用函数名称，调用函数参数1，调用函数参数2，。。。，调用函数参数n)t1.join();//表示同步（阻塞），调用线程走完，才能走后面的流程t1.detach();//表示异步，主线程只触发此线程，后面和此线程无关多线程传递参数#include#includevoidshow(con
深入浅出JVM(一)---两种环境杨洪波 Java jvm java class api 语言引擎
如果你想真正掌握JAVA技术,请首先记住它的四个组成部分:JAVA语言,class文件格式,JVM和JAVAAPI.如果你说你学过JAVA,那么,你已经知道了,JAVA有两个环境:编译环境和运行环境.好,我们分别讨论.1)编译环境编译环境是什么?如果你装了JDK,那么,你的D:/j2sdk1.4.2目录下的所有东西,就是你的JAVA编译环境.编译环境的工作流程如下:你利用JAVA语言规范,或利用J
FerretDB 2.0：开源 MongoDB 替代品的安装与使用指南田猿笔记 MongoDB 开源数据库 FerretDB
介绍FerretDB2.0是一个开源数据库，旨在作为MongoDB的替代品。它与MongoDB5.0+的驱动程序和工具兼容，适合需要避免MongoDB许可复杂性的开发者。它的核心特点是使用PostgreSQL作为后端，并通过DocumentDB扩展提升性能，研究表明某些工作负载可快20倍。安装与使用安装FerretDB2.0使用dockercompose需要以下步骤：创建docker-compos
【AI Agent教程】各种Agent开发框架都是如何实现ReAct思想的？深入源码学习一下同学小张大模型人工智能学习笔记经验分享 AIGC AI Agent ReAct
大家好，我是同学小张，持续学习C++进阶知识和AI大模型应用实战案例，持续分享，欢迎大家点赞+关注，共同学习和进步。驱动大模型有很多种方式，例如纯Prompt方式、思维链方式、ReAct方式等。ReAct方式是AIAgent最常用的实现思路之一，它强调在执行任务时结合推理（Reasoning）和行动（Acting）两个方面，使得Agent能够在复杂和动态的环境中更有效地工作。本文我们来看看常用的那
图片压缩及水印添加概述华为云微认证大嘴巴子华为网络技术华为华为云网络
一、图片压缩和水印添加概述（1）为更好地传输，存储和辨识数据；使用压缩降低图片大小，节约了成本；图片压缩：简单易用；；图片压缩软件：功能单一；网页在线图片压缩；自设图片压缩代码：需要变成基础；使用云服务批量压缩：适合批量处理，可结合自设代码；（2）水印：logo增加辨识，盖章表示版权；附加信息，可增加了地点等信息；二、函数工作流简介（1）是华为云提供的一款无服务器计算服务，它包含了函数和工作流两个
基于STC89C52的CD4511译码显示数字设计 @小张要努力单片机嵌入式硬件 51单片机 proteus mcu
摘要本文深入探讨基于STC89C52单片机的数字显示系统设计，剖析CD4511译码驱动芯片工作原理，结合Proteus仿真验证功能。通过硬件电路、软件编程及原理分析，完整呈现单片机控制数码管显示的实现过程，为相关开发提供理论与实践参考。一、引言在单片机应用中，数码管显示是基础模块。CD4511作为BCD码译码驱动芯片，可简化单片机与数码管接口设计。STC89C52凭借丰富资源与稳定性能，成为驱动C
【项目实战】—— 高并发内存池 Ryan.Alaskan Malamute 开发语言 c++高并发内存池缓存
文章目录什么是高并发内存池？项目介绍一、项目背景二、项目目标三、核心组件四、关键技术五、应用场景六、项目优势什么是高并发内存池？高并发内存池是一种专门设计用于高并发环境下的内存管理机制。它的原型是Google的一个开源项目tcmalloc，全称Thread-CachingMalloc，实现了高效的多线程内存管理，用于替换系统的内存分配相关函数malloc和free。在高并发系统中，大量的线
linux find 命令超全完整指南疑犯 linux 服务器 find命令
linuxfind命令超全完整指南一、基础语法与工作逻辑find[起始路径][表达式][操作]起始路径：指定搜索根目录，默认为当前目录.。支持多路径（如find/etc/var）表达式：定义搜索条件（如文件名、类型、时间等）。操作：对匹配文件执行命令（如删除、压缩等）。二、核心查找条件详解1.按名称查找精确匹配：-name"文件名"find/home-name"example.txt"#精确查找文
参加AIGC四级考试的，建议先看下我的备考经验 Tester_孙大壮 AI培训师 AIGC
写在前面这是我2024年末看到AI快速发展，自己也想入局AI而准备的一个考试，但是真正考试下来发现这个考试真的特别简单，除了政府补贴，其他可能对自己没有任何的用处，我觉得这个在面试的时候也很难成为一个加分项，但是备考过程中可能会对一些AI的知识有框架式的了解，以下是我的备考经验，希望对你有帮助。我参加的是广州本地宝推荐的人社部AIGC考试。整体而言，考试难度不算特别大。以我的工作年限，符合报考四级
DMA的工作模式详解浩瀚之水_csdn #嵌入式高速总线研究 DMA
DMA（直接内存访问）通过不同的工作模式管理数据传输过程，以适应各种应用场景的需求。以下是其核心工作模式及特点：1.单次传输模式（SingleTransferMode）特点：每次传输仅完成指定数据量的搬运（如1024字节），完成后自动停止。需要CPU重新配置并启动下一次传输。适用场景：非连续或一次性数据传输（如文件单次读写、传感器单次采样）。示例配置（STM32）：hdma.Init.Mode=D
大模型应用编排工具Dify二开之登录Token改造 Daphnis_z Python开发 LLM chatgpt python docker web
1.前言dify工作室支持在画布上直接编辑业务流程，通过调用开源大模型可以实现特定场景的业务，而且可以迅速更新发布。因此，某些项目要求在产品里面能够直接编辑dify业务流程，使得现场开发人员能够迅速响应客户需求。另外，方便对dify进行运维，比如更新开源大模型认证信息。环境信息：dify-0.8.3,docker-212.实现思路分析常规的思路有两种：把dify源码迁移到产品中代码改造量大、难度高
Docker DRUN_K docker 容器
DockerDocker架构的工作流程构建镜像：通过编写dockerfile来进行构建推送镜像到仓库：将镜像上传到DockerHub或私有注册表中拉取镜像：通过dockerpull从从仓库中拉取镜像运行容器：使用镜像创建并启动容器管理容器：使用Docker客户端命令管理正在运行的容器，如查看日志、停止容器、查看资源使用情况等网络与存储：容器之间通过Docker网络连接，数据通过Docker卷或绑定
机器视觉工程师必须知道读码器如何选型视觉人机器视觉杂说数码相机 3d 人工智能 c#
一、明确核心需求应用场景工业场景（产线、仓储）：需高防护等级（IP65+）、抗震动/冲击、宽温工作（-20℃~50℃）。商业场景（零售、物流）：注重扫描速度、多码兼容性（一维/二维码混合）。移动场景（手持设备、AGV）：选择无线连接（蓝牙/Wi-Fi）、轻便设计。特殊环境（高粉尘、强光）：需配备强光源补偿、高帧率图像传感器。码的类型一维码：传统激光扫描器（成本低）或线性图像式扫描器（破损码容错）。
AI人工智能代理工作流AI Agent WorkFlow：设计智能任务处理流程 AI天才研究院计算 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能代理工作流AIAgentWorkFlow：设计智能任务处理流程作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来在当今的数字化时代，随着数据量的爆炸式增长和复杂性的提升，传统的手动任务处理方式已经无法满足高效、准确的需求。人工智能技术的发展为自动化任务处理提供了新的可能性。AI人工智能代理（AIAgent）作为一
清晰易懂的Python安装与配置教程 Tee xm python 开发语言
初学者也能看懂的Python安装与配置教程本教程将手把手教你安装Python，并配置国内镜像源和自定义依赖包缓存位置，即使你是零基础小白，也能轻松完成！一、准备工作操作系统：Windows10/11、macOS或Linux。下载工具：浏览器（推荐Chrome或Edge）。存储空间：至少预留500MB可用空间。二、安装Python1.下载Python访问Python官网下载页面：https://ww
ESP8266 与 ARM7 接口-LPC2148 创建 Web 服务器以控制 LED David WangYang ESP8266项目服务器运维
ESP8266与ARM7接口-LPC2148创建Web服务器以控制LEDESP8266Wi-Fi收发器提供了一种将微控制器连接到网络的方法。它被广泛用于物联网项目，因为它便宜、体积小且易于使用。在本教程中，我们将ESP8266Wi-Fi模块与ARM7-LPC2148微控制器连接，并创建一个Web服务器来控制连接到LPC2148的LED。工作流程将如下所示：从LPC2148向ESP8266发送AT命
docker实现Nginx
在Ubuntu上使用Docker搭建Nginx服务器是一种高效、灵活的方式。以下将详细介绍从安装Docker到配置和运行Nginx容器的全过程，帮助你快速实现Nginx服务的部署与管理。目录安装Docker获取Nginx镜像运行Nginx容器访问Nginx配置Nginx持久化数据工作流程总结️注意事项⚠️1.安装Docker在开始之前，确保你的系统是最新的，并且安装了必要的依赖包。sudoapt-
工作记录 2017-01-20 月巴月巴白勺合鸟月半医疗行业开发技术分享 Microsoft Visual Studio开发技术分享健康医疗 C#
工作记录2017-01-20序号工作相关人员1修改从AmazingChart导出的数据的程序。处理AmazingChart的数据的导入，预计下周一可以提交。修改EDI837的生成。更新RD服务器。郝更新的问题1、更新了DataExport。1.1增加了BillingJobInfo\ProblemList、PatVisit\ProviderInfo\ProviderList、PatMas\Probl
施磊老师高级c++(二) Zhuai-行淮施磊老师cpp c++开发语言
智能指针文章目录智能指针基础--实现简单的智能指针2.不带引用计数的智能指针问题解决不带引用计数的智能指针汇总auto_ptr--#include--不推荐scoped_ptr---不推荐unique_ptr--推荐--右值引用--move3.带引用计数的智能指针4.shared_ptr交叉(循环)引用问题代码示例整体过程解决办法--强弱混用弱智能指针-不能使用资源5.多线程访问共享对象的线程安全
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam

并行计算简介和多核CPU编程Demo

你可能感兴趣的:(多线程,并行计算,openmp,多核编程,工作线程池)