wanglei5695312

Intel Threading Building Blocks 基于任务编程

为程序争取更多性能时，使用基于线程的方法来编写多线程程序并不是一个好的办法，而更好的是用逻辑任务来表达你的程序

关于TBB的安装配置请参考：并行循环(http://www.cppprog.com/2009/0325/92.html)
为程序争取更多性能时，使用基于线程的方法来编写多线程程序并不是一个好的办法，而更好的是用逻辑任务来表达你的程序，理由如下：

与可用资源相匹配的并行化

你使用线程库所建立的线程是逻辑线程，它们要映射到硬件的物理线程中去。当每个物理线程各自运行一个逻辑线程时效率最高，其它情况下会由于不匹配而致使性能下降。TBB调度试图避免这种不匹配，使一个物理线程对应一个逻辑线程。

任务的启动和停止过程更加迅速

任务和线程相比关键优势是它们更轻量，在Linux系统，启动和终止一个任务的速度是线程的18倍，在Windows系统，这个比率更是超过了100。这是因为每个线程有自己的一堆资源，象寄存器和堆栈，在Linux里，线程甚至有自己的进程ID。与之形成对比的是任务，它只是一个小例程，而且，任务不是抢先式的。

更高效率的优先级评定

TBB里的任务效率高在于它们的调度是“不公平的”，线程调度典型的做法是分发时间片，这种分发是“公平的”，因为这是一个在不知道程序的高级别组织形式下最安全的策略。基于任务编程时，任务调度有高级别信息，所以可以为了效率而牺牲公平性。实际上，它经常延迟启动一个任务直到进程确实要用到它为止。

提高负载平衡

任务调度尽量做到负载平衡，只要把你的程序分解成一组足够小的任务，任务调度通常会很好地分配这些任务到线程中去并让各线程平衡负荷。

处于更高级别思考问题

最后，一个主要优势是使你处于更高级别的、基于任务来思考。

在并行循环(http://www.cppprog.com/2009/0325/92.html) 一文中，所有例程都首先创建一个task_scheduler_init对象，它就是TBB的任务调度服务。在使用任务之前，也要先创建这个对象。

任务task

所有的TBB任务都从task继承，并重载其中的纯虚函数task* execute()。

TBB库还有一个特殊的task，空任务:

 
   // Task that does nothing. Useful for synchronization. 
class empty_task: public task { 
    /*override*/ task* execute() { 
        return NULL; 
    } 
}; 
 
  

下面是一个最简单的使用task的例子:

 
   #include <iostream> 
#include <tbb/task_scheduler_init.h> 
#include <tbb/task.h> 
  
using namespace std; 
using namespace tbb; 
  
struct printtask 
    :task 
{ 
    printtask(int n) 
        :m_n(n){} 
    task* execute() 
    { 
        cout << m_n; 
        return NULL; 
    } 
private: 
    int m_n; 
}; 
  
int main() 
{ 
    task_scheduler_init init; 
  
    task *dummy = new(task::allocate_root()) empty_task; 
    dummy->set_ref_count(10+1); 
    for(int i=0; i<10; i++) 
    { 
        task* childtask = new(dummy->allocate_child()) printtask(i); 
        dummy->spawn(*childtask); 
    } 
    dummy->wait_for_all(); 
    dummy->destroy(*dummy); 
  
    return 0; 
} 
 
  

本例中，打印10个数字，分别从0-9。因为任务是并行执行的，所以打印结果是乱序的。

printtask是一个打印任务，打印一个数字。

   empty_task类型的dummy是一个空任务，它是所有打印任务的父任务，我们要利用它的wait_for_all等待所有子任务完成。
   默认task的execute()执行完成后这个任务就会被删除，所在新建的所有printtask类型子任务不用显式地删除它们。
   同样，dummy一直没有执行，所以这个删除任务就由我们来处理。task必须使用destroy来删除。

task还有一个特色是它只能使用placement new的形式新建任务，placement new中使用的是一个代理对象，这些代理对象可以是下面中的一个：

task::allocate_root()	生成根任务
this->allocate_continuation()	生成一个和当前任务同级的任务，并把当前任务的父任务转移过来。一般用于立即返回当前任务并由这个新任务代替当前任务继续做接下去的事。
this->allocate_child()	生成当前任务的子任务
this->task::allocate_additional_child_of(parent)	为指定的parent生成一个子任务

本例中还用到了三个task的方法

 
   void set_ref_count(int count) 
void spawn(task& child) 
void wait_for_all()

   set_ref_count设置任务的参考计数，当任务中的一个子任务完成后参考计数减一
   spawn把子任务放入“就绪池”并马上返回
   wait_for_all等待任务的参考计数降到1为止（所以上面是：dummy->set_ref_count(10+1);），然后把这个计数值设为0。
   这里还有必要提一下，task还提供了一个spawn_and_wait_for_all(task& child)方法，相当于spawn(child);wait_for_all();。据说性能更高一点。

spawn还支持一个叫task_list的类作为参数，这是一个存放任务的队列，它只有四个方法：

 
   void push_back(task& task); 
task& pop_front(); 
void clear(); 
bool empty() const;

看名字即可知道怎样使用它们了。比如上面的例子我们可以这样写：

 
   int main() 
{ 
    task_scheduler_init init; 
  
    task *dummy = new(task::allocate_root()) empty_task; 
    dummy->set_ref_count(10+1); 
  
    task_list tl; 
    for(int i=0; i<10; i++) 
    { 
        task* childtask = new(dummy->allocate_child()) printtask(i); 
        // 把任务放入列表 
        tl.push_back(*childtask); 
    } 
    // 放入“就绪池”并等待 
    dummy->spawn_and_wait_for_all(tl); 
    dummy->destroy(*dummy); 
  
    return 0; 
} 
 
  

任务调度算法

TBB任务调度使用的是称为工作偷取(work stealing)的技术，每个线程维护一个“就绪池”，“就绪池”的结构可以看成是一个准备执行的任务列表数组。

从上例的task组织结构（parent-child）可以看出，TBB的任务是以树型来组织的。其中“就绪池”的数组中第n个元素对应任务树的第n级，因此称数组头部是“就绪池”的“浅”位，越到尾部越“深”，每个元素是一个任务列表，这个列表是后进先出的顺序。

线程依次按照下面的规则选择下一个执行的任务：

由前一个任务的execute()方法返回的任务。
这个线程中最晚一个所有子任务都已完成的任务。
从“就绪池”最“深”的非空列表中取得一个任务。
与线程关联的任务。
随机从其它线程“就绪池”的最浅列表中取得一个任务。

任务进入“就绪池”有三种途径：

使用spawn等方法明确地放入
任务被void recycle_to_reexecute()方法标记为re-execution
由于子任务完成，任务的参考计数被降至0。

并行排序

在并行循环(http://www.cppprog.com/2009/0325/92.html) 一文中，已经介绍了一个叫parallel_sort的函数，它可以快速并行排序。对应于std::sort，它是不稳定的。

这里，我们使用task写一个对应于std::stable_sort稳定排序的并行版本。

在众多稳定排序算法中，这里我选择使用归并排序：一是因为这种排序方式相对简单；二是归并排序不会有数据竞争，便于并行化；三是它的思想正好可以建立成一个二叉任务树。（另外，貌似std::stable_sort也是用归并算法排序的）

归并排序简单地说就是：将数组分割成两份，分别对它们进行归并排序，然后把已排好序的两份合并。

完整代码：

 
   #include <iostream> 
#include <algorithm> 
#include <functional> 
#include <tbb/task_scheduler_init.h> 
#include <tbb/task.h> 
#include <tbb/tick_count.h> 
// T是迭代器，F是比较算子 
template<class T, class F> 
struct stable_sort_task 
:tbb::task 
{ 
    typedef typename stable_sort_task<T,F> this_type; 
    typedef typename std::iterator_traits<T>::value_type value_type; 
  
    stable_sort_task(T begin_, T end_,F &func) 
        :m_begin(begin_),m_end(end_),m_func(func) 
    {} 
  
    tbb::task* execute() 
    { 
        int size = m_end - m_begin; 
        if(size < 200) 
        { 
            std::stable_sort(m_begin,m_end,m_func); 
        } 
        else 
        { 
            T m = m_begin + (size+1)/2; 
            // 分出两个子任务，分别排序前后半边的数据 
            this_type &t1 = *new(allocate_child()) this_type(m_begin,m,m_func); 
            this_type &t2 = *new(allocate_child()) this_type(m,m_end,m_func); 
            // 设置ref_count，两个子任务+一个wait_for_all 
            set_ref_count(3); 
            spawn(t1); 
            spawn(t2); 
            wait_for_all(); 
            // 前后半边都各自排好序了，开始归并 
            value_type* temp = new value_type[size]; 
            std::merge(m_begin,m,m,m_end,temp,m_func); 
            std::copy(temp,temp+size,m_begin); 
            delete []temp; 
        } 
        return NULL; 
    } 
private: 
    T m_begin, m_end; 
    F &m_func; 
}; 
// 并行排序 
template <class T, class F> 
void parallel_stable_sort( T begin_, T end_, F func ) 
{ 
    stable_sort_task<T,F> &t = *new(tbb::task::allocate_root()) stable_sort_task<T,F>(begin_,end_,func); 
    tbb::task::spawn_root_and_wait(t); 
} 
// 测试代码 
int main() 
{ 
    tbb::task_scheduler_init init; 
  
    const size_t TESTSIZE = 5000; 
    int test[TESTSIZE]; 
  
    for(int i=0; i<TESTSIZE; i++) test[i]=i; 
    tbb::tick_count t0, t1; 
    // 并行排序 
    t0 = tbb::tick_count::now(); 
    for(int i=0; i<100; i++) 
    { 
        parallel_stable_sort(test, test + TESTSIZE, std::greater<int>()); 
        parallel_stable_sort(test, test + TESTSIZE, std::less<int>()); 
    } 
    t1 = tbb::tick_count::now(); 
    std::cout << (t1-t0).seconds() << std::endl; 
    // 串行排序 
    t0 = tbb::tick_count::now(); 
    for(int i=0; i<100; i++) 
    { 
        std::stable_sort(test, test + TESTSIZE, std::greater<int>()); 
        std::stable_sort(test, test + TESTSIZE, std::less<int>()); 
    } 
    t1 = tbb::tick_count::now(); 
    std::cout << (t1-t0).seconds() << std::endl; 
  
    return 0; 
} 
 
  

在我的双核CPU+VC2005的Debug模式下显示1.9秒和3.2秒。说明我们的并行排序效率的提升还是明显的。

在stable_sort_task的execute()方法中，有一个判断：if(size < 200)，如果小于200就直接使用串行方法排序。

我们也可以断续分解直到剩下一个元素为止，为什么不这么做呢？其实这个200是个“艺术”问题，它和实际应用有关，大数可以减少task的调度，但可能造成不能充分利用CPU或负载不平衡。小数正好相反，而且过小的话如果task调度开销超过算法本身开销就更不合算了。

parallel_stable_sort函数建立一个根任务，并使用spawn_root_and

转自http://www.cppprog.com/2009/0401/96_3.html

任务调度算法

TBB任务调度使用的是称为工作偷取(work stealing)的技术，每个线程维护一个“就绪池”，“就绪池”的结构可以看成是一个准备执行的任务列表数组。

线程依次按照下面的规则选择下一个执行的任务：

由前一个任务的execute()方法返回的任务。
这个线程中最晚一个所有子任务都已完成的任务。
从“就绪池”最“深”的非空列表中取得一个任务。
与线程关联的任务。
随机从其它线程“就绪池”的最浅列表中取得一个任务。

任务进入“就绪池”有三种途径：

使用spawn等方法明确地放入
任务被void recycle_to_reexecute()方法标记为re-execution
由于子任务完成，任务的参考计数被降至0。

并行排序

在并行循环(http://www.cppprog.com/2009/0325/92.html) 一文中，已经介绍了一个叫parallel_sort的函数，它可以快速并行排序。对应于std::sort，它是不稳定的。

这里，我们使用task写一个对应于std::stable_sort稳定排序的并行版本。

归并排序简单地说就是：将数组分割成两份，分别对它们进行归并排序，然后把已排好序的两份合并。

完整代码：

 
   #include <iostream> 
#include <algorithm> 
#include <functional> 
#include <tbb/task_scheduler_init.h> 
#include <tbb/task.h> 
#include <tbb/tick_count.h> 
// T是迭代器，F是比较算子 
template<class T, class F> 
struct stable_sort_task 
:tbb::task 
{ 
    typedef typename stable_sort_task<T,F> this_type; 
    typedef typename std::iterator_traits<T>::value_type value_type; 
  
    stable_sort_task(T begin_, T end_,F &func) 
        :m_begin(begin_),m_end(end_),m_func(func) 
    {} 
  
    tbb::task* execute() 
    { 
        int size = m_end - m_begin; 
        if(size < 200) 
        { 
            std::stable_sort(m_begin,m_end,m_func); 
        } 
        else 
        { 
            T m = m_begin + (size+1)/2; 
            // 分出两个子任务，分别排序前后半边的数据 
            this_type &t1 = *new(allocate_child()) this_type(m_begin,m,m_func); 
            this_type &t2 = *new(allocate_child()) this_type(m,m_end,m_func); 
            // 设置ref_count，两个子任务+一个wait_for_all 
            set_ref_count(3); 
            spawn(t1); 
            spawn(t2); 
            wait_for_all(); 
            // 前后半边都各自排好序了，开始归并 
            value_type* temp = new value_type[size]; 
            std::merge(m_begin,m,m,m_end,temp,m_func); 
            std::copy(temp,temp+size,m_begin); 
            delete []temp; 
        } 
        return NULL; 
    } 
private: 
    T m_begin, m_end; 
    F &m_func; 
}; 
// 并行排序 
template <class T, class F> 
void parallel_stable_sort( T begin_, T end_, F func ) 
{ 
    stable_sort_task<T,F> &t = *new(tbb::task::allocate_root()) stable_sort_task<T,F>(begin_,end_,func); 
    tbb::task::spawn_root_and_wait(t); 
} 
// 测试代码 
int main() 
{ 
    tbb::task_scheduler_init init; 
  
    const size_t TESTSIZE = 5000; 
    int test[TESTSIZE]; 
  
    for(int i=0; i<TESTSIZE; i++) test[i]=i; 
    tbb::tick_count t0, t1; 
    // 并行排序 
    t0 = tbb::tick_count::now(); 
    for(int i=0; i<100; i++) 
    { 
        parallel_stable_sort(test, test + TESTSIZE, std::greater<int>()); 
        parallel_stable_sort(test, test + TESTSIZE, std::less<int>()); 
    } 
    t1 = tbb::tick_count::now(); 
    std::cout << (t1-t0).seconds() << std::endl; 
    // 串行排序 
    t0 = tbb::tick_count::now(); 
    for(int i=0; i<100; i++) 
    { 
        std::stable_sort(test, test + TESTSIZE, std::greater<int>()); 
        std::stable_sort(test, test + TESTSIZE, std::less<int>()); 
    } 
    t1 = tbb::tick_count::now(); 
    std::cout << (t1-t0).seconds() << std::endl; 
  
    return 0; 
} 
 
  

在我的双核CPU+VC2005的Debug模式下显示1.9秒和3.2秒。说明我们的并行排序效率的提升还是明显的。

在stable_sort_task的execute()方法中，有一个判断：if(size < 200)，如果小于200就直接使用串行方法排序。

parallel_stable_sort函数建立一个根任务，并使用spawn_root_and

Continuation Passing模式

上例stable_sort_task的execute方法的执行过程是生成两个子任务，等待两个子任务完成再开始归并数组。

等待可能会引起性能下降，我们可以利用上面所说的任务进入“就绪池”途径第三条：“由于子任务完成，任务的参考计数被降至0”来消除这个等待。

方法是:

使用allocate_continuation作为代理对象生成一个同级任务，这样当前任务的父任务转移到了这个新任务之下，原任务退出时不再会修改父任务的参考计数（事实上这时原任务的parent属性为NULL）。
在这个新任务下建立两个子任务来处理子串的排序工作。
设置新任务的参考计数为2
当两个子任务完成时，此新任务的参考计数被降为0，由此进入“就绪池”准备执行。
两个排完序的子串的归并工作由这个新任务完成。

说来话长，直接看代码：

 
   // T是迭代器，F是比较算子 
template<class T, class F> 
struct merge_task 
:tbb::task 
{ 
    typedef typename std::iterator_traits<T>::value_type value_type; 
    typedef typename std::iterator_traits<T>::distance_type dist_type; 
    T m_begin, m_end, m_mid; 
    F &m_func; 
    dist_type m_size; 
  
    merge_task(T begin_, T end_,F &func) 
        :m_begin(begin_),m_end(end_),m_func(func), 
        m_size(end_ - begin_) 
    { 
        m_mid = begin_ + (m_size + 1)/2; 
    } 
  
    tbb::task* execute() 
    { 
        // 只有参考计算降为0才会执行这里，即它的两个子任务已完成 
        // 前后半边都各自排好序了，开始归并 
        value_type* temp = new value_type[m_size]; 
        std::merge(m_begin,m_mid,m_mid,m_end,temp,m_func); 
        std::copy(temp,temp+m_size,m_begin); 
        delete []temp; 
        return NULL; 
    } 
}; 
  
template<class T, class F> 
struct stable_sort_task 
:tbb::task 
{ 
    typedef typename stable_sort_task<T,F> this_type; 
    typedef typename merge_task<T,F> merge_task_type; 
    typedef typename std::iterator_traits<T>::value_type value_type; 
  
    stable_sort_task(T begin_, T end_,F &func) 
        :m_begin(begin_),m_end(end_),m_func(func) 
    {} 
  
    tbb::task* execute() 
    { 
        if(m_end - m_begin < 200) 
        { 
            std::stable_sort(m_begin,m_end,m_func); 
        } 
        else 
        { 
            // 建立一个新任务，使用allocate_continuation作为代理 
            merge_task_type &tc =  
                *new(allocate_continuation()) merge_task_type(m_begin, m_end, m_func); 
            // 分别排序前后半边的数据，注意，它们是tc的子任务 
            this_type &t1 = *new(tc.allocate_child()) this_type(m_begin, tc.m_mid, m_func); 
            this_type &t2 = *new(tc.allocate_child()) this_type(tc.m_mid, m_end, m_func); 
            // 设置tc的ref_count，两个子任务 
            tc.set_ref_count(2); 
            tc.spawn(t1); 
            tc.spawn(t2); 
        } 
        return NULL; 
    } 
private: 
    T m_begin, m_end; 
    F &m_func; 
}; 
 
  

实测，貌似速度快了那么一点点，应该不是心理作用吧^_^

Recycling Parent as a Child

使用Continuation Passing模式后，stable_sort_task类的execute方法做的工作是生成新任务然后立即退出并被删除。

观察代码会发现，其中新建的用于排序的子任务和当前任务相差不大，我们完全可以把已执行完所有工作的当前任务转换为排序子串的子任务重新利用。

重用任务并转化成其它任务的子任务的方法是

void recycle_as_child_of( task& new_parent );

调用此方法后，this在execute()返回后不会被自动删除；父任务被设置为new_parent。

修改后的stable_sort_task类execute方法如下：

 
   tbb::task* execute() 
{ 
    if(m_end - m_begin < 200) 
    { 
        std::stable_sort(m_begin,m_end,m_func); 
    } 
    else 
    { 
        // 建立一个新任务，使用allocate_continuation作为代理 
        merge_task_type &tc = *new(allocate_continuation()) merge_task_type(m_begin, m_end, m_func); 
        // 分别排序前后半边的数据，注意，它们是tc的子任务 
        this_type &t1 = *new(tc.allocate_child()) this_type(m_begin, tc.m_mid, m_func); 
        //this_type &t2 = *new(tc.allocate_child()) this_type(tc.m_mid, m_end, m_func); 
        // 设置tc的ref_count，两个子任务 
        tc.set_ref_count(2); 
        tc.spawn(t1); 
        // 把this作为tc的子任务，代替原t2的工作 
        this->recycle_as_child_of(tc); 
        m_begin = tc.m_mid; 
        //tc.spawn(t2); 
        // 返回this, 任务调度算法线程取下一任务规则第一条 
        return this; 
    } 
    return NULL; 
} 
 
  

实测，貌似速度又快了那么一点点^_^

不适合使用基于任务编程的场合

使用任务调度通常接近线程的最高性能，不过在有些情形下使用任务调度并不合适，任务调度是为高性能算法的非阻塞任务设计的，或者在阻塞次数较小的情况下。

如果线程经常阻塞，使用任务调度时就会有性能损失（因为任务是非抢先式的）。阻塞一般在等待I/O或长时间互斥时发生。如果你有阻塞任务，最好使用线程。

TBB任务调度可以安全地和你自己的线程混合工作。

转自http://www.cppprog.com/2009/0401/96_3.html

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
2022-04-18 Apbenz
语重心长的和我说，不要老是说不行，人至而立之年危机四伏，内在的，外在的，感觉就是心力憔悴，让人无所适从。面对职场的无情，突然好羡慕干体力劳动的外卖小哥。难道命运是想让我去送外卖了吗？干体力活才能让我活下去？fastadmin打卡成功,淘宝金币任务完成。ㅏㅓㅗㅜㅡㅣㅐㅔㅑㅕㅛㅠㅢㅒㅖY行。야자여자요리우유의사얘기예
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
Day17笔记-高阶函数 ~在杰难逃~ Python 笔记 python 开发语言 pycharm 数据分析
高阶函数【重点掌握】函数的本质：函数是一个变量，函数名是一个变量名，一个函数可以作为另一个函数的参数或返回值使用如果A函数作为B函数的参数，B函数调用完成之后，会得到一个结果，则B函数被称为高阶函数常用的高阶函数：map(),reduce(),filter(),sorted()1.map()map(func,iterable)，返回值是一个iterator【容器，迭代器】func:函数iterab
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
【JS】执行时长(100分) |思路参考+代码解析（C++） l939035548 JS 算法数据结构 c++
题目为了充分发挥GPU算力，需要尽可能多的将任务交给GPU执行，现在有一个任务数组，数组元素表示在这1秒内新增的任务个数且每秒都有新增任务。假设GPU最多一次执行n个任务，一次执行耗时1秒，在保证GPU不空闲情况下，最少需要多长时间执行完成。题目输入第一个参数为GPU一次最多执行的任务个数，取值范围[1,10000]第二个参数为任务数组长度，取值范围[1,10000]第三个参数为任务数组，数字范围
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
2019-3-23晨间日记红红火火小耳朵
今天是什么日子起床：7点40就寝：23点半天气：有太阳，不过一会儿出来一会儿进去特别清爽的凉意，还蛮舒服的心情：小激动要给女朋友过生日啦纪念日：田田女士过生日任务清单昨日完成的任务，最重要的三件事：1.英语一对一2.运动计划3.认真护肤习惯养成：调整状态周目标·完成进度英语七天打卡（5/7）轻课阅读（87/180）音标课（25/30）读书（福尔摩斯一章）学习·信息·阅读#英语课#Cookingte
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
ios GCD _Waiting_
1.GCD任务和队列学习GCD之前，先来了解GCD中两个核心概念：任务和队列。任务：就是执行操作的意思，换句话说就是你在线程中执行的那段代码。在GCD中是放在block中的。执行任务有两种方式：同步执行（sync）和异步执行（async）。两者的主要区别是：是否等待队列的任务执行结束，以及是否具备开启新线程的能力。同步执行（sync）：同步添加任务到指定的队列中，在添加的任务执行结束之前，会一直等
为什么你总是对下属不满意? ZhaoWu1050
【ZhaoWu的听课笔记】大多数公司，都存在两种问题。我创业四年，更是体会深切。这两种问题就是：老板经常不满意下属的表现；下属总是不知道老板想要什么；虽然这两种问题普遍存在，其实解决方法并不复杂。这节课，我们再聊聊第一个问题：为什么老板经常不满意下属表现?其实，这背后也是一条管理常识。管理学家德鲁克先生早就说过：管理者的任务，不是去改变人。*来自《卓有成效的管理者》只是大多数老板和我一样，都是一边
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
BART&BERT Ambition_LAO 深度学习
BART和BERT都是基于Transformer架构的预训练语言模型。模型架构：BERT(BidirectionalEncoderRepresentationsfromTransformers)主要是一个编码器（Encoder）模型，它使用了Transformer的编码器部分来处理输入的文本，并生成文本的表示。BERT特别擅长理解语言的上下文，因为它在预训练阶段使用了掩码语言模型（MLM）任务，即
2020-8-19晨间日记：看过的电影盐大虾
今天是周三起床：6点半就寝：11点天气：晴心情：正常纪念日：周三任务清单今日完成的任务，最重要的三件事：1.整理写过的文档2.电影《电灯泡》3.这就是街舞第三季第五期改进：早睡早起习惯养成：早睡早起，看书周目标·完成进度两篇文章学习·信息·阅读电影艺术发展史相关教材健康·饮食·锻炼吃了挺多零食，还喝了果粒橙，还是得少吃，多锻炼，不然会慢慢死掉的。人际·家人·朋友淡定交流，不放在心上。工作·思考专心
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
vue项目element-ui的table表格单元格合并酋长哈哈 vue.js elementui javascript 前端
一、合并效果二全部代码exportdefault{name:'CellMerge',data(){return{tableData:[{id:'1',name:'王小虎',amount1:'165',amount2:'3.2',amount3:10},{id:'1',name:'王小虎',amount1:'162',amount2:'4.43',amount3:12},{id:'1',name:'
python批量读取tiff文件_Python Pillow批量转换tif格式到jpg weixin_39557797
最近因为想要整下网站的壁纸，从网站下载了别人整理好的合集压缩包，解压之后，却发现里面的文件都是tif的，tif格式网站和电脑都不认的，根本不能作壁纸。这时候，就需要转换图片格式了，首先我找了几款转换格式的软件，发现效果都不好，要不是不支持tif格式，要不就是转换出来的图片糊的不行。最终，还是决定用Python的Pillow库来写一个脚本，完成这个任务。下面是整个的小脚本----importosim
Python算法L5：贪心算法小熊同学哦 Python算法算法 python 贪心算法
Python贪心算法简介目录Python贪心算法简介贪心算法的基本步骤贪心算法的适用场景经典贪心算法问题1.**零钱兑换问题**2.**区间调度问题**3.**背包问题**贪心算法的优缺点优点：缺点：结语贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取当前最优或最优解的算法。它的核心思想是，在保证每一步局部最优的情况下，希望通过贪心选择达到全局最优解。虽然贪心算法并不总能得到全
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR

Intel Threading Building Blocks 基于任务编程

任务task

任务调度算法

并行排序

任务调度算法

并行排序

Continuation Passing模式

Recycling Parent as a Child

不适合使用基于任务编程的场合

你可能感兴趣的:(算法,iterator,任务调度,任务,merge,parallel)