Iovebecky

OpenMP编程

1. 执行模式

概述：
OpenMP是跨平台的多核多线程编程的一套指导性的编译处理方案(Compiler Directive)，指导编译器将代码编译为多线程程序。
Openmp的执行模型采用fork-join的形式，其中fork（派生）创建新线程或者唤醒已有线程；join即多线程的会合。

OpenMP的编程者需要在可并行工作的代码部分用制导指令向编译器指出其并行属性。（并行区域可以出现嵌套的情况）。

并行域与线程：

对**并行域（Paralle region）**作如下定义：在成对的fork和join之间的区域，称为并行域，它既表示代码也表示执行时间区间。
对OpenMP线程作如下定义：在OpenMP程序中用于完成计算任务的一个执行流的执行实体，可以是操作系统的线程也可以是操作系统上的进程。

2. OpenMP编程要素

OpenMP编程模型以线程为基础，通过编译制导指令来显式地指导并行化，OpenMP为编程人员提供了三种编程要素来实现对并行化的完善控制。它们是编译制导、API函数集和环境变量。

2.1编译制导

C/C++程序中，OpenMP的所有编译制导指令是以#pragma omp开始，后面跟具体的功能指令（或命令），其具有如下形式：

#pragma omp 指令子句

支持OpenMP的编译器能识别、处理这些制导指令并实现其功能。其中指令或命令是可以单独出现的，而子句则必须出现在制导指令之后。制导指令和子句按照功能可以大体上分成四类：

并行域控制类；
任务分担类；
同步控制类；
数据环境类。

OpenMP规范中的指令：

parallel：用在一个结构块之前，表示这段代码将被多个线程并行执行；
for：用于for循环语句之前，表示将循环计算任务分配到多个线程中并行执行，以实现任务分担，必须由编程人员自己保证每次循环之间无数据相关性；
sections：用在可被并行执行的代码段之前，用于实现多个结构块语句的任务分担，可并行执行的代码段各自用section指令标出（注意区分sections和section）；
single：用在并行域内，表示一段只被单个线程执行的代码；
critical：用在一段代码临界区之前，保证每次只有一个OpenMP线程进入；
flush、barrier、atomic、master、threadprivate …

相应的OpenMP子句：

private：指定一个或多个变量在每个线程中都有它自己的私有副本；
firstprivate：指定一个或多个变量在每个线程都有它自己的私有副本，并且私有变量要在进入并行域或任务分担域时，继承主线程中的同名变量的值作为初值；
lastprivate：是用来指定将线程中的一个或多个私有变量的值在并行处理结束后复制到主线程中的同名变量中，负责拷贝的线程是for或sections任务分担中的最后一个线程；
reduction：用来指定一个或多个变量是私有的，并且在并行处理结束后这些变量要执行指定的归约运算，并将结果返回给主线程同名变量；
nowait：指出并发线程可以忽略其他制导指令暗含的路障同步；
num_threads：指定并行域内的线程的数目；
schedule、shared、ordered、copyprivate、copyin、default…

2.2 API函数

除上述编译制导指令之外，OpenMP还提供了一组API函数用于控制并发线程的某些行为，下面列出OpenMP 2.5所有的API函数：

2.3 环境变量

OpenMP规范定义了一些环境变量，可以在一定程度上控制OpenMP程序的行为。以下是开发过程中常用的环境变量

OMP_SCHEDULE：用于for循环并行化后的调度，它的值就是循环调度的类型；
OMP_NUM_THREADS：用于设置并行域中的线程数；
OMP_DYNAMIC：通过设定变量值，来确定是否允许动态设定并行域内的线程数；
OMP_NESTED：指出是否可以并行嵌套。

编译方式

C / C++编译语句添加：-fopenmp

3. 并行域管理

parallel制导语句：开辟并行域，也可组合使用形成复合指令由线程组并行执行

例：开辟并行域

#include 
#include 
int main()
{
#pragma omp parallel
    {
        printf("hello world! from thread_num %d\n", omp_get_thread_num());
    }
    return 0;
}

输出：

hello world! from thread_num 5
hello world! from thread_num 4
hello world! from thread_num 8
hello world! from thread_num 6
hello world! from thread_num 2
hello world! from thread_num 13
hello world! from thread_num 3
hello world! from thread_num 19
hello world! from thread_num 16
hello world! from thread_num 12
hello world! from thread_num 7
hello world! from thread_num 1
hello world! from thread_num 11
hello world! from thread_num 14
hello world! from thread_num 9
hello world! from thread_num 10
hello world! from thread_num 15
hello world! from thread_num 18
hello world! from thread_num 17
hello world! from thread_num 0

可以通过omp_set_num_threads(n);设置使用的线程数

#include 
#include 
int main()
{
    omp_set_num_threads(2);
#pragma omp parallel
    {
        printf("hello world! from thread_num %d\n", omp_get_thread_num());
    }
    return 0;
}

输出：

hello world! from thread_num 0
hello world! from thread_num 1

4. 任务分担

当使用parellel制导指令产生出并行域之后，如果仅仅是多个线程执行完全相同的任务，那么只是徒增计算工作量而不能达到加速计算的目的，甚至可能相互干扰得出错误结果。因此在产生出并行域之后，紧接着的问题就是如何将计算任务在这些线程之间分配，并加快计算结果的生成速度及其保证正确性。

OpenMP可以完成的任务分担的指令只有for、sections和single。

4.1 for制导指令

for制导语句：指定紧随它的循环语句由线程组并行执行

例：for制导语句

#include 
#include 
int main()
{
#pragma omp parallel
    {
        int i;
#pragma omp for
        for (i = 0; i < 4; i++)
            printf("i = %d,from thread_num%d\n", i, omp_get_thread_num());
    }
    return 0;
}

写法2: parallel for开辟for并行域

#include 
#include 
int main()
{
    int i;
#pragma omp parallel for
    for (i = 0; i < 4; i++)
        printf("i = %d,from thread_num%d\n", i, omp_get_thread_num());
    return 0;
}

这里我们对第一层循环并行执行，第二层循环非并行执行：

#include 
#include 
int main()
{
    int i, j;
#pragma omp parallel for
    for (i = 0; i < 4; i++)
        printf("i = %d,from thread_num%d\n", i, omp_get_thread_num());
    puts("");
    for (j = 0; j < 4; j++)
        printf("j = %d,from thread_num%d\n", j, omp_get_thread_num());
    return 0;
}

输出：

i = 3,from thread_num3
i = 2,from thread_num2
i = 1,from thread_num1
i = 0,from thread_num0

j = 0,from thread_num0
j = 1,from thread_num0
j = 2,from thread_num0
j = 3,from thread_num0

特殊情况：一个并行域中有多个for制导指令首先完成第一个for语句的任务分担，然后在此进行一次同步（for制导指令本身隐含有结束处的路障同步）

例：多个for制导指令

#include 
#include 
int main()
{
    int i, j;
#pragma omp parallel
{
#pragma omp for
        for (i = 0; i < 4; i++)
            printf("i = %d,from thread_num%d\n", i, omp_get_thread_num());
#pragma omp single
        printf("\n");
#pragma omp for
        for (j = 0; j < 4; j++)
            printf("j = %d,from thread_num%d\n", j, omp_get_thread_num());
}
    return 0;
}

输出：第一个for循环结束后进行了一次同步

i = 1,from thread_num1
i = 3,from thread_num3
i = 2,from thread_num2
i = 0,from thread_num0

j = 2,from thread_num2
j = 0,from thread_num0
j = 1,from thread_num1
j = 3,from thread_num3

4.2 for调度

在OpenMP中，对for循环任务调度使用schedule子句来实现，一个简单的理解：一个for循环假设有10次迭代，使用4个线程去执行，那么哪些线程去执行哪些迭代呢？通过schedule去控制迭代的调度和分配，从而适应不同的使用情况，提高性能。使用格式为：schedule (type ,size)。

有四种type：static、dynamic、guided、runtime, 如果没有指定size大小，循环迭代会尽可能平均地分配给每个线程。

static:“静态”体现在这个分配过程跟实际的运行是无关的，可以从逻辑上推断出哪几次迭代会在哪几个线程上运行。具体而言，对于一个N次迭代，使用M个线程，那么，[0,size-1]的size次的迭代是在第一个线程上运行，[size, size + size -1]是在第二个线程上运行，依次类推。
dynamic: 较快的线程抢到更多的任务，没有size参数的情况下，每个线程按先执行完先分配的方式执行1次循环；dynamic也可以设置size参数，size表示每次线程执行完（空闲）的时候给其一次分配的迭代的数量
guided：采用指导性的启发式自调度方式
runtime: 表示根据环境变量确定上述调度策略中的某一种，默认也是静态的 (static), 控制schedule环境变量的是OMP_SCHEDULE环境变量

例：for调度中的schedule子句 : static静态分配方式

#include 
#include 
int main()
{
    int NUM_THREADS = omp_get_num_procs();
    int i;
#pragma omp parallel for schedule(static, 2)
    for (i = 0; i < NUM_THREADS; i++)
        printf("i=%d, from thread_num %d\n", i, omp_get_thread_num());
    return 0;
}

输出

i=0, from thread_num 0
i=1, from thread_num 0
i=4, from thread_num 2
i=5, from thread_num 2
i=12, from thread_num 6
i=13, from thread_num 6
i=14, from thread_num 7
i=15, from thread_num 7
i=18, from thread_num 9
i=19, from thread_num 9
i=10, from thread_num 5
i=11, from thread_num 5
i=6, from thread_num 3
i=7, from thread_num 3
i=16, from thread_num 8
i=17, from thread_num 8
i=8, from thread_num 4
i=9, from thread_num 4
i=2, from thread_num 1
i=3, from thread_num 1

例：for调度中的schedule子句 : dynamic动态分配方式，不指定size

#include 
#include 
int v[25];  //记录每个线程抢到的任务数
int main()
{
    int NUM_THREADS = omp_get_num_procs();  // 线程总数
    int i;
#pragma omp parallel for schedule(dynamic)
    for (i = 0; i < 30; i++)
    {
        v[omp_get_thread_num()] ++;
        printf("i=%d, from thread_num %d\n", i, omp_get_thread_num());

    }
    for (i = 0; i < NUM_THREADS; i ++)
    {
        printf("thread %d gets %d jobs\n", i, v[i]);
    }
    return 0;
}

i=4, from thread_num 6
i=12, from thread_num 12
i=21, from thread_num 12
i=22, from thread_num 12
i=23, from thread_num 12
i=9, from thread_num 13
i=25, from thread_num 13
i=26, from thread_num 13
i=27, from thread_num 13
i=28, from thread_num 13
i=29, from thread_num 13
i=10, from thread_num 10
i=0, from thread_num 9
i=7, from thread_num 3
i=17, from thread_num 8
i=3, from thread_num 15
i=1, from thread_num 5
i=15, from thread_num 11
i=14, from thread_num 0
i=5, from thread_num 2
i=6, from thread_num 4
i=8, from thread_num 18
i=20, from thread_num 6
i=24, from thread_num 12
i=16, from thread_num 14
i=18, from thread_num 7
i=13, from thread_num 17
i=2, from thread_num 1
i=19, from thread_num 19
i=11, from thread_num 16
thread 0 gets 1 jobs
thread 1 gets 1 jobs
thread 2 gets 1 jobs
thread 3 gets 1 jobs
thread 4 gets 1 jobs
thread 5 gets 1 jobs
thread 6 gets 2 jobs
thread 7 gets 1 jobs
thread 8 gets 1 jobs
thread 9 gets 1 jobs
thread 10 gets 1 jobs
thread 11 gets 1 jobs
thread 12 gets 5 jobs
thread 13 gets 6 jobs
thread 14 gets 1 jobs
thread 15 gets 1 jobs
thread 16 gets 1 jobs
thread 17 gets 1 jobs
thread 18 gets 1 jobs
thread 19 gets 1 jobs

例：for调度中的schedule子句 : dynamic动态分配方式，指定size

#include 
#include 

int v[25];
int main()
{
    int tot = omp_get_num_procs();  // 线程总数
    int i;
#pragma omp parallel for schedule(dynamic, 2)
    for (i = 0; i < 100; i++)
    {
        v[omp_get_thread_num()] ++;
        printf("i=%d, from thread_num %d\n", i, omp_get_thread_num());

    }
    for (i = 0; i < tot; i ++)
    {
        printf("thread %d gets %d jobs\n", i, v[i]);
    }
    return 0;
}

i=22, from thread_num 19
i=23, from thread_num 19
i=40, from thread_num 19
i=41, from thread_num 19
...
i=8, from thread_num 3
i=9, from thread_num 3
i=14, from thread_num 9
i=15, from thread_num 9

thread 0 gets 2 jobs
thread 1 gets 2 jobs
thread 2 gets 2 jobs
thread 3 gets 2 jobs
thread 4 gets 2 jobs
thread 5 gets 2 jobs
thread 6 gets 2 jobs
thread 7 gets 16 jobs
thread 8 gets 2 jobs
thread 9 gets 2 jobs
thread 10 gets 2 jobs
thread 11 gets 2 jobs
thread 12 gets 2 jobs
thread 13 gets 2 jobs
thread 14 gets 2 jobs
thread 15 gets 2 jobs
thread 16 gets 2 jobs
thread 17 gets 2 jobs
thread 18 gets 2 jobs
thread 19 gets 48 jobs

4.3 sections 制导指令

用于非迭代计算的任务分担，将sections语句里的代码用section指导指令划分。不同的secion段由不同的线程并行执行。

#include 
#include 

int main()
{
#pragma omp parallel sections
    {
#pragma omp section
        printf("section 1 from thread_num %d\n", omp_get_thread_num());
#pragma omp section
        printf("section 2 from thread_num %d\n", omp_get_thread_num());
#pragma omp section
        printf("section 3 from thread_num %d\n", omp_get_thread_num());
    }
    return 0;
}

section 1 from thread_num 12
section 3 from thread_num 4
section 2 from thread_num 2

多个sections：总体串行单个sections内部并行

#include 
#include 
int main()
{
#pragma omp parallel
    {
#pragma omp sections
        {
#pragma omp section
            printf("section 1 from thread_num %d\n", omp_get_thread_num());
#pragma omp section
            printf("section 2 from thread_num %d\n", omp_get_thread_num());
        }

#pragma omp sections
        {
#pragma omp section
            printf("section 3 from thread_num %d\n", omp_get_thread_num());
#pragma omp section
            printf("section 4 from thread_num %d\n", omp_get_thread_num());
        }
    }
    return 0;
}

section 1 from thread_num 0
section 2 from thread_num 9
section 3 from thread_num 9
section 4 from thread_num 15

4.4 single制导指令

single制导指令所包含的代码段只由一个线程执行，别的线程跳过这段代码。

#include 
#include 
int main()
{
    omp_set_num_threads(4);
#pragma omp parallel
    {
#pragma omp single
        printf("Begining work1. \n");
        printf("work on 1 parallellly. %d\n", omp_get_thread_num());
#pragma omp single nowait
        printf("Finishing work1. \n");
#pragma omp single nowait
        printf("Begining work2. \n");
        printf("work on 2 parallelly.  %d\n", omp_get_thread_num());
#pragma omp single
        printf("Finishing work2. \n");
    }
    return 0;
}

Begining work1. 
work on 1 parallellly. 0
Finishing work1. 
Begining work2. 
work on 2 parallelly.  0
Finishing work2. 
work on 1 parallellly. 3
work on 2 parallelly.  3
work on 1 parallellly. 1
work on 2 parallelly.  1
work on 1 parallellly. 2
work on 2 parallelly.  2

5. 同步

多线程执行中不可避免数据竞争，openmp提供了两种线程互斥机制：互斥锁与事件同步机制。

5.1 critical 临界区

临界区用在可能产生数据访问竞争的地方，用法：#pragma omp critical (name) (name可省略)。保证每次只有一个线程进入。

注意：critical语句不允许互相嵌套

例：在一个并行域内的for任务分担域中，各个线程逐个进入到critical保护的区域内，比较当前元素的最大值得关系并可能进行最大值的更替，从而避免了数据竞争的情况。

#include 
#include 
int main()
{
    int i, max_x = -1, max_y = -1;
    int arx[] = {5, 16, 87, 65, 24, 35, 9, 33};
    int ary[] = {68, 4, 98, 43, 56, 18, 54, 11};
#pragma omp parallel for
    for (i = 0; i < 8; i++)
    {
#pragma omp critical
        if (arx[i] > max_x)
            max_x = arx[i];
#pragma omp critical
        if (ary[i] > max_y)
            max_y = ary[i];
    }
    printf("max_x = %d , max_y = %d\n", max_x, max_y);

    return 0;
}

5.2 atomic原子操作

在OpenMP的程序中，原子操作的功能是通过#pragma omp atomic编译制导指令提供的。critical临界区操作能够作用在任意大小的代码块上，而原子操作只能作用在单条赋值语句中，C\C++中可用的原子操作如下：+ - * / & ^ | << >>

atomic在使用中需要注意：

当对一个数据进行原子操作的时候，就不能对数据进行临界区的保护
用户在针对同一个内存单元使用院子操作的时候，需要在程序所有涉及到该变量并行赋值的部位都加入原子操作的保护。

例：

#include 
#include 

int main()
{
    omp_set_num_threads(2);
    int counter = 0, i;
#pragma omp parallel
    {
        for (i = 0; i < 10000; i++)
        {
#pragma omp atomic
            counter++;
        }
    }
    printf("counter = %d\n", counter);
    return 0;
}

由于使用atomic语句，避免了可能出现的数据访问竞争情况，最后的执行结果都是一致的，执行结果总是counter = 20000（假设有两个并发线程）。

5.3 barrier同步路障

线程遇到路障必须等待，直到并行区域内所有线程都达到了同一点。

5.4 nowait

避免不必要的路障

5.5 master

主线程执行用于指定一段代码由主线程执行。

5.6 ordered顺序制导指令

按照规定的顺序执行

5.7 互斥锁函数

OpenMP API所提供的互斥函数可放在任意需要的位置。程序员必须自己保证在调用相应锁操作之后释放相应的锁，否则就可能造成多线程程序的死锁。
下面为OpenMP API函数提供的互斥函数和可嵌套的互斥锁函数。

void omp_init_lock(omp_lock*)：初始化互斥器
void omp_destroy_lock(omp_lock*)：销毁互斥器
void omp_set_lock(omp_lock*)：获得互斥器
void omp_unset_lock(omp_lock*)：释放互斥器
void omp_test_lock(omp_lock*): 试图获得互斥器，如果获得成功则返回true，否则返回false

#include 
#include 
static omp_lock_t lock;
int main()
{
    int i;
    omp_init_lock(&lock);

#pragma omp parallel for
    for (i = 0; i < 5; ++i)
    {
        omp_set_lock(&lock);
        printf("%d +\n", omp_get_thread_num());
        printf("%d -\n", omp_get_thread_num());
        omp_unset_lock(&lock);
    }

    omp_destroy_lock(&lock);

    return 0;
}

上例对for循环中的所有内容进行加锁保护，同时只能有一个线程执行for循环中的内容。
线程1或线程2在执行for循环内部代码时不会被打断。如果删除代码中的获得锁释放锁的代码，则相当于没有互斥锁。

输出：

0 +
0 -
3 +
3 -
1 +
1 -
4 +
4 -
2 +
2 -

5.8 Flush 指令

flush指令主要用于处理内存一致性问题。每个处理器(processor)都有自己的本地(local)存储单元：寄存器和缓存，当一个线程更新了共享变量之后，新的值会首先存储到寄存器中, 然后更新到本地缓存中。这些更新并非立刻就可以被其他线程得知，因此在其它处理器中运行的线程不能访问这些存储单元。如果一个线程不知道这些更新而使用共享变量的旧值就行运算，就可能会得到错误的结果。
通过使用flush指令，可以保证线程读取到的共享变量的最新值。下面是语法形式：
#pragma omp flush[(list)]

例：第一个section的线程将flag刷新后，第二个线程才得以运行

// compile with: /openmp
#include 
#include 

void read(int *data)
{
    printf("read data\n");
    *data = 1;
}

void process(int *data)
{
    printf("process data\n");
    (*data)++;
}

int main()
{
    int data;
    int flag = 0;

#pragma omp parallel sections num_threads(2)
    {
#pragma omp section
        {
            printf("Thread %d: ", omp_get_thread_num());
            read(&data);
#pragma omp flush(data)
            flag = 1;
#pragma omp flush(flag)
            // Do more work.
        }

#pragma omp section
        {
            while (!flag)
            {
                printf("Thread %d: flushing... \n", omp_get_thread_num());
#pragma omp flush(flag)
                if (flag) printf("Thread %d: flush complete. \n", omp_get_thread_num());
            }
#pragma omp flush(data)

            printf("Thread %d: ", omp_get_thread_num());
            process(&data);
            printf("data = %d\n", data);
        }
    }
}

输出：

Thread 1: flushing... 
Thread 1: flushing... 
Thread 1: flushing... 
Thread 1: flushing... 
Thread 1: flushing... 
Thread 0: Thread 1: flushing... 
read data
Thread 1: flushing... 
Thread 1: flush complete. 
Thread 1: process data
data = 2

6 数据环境控制

多线程的环境中不可避免共享变量和私有变量这两个基本问题，在此基础上还有线程专有数据、变量的初值和终值得设定、规约操作相关的变量等问题。
OpenMP中各个线程的变量是公有还是私有是依据OpenMP自身的规则和相关的数据子句而定，而不是依据操作系统线程或进程上的变量特性而定的。

6.1共享与私有化

shared子句
shared子句用来声明一个或多个变量是共享变量。用法：shared(list)
default子句
default子句允许用户控制并行域中变量的共享属性。用法：default(shared | none)
使用shared时，默认情况下，传入并行域内的同名变量被当做共享变量来处理，不会产生线程私有副本。
如果使用none作为参数，除了那些有明确定义的，线程中用到的变量都必须显式指定为是共享的还是私有的。
private子句
private子句将一个或多个变量声明为线程私有变量，变量声明成私有变量后，指定每个线程都有它自己的变量私有副本，其他线程无法访问私有副本。即使在并行域外有同名的共享变量，共享变量在并行域内不起任何作用，并且并行域内不会操作到外面的共享变量。
firstprivate子句
firstprivate子句使并行域或任务分担开始执行时，私有变量通过主线程中的变量初始化
lastprivate子句
for循环：最后一次循环迭代中的值给对应的共享变量；如果是sections构造，最后一个section语句中的值赋给对应的共享变量。
flush
确保同步时程序被正确写入，flush指令将列表中的变量执行flush操作，直到所有变量都已完成相关操作后才返回。用法：flush(list)

6.2线程专有数据

threadprivate子句
threadprivate子句用来指定全局的对象被各个线程复制了一个专有数据，即各个线程具有各自私有、线程范围内的全局对象。用法：#pragma omp threadprivate(list) new-line
copyin子句
copyin子句用来将主线程中threadprivate变量的值复制到执行并行域的各个线程的threadprivate变量中，便于所有线程访问主线程中的变量值。用法：copyin(list)。copyin中的参数必须被声明成threadprivate的，对于类类型的变量，必须带有明确的拷贝赋值操作符。
规约操作
reduction子句用来对一个或多个参数条目指定一个操作符，每个线程将创建参数条目的一个私有拷贝，在并行域或任务分担域的结束处，将用私有拷贝的值通过指定的运行符运算，原始的参数条目被运算结果的值更新。用法：reduction(operator:list)

你可能感兴趣的:(高性能计算,openmp)

在服务器计算节点中使用 jupyter Lab ranshan567 程序人生
JupyterLab是一个基于网页的交互式开发环境,用于科学计算、数据分析和机器学.jupyterlab是jupyternotebook的下一代产品,集成了更多功能,使用起来更方便.在进行数据分析及可视化时，个人电脑不能满足大数据的分析需求，就需要用到高性能计算机集群资源，然而计算机集群的计算节点往往没有联网功能，所以在计算机集群中使用jupyterLab需要进行一些配置。具体的步骤如下：
Visual Studio（VS）中使用OpenMP 我叫柳云烟 c++visual studio 算法
一、OpenMP简介OpenMP是由OpenMPArchitectureReviewBoard牵头提出的，并已被广泛接受，用于共享内存并行系统的多处理器程序设计的一套指导性编译处理方案。它支持的编程语言包括C、C++和Fortran，支持的编译器包括SunCompiler、GNUCompiler和IntelCompiler等。二、VS中启用OpenMP项目配置：打开你的VS项目，找到“项目属性”。
windows C++-并行编程-将使用缩减变量的 OpenMP 循环转换为使用并发运行时 sului c++开发语言
此示例介绍如何将使用reduction子句的OpenMPparallelforloop转换为使用并发运行时。OpenMPreduction子句允许指定一个或多个线程专用变量，这些变量受并行区域末尾的缩减操作的约束。OpenMP预定义一组缩减运算符。每个减量变量必须是标量（例如int、long和float）。OpenMP还定义了一些限制，说明如何在并行区域中使用缩减变量。并行模式库(PPL)提供co
如何搭建一个渲染农场炫云云渲染渲染农场渲染解决方案
在影视特效、动画制作、建筑设计等领域，渲染农场作为高性能计算集群的应用，扮演着至关重要的角色。它通过将大量的渲染任务分配到多个计算节点上并行处理，极大地提升了渲染效率，缩短了项目周期。搭建一个渲染农场是一个复杂的事情，要考虑很多因素，本文将详细介绍如何搭建一个基本的渲染农场，包括前期规划、硬件选择、软件配置、网络设置、运维管理等方面。一、前期规划与需求分析1.明确渲染需求，在搭建渲染农场之前，首先
英伟达A100算力卡性能及应用算力资源比较多算力英伟达大模型人工智能 gpu算力语言模型大数据推荐算法
英伟达A100是一款高性能计算卡，基于英伟达Ampere架构，专为数据中心和高性能计算领域设计。以下是关于A100的性能参数及应用的详细介绍：性能参数架构与制程：架构：Ampere制程：7纳米核心与频率：CUDA核心数：6912个Tensor核心数：432个Boost时钟频率：1.41GHz性能：FP32性能：19.5TFLOPSFP64性能：9.7TFLOPSTensor性能：624.6TFLO
2024国外类脑智能企业汇总细节的温柔 OpenSNN推文人工智能
Intel官网:Intel:https://www.intel.com企业介绍:Intel是全球领先的半导体公司，致力于开发高性能计算技术。产品及介绍:HalaPoint:这是世界上最大的类脑智能系统，利用Intel的Loihi2处理器，支持高达20千万亿次操作每秒（petaops），显著提高AI工作负载的效率和可持续性，应用于科学和工程问题解决、物流、智能城市基础设施管理和大型语言模型（LLM）
Solarflare内核旁路技术深度解析 FIN技术铺服务器网络金融
网络性能的优化对于各种应用场景来说至关重要。尤其对于那些对延迟和吞吐量要求极高的领域，如金融交易和高性能计算，传统的网络处理模式往往成为瓶颈。而Solarflare的内核旁路技术，则以其独特的创新方式，为这些场景带来了革命性的改变。本文将介绍Solarflare内核旁路技术的原理、应用场景和优势，及其在现实中的应用价值。一、Solarflare内核旁路技术原理Solarflare内核旁路技术是一种
【笔试】03 yogurt=b 笔试记录数据库数据结构
FLOPSFLOPS是FloatingPointOperationsPerSecond的缩写，意为每秒浮点运算次数。它是衡量计算机性能的指标，特别是用于衡量计算机每秒能够执行多少浮点运算。在高性能计算领域，FLOPS被广泛用来评估超级计算机、CPU、GPU和其他处理器的计算能力。FLOPS数值越高，计算机执行涉及浮点数的计算能力越强。SQL子查询可以用在FROM子句的数据源SELECT*FROM(
布隆过滤器：大数据的高效守门员（在 Spring Boot 项目中实现布隆过滤器）无理 Java #Java spring boot 后端 java 布隆过滤器面试
文章目录手写SpringBoot启动器：实现布隆过滤器布隆过滤器基本概念布隆过滤器原理应用场景SpringBoot实现示例添加依赖示例代码解析总结手写SpringBoot启动器：实现布隆过滤器在大数据和高性能计算领域，布隆过滤器（BloomFilter）作为一种概率型数据结构，以其独特的空间效率和快速查询能力脱颖而出。它能够在允许一定误报率的前提下，大幅减少存储需求，特别适合于处理海量数据集中的元
GPU算力租用平台推荐 hong161688 gpu算力
在当前快速发展的AI和深度学习领域，GPU算力租用平台成为了研究者、开发者及企业不可或缺的工具。这些平台提供了灵活、高效、可扩展的GPU资源，帮助用户解决计算资源不足的问题，加速模型训练、推理及高性能计算等任务。以下是对几个主流GPU算力租用平台的详细推荐，旨在为用户提供全面的选择和参考。一、国内GPU算力租用平台1.阿里云（AlibabaCloud）平台概述：阿里云作为中国领先的云计算服务提供商
c++调用python和numpy混合编程 AIVoyager c++python c++python numpy
目录1.cmake配置2.python脚本3.c++头文件初始化4.c++调用python中的函数，实现功能参考在现代软件开发中，跨语言编程和混合编程的需求日益增长。C++作为一种高效、强大的编程语言，广泛应用于底层开发、游戏引擎、高性能计算等领域。而Python则因其简洁的语法、丰富的库和易于学习的特性，在数据科学、机器学习、Web开发等领域占据重要地位。NumPy是Python中一个用于数值计
Python，pip安装模块提示模块无法卸载导致安装失败，which files belong to it which would lead to only a partial uninstall. 飞天小女警出击 python pip 开发语言
问题描述：pip安装模块的时候，模块无法安装成功，提示有模块无法卸载这次是tbb模块无法卸载，之前遇到过wrapt、setuptools、request、反正同样的报错无论什么报错，都可以通过这个方案解决Installingcollectedpackages:tbb,intel-openmp,typing-extensions,mkl,torchAttemptinguninstall:tbbFou
国货之光|暴雨机推出面向大模型训练的AI服务器 BAOYUCompany 人工智能服务器运维
当前，“百模大战”带来了算力需求的爆发，尤其是以ChatGPT为代表的多模态AI大模型，‌其参数规模和训练数据量均达到了前所未有的规模。‌GPT-3.5、‌GPT-4等模型的参数规模突破了万亿级别，‌训练数据量达到了TB级别，‌这使得大模型训练成为了一个计算密集型的任务，对算力的需求极高。‌近日，暴雨重磅推出基于安全架构的训练型AI服务器envadio，适用于大模型训练、高性能计算、数据分析等多种
高性能计算（HPC）与超级计算给生活加糖！科技
1.引言随着科技的飞速发展，计算需求在各个领域中不断增加。高性能计算和超级计算成为了解决复杂科学问题、处理大规模数据的关键工具。无论是在气象模拟、基因组研究、物理模拟，还是在金融分析和人工智能训练中，HPC和超级计算都发挥着至关重要的作用。2.高性能计算（HPC）概述高性能计算通常是指利用并行处理的方式，使用多个处理器同时执行计算任务，以大幅提高计算效率和处理能力。HPC系统通常由多个节点（节点由
GPGPU 朝朝暮暮Quake 其他
1、GPGPU(general-purposegraphicsprocessorunitsarchitecture，通用图像处理器）:是一种利用处理图形任务的图形处理器来计算原本由中央处理器处理的通用计算任务。这些通用计算常常与图形处理没有任何关系。从传统上来说用于处理图形计算，但越来越用于高性能计算、人工智能领域等。由于现代图形处理器强大的并行处理能力和可编程流水线，令流处理器可以处理非图形数据
重磅！RISC-V+OpenHarmony平板电脑发布问界前讯业界资讯
仟江水商业电讯（8月18日北京委托发布）RISC-V作为历史上全球发展速度最快、创新最为活跃的开放指令架构，正在不断拓展高性能计算领域的边界。OpenHarmony是由开放原子开源基金会孵化并运营的开源项目，已成为发展速度最快的智能终端开源操作系统，成为下一代智能终端操作系统根社区。开放RISC-V指令架构结合开源OpenHarmony操作系统，实现了移动终端设备从硬件到软件的全栈开源开放创新。经
黑神话：悟空游戏用的什么服务器？ petaexpress 游戏服务器运维
黑神话：悟空游戏用的什么服务器？《黑神话：悟空》游戏使用的是基于云计算的强大服务器，具体型号和配置未公开。这些服务器在游戏发布初期就表现出极强的处理能力和稳定性，尽管同时在线人数一度突破百万，但整体运行仍然十分稳定。下面将详细介绍相关技术细节和性能表现：1.服务器的基本配置高性能计算：根据Steam平台的记录，《黑神话：悟空》在开售不到一小时内，同时在线玩家数量便突破了100万，峰值达到了140万
OMP: Error #15问题解决方法 WD-ss python
报错信息OMP:Error#15:Initializinglibomp140.x86_64.dll,butfoundlibiomp5md.dllalreadyinitialized.OMP:HintThismeansthatmultiplecopiesoftheOpenMPruntimehavebeenlinkedintotheprogram.Thatisdangerous,sinceitcand
阿里云服务器X86计算、Arm计算、GPU/FPGA/ASIC、弹性裸金属服务器、高性能计算架构区别阿里云最新优惠和活动汇总
在我们选购阿里云服务器的时候，云服务器架构有X86计算、ARM计算、GPU/FPGA/ASIC、弹性裸金属服务器、高性能计算可选，有的用户并不清楚他们之间有何区别，本文主要简单介绍下不同类型的云服务器有何不同，主要特点及适用场景有哪些。云服务器架构选择.png1、x86计算架构x86计算架构的云服务器实例规格有计算型c7、计算型c8i、AMD计算型c8a、通用型g7、性能增强通用型g8ae、内存型
GPU算力租用平台推荐 bigbig猩猩 gpu算力
在探讨GPU算力租用平台时，我们首先需要了解GPU算力在当今科技领域中的重要性。GPU（图形处理单元）不仅在图形渲染方面发挥关键作用，还在深度学习、高性能计算、科学模拟等多个领域展现出强大的计算能力。随着这些领域对算力需求的不断增长，GPU算力租用平台应运而生，为用户提供灵活、高效的计算资源解决方案。以下是一些值得推荐的GPU算力租用平台，它们各具特色，能够满足不同用户的需求。一、国内外知名GPU
大模型开源，让人工智能更普惠智能助手观察大模型开源人工智能大模型
人工智能的发展，离不开大模型支撑。而开源模型的出现，则让更多的企业和开发者能够利用这些模型，来构建出更加智能的应用。那么，什么是大模型呢？大模型顾名思义，指的是规模较大的深度学习模型，通常需要运行在高性能计算机上。这些模型包含了数以亿计的参数，可以处理自然语言处理、图像识别、语音识别等多个领域的任务。一般来说，大型模型的训练需要耗费大量的计算资源和时间。不过，随着云计算的发展和开源社区的成熟，越来
服务器虚拟化和云平台,云平台和服务器虚拟化区别木子Hui 服务器虚拟化和云平台
云平台和服务器虚拟化区别内容精选换一换云硬盘(ElasticVolumeService,EVS)可以为云服务器提供高可靠、高性能、规格丰富并且可弹性扩展的块存储服务，可满足不同场景的业务需求，适用于分布式文件系统、开发测试、数据仓库以及高性能计算等场景。云服务器包括弹性云服务器和裸金属服务器。云硬盘类似PC中的硬盘，需要挂载至云服务器使用，无法单独使用。您可以对已挂载的用户可以为虚拟IP地址绑定一
算法部署优化工程师面试题整理发狂的小花 C/C++面试宝典算法面试性能优化计算机视觉
原文来自【知乎-高性能计算方向面试问题总结】个人简介：一个全栈工程师的升级之路！个人专栏：C/C++面试整理CSDN主页发狂的小花人生秘诀：学习的本质就是极致重复!目录整体情况简介高性能计算基础AI框架知识算法题一些比较零碎的问题推荐参考资料整体情况简介面试中的问题基本上分成以下几类：基础的八股文：C/C++，OS，计算机体系结构等。这一部分略，网上已经有很多总结了。高性能计算基础知识：这一部分是
云聚高性能，论道“新超算” 中国云报人工智能大数据编程语言微软机器学习
点击上方关注我们!业界最具影响力的年度高性能计算盛会——2020CCF全国高性能计算学术年会（CCFHPCCHINA2020）9月28-30日在中原古都郑州通过云端线下线上同步隆重举行。本次大会的主题是“新超算新基建新经济”。CCFHPCCHINA2020由中国计算机学会主办，中国计算机学会高性能计算专业委员会、郑州大学、郑州航空港经济综合实验区共同承办，北京并行科技股份有限公司协办。为期三天的盛
多机多卡运行nccl-tests和channel获取 Pretend ^^ #NCCL NCCL 分布式 mpi 深度学习 ubuntu 网络大模型
nccl-tests环境1.安装nccl2.安装openmpi3.单机测试4.多机测试mpirun多机多进程多节点运行nccl-testschannel获取环境Ubuntu22.04.3LTS(GNU/Linux5.15.0-91-genericx86_64)cuda11.8+cudnn8nccl2.15.1NVIDIAGeForceRTX4090*21.安装nccl#查看cuda版本nvcc-V
cuda。小小娱乐 python
CUDA是由NVIDIA推出的通用并行计算架构，它允许开发人员利用NVIDIA的GPU进行高效的计算。1.高性能计算：CUDA使得GPU能够执行高度并行的计算任务，这对于需要处理大量数据的应用程序来说是非常有用的。GPU拥有成百上千个流处理器，可以同时执行多个计算任务。2.编程框架：CUDA提供了一个编程框架，支持多种编程语言，如C、C++、Fortran、Python等，使得开发者可以使用这些语
day2-理解 linux 云计算 Faith丶信仰 linux 云计算运维
1.解释服务器是什么；服务器是一种高性能计算机，它的主要功能是提供计算服务和资源给其他计算机使用。在网络环境中，服务器扮演着重要的角色，它们可以存储和管理大量的数据，处理网络请求，提供应用程序运行的环境，以及提供文件、邮件、数据库等各种服务。2.解释服务器机房是什么；服务器机房是一个专门设计用于计算机服务器持续运行的封闭空间，通常装有空调以保证其环境稳定。这些机房类似于一个小型数据中心，大小可以从
并行计算工具 MPI 简单教程疯狂的泰码君 MPI 并行计算 MPI
UsingMPIwithC并行程序使用户能够充分利用超级计算集群的多节点结构。消息传递接口(MPI)是一种标准，用于允许集群上的多个不同处理器相互通信。在本教程中，我们将使用英特尔C++编译器、GCC、IntelMPI和OpenMPI用C++创建多处理器“helloworld”程序。本教程假设用户具有Linux终端和C++经验。Setupand“Hello,World”这应该为您的环境准备好编译和
C++从0实现百万并发Reactor服务器(吾爱分享) c++
C++从0实现百万并发Reactor服务器//xia仔ke：百度网盘C++从0实现百万并发的前景与未来发展趋势C++作为一门高效、底层且功能强大的编程语言，一直在系统级开发、游戏引擎、嵌入式系统等领域占据着重要地位。随着互联网和高性能计算的飞速发展，对于并发处理能力的需求日益增强，C++在实现百万并发方面的前景与未来发展趋势备受关注。一、C++实现百万并发的前景性能优势：C++以其接近底层的特性和
国外现代并行计算课程CMU-15-418/15-618: Parallel Computer Architecture and Programming wwxy261 算法
这是与计算物理最相关的CS课程，计算物理方向很容易吃透作为项目写到简历上这部分主要包括多核计算OpenMPSIMD集群计算MPIGPU计算CUDA分布式计算MapReduceSpark互联网主要重视分布式计算，科学研究主要在多核和MPI，但是科学研究很少研究底层，只管应用。GPU在算法工程师领域用得比较多。18645(15spring)HowtoWriteFastCodeECE版的parallel
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。