南开23秋学期（高起本：1709-2103、专升本高起专：2003-2103）《并行程序设计》在线作业【标准答案】

作者：佚名字体：[增加减小] 来源：互联网时间：2024-02-20 11:24

23秋学期（高起本：1709-2103、专升本/高起专：2003-2103）《并行程序设计》在线作业-00001 试卷总分:100 得分:100 一、单选题 (共 50 道试题,共 100 分) 1.SSE intrinsics _mm_storeu_ps命令的功能是__

23秋学期（高起本：1709-2103、专升本/高起专：2003-2103）《并行程序设计》在线作业-00001

试卷总分:100 得分:100

一、单选题 (共 50 道试题,共 100 分)

1.SSE intrinsics _mm_storeu_ps命令的功能是____。

A.对齐标量存单精度浮点数

B.未对齐向量存单精度浮点数

C.对齐标量存双精度浮点数

D.未对齐向量存双精度浮点数

2.OpenMP相对于Pthread的优点是____。

A.功能更强大

B.可达更高并发度

C.可降低通信开销

D.由编译器生成线程创建和管理代码，更简单

3.关于OpenMP循环并行程序的编写,下列说法中正确的是____。

A.程序员需要编写线程创建和管理代码

B.程序员需要编写循环划分代码

C.程序员需要编写调度策略代码

D.程序员只需指出对哪个循环进行并行，循环划分和调度策略是什么

4.OpenMP是___架构下的一种编程工具。

A.SIMD

B.MISD

C.共享内存

D.分布式内存

5.CUDA程序中不包括____。

A.host代码

B.device代码

C.kernel

D.图形渲染代码

6.pthread_rwlock_rdlock是对读写锁进行____操作。

A.加锁

B.解锁

C.加读琐

D.加写锁

7.将寄存器设置为4个给定单精度浮点数的SSE intrinsics指令是____。

A._mm_set_ps

B._mm_set1_ss

C._mm_setzero_ss

D._mm_setzero_ps

8.MPI中表示虚拟进程的____。

A.MPI_ANY_SOURCE

B.MPI_PROC_NULL

C.MPI_PROC_ANY

D.MPI_ANY_TAG

9.采用搜索分解设计15数码问题的并行算法,不包含下面哪个步骤____。

A.串行生成一定规模的搜索树

B.当前每个叶结点为根的子树搜索分配给一个处理器

C.发现解的处理器通知其他处理器

D.将所有处理器的结果组合成最终解

10.如果运算对象是独立无关的变量,则在向量运算之前需____。

A.将变量拷贝到连续区域

B.将变量地址拷贝到连续区域

C.将变量逐个传输到向量寄存器

D.以上皆错

11.在下列应用中,SIMD最不适合____。

A.图像处理

B.音频处理

C.科学计算

D.数据库查询

12.任务依赖图中权重之和最长的路径称为____。

A.最大任务

B.关键路径

C.平均并发度

D.最短路径

13.SSE的shuffle指令的8位二进制整数参数被划分为4个2位二进制整数imm8[0:3],若imm8[2]=j则表示___。

A.将第一个源寄存器的第j个元素放在目标寄存器位置2

B.将第二个源寄存器的第j个元素放在目标寄存器位置2

C.将第一个源寄存器的第2个元素放在目标寄存器位置2

D.将第二个源寄存器的第2个元素放在目标寄存器位置2

14.在下面问题中,SIMD并行更适合____。

A.搜索

B.排序

C.矩阵乘法

D.构建二叉排序树

15.两个MPI进程A和B相互收发消息,关于死锁下面说法正确的是____。

A.均为先向对方发再从对方收不会产生死锁

B.均为先向对方发再从对方收可能产生死锁

C.一个先发后收另一个先收后发必然死锁

D.一个先发后收另一个先收后发不会产生死锁

16.编写矩阵乘法的AVX程序,若矩阵元素为双精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。

A.2

B.4

C.8

D.16

17.静态线程编程模式的缺点是____。

A.线程管理开销高

B.系统资源利用率低

C.线程负载不均

D.线程通信开销高

18.float a[64]; for (i=0; i<60; i+=4) Va = a[i+2:i+5]; 系统向量化访存是按16字节对齐的,则此向量化程序每个循环步产生____个内存访问操作。

A.1

B.2

C.3

D.4

19.CUDA共享内存是由____共享。

A.Grid中所有线程

B.一个Block中所有线程

C.一个Warp中所有线程

D.GPU中所有线程

20.一个Neon寄存器最多存放____个双精度浮点数。

A.2

B.4

C.8

D.16

21.对于粗粒度任务划分和细粒度任务划分,下面说法错误的是____。

A.细粒度划分可达到更高的并发度，应选择它

B.细粒度划分会导致更大通信开销

C.粗粒度划分更不容易达到负载均衡

D.粗粒度划分会产生更多线程间交互

22.执行pthread_rwlock_wrlock时,____的情况下加锁成功。

A.没有线程已为线程上锁

B.已有一个线程上了读锁

C.已有一个线程上了写锁

D.已有多个线程上了读锁

23.Pthread是_____线程接口标准。

A.Linux

B.POSIX

C.Windows

D.IOS

24.OpenMP的缺点不包括____。

A.常见并行结构的表达并不总可行

B.局部性处理不易

C.不易编写多核单核通用程序

D.性能控制不易

25.对于向量化,以下说法错误的是____。

A.总会有打包/解包开销

B.若运算对象连续存储，可消除打包开销

C.若运算结果连续存储，可消除解包开销

D.打包/解包开销由数据存储决定

26.OpenMP循环并行指令是____。

A.omp parallel

B.omp single

C.omp parallel for

D.omp master

27.指定线程间划分循环策略的OpenMP子句是____。

A.shared

B.reduction

C.schedule

D.nowait

28.两个矩阵相乘,若矩阵规模大于cache大小,则优化访存的可行方法是____。

A.先将两个矩阵读入cache再进行乘法

B.先转置第一个矩阵再进行乘法

C.先转置第二个矩阵再进行乘法

D.以上皆错

29.信号量是一种____同步机制。

A.一元状态

B.二元状态

C.多元状态

D.以上皆错

30.天河1号、天河2号、神威.太湖之光总体上都是____架构

A.单核

B.多核

C.众核

D.集群

31.线程主动退出不能采用____。

A.return语句

B.pthread_exit函数

C.pthread_cancel函数

D.exit调用

32.一个AVX寄存器最多存放____个双精度浮点数。

A.2

B.4

C.8

D.16

33.定期评选全球计算能力最强的超级计算机的国际组织是____。

A.top500

B.green500

C.graph500

D.super500

34.pthread_create函数中设置一个参数为“线程函数参数”的原因是____。

A.它调用线程函数时可直接传递，性能更优

B.它需要预处理之后传递给线程函数

C.线程函数不是用户程序调用，只能采用这种方式由系统代为传递参数

D.没有特别用意

35.____执行pthread_sem_post操作,当前线程会唤醒阻塞线程。

A.当信号量已加锁时

B.当信号量为0时

C.当信号量已超过阈值时

D.当信号量已销毁时

36.我们不能通过____指定OpenMP循环划分策略。

A.使用编译指示

B.设置环境变量

C.调用库函数

D.采用默认设置

37.动态任务划分相对于静态任务划分的缺点是____。

A.可能导致负载不均

B.通信开销高

C.任务粒度粗

D.计算复杂度高

38.在SSE intrinsics程序中整数数据类型是____。

A.__m128

B.__m128f

C.__m128d

D.__m128i

39.对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,就计算出了结果矩阵的一个元素,这种说法是____。

A.正确的

B.错误的

40.OpenMP中指定多线程中只有主线程执行代码块的指令是____。

A.omp single

B.omp master

C.omp slave

D.omp parallel

41.当处理器数量不变时,随着问题规模增大,效率增大对____成立。

A.部分并行算法

B.所有并行算法

C.所有并行算法都不

D.以上皆错

42.一个Neon寄存器最多存放____个整型数。

A.2

B.4

C.8

D.16

43.两个n*n的矩阵相乘,将所有n^3个乘法计算划分给不同进程,再将对应某行某列的n个乘法结果累加得到结果矩阵对应元素,这是一种划分____的数据并行。

A.输入数据

B.中间结果

C.输出数据

D.临时数据

44.任务依赖图的平均并发度的定义是____。

A.顶点权重之和

B.顶点数

C.各层平均顶点数

D.顶点权重之和/关键路径长度

45.多线程是____架构下的并行模式。

A.MIMD

B.共享内存

C.分布式内存

D.分离式地址空间

46.在应用中____的情况下读写锁相对于互斥量的性能优势更明显。

A.读写操作较为平均

B.读操作远远多于写操作

C.写操作远远多于读操作

D.以上皆错

47.关于消息传递编程的特点,以下说法正确的是____。

A.与共享内存一样有竞争条件

B.编程简单

C.需程序员考虑局部性

D.无需考虑进程间通信

48.采用MPI主从模型解决矩阵每行排序问题,主进程每次向一个从进程发送10行作为一个任务相对于每次发送1行的缺点是____。

A.更不利于负载均衡

B.增大了通信开销

C.提高了计算次数

D.增加了从进程空闲

49.采用多核、众核技术提升CPU性能,相对于单核的优势不包括____。

A.架构设计更容易

B.更易突破物理极限

C.能更充分利用现有资源

D.功耗优势明显

50.关于OpenMP循环并行程序的编写,下列说法中不正确的是____。

A.程序员无需编写线程创建和管理代码

B.程序员无需编写循环划分代码

C.程序员需指出哪个循环应并行

D.程序员需编写线程同步代码

Tag：

南开23秋学期（高起本：1709-2103、专升本高起专：2003-2103）《并行程序设计》在线作业【标准答案】

相关文章

文章分类

大家感兴趣的内容

最近更新的内容