南开23秋学期(高起本:1709-2103、专升本高起专:2003-2103)《并行程序设计》在线作业【标准答案】

作者:佚名 字体:[增加 减小] 来源:互联网 时间:2024-02-20 11:24

23秋学期(高起本:1709-2103、专升本/高起专:2003-2103)《并行程序设计》在线作业-00001 试卷总分:100 得分:100 一、单选题 (共 50 道试题,共 100 分) 1.SSE intrinsics _mm_storeu_ps命令的功能是__
23秋学期(高起本:1709-2103、专升本/高起专:2003-2103)《并行程序设计》在线作业-00001
试卷总分:100  得分:100
一、单选题 (共 50 道试题,共 100 分)
1.SSE intrinsics _mm_storeu_ps命令的功能是____。
A.对齐标量存单精度浮点数
B.未对齐向量存单精度浮点数
C.对齐标量存双精度浮点数
D.未对齐向量存双精度浮点数
 
2.OpenMP相对于Pthread的优点是____。
A.功能更强大
B.可达更高并发度
C.可降低通信开销
D.由编译器生成线程创建和管理代码,更简单
 
3.关于OpenMP循环并行程序的编写,下列说法中正确的是____。
A.程序员需要编写线程创建和管理代码
B.程序员需要编写循环划分代码
C.程序员需要编写调度策略代码
D.程序员只需指出对哪个循环进行并行,循环划分和调度策略是什么
 
4.OpenMP是___架构下的一种编程工具。
A.SIMD
B.MISD
C.共享内存
D.分布式内存
 
5.CUDA程序中不包括____。
A.host代码
B.device代码
C.kernel
D.图形渲染代码
 
6.pthread_rwlock_rdlock是对读写锁进行____操作。
A.加锁
B.解锁
C.加读琐
D.加写锁
 
7.将寄存器设置为4个给定单精度浮点数的SSE intrinsics指令是____。
A._mm_set_ps
B._mm_set1_ss
C._mm_setzero_ss
D._mm_setzero_ps
 
8.MPI中表示虚拟进程的____。
A.MPI_ANY_SOURCE
B.MPI_PROC_NULL
C.MPI_PROC_ANY
D.MPI_ANY_TAG
 
9.采用搜索分解设计15数码问题的并行算法,不包含下面哪个步骤____。
A.串行生成一定规模的搜索树
B.当前每个叶结点为根的子树搜索分配给一个处理器
C.发现解的处理器通知其他处理器
D.将所有处理器的结果组合成最终解
 
10.如果运算对象是独立无关的变量,则在向量运算之前需____。
A.将变量拷贝到连续区域
B.将变量地址拷贝到连续区域
C.将变量逐个传输到向量寄存器
D.以上皆错
 
11.在下列应用中,SIMD最不适合____。
A.图像处理
B.音频处理
C.科学计算
D.数据库查询
 
12.任务依赖图中权重之和最长的路径称为____。
A.最大任务
B.关键路径
C.平均并发度
D.最短路径
 
13.SSE的shuffle指令的8位二进制整数参数被划分为4个2位二进制整数imm8[0:3],若imm8[2]=j则表示___。
A.将第一个源寄存器的第j个元素放在目标寄存器位置2
B.将第二个源寄存器的第j个元素放在目标寄存器位置2
C.将第一个源寄存器的第2个元素放在目标寄存器位置2
D.将第二个源寄存器的第2个元素放在目标寄存器位置2
 
14.在下面问题中,SIMD并行更适合____。
A.搜索
B.排序
C.矩阵乘法
D.构建二叉排序树
 
15.两个MPI进程A和B相互收发消息,关于死锁下面说法正确的是____。
A.均为先向对方发再从对方收不会产生死锁
B.均为先向对方发再从对方收可能产生死锁
C.一个先发后收另一个先收后发必然死锁
D.一个先发后收另一个先收后发不会产生死锁
 
16.编写矩阵乘法的AVX程序,若矩阵元素为双精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。
A.2
B.4
C.8
D.16
 
17.静态线程编程模式的缺点是____。
A.线程管理开销高
B.系统资源利用率低
C.线程负载不均
D.线程通信开销高
 
18.float a[64]; for (i=0; i<60; i+=4) Va = a[i+2:i+5]; 系统向量化访存是按16字节对齐的,则此向量化程序每个循环步产生____个内存访问操作。
A.1
B.2
C.3
D.4
 
19.CUDA共享内存是由____共享。
A.Grid中所有线程
B.一个Block中所有线程
C.一个Warp中所有线程
D.GPU中所有线程
 
20.一个Neon寄存器最多存放____个双精度浮点数。
A.2
B.4
C.8
D.16
 
21.对于粗粒度任务划分和细粒度任务划分,下面说法错误的是____。
A.细粒度划分可达到更高的并发度,应选择它
B.细粒度划分会导致更大通信开销
C.粗粒度划分更不容易达到负载均衡
D.粗粒度划分会产生更多线程间交互
 
22.执行pthread_rwlock_wrlock时,____的情况下加锁成功。
A.没有线程已为线程上锁
B.已有一个线程上了读锁
C.已有一个线程上了写锁
D.已有多个线程上了读锁
 
23.Pthread是_____线程接口标准。
A.Linux
B.POSIX
C.Windows
D.IOS
 
24.OpenMP的缺点不包括____。
A.常见并行结构的表达并不总可行
B.局部性处理不易
C.不易编写多核单核通用程序
D.性能控制不易
 
25.对于向量化,以下说法错误的是____。
A.总会有打包/解包开销
B.若运算对象连续存储,可消除打包开销
C.若运算结果连续存储,可消除解包开销
D.打包/解包开销由数据存储决定
 
26.OpenMP循环并行指令是____。
A.omp parallel
B.omp single
C.omp parallel for
D.omp master
 
27.指定线程间划分循环策略的OpenMP子句是____。
A.shared
B.reduction
C.schedule
D.nowait
 
28.两个矩阵相乘,若矩阵规模大于cache大小,则优化访存的可行方法是____。
A.先将两个矩阵读入cache再进行乘法
B.先转置第一个矩阵再进行乘法
C.先转置第二个矩阵再进行乘法
D.以上皆错
 
29.信号量是一种____同步机制。
A.一元状态
B.二元状态
C.多元状态
D.以上皆错
 
30.天河1号、天河2号、神威.太湖之光总体上都是____架构
A.单核
B.多核
C.众核
D.集群
 
31.线程主动退出不能采用____。
A.return语句
B.pthread_exit函数
C.pthread_cancel函数
D.exit调用
 
32.一个AVX寄存器最多存放____个双精度浮点数。
A.2
B.4
C.8
D.16
 
33.定期评选全球计算能力最强的超级计算机的国际组织是____。
A.top500
B.green500
C.graph500
D.super500
 
34.pthread_create函数中设置一个参数为“线程函数参数”的原因是____。
A.它调用线程函数时可直接传递,性能更优
B.它需要预处理之后传递给线程函数
C.线程函数不是用户程序调用,只能采用这种方式由系统代为传递参数
D.没有特别用意
 
35.____执行pthread_sem_post操作,当前线程会唤醒阻塞线程。
A.当信号量已加锁时
B.当信号量为0时
C.当信号量已超过阈值时
D.当信号量已销毁时
 
36.我们不能通过____指定OpenMP循环划分策略。
A.使用编译指示
B.设置环境变量
C.调用库函数
D.采用默认设置
 
37.动态任务划分相对于静态任务划分的缺点是____。
A.可能导致负载不均
B.通信开销高
C.任务粒度粗
D.计算复杂度高
 
38.在SSE intrinsics程序中整数数据类型是____。
A.__m128
B.__m128f
C.__m128d
D.__m128i
 
39.对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,就计算出了结果矩阵的一个元素,这种说法是____。
A.正确的
B.错误的
 
40.OpenMP中指定多线程中只有主线程执行代码块的指令是____。
A.omp single
B.omp master
C.omp slave
D.omp parallel
 
41.当处理器数量不变时,随着问题规模增大,效率增大对____成立。
A.部分并行算法
B.所有并行算法
C.所有并行算法都不
D.以上皆错
 
42.一个Neon寄存器最多存放____个整型数。
A.2
B.4
C.8
D.16
 
43.两个n*n的矩阵相乘,将所有n^3个乘法计算划分给不同进程,再将对应某行某列的n个乘法结果累加得到结果矩阵对应元素,这是一种划分____的数据并行。
A.输入数据
B.中间结果
C.输出数据
D.临时数据
 
44.任务依赖图的平均并发度的定义是____。
A.顶点权重之和
B.顶点数
C.各层平均顶点数
D.顶点权重之和/关键路径长度
 
45.多线程是____架构下的并行模式。
A.MIMD
B.共享内存
C.分布式内存
D.分离式地址空间
 
46.在应用中____的情况下读写锁相对于互斥量的性能优势更明显。
A.读写操作较为平均
B.读操作远远多于写操作
C.写操作远远多于读操作
D.以上皆错
 
47.关于消息传递编程的特点,以下说法正确的是____。
A.与共享内存一样有竞争条件
B.编程简单
C.需程序员考虑局部性
D.无需考虑进程间通信
 
48.采用MPI主从模型解决矩阵每行排序问题,主进程每次向一个从进程发送10行作为一个任务相对于每次发送1行的缺点是____。
A.更不利于负载均衡
B.增大了通信开销
C.提高了计算次数
D.增加了从进程空闲
 
49.采用多核、众核技术提升CPU性能,相对于单核的优势不包括____。
A.架构设计更容易
B.更易突破物理极限
C.能更充分利用现有资源
D.功耗优势明显
 
50.关于OpenMP循环并行程序的编写,下列说法中不正确的是____。
A.程序员无需编写线程创建和管理代码
B.程序员无需编写循环划分代码
C.程序员需指出哪个循环应并行
D.程序员需编写线程同步代码
 
Tag:  

作业咨询:
点击这里给我发消息

论文咨询:
点击这里给我发消息

合作加盟:
点击这里给我发消息

服务时间:
8:30-24:00(工作日)