南开23春学期(高起本:1709-2103、专升本高起专:1909-2103)《并行程序设计》在线作业【标准答案】

作者:佚名 字体:[增加 减小] 来源:互联网 时间:2023-06-15 10:13

23春学期(高起本:1709-2103、专升本/高起专:1903-2103)《并行程序设计》在线作业-00001 试卷总分:100 得分:100 一、单选题 (共 50 道试题,共 100 分) 1.当问题规模不变时,随着处理器数量增大
23春学期(高起本:1709-2103、专升本/高起专:1903-2103)《并行程序设计》在线作业-00001
试卷总分:100  得分:100
一、单选题 (共 50 道试题,共 100 分)
1.当问题规模不变时,随着处理器数量增大,效率降低的性质对____成立。
A.部分并行算法
B.代价最优并行算法
C.所有并行算法
D.以上皆错
 
2.Pthread不支持____。
A.创建并发执行线程
B.同步
C.非显式通信
D.自动并行化
 
3.采用MPI主从模型解决矩阵每行排序问题,主进程不断向每个从进程发送任务、接收结果,则它从从进程接收结果时,以下哪种方式更好____。
A.按编号顺序依次从从进程接收结果
B.按编号逆序依次从从进程接收结果
C.按编号顺序、逆序交替从从进程接收结果
D.使用MPI_ANY_SOURCE和MPI_ANY_TAG
 
4.在SSE intrinsics程序中整数数据类型是____。
A.__m128
B.__m128f
C.__m128d
D.__m128i
 
5.为持续提高CPU性能,以下说法正确的是____。
A.只需不断增加器件集成密度
B.只需不断提高频率
C.必须利用并行技术
D.只需提高功耗
 
6.超算领域软件应用的最高奖项是____。
A.图灵奖
B.菲尔茨奖
C.诺贝尔奖
D.戈登?贝尔奖
 
7.MPI_Send和MPI_recv是通过____区分消息。
A.端口号
B.消息名
C.消息标签
D.消息哈希
 
8.主线程通过____函数获取特定线程的返回结果。
A.pthread_create
B.pthread_join
C.pthread_cancel
D.pthread_get
 
9.CUDA内存层次中不包括____。
A.全局内存
B.共享内存
C.分布式内存
D.寄存器
 
10.一个程序用pthread_create创建了4个线程,此时系统中属于这个程序的共有____线程。
A.4
B.5
C.6
D.7
 
11.pthread_rwlock_rdlock是对读写锁进行____操作。
A.加锁
B.解锁
C.加读琐
D.加写锁
 
12.在使用信号量之前必须对其进行____。
A.初始化
B.加锁
C.加1
D.销毁
 
13.SSE intrinsics _mm_store_ss命令的功能是____。
A.对齐向量存单精度浮点数
B.未对齐向量存双精度浮点数
C.对齐标量存单精度浮点数
D.未对齐标量存双精度浮点数
 
14.并行计算还主要用于国防、工程研究等领域,这种说法是____。
A.正确的
B.错误的
 
15.天河1号、天河2号、神威.太湖之光总体上都是____架构
A.单核
B.多核
C.众核
D.集群
 
16.在矩阵乘法的串行程序中,对____部分进行向量化收益最大。
A.初始化
B.第二个矩阵转置循环
C.矩阵元素乘—加计算的循环
D.结果输出
 
17.关于消息传递编程的特点,以下说法正确的是____。
A.与共享内存一样有竞争条件
B.编程简单
C.需程序员考虑局部性
D.无需考虑进程间通信
 
18.全球500强超算在CPU、网络等硬件上越来越体现出采用____的趋势。
A.特殊硬件
B.通用硬件
C.非公开硬件
D.廉价硬件
 
19.下列哪门课程不是并行程序设计的先导课?
A.计算机概论
B.高级语言程序设计
C.计算机体系结构
D.数据库系统
 
20.Flynn分类法中,下面哪种体系结构非常适合向量/矩阵计算的并行化?
A.SISD
B.SIMD
C.MISD
D.MIMD
 
21.起泡排序改为奇偶转置排序,消除了循环步间的数据依赖的原因是____。
A.增大了元素比较距离
B.减小了元素比较距离
C.改为元素两两分组比较
D.消除了元素比较
 
22.并行算法运行时间是指____。
A.最快进程花费时间
B.所有进程平均花费时间
C.所有进程花费总时间
D.最慢进程花费时间
 
23.float a[64]; for (i=0; i<60; i+=4) Va = a[i+2:i+5]; 系统向量化访存是按16字节对齐的,则此向量化程序每个循环步产生____个内存访问操作。
A.1
B.2
C.3
D.4
 
24.编译器编译OpenMP并行循环时,会自动生成一些代码,其中不包括____。
A.创建和管理线程代码
B.循环划分给线程的代码
C.找出数据依赖的代码
D.线程同步的代码
 
25.当前CPU性能提升已从依赖时钟频率提升转为更多依赖____。
A.多核和众核技术
B.突破物理局限
C.改善散热
D.采用新材料
 
26.n个节点的线性阵列中,节点最远通信距离为____。
A.1
B.O(logn)
C.O(sqrt(n))
D.O(n)
 
27.SIMD架构中,_____。
A.唯一控制单元控制所有计算单元
B.每个计算单元独有控制单元
C.一组计算单元共享一个控制单元
D.以上皆错
 
28.以下超级计算机中,____是SIMD架构。
A.CRAY-1
B.天河1A
C.天河2号
D.神威.太湖之光
 
29.使用____无法直接实现“主线程等待4个从线程完成任务”。
A.1个信号量
B.障碍
C.1个互斥量
D.4个互斥量
 
30.适合进行SIMD并行化的串行程序特点不包括____。
A.大数据对象
B.数据项连续存储
C.流式计算
D.算术计算密集
 
31.OpenMP的缺点不包括____。
A.常见并行结构的表达并不总可行
B.局部性处理不易
C.不易编写多核单核通用程序
D.性能控制不易
 
32.多对多广播/归约高效算法基于____。
A.递归思想
B.流水线思想
C.分治思想
D.贪心思想
 
33.编写矩阵乘法的AVX程序,若矩阵元素为单精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。
A.2
B.4
C.8
D.16
 
34.对于障碍同步机制,以下说法错误的是____。
A.SIMD架构无需障碍机制
B.是一种群体同步机制
C.可用信号量实现
D.无法用其他同步机制实现
 
35.互斥量mutex机制,在任何时刻____进入它保护的区域。
A.允许任意数量任意类型的线程
B.允许一个读线程任意个写线程
C.允许一个写线程任意个读线程
D.只允许一个线程
 
36.多线程是____架构下的并行模式。
A.MIMD
B.共享内存
C.分布式内存
D.分离式地址空间
 
37.一个AVX寄存器最多存放____个双精度浮点数。
A.2
B.4
C.8
D.16
 
38.在下列应用中,SIMD最不适合____。
A.图像处理
B.音频处理
C.科学计算
D.数据库查询
 
39.AVX是____平台的SIMD架构。
A.x86
B.POWER
C.SPARC
D.ARM
 
40.记并行时间为T,串行时间为T',处理器数量为p,并行代价的定义是____。
A.pT
B.T'+T
C.p(T'-T)
D.pT-T'
 
41.在共享内存架构编程中,线程间不能通过____进行通信
A.全局变量
B.局部变量
C.静态变量
D.全局堆中变量
 
42.以下哪种数据集合不能用一个MPI的自定义数据类型表示____。
A.对角矩阵元素
B.矩阵中为0元素
C.矩阵中一列元素
D.上三角矩阵中元素
 
43.下列指令集中___不是SIMD指令集。
A.SSE
B.Neon
C.AVX
D.EMT64
 
44.循环需满足特定条件才能进行OpenMP并行化,下列哪个条件是错误的____。
A.循环变量应为带符号整数
B.终止检测必须是与循环不变量的比较
C.循环变量每步递增/递减一个循环不变量
D.循环体无进/出控制流
 
45.在编写使用n个线程进行n个数求和的OpenMP的程序时采用临界区技术,则多线程版本____串行版本。
A.肯定快于
B.肯定慢于
C.可能快于
D.以上皆错
 
46.主线程创建了4个线程,它们打印各自的线程号(0-3),未使用任何同步,则两次执行程序的输出顺序____。
A.必然都是0 1 2 3
B.必然不同
C.可能不同
D.必然相同但不一定是0 1 2 3
 
47.从线程检查主线程是否要求它退出应采用____。
A.pthread_join
B.pthread_cancel
C.pthread_testcancel
D.pthread_exit
 
48.采用多核、众核技术提升CPU性能,相对于单核的优势不包括____。
A.架构设计更容易
B.更易突破物理极限
C.能更充分利用现有资源
D.功耗优势明显
 
49.OpenMP编译指示的作用范围是____。
A.其后一个语句
B.其后连续语句
C.其后直到函数结束
D.整个函数
 
50.执行pthread_rwlock_rdlock时,____的情况下线程进入阻塞。
A.已有一个线程上了读锁
B.已有一个线程上了写锁
C.已有多个线程上了读锁
D.已有多个线程上了写锁
 

Tag:  

作业咨询:
点击这里给我发消息

论文咨询:
点击这里给我发消息

合作加盟:
点击这里给我发消息

服务时间:
8:30-24:00(工作日)