1.一个SSE寄存器可容纳____个短整型数。
A 2
B 4
C 8
D 16
我的答案:C
2.采用划分子矩阵技术优化矩阵乘法CUDA程序,子矩阵数组变量声明应加___前缀。
A __global__
B __device___
C __shared__
D __private__
我的答案:C
3.起泡排序改为奇偶转置排序,消除了循环步间的数据依赖的原因是____。
A 增大了元素比较距离
B 减小了元素比较距离
C 改为元素两两分组比较
D 消除了元素比较
我的答案:C
4.求解同一个问题的4个并行算法的等效率函数分析结果如下,其中____的可扩展性最优。
A Θ(plogp)
B Θ(p^2)
C Θ(p^2logp)
D Θ(p^3)
我的答案:A
5.为防止编译器不支持OpenMP,应使用____实现OpenMP代码和普通代码的条件编译。
A "#include "
B "#pragma omp parallel"
C "#ifdef _OPENMP"
D "#define _OPENMP"
我的答案:C
6.利用cache line一次读取多个数据字的机制优化程序访存性能,其机理是____。
A 降低了访存延迟
B 隐藏了访存延迟
C 利用了cache空间局部性
D 利用了cache时间局部性 
我的答案:C
7.有大量分支指令的程序不适合下面哪种体系结构上进行并行化?
A SISD
B SIMD
C SPMD
D MIMD
我的答案:B
8.CPU cache大小为32KB,如希望(单精度浮点数)矩阵乘法计算过程中所有数据都驻留cache中,则矩阵大小最大为
A 16*16
B 32*32
C 64*64
D 128*128
我的答案:C
9.pthread_join的第二个参数的作用是____。
A 设置指定线程属性
B 获取指定线程属性
C 向指定线程传递参数
D 获取指定线程函数返回结果
我的答案:D
10.在分布式内存架构编程中,进程间不能____。
A 进行通信
B 进行同步
C 发送和接收消息
D 通过读写变量交换数据
我的答案:D
11.关于OpenMP循环并行程序的编写,下列说法中正确的是____。
A 程序员需要编写线程创建和管理代码
B 程序员需要编写循环划分代码
C 程序员需要编写调度策略代码
D 程序员只需指出对哪个循环进行并行,循环划分和调度策略是什么
我的答案:D
12.在SSE intrinsics程序中双精度浮点数数据类型是____。
A __m128
B __m128f
C __m128d
D __m128i
我的答案:C
13.在使用条件变量之后必须对其进行____。
A 初始化
B 加锁
C 解锁
D 销毁
我的答案:D
14.采用搜索分解设计15数码问题的并行算法,不包含下面哪个步骤____。
A 串行生成一定规模的搜索树
B 当前每个叶结点为根的子树搜索分配给一个处理器
C 发现解的处理器通知其他处理器
D 将所有处理器的结果组合成最终解
我的答案:D
15.静态任务划分相对于动态任务划分的缺点是____。
A 可能导致负载不均
B 通信开销高
C 计算复复杂度高
D 任务粒度粗
我的答案:A
16.OpenMP能实现的是____。
A 避免数据竞争
B 提供任务划分策略
C 确保加速
D 确保降低通信开销
我的答案:B
17.忙等待方法解决竞争条件的思路是____。
A 令CPU一直处于忙碌状态无法产生竞争条件
B 令存在数据依赖的内存操作充分并行
C 强制多线程进入临界区的顺序来将存在数据依赖内存操作串行化
D 以上皆错
我的答案:C
18.矩阵乘法问题更适合使用MPI的____编程模型。
A 阻塞的
B 非阻塞的
C 对等的
D 主从的
我的答案:C
19.采用多核、众核技术提升CPU性能,相对于单核的优势不包括____。
A 架构设计更容易
B 更易突破物理极限
C 能更充分利用现有资源
D 功耗优势明显
编程哪一家比较好

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。