LU分解和Laplace算法在GPU上的实现 - Details

初始密码提示：姓名拼音首字母【第一个汉字的首字母大写，其他首字母小写】+身份证号（或护照）后六位【包含字母的，字母大写】

手机验证码登录找回密码

author：

陈颖 (陈颖.) ^[1] | 林锦贤 (林锦贤.) ^[2] (Scholars：林锦贤) | 吕暾 (吕暾.) ^[3]

Indexed by：

CQVIP PKU CSCD

Abstract：

随着图形处理器(GPU)性能的大幅度提升以及可编程性的发展,已经有许多算法成功地移植到GPU上.LU分解和Laplace算法是科学计算的核心,但计算量往往很大,由此提出了一种在GPU上加速计算的方法.使用Nvidia公司的统一计算设备架构(CUDA)编程模型实现这两个算法,通过对CPU与GPU进行任务划分,同时利用GPU上的共享存储器提高数据访问速度,对GPU程序进行分支消除,并且对矩阵分段计算以达到加速计算的目的.实验结果表明,随着矩阵规模的增大,基于GPU的算法相对于基于CPU的算法具有良好的加速效果.

Keyword：

Laplace算法 LU分解共享存储器图形处理器统一计算设备架构

Community：

[ 1 ] [陈颖]福州大学
[ 2 ] [林锦贤]福州大学
[ 3 ] [吕暾]福州大学

Reprint 's Address：

Email：

Show more details

Version：

LU分解和Laplace算法在GPU上的实现
2011，计算机应用
LU分解和Laplace算法在GPU上的实现
2011，计算机应用

Related Keywords：

小型分布式控制系统中共享存储器的使用
2009，计算机应用
可扩展的分布式共享存储器(DSM)模型
2002，中国计算机学会网络与数据通信学术会议
分布式共享存储器(DSM)的可扩展模型设计
2003，福建电脑
GIB(200)高分辨率彩色图形图象显示控制板的研制
1997，电子器件

Source ：

计算机应用

ISSN： 1001-9081

CN： 51-1307/TP

Year： 2011

Issue： 3

Volume： 31

Page： 851-855

Cited Count：

WoS CC Cited Count：

SCOPUS Cited Count：

ESI Highly Cited Papers on the List： 0 Unfold All

WanFang Cited Count： -1

Chinese Cited Count：

30 Days PV： 3

Affiliated Colleges：

计算机与大数据学院、软件学院本学院/部未明确归属的数据

Get Fulltext

DOI Library Discovery Baidu Scholar Search WF

Type
Departments

All Years Choose Year From to