CUDA範例精解

CUDA範例精解

《CUDA範例精解》是2010年10月清華大學出版社出版的圖書,作者是山德爾。

基本介紹

  • 書名:CUDA範例精解
  • 作者:山德爾(JasonSanders)
  • ISBN:9787302239956
  • 出版社清華大學出版社
  • 出版時間:2010年10月1日
  • 開本:16開
內容簡介,作者簡介,圖書目錄,

內容簡介

《CUDA範例精解:通用GPU編程(影印版)》內容簡介:CUDA是設計用於幫助開發並行程式的計算體系結構。通過與廣泛的軟體平台相結合,cuda體系結構使程式設計師可以充分利用圖形處理單元(gpu)的強大能力構建高性能的應用程式。當然,gpu已經在很長時間內用於實現複雜的圖形和遊戲應用程式。現在,cuda將這種極具價值的資源帶給在其他領域內從事應用程式開發的程式設計師,包括科學、工程和財務領域。這些程式設計師完全不需要了解圖形編程的相關知識,而只要能夠採用適當擴展的c語言版本進行編程即可。
《CUDA範例精解:通用GPU編程(影印版)》由cuda軟體平台團隊中的兩位資深成員編寫而成,他們向程式設計師展示了如何使用這種新的技術,並且通過大量可以運行的示例介紹了cuda開發的每個領域。在簡要介紹cuda平台和體系結構以及快速指導cudac之後,本書詳細介紹了與每個關鍵的cuda功能相關的技術,以及如何權衡使用這些功能。通過閱讀本書,您將掌握使用每個cudac擴展的時機以及編寫性能極為優越的cuda軟體的方式。

作者簡介

作者:(美國)山德爾(Jason Sanders) (美國)康洛特(Edward Kandrot)
山德爾(Jason Sanders)是NVIDIA公司CUDA平台團隊中的資深軟體工程師,他協助開發了早期版本的CUDA系統軟體,並且幫助制定了作為異構計算的行業標準的OpenCL 1.0規範。Jason也在ATI Technologies、Apple和Novell擔任相關職務。
康洛特(Edward Kandrot)是NVIDIA公司CUDA算法團隊中的資深軟體工程師,他擁有超過20年的行業經驗,主要為Adobe、Microsoft、Google和Autodesk最佳化代碼性能。

圖書目錄

foreword
preface
acknowledgments
about the authors
1 why cuda ? why now?
1.1 chapter objectives
1.2 the age of parau. el. processing
1.3 the rise of gpu computing
1.4 cuda
1.5 applications of cuda
1.6 chapter review
2 getting started
3.1 chapter objectives
2.2 deve!.opment environment
2.3 chapter review
3 introduction to cuda c
3.1 chapter objectives
3.2 a first program
3.3 querying devices
3.4 using device properties
3.5 chapter review
4 parallel programming in cuda c
4.1 chapter objectives
4.2 cuda para[tel programming
4.3 chapter review
5 thread cooperation
5.1 chapter objectives
5.2 splitting parallel blocks
5.3 shared memory and synchronization
5.4 chapter review
6 constant memory and events
6.1 chapter objectives
6.2 constant memory
6.3 measuring performance with events
6.4 chapter review
7 texture memory
7.1 chapter objectives
7.2 texture memory overview
7.3 simulating heat transfer
7.4 chapter review
8 graphics interoperability
8.1 chapter objectives
8.2 graphics interoperation
8.3 gpu ripple with graphics interoperability
8.4 heat transfer with graphics interop
8.5 directx interoperability
8.6 chapter' review
9 atomics
9.1 chapter objectives
9.2 compute capability
9.3 atomic operations overview
9.4computing histograms
9.5 chapter review
10 streams
10.1 chapter objectives
10.2 page-locked host memory
10.3 cuda streams
10.4 using a single cuda stream
10.5 using multipte cuda streams
10.6 gpu work scheduling
10.7 using multiple cuda streams effectively
10.8 chapter review
11 cuda c on multiple gpus
11.1 chapter objectives
11.2 zero-copy host memory
11.3 using multiple gpus
11.4 portable pinned memory
11.5 chapter review
12 the final countdown
12.1 chapter objectives
12.2 cuda tools
12.3 written resources
12.4 code resources
12.5 chapter review
a advanced atomics
a.1 dot product revisited
a.2 impl. ementing a hash tabte
a.3 appendix review
index

相關詞條

熱門詞條

聯絡我們