'Programming/openCL &amp; CUDA' 카테고리의 글 목록 (6 Page)

'Programming/openCL & CUDA'에 해당되는 글 80건

2011.01.18 CUDA 3.1과 3.2의 devicequery 결과 차이점
2011.01.18 vectorAdd 를 이용한 CUDA 연습
2011.01.17 CUDA 메모리별 범위(scope)
2011.01.16 CUDA 내장변수 - built in variable
2011.01.16 CUDA Toolkit 3.2 - SDK와 Toolkit을 둘다 설치하세요! 2
2011.01.14 CUDA SDK 3.2 예제파일 변경점
2011.01.14 CUDA_Occupancy_calculator 내용 캡쳐
2011.01.05 CUDA Programming Model Overview 내용중 일부
2011.01.05 CUDA training
2011.01.04 Visual Studio 2008 에서 CUDA 프로젝트 만들기 2

CUDA 3.1과 3.2의 devicequery 결과 차이점

별건없고, 멀티프로세서와 core의 출력방식이 변경되었다.

CUDA SDK 3.1

D:\CUDA\NVIDIA GPU Computing SDK\C\bin\win32\Release\deviceQuery.exe Starting...

CUDA Device Query (Runtime API) version (CUDART static linking)

There are 2 devices supporting CUDA

Device 0: "GeForce 8800 GT"

CUDA Driver Version: 3.20

CUDA Runtime Version: 3.10

CUDA Capability Major revision number: 1

CUDA Capability Minor revision number: 1

Total amount of global memory: 536543232 bytes

Number of multiprocessors: 14

Number of cores: 112

Total amount of constant memory: 65536 bytes

Total amount of shared memory per block: 16384 bytes

Total number of registers available per block: 8192

Warp size: 32

Maximum number of threads per block: 512

Maximum sizes of each dimension of a block: 512 x 512 x 64

Maximum sizes of each dimension of a grid: 65535 x 65535 x 1

Maximum memory pitch: 2147483647 bytes

Texture alignment: 256 bytes

Clock rate: 1.50 GHz

Concurrent copy and execution: Yes

Run time limit on kernels: Yes

Integrated: No

Support host page-locked memory mapping: Yes

Compute mode: Default

(multiple host threads can use this device simultaneously)

Concurrent kernel execution: No

Device has ECC support enabled: No

deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 3.20, CUDA Runtime Vers

ion = 3.10, NumDevs = 2, Device = GeForce 8800 GT, Device = GeForce 8800 GT

PASSED

Press <Enter> to Quit...

-----------------------------------------------------------

CUDA SDK 3.2

D:\CUDA\NVIDIA GPU Computing SDK 3.2\C\bin\win32\Release\deviceQuery.exe Starting...

CUDA Device Query (Runtime API) version (CUDART static linking)

There are 2 devices supporting CUDA

Device 0: "GeForce 8800 GT"

CUDA Driver Version: 3.20

CUDA Runtime Version: 3.20

CUDA Capability Major/Minor version number: 1.1

Total amount of global memory: 536543232 bytes

Multiprocessors x Cores/MP = Cores: 14 (MP) x 8 (Cores/MP) = 112 (Cores)

Total amount of constant memory: 65536 bytes

Total amount of shared memory per block: 16384 bytes

Total number of registers available per block: 8192

Warp size: 32

Maximum number of threads per block: 512

Maximum sizes of each dimension of a block: 512 x 512 x 64

Maximum sizes of each dimension of a grid: 65535 x 65535 x 1

Maximum memory pitch: 2147483647 bytes

Texture alignment: 256 bytes

Clock rate: 1.50 GHz

Concurrent copy and execution: Yes

Run time limit on kernels: Yes

Integrated: No

Support host page-locked memory mapping: Yes

Compute mode: Default

(multiple host threads can use this device simultaneously)

Concurrent kernel execution: No

Device has ECC support enabled: No

Device is using TCC driver mode: No

deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 3.20, CUDA Runtime Vers

ion = 3.20, NumDevs = 2, Device = GeForce 8800 GT, Device = GeForce 8800 GT

PASSED

Press <Enter> to Quit...

-----------------------------------------------------------

'Programming > openCL & CUDA' 카테고리의 다른 글

CUDA 관련 해외글 (0)	2011.01.22
CUDA에서 grid 와 thread 의 갯수에 대한 짧은생각 (2)	2011.01.18
vectorAdd 를 이용한 CUDA 연습 (0)	2011.01.18
CUDA 메모리별 범위(scope) (0)	2011.01.17
CUDA 내장변수 - built in variable (0)	2011.01.16

Posted by 구차니

CUDA에서 grid 와 thread 의 갯수에 대한 짧은생각 (2)	2011.01.18
CUDA 3.1과 3.2의 devicequery 결과 차이점 (0)	2011.01.18
CUDA 메모리별 범위(scope) (0)	2011.01.17
CUDA 내장변수 - built in variable (0)	2011.01.16
CUDA Toolkit 3.2 - SDK와 Toolkit을 둘다 설치하세요! (2)	2011.01.16

CUDA 3.1과 3.2의 devicequery 결과 차이점 (0)	2011.01.18
vectorAdd 를 이용한 CUDA 연습 (0)	2011.01.18
CUDA 내장변수 - built in variable (0)	2011.01.16
CUDA Toolkit 3.2 - SDK와 Toolkit을 둘다 설치하세요! (2)	2011.01.16
CUDA SDK 3.2 예제파일 변경점 (0)	2011.01.14

vectorAdd 를 이용한 CUDA 연습 (0)	2011.01.18
CUDA 메모리별 범위(scope) (0)	2011.01.17
CUDA Toolkit 3.2 - SDK와 Toolkit을 둘다 설치하세요! (2)	2011.01.16
CUDA SDK 3.2 예제파일 변경점 (0)	2011.01.14
CUDA_Occupancy_calculator 내용 캡쳐 (0)	2011.01.14

CUDA Toolkit 3.2 - SDK와 Toolkit을 둘다 설치하세요!

귀찮아서 CUDA 3.2 SDK만 설치하고, CUDA Toolkit 3.2는 설치하지 않고

비쥬얼 스튜디오에서 3.2용 SDK 샘플 파일을 열려고 하니 다음과 같은 에러가 발생한다.

음.. C:\Program Files\Microsoft Visual Studio 9.0\VC\VCProjectDefaults\NvCudaRuntimeApi.rules 이 파일은 머지?

머 결론은 프로젝트 파일 열수 없음 배째! 라는 건데..

3.1과 3.2의 프로젝트 파일을 비교해보니

ToolFiles의 경로가 달라졌다 -_-

부랴부랴 Toolkit 3.2를 설치하는데

경로를 바꾸니 졸라 겁준다 -_-

줸장! 내가 쫄아서 "Yes" 누르는 건 아냐 ㅠ.ㅠ

아무튼 3.2 Toolkit을 설치하고 나니 이제야 파일이 생성되고, 제대로 프로젝트 파일이 열린다.

'Programming > openCL & CUDA' 카테고리의 다른 글

CUDA 메모리별 범위(scope) (0)	2011.01.17
CUDA 내장변수 - built in variable (0)	2011.01.16
CUDA SDK 3.2 예제파일 변경점 (0)	2011.01.14
CUDA_Occupancy_calculator 내용 캡쳐 (0)	2011.01.14
CUDA Programming Model Overview 내용중 일부 (0)	2011.01.05

Posted by 구차니

CUDA 내장변수 - built in variable (0)	2011.01.16
CUDA Toolkit 3.2 - SDK와 Toolkit을 둘다 설치하세요! (2)	2011.01.16
CUDA_Occupancy_calculator 내용 캡쳐 (0)	2011.01.14
CUDA Programming Model Overview 내용중 일부 (0)	2011.01.05
CUDA training (0)	2011.01.05

CUDA_Occupancy_calculator 내용 캡쳐

버전별로 캡쳐(오픈오피스 쓰니 오작동해서 ㅠ.ㅠ)

8800GT는 CUDA1.1을 지원하므로.. 표를 따라서 보면

블럭당 쓰레드 256개

멀티프로세서당 쓰레드 768개

쓰레드당 레지스터 8개

블럭당 쉐어드 메모리 1024Byte

멀티프로세서당 Warp 24개

멀티프로세서당 쓰레드 블럭 3개

Warp당 쓰레드 32

멀티프로세서당 Warp 24

멀티프로세서당 쓰레드 768

멀티프로세서당 32bit 레지스터의 총합 8192개

멀티프로세서당 쉐어드 메모리 16384Bytes

쓰레드 블럭당 Warp 8

레지스터 2048

쉐어드 메모리 1024

흐음.. 이렇게 보니 조금 프로그래밍의 방향이 보이는 느낌?

'Programming > openCL & CUDA' 카테고리의 다른 글

CUDA Toolkit 3.2 - SDK와 Toolkit을 둘다 설치하세요! (2)	2011.01.16
CUDA SDK 3.2 예제파일 변경점 (0)	2011.01.14
CUDA Programming Model Overview 내용중 일부 (0)	2011.01.05
CUDA training (0)	2011.01.05
Visual Studio 2008 에서 CUDA 프로젝트 만들기 (2)	2011.01.04

Posted by 구차니

CUDA Programming Model Overview 내용중 일부

영어로 쏼라쏼라 해대는 바람에 프리젠테이션 내용은 이해불가 -_-
하지만 아래 내용만큼은 중요한 의미를 포함!

소프트웨어와 하드웨어의 추상화 과정은 다음과 같다.
Grid는 Device 이며, 한번에 하나의 Kernel 만을 (다르게 말하면 Grid를) 실행 할 수 있다.
   다르게 말하자면, 한번에 최대한 많은 블럭과 쓰레드를 사용하는 것이 시간효용면에서 유리해진다.
Thread Block은 Multiprocessor 이며,
   물리적 프로세서이므로 하나의 메모리를 공유한다(Shared Memory)
   그리고 다른 물리적 프로세서와는 메모리를 공유하지 못한다.
Thread는 Thread Processor 이며, 다른 자료에서 굳이 비유하자면 ALU 이다.

그런데.. Multi GPU 상황(그러니까 SLI를 사용하지 않는 다중 GPU)이라면
Grid를 동시에 여러개 구성해서 돌릴수도 있다는 의미일려나?

[링크 : http://http.download.nvidia.com/developer/cuda/podcasts/CUDA_Programming_Model_Overview.m4v]
2011/01/05 - [Programming/CUDA / openCL] - CUDA training

'Programming > openCL & CUDA' 카테고리의 다른 글

CUDA SDK 3.2 예제파일 변경점 (0)	2011.01.14
CUDA_Occupancy_calculator 내용 캡쳐 (0)	2011.01.14
CUDA training (0)	2011.01.05
Visual Studio 2008 에서 CUDA 프로젝트 만들기 (2)	2011.01.04
CUDA Toolkit 3.2 (0)	2011.01.02

Posted by 구차니

CUDA training

도대체 어떻게 짱박아 놓았길래 안보인걸까..

[링크 : http://developer.nvidia.com/object/cuda_training.html]

[링크 : http://www.miruware.com/index.php?menu_no=116]

'Programming > openCL & CUDA' 카테고리의 다른 글

CUDA_Occupancy_calculator 내용 캡쳐 (0)	2011.01.14
CUDA Programming Model Overview 내용중 일부 (0)	2011.01.05
Visual Studio 2008 에서 CUDA 프로젝트 만들기 (2)	2011.01.04
CUDA Toolkit 3.2 (0)	2011.01.02
deviceQuery on 8600GT 512MB + CUDA 하드웨어 구조 (0)	2011.01.02

Posted by 구차니

Visual Studio 2008 에서 CUDA 프로젝트 만들기

CUDA 프로젝트를 보면 다음과 같이, "CUDA Build Rule" 이라는 항목이 추가되있다.

명령줄에 보면 "nvcc.exe" 에 대한 언급도 나오는데 어디서 어떻게 추가하는지는 알수가 없었다.

그래서 검색을 해보니,

솔루션 탐색기에서 "사용자 지정 빌드 규칙" 이라는 부분을 통해

"기존 파일 찾기"를 이용하여 Cuda.rules를 추가하면 하면 저러한 기능이 추가된다.

나의 경우에는

D:\CUDA\NVIDIA GPU Computing SDK\C\common\Cuda.rules 경로에 위치하였다.

[링크 : http://celdee.tistory.com/542]

'Programming > openCL & CUDA' 카테고리의 다른 글

CUDA Programming Model Overview 내용중 일부 (0)	2011.01.05
CUDA training (0)	2011.01.05
CUDA Toolkit 3.2 (0)	2011.01.02
deviceQuery on 8600GT 512MB + CUDA 하드웨어 구조 (0)	2011.01.02
CUDA on Linux (0)	2010.12.07

Posted by 구차니

구차니의 잡동사니 모음

'Programming/openCL & CUDA'에 해당되는 글 80건

CUDA 3.1과 3.2의 devicequery 결과 차이점

'Programming > openCL & CUDA' 카테고리의 다른 글

vectorAdd 를 이용한 CUDA 연습

'Programming > openCL & CUDA' 카테고리의 다른 글

CUDA 메모리별 범위(scope)

'Programming > openCL & CUDA' 카테고리의 다른 글

CUDA 내장변수 - built in variable

'Programming > openCL & CUDA' 카테고리의 다른 글

CUDA Toolkit 3.2 - SDK와 Toolkit을 둘다 설치하세요!

'Programming > openCL & CUDA' 카테고리의 다른 글

CUDA SDK 3.2 예제파일 변경점

'Programming > openCL & CUDA' 카테고리의 다른 글

CUDA_Occupancy_calculator 내용 캡쳐

'Programming > openCL & CUDA' 카테고리의 다른 글

CUDA Programming Model Overview 내용중 일부

'Programming > openCL & CUDA' 카테고리의 다른 글

CUDA training

'Programming > openCL & CUDA' 카테고리의 다른 글

Visual Studio 2008 에서 CUDA 프로젝트 만들기

'Programming > openCL & CUDA' 카테고리의 다른 글

카테고리

공지사항

태그목록

최근에 올라온 글

최근에 달린 댓글

티스토리툴바