Programming/openCL & CUDA2011. 1. 4. 23:09
CUDA 프로젝트를 보면 다음과 같이, "CUDA Build Rule" 이라는 항목이 추가되있다.

명령줄에 보면 "nvcc.exe" 에 대한 언급도 나오는데 어디서 어떻게 추가하는지는 알수가 없었다.

그래서 검색을 해보니,
솔루션 탐색기에서 "사용자 지정 빌드 규칙" 이라는 부분을 통해

"기존 파일 찾기"를 이용하여 Cuda.rules를 추가하면 하면 저러한 기능이 추가된다.

나의 경우에는
D:\CUDA\NVIDIA GPU Computing SDK\C\common\Cuda.rules 경로에 위치하였다.

'Programming > openCL & CUDA' 카테고리의 다른 글

CUDA Programming Model Overview 내용중 일부  (0) 2011.01.05
CUDA training  (0) 2011.01.05
CUDA Toolkit 3.2  (0) 2011.01.02
deviceQuery on 8600GT 512MB + CUDA 하드웨어 구조  (0) 2011.01.02
CUDA on Linux  (0) 2010.12.07
Posted by 구차니
회사에서 사용할만한 웹 달력 / 스케쥴러를 찾는데 눈에 띄는 두녀석.

[링크 : http://sourceforge.net/projects/webcalendar/] web calendar
[링크 : http://www.php.brickhost.com/]                     web scehduler

'프로그램 사용 > Webcalendar' 카테고리의 다른 글

webcalendar 한글문제  (0) 2011.06.21
webcalendar  (0) 2011.04.06
Posted by 구차니
프로그램 사용/wiki2011. 1. 4. 16:47
dokuwiki의 fckeditor와 비슷한 증상인데 원인은 완전히 달랐다.

증상
wikieditor -> FCKEditor 로는 변환이 되지만
FCKEditor ->wikieditor 로는 변환이 되지 않음(내용이 전부 사라짐)

원인
 [Tue Jan 04 16:32:57 2011] [error] [client 125.132.149.241] PHP Warning:  Unknown: POST Content-Length of 501 bytes exceeds the limit of -1073741824 bytes in Unknown on line 0, referer: http://localhost/mediawiki-1.15.5/index.php?title=Housing_front&action=edit

예전 ajaxplorer의 업로드 용량을 늘리기 위해 설정한
/etc/php5/apache2/php.ini (우분투 기준) 파일의
  post_max_size = 8M
이 설정이 어떤 값을 넘어섰기 때문으로 추측됨

추측
-1,073,741,824 은 1100 0000 0000 0000 0000 0000 0000 0000(2) 인데
post_max_size가 기가 단위로는 설정되어서는 안되서 그럴려나?

0011 1111 1111 1111 1111 1111 1111 1111(2)는 10진수로
1,073,741,823 대략 1기가 정도이다. post max 값이 1기가를 넘으면 충돌이 나는 것으로 추측된다.

실험
post_max_size = 1G는 이상없이 변환되고
post_max_size = 2G는 변환이 되지 않는다.

결론
무리하게 post_max_size를 키우진 말자.
Posted by 구차니
개소리 왈왈2011. 1. 4. 13:37
의사 : 증상이 어떻게 되시나요?
구차니 : 두통, 오한, 발열, 근육통, 무기력함 등등등인데요
의사 : 한번 몸좀 볼까요?

의사 : 숨소리를 이상없고, 목도 괜찮고, 열도 없고
         아. 코가 완전 죽었네요
구차니 : (응? 의사 새끼가 머라는거야! -_- 적어도 코가 제기능을 못한다 정도라고 해달라구! 너무 리얼하자나!!!!)
의사 : 코감기에요
구차니 : 작년 23일부터 계속 이랬는데...
의사 : 그때 코감이 약 먹었으면 나았을꺼에요
구차니 : 그래도 두통도 있는데..
의사 : 그것도 코감기 때문에 그래요
구차니 : 근육통에 무기력증도...
의사 : 그것도 코감기 때문에 그래요
구차니 : (그만 강조좀 하라고 -_-)
의사 : 주사 맞고 가세요.
         아 그리고 하루만에 나을려면 마스크 잘때도 끼고 있으시구요
         안그러면 낫는데 한달 걸립니다.
구차니 : 네 (-_- 내가 아프니까 참는다 -_-)





완전 두통에 오한이 와서 죽을맛이었는데
마스크의 영향인지 주사의 영향인지 조금 나아진 듯한 기분이긴 한데..
웬지 모르게 먼가 속는 기분이랄까...




사족 : 병원가서 주사 맞은거 근 10년 만인듯 -_-

'개소리 왈왈' 카테고리의 다른 글

헉?! 윈도우 msn 털린건가?  (6) 2011.01.19
악 나의 삐뚜러진 필터링  (2) 2011.01.05
Reboot  (4) 2011.01.02
냉기 보호막 +1 ?  (2) 2010.12.28
내 머리속에 도청장치가 있는것 같아!  (4) 2010.12.26
Posted by 구차니
기본적으로 mantisbt-1.2.3 에서 첨부 파일 저장방식이 DATABASE로 되어있다.
하지만 웹페이지 상에서는


이렇게 4M도 아닌 40000000 로 설정된 상황 -_-
mysql쪽 설정을 찾아서 4000이나 4M으로 찾아도 나오지 않는데 도대체 어떻게 해야 되려나?

Posted by 구차니
ajaxplorer에서 업로드시
망 내부와 외부에서 올릴수 있는 용량이 다르게 나온다는 문제가 발생 -_-

기본적으로는 /etc/php5/apache2/php.ini 파일에서
  upload_max_filesize = 4G
부분의 용량을 늘려주면 해결된다고 하지만

내부에서 외부 아이피를 통해 접속을 해도 이상이 없어 보이던 ajaxplorer이
진짜 외부에서 접속을 하면 post_max_size의 용량으로 제한이 되는 현상이 발생했다.
 post_max_size = 8M

머.. 이거 늘려주고
 $ sudo service apache2 restart
해주면 해결완료!

Posted by 구차니
Programming/openCL & CUDA2011. 1. 2. 21:57
예전에 설치할때는 3.2는 RC(Release Candidate) 여서 3.1을 설치했었는데
지난 2010년 12월 22일에 3.2가 정식으로 나왔다.

결론은 빨라진게 대부분이고, H.264 인코딩/디코딩 라이브러리가 추가 되었다고 한다.

Last Updated: 12 / 22 / 2010

CUDA Toolkit 3.2 (November 2010)

For older releases, see the CUDA Toolkit Release Archive

 

Release Highlights

New and Improved CUDA Libraries

  • CUBLAS performance improved 50% to 300% on Fermi architecture GPUs, for matrix multiplication of all datatypes and transpose variations
  • CUFFT performance tuned for radix-3, -5, and -7 transform sizes on Fermi architecture GPUs, now 2x to 10x faster than MKL
  • New CUSPARSE library of GPU-accelerated sparse matrix routines for sparse/sparse and dense/sparse operations delivers 5x to 30x faster performance than MKL
  • New CURAND library of GPU-accelerated random number generation (RNG) routines, supporting Sobol quasi-random and XORWOW pseudo-random routines at 10x to 20x faster than similar routines in MKL
  • H.264 encode/decode libraries now included in the CUDA Toolkit

[링크 : http://developer.nvidia.com/object/cuda_3_2_downloads.html]

'Programming > openCL & CUDA' 카테고리의 다른 글

CUDA training  (0) 2011.01.05
Visual Studio 2008 에서 CUDA 프로젝트 만들기  (2) 2011.01.04
deviceQuery on 8600GT 512MB + CUDA 하드웨어 구조  (0) 2011.01.02
CUDA on Linux  (0) 2010.12.07
CUDA 예제 컴파일시 오류  (0) 2010.12.05
Posted by 구차니
Programming/openCL & CUDA2011. 1. 2. 21:51
deviceQuery 예문은 말그대로 장치에 질의의 던져 어떤 스펙인지
몇개의 thread가 존재하는지를 파악하는 프로그램이다.

아무튼 NVIDIA_CUDA_C_ProgrammingGuide.pdf 문서를 보면 아래의 내용이 나오니 참고를 해서 보자면,


Geforce 8800GT(이하 8800GT)는 14개의 멀티 프로세서를 가졌고 112개의 코어를 지녔다.
Grid는 Block을 포함하고, Block은 Thread를 포함한다.

단순 계산으로는 하나의 프로세서별로 8개의 코어가 존재하며
멀티프로세서는 14개 코어는 총 112개가 존재한다.

그리드(Grid)는 블럭의 2차원 배열로 존재하고,
블럭(Block)은 쓰레드의 2차원 배열로 존재한다.
쓰레드(Thread)는 일을하는 최소단위이다.

한번에 묶이는 최소 쓰레드의 숫자(Warp size)는 32개 이며
하나의 블럭으로 묶을수 있는 최대 쓰레드는 512개 이다.

블럭의 최대 차원은 3차원 512x512x64 이며
그리드의 최대 차원은 2차원 65535x65535x1 이다.

라고 이해하면 되려나?

A multithreaded program is partitioned into blocks of threads that execute independently from each
other, so that a GPU with more cores will automatically execute the program in less time than a GPU
with fewer cores.
=> 멀티쓰레드화된 프로그램은 서로 독립적으로 실행되는 쓰레드의 블럭으로 나누어지며, 그러한 이유로 더욱 많은 코어를 포함하는 CPU는 적은 코어를 지닌 GPU보다 짧은 시간에 프로그램을 실행할 수 있다.

Host는 일반적인 CPU 환경이고, Device는 GPU 환경이다.
컴파일시에 Device 코드만 nvcc에서 처리하고, 나머지는 일반적인 컴파일러에서 처리하는 이원화된 구조이다.

아래는 커널이다. 디바이스 코드를 생성하는 부분이며
MatAdd 함수는 __global__ 선언을 앞에 붙여 device 코드임을 명시해야 한다.
MatAdd<<<numBlocks, threadsPerBlock>>>(A, B, C);
그리고 커널 안에는 int형이나 dim3 형으로 선언이 되어야 한다.

아래는 dim3 형으로 선언된 녀석으로,
dim3 threadsPerBlock(16, 16);
dim3 numBlocks(N / threadsPerBlock.x, N / threadsPerBlock.y);
MatAdd<<<numBlocks, threadsPerBlock>>>(A, B, C);
블럭당 쓰레디의 크기를 16x16 thread로, 그리드를 N/16개로 분할하는 예제이다.

물론 2차원은 1차원과 같이 사용이 가능하므로 int형도 허용하는 듯?

B.15  Execution Configuration
Any call to a __global__ function must specify the execution configuration for that call. The execution configuration defines the dimension of the grid and blocks that will be used to execute the function on the device, as well as the associated stream (see Section 3.3.10.1 for a description of streams).
When using the driver API, the execution configuration is specified through a series of driver function calls as detailed in Section 3.3.3.
When using the runtime API (Section 3.2), the execution configuration is specified by inserting an expression of the form <<< Dg, Db, Ns, S >>> between the function name and the parenthesized argument list, where:
  Dg is of type dim3 (see Section B.3.2) and specifies the dimension and size of the grid,
     such that Dg.x * Dg.y equals the number of blocks being launched; Dg.z must be equal to 1;
  Db is of type dim3 (see Section B.3.2) and specifies the dimension and size of each block,
     such that Db.x * Db.y * Db.z equals the number of threads per block;
  Ns is of type size_t and specifies the number of bytes in shared memory that is dynamically allocated per block for this call in addition to the statically allocated memory; this dynamically allocated memory is used by any of the variables declared as an external array as mentioned in Section B.2.3; Ns is an optional argument which defaults to 0;
  S is of type cudaStream_t and specifies the associated stream; S is an optional argument which defaults to 0.
As an example, a function declared as
__global__ void Func(float* parameter);
must be called like this:
Func<<< Dg, Db, Ns >>>(parameter);
The arguments to the execution configuration are evaluated before the actual function arguments and like the function arguments, are currently passed via shared memory to the device. The function call will fail if Dg or Db are greater than the maximum sizes allowed for the device as specified in Appendix G, or if Ns is greater than the maximum
amount of shared memory available on the device, minus the amount of shared memory required for static allocation, functions arguments (for devices of compute capability 1.x), and execution configuration. 

아무튼 원래는 아래의 예제 내용을 분석하기 위한 내용인데
점점 미궁으로 빠지는 느낌 -_-

CUDA deviceQuery


OpenCL DeviceQuery

'Programming > openCL & CUDA' 카테고리의 다른 글

Visual Studio 2008 에서 CUDA 프로젝트 만들기  (2) 2011.01.04
CUDA Toolkit 3.2  (0) 2011.01.02
CUDA on Linux  (0) 2010.12.07
CUDA 예제 컴파일시 오류  (0) 2010.12.05
CUDA / Visual Studio 2008  (2) 2010.12.05
Posted by 구차니
개소리 왈왈2011. 1. 2. 20:28
가끔 인간에게 리부팅이 있으면 어떨까? 라는 망상을 하곤한다.
어짜피 작업하던것들은 저장해놓고 재시작하는 거라 무슨 차이가 있겠냐지만,

그러한 과정속에 생겨나는 데이터의 손실이 어쩌면 인간의 망각의 상위 단계가 아닐까?
메모리 누수와 같은 관리불가능한 부분들에 대한 초기화 역시 포함이 되니 말이다.




크리스마스 직전의 98% 병신상태에서, 육체는 60% 회복되었지만
여전히 책이나 문서는 눈에 들어 오지 않는 정서적 40% 정도 상태.


reboot가 안된다면
restart 정도는 해야겠지?







올해의 목표
openGL과 CUDA 아작내자!!!!
리눅스 시스템 포팅 공부

나머지 자잘하게 몇가지 더 추가되겠지만
올해는 너무 멀리 새어나가지 않기를 기원해 본다.

'개소리 왈왈' 카테고리의 다른 글

악 나의 삐뚜러진 필터링  (2) 2011.01.05
의사의 초간단 진찰  (4) 2011.01.04
냉기 보호막 +1 ?  (2) 2010.12.28
내 머리속에 도청장치가 있는것 같아!  (4) 2010.12.26
내년 지름목록!  (0) 2010.12.22
Posted by 구차니
개소리 왈왈/영화2011. 1. 1. 19:32
근 1년 전부터 봐오던 예고편에서 벗어나 새해를 맞이하여 드디어! 본편을 보았다.
왕십리 4DFlex로 봤지만 머랄까.. 3D 정도면 충분한데 4D는 조금 아쉬운 느낌?





간단하게 요약하면 빛의 항연 이라고 하면되려나?
가끔 떡밥으로 던져졌던 공중에서 드러나는 탑승물이라던가 이런 것들을 보면서
"멋지다!" 라고 밖에 표현을 할 수 없는 영상에 압도되었다.

영   상 : 5/5
사운드 : 4/5 (좋은지 나쁜지 딱히 판단이 안섬 = 부조화스런 음악은 없음)
스토리 : 3/5 (이제 시작이니까?)


초반에 유닉스 계열 셸 화면이 나오는데 과거의 영화들과는 다르게 실제로
명령행에서 작동하는 듯한 착각이 들정도로 제대로 된 서버환경에서 작업을 한다
(아아 직업병인가 ㅠ.ㅠ)

스토리
간단하게 요약하면, 아부지가 죽여주는 게임만들어서 같이 하자고 해놓고는
뿅~ 하고 몇십년간 잠수타고 어느날 갑자기 연락와서 가봤더니
이상한 세상으로 납치당하고 개고생 하다가 겨우겨우 돌아오는 이야기

명대사
I'm not your father, Sam.



스포일러를 감안하면서 이것저것 적고 싶지만
말이 자꾸만 꼬여서 몇번을 쓰다가 지우게 된다. -_-

아무튼 아래는 세계관 + 스포일러 ㅋㅋ

'개소리 왈왈 > 영화' 카테고리의 다른 글

토르 : 천둥의 신 (Thor, 2011)  (8) 2011.05.01
언스토퍼블 + CAR  (8) 2011.02.15
슈퍼배드(2010, 3D) - Despicable me  (0) 2010.09.20
아바타 특별판(Avatar Special, 1020)  (6) 2010.08.29
인셉션(Inception 2010)  (4) 2010.08.01
Posted by 구차니