Instale o Visual C++ 2005 Express Edition(ou alguma IDE similar - esse é o que eu uso).
Crie um projeto novo com o nome "example1" (next->finish)
Aparecerá no Soltuion Explorer(lado esquerdo) os headers, resources e source files. Clique com o botão direito sobre o arquivo "example1.cpp". Primeiro renomeie ele pra example1.cu e depos adicione essas linhas a estes paths:
Configuration Properties → Custom Build Step → General:
Command Line =
"$(CUDA_BIN_PATH)\nvcc.exe" -ccbin "$(VCInstallDir)bin" -c -D_DEBUG -DWIN32 -D_CONSOLE -D_MBCS -Xcompiler /EHsc,/W3,/nologo,/Wp64,/Od,/Zi,/MTd -I"$(CUDA_INC_PATH)" -I./ -o $(ConfigurationName)\example1.obj example1.cu
Configuration Properties → Custom Build Step → General:
Outputs = $(ConfigurationName)\example1.obj
Após isso dê OK. Agora clique com o botão direito sobre o projeto, no solution explorer(example1). Agora aparecerá várias opções do projeto. Mudem esses paths:
Está pronto. Mas só pra quem tem placa da nvidia. Se for emular, precisa adicionar esse comando na linha do source file (example1.cpp):Configuration Properties → C/C++ → General:
Additional Include Directories = $(CUDA_INC_PATH);"C:\Program Files\NVIDIA Corporation\NVIDIA CUDA SDK\common\inc"Configuration Properties → C/C++ → General:
Debug Information Format = Program Database (/Zi)Configuration Properties → C/C++ → Code Generation:
Runtime Library = Multi-threaded Debug (/MTd)Configuration Properties → Linker → General:
Enable incremental linking = No (/INCREMENTAL:NO)Configuration Properties → Linker -> General:
Additional Library Directories = "C:\CUDA\lib";"C:\Program Files\NVIDIA Corporation\NVIDIA CUDA SDK\common\lib"Configuration Properties → Linker → Input:
Additional Dependencies = cudart.lib cutil32D.libConfiguration Properties → Linker → Optimization:
Enable COMDAT folding = Do Not Remove Redundant COMDATs (/OPT:NOICF)
-deviceemu
ou seja,
Configuration Properties → Custom Build Step → General:
Command Line =
"$(CUDA_BIN_PATH)\nvcc.exe" -deviceemu -ccbin "$(VCInstallDir)bin" -c -D_DEBUG -DWIN32 -D_CONSOLE -D_MBCS -Xcompiler /EHsc,/W3,/nologo,/Wp64,/Od,/Zi,/MTd -I"$(CUDA_INC_PATH)" -I./ -o $(ConfigurationName)\example1.obj example1.cu
Desse jeito eu consegui rodar o exemplo dessa página, que calcula o quadrado de n numeros, e foi onde eu peguei essas informações pra rodar no windows:
http://llpanorama.wordpress.com/2008/05/21/my-first-cuda-program/
Vocês também podem pegar o projeto que está na pasta do CUDA, onde já existem todos esses passos e apenas modificar com o programa de vocês e adicionar -deviceemu pra quem não tem placa nvidia.
Espero ter ajudado.