[学习笔记]关于CUDA与OPENCL

摘要:
最近,我突然感觉到opencl的重要性,所以我准备拿起它。昨天,我重新安装了NVIDIA驱动程序,它比AMD更可靠。我发现在使用CUDA 5.5时,opencl更少。现在,我已经在一些opencl开发人员之前的博客文章中看到了这一点,这是真的。所以我还参加了一个请愿活动:http://www.ipetitions.com/petition/opencl-examples-in-cuda-5-sdk

最近突然感觉到opencl的重要性,于是准备拾起来,昨天重装了NVIDIA的驱动,嗯,比AMD的靠谱多了,

之前在使用CUDA5.5的时候,发现少了opencl,现在,额,在一些opencl开发人员博客的早先博文中看到,

确实如此,为此在这里还参加了一个petition活动:http://www.ipetitions.com/petition/opencl-examples-in-cuda-5-sdk/

自CUDA5.0开始,opencl的sample就被移除,而且关于opencl的profiler工具也没有继续发展下去,NVIDIA是集中

精力发展自己的亲儿子了。。。

而在这里,有Vincent在linkedin上的讨论:http://www.linkedin.com/groups/Petition-put-back-OpenCL-samples-1729897.S.149050851 , 这里还有

NVIDIA的VP上来参与讨论,很有意思。。。

NVIDIA在驱动上被Linus鄙视一次,现在在CUDA和OPENCL的开发上也是“态度鲜明‘啊,看来,一个企业要去革自己的命,还真是不容易啊

我自己的做法就是下载CUDA4.0,因为这里面还是有opencl的samples的;不过这里首先说明下,我只是使用了这个samples而已,而机器当中

已经安装好了CUDA5.5 toolkit,这里面包含有opencl1.2的动态链接库;

编译4.0当中的opencl samples,没有任何问题,而且运行也是没有任何问题,但是对于低版本(如V2.3版本)当中获取得到的samples,编译成功但是不能

运行,不懂为什么。。。。

这里有个值得记录的链接: http://askubuntu.com/questions/131506/how-can-i-get-nvidia-cuda-or-opencl-working-on-a-laptop-with-nvidia-discrete-car#!

最后,还是想说自己十分喜欢linkedin当中的讨论:

1, http://www.linkedin.com/groups/Petition-put-back-OpenCL-samples-1729897.S.149050851

2,http://comportability.org/forums/discussion/6/profiling-opencl-code-on-nvidia

3,http://comportability.org/#!

现在既然已经在CUDA下完成了对于opencl的编译,可以使用NVIDIA GPU,但是关于profiler的问题却是没有解决的;

在这里: http://comportability.org/forums/discussion/6/profiling-opencl-code-on-nvidia  提供了两个profiler,一个是轻量级的,一个则是功能完整的,

enjoy it !!!!

免责声明:文章转载自《[学习笔记]关于CUDA与OPENCL》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇java多线程文件上传服务器A4纸网页打印中对应像素的设定和换算下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

DeepFaceLab: SSE,AVX, OpenCL 等版本说明!

Deep Fake Lab早期只有两个版本,一个是专门正对NVIDIA显卡的CUDA9的版本,另一个是支持CPU的版本。 三月初该项目作者对tenserFlow,Cuda的版本进行了升级,预编译的软件包也分成了三个版本,每个版本针对不同配置的电脑。 为了方便大家正确选择版本,下面对每个版本做一个简单的介绍。 作者解释 Available builds:...

NVIDIA显卡驱动,CUDA,CUDNN安装流程

GPU计算力分析 https://blog.csdn.net/iefenghao/article/details/97956440?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.edu_weight&depth_1-utm_sou...

Ubuntu16 编译源码安装MXNet 可变卷积Deformable-ConvNets GPU版

【引言】最近接手了公司的关于虫子识别的项目,使用MXNet框架开发,但是实际用的是Deformable-ConvNets. Deformable-ConvNets为微软研究研究院提出的可变卷积网络,可用于对图像中大小不一的物体识别,不是单单识别图中的猫和狗(它们都一般大小),而识别图像中不同种类的虫子(虫子本身小,而且难以区分),在这样的场景下很适合用可变...

ubuntu20.04系统配置、安装显卡驱动、安装cuda、安装pytorch

ESXI 记得 虚拟机设置,高级里新增:hypervisor.cpuid.v0 = FALSE ,不然nvidia-smi报错:Unable to determine the device handle for GPU 0000:XX:00.0: Unknown Error 一、安装完系统后的设置 1、更换源为阿里源  我这是已经改过的    2、关...

Cortex-A15架构解析:它为什么这么强(转)

今年的新手机趋势无异是全面向四核靠拢,不过同样是四核,在实际的性能上其实是千差万别。例如针对入门级主流市场的四核手机普遍采用的都是Cortex-A7以及 Cortex-A9 级别的CPU内核,这类内核性能、成本以及发热都会较低,因此在入门市场上大行其道。  而在高端智能手机中则出现了一些新的变化,除了去年就已经崭露头角的高通Krait系列架构四核外,ARM正...

Centos 7 安装nvidia显卡驱动

----系统版本:CentOS Linux release 7.7.1908  ----显卡:P1000 1、添加ELRepo源 $ rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org $rpm -Uvh http://www.elrepo.org/elrepo-release-7.0-4...