如何使用OpenCL编写程序

摘要:
代码函数是计算两个数字的和#include #include<iostream>#pragmacomment(lib,“opencl.lib”)intmain(intargc,char**argv){cl_contexthContext;cl_context_propertesrop=cl_context_PLATFORM;cl_PLATFORM_idplatform;clGet

代码功能为计算2个数相加

#include <CL/CL.h>
#include <iostream>

#pragma comment( lib, "opencl.lib" )

int main(int argc, char** argv)
{
    cl_context hContext;
    cl_context_properties prop = CL_CONTEXT_PLATFORM;
    cl_platform_id platform;
    clGetPlatformIDs( 1, &platform, NULL );
    cl_device_id device;
    clGetDeviceIDs( platform, CL_DEVICE_TYPE_GPU, 1, &device, NULL );
    cl_int err;
    hContext = clCreateContext( NULL, 1, &device, NULL, NULL , &err );
    size_t nCtxDescSize;
    clGetContextInfo( hContext, CL_CONTEXT_DEVICES, 0, 0, &nCtxDescSize );
    cl_device_id* pDevices = (cl_device_id*)new char[nCtxDescSize];
    clGetContextInfo( hContext, CL_CONTEXT_DEVICES, nCtxDescSize, pDevices, NULL );

    const char* sources =
    {
        "__kernel void VectorAdd(__global const float* a, __global const float* b, __global float* c)\n"
        "{\n"
        "    // get index into global data array\n"
        "    int iGID = get_global_id(0);\n"
        "\n"
        "    // bound check (equivalent to the limit on a 'for' loop for standard/serial C code\n"
        "    if (iGID >= 1)\n"
        "    {   \n"
        "        return; \n"
        "    }\n"
        "    c[iGID] = a[iGID] + b[iGID];\n"
        "}\n"
    };

    const char** sSources = (const char**)&sources;
    cl_command_queue hCmdQueue;
    hCmdQueue = clCreateCommandQueue( hContext, pDevices[0], 0, 0 );
    cl_program hProgram;
    hProgram = clCreateProgramWithSource( hContext, 1, sSources, 0, 0 );
    clBuildProgram( hProgram, NULL, NULL, NULL, NULL, NULL );

    cl_kernel hKernel;
    hKernel = clCreateKernel( hProgram, "VectorAdd", 0 );

    int cnBlockSize = 512;
    int cnBlocks = 3;
    size_t cnDimension = cnBlocks * cnBlockSize;

    float* pA = new float[cnDimension];
    float* pB = new float[cnDimension];
    float* pC = new float[cnDimension];
    memset( pA, 0, 4 * cnDimension );
    memset( pB, 0, 4 * cnDimension );
    *pA = 1.0f;
    *pB = 2.0f;
    cl_mem MemA, MemB, MemC;
    MemA = clCreateBuffer( hContext, CL_MEM_READ_ONLY | CL_MEM_USE_HOST_PTR,
        cnDimension * sizeof(float), pA, 0 );
    MemB = clCreateBuffer( hContext, CL_MEM_READ_ONLY | CL_MEM_USE_HOST_PTR,
        cnDimension * sizeof(float), pB, 0 );
    MemC = clCreateBuffer( hContext, CL_MEM_WRITE_ONLY | CL_MEM_USE_HOST_PTR,
        cnDimension * sizeof(float), pC, 0 );

    clSetKernelArg( hKernel, 0, sizeof(cl_mem), (void*)&MemA );
    clSetKernelArg( hKernel, 1, sizeof(cl_mem), (void*)&MemB );
    clSetKernelArg( hKernel, 2, sizeof(cl_mem), (void*)&MemC );
    clEnqueueNDRangeKernel( hCmdQueue, hKernel, 1, 0, &cnDimension, 0, 0, 0, 0 );
    clEnqueueReadBuffer( hCmdQueue, MemC, CL_TRUE, 0, cnBlockSize * sizeof(float),
        pC, NULL, NULL, NULL );

    delete[] pA;
    delete[] pB;
    delete[] pC;
    delete[] pDevices;

    clReleaseMemObject( MemA );
    clReleaseMemObject( MemB );
    clReleaseMemObject( MemC );

  return 0;
}

免责声明:文章转载自《如何使用OpenCL编写程序》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇pyspider 安装问题总结oracle多行合并一行,且需排序下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

OpenCL编程基本流程及完整示例

1. 选择OpenCL平台并创建一个上下文平台(Platform)是指主机和OpenCL管理框架下的若干个设备构成的可以运行OpenCL程序的完整硬件系统,这个是跑OpenCL程序的基础,所以第一步要选择一个可用的OpenCL品台。一台机器上可以有不止一个这样的品台,一个平台也可以有不止一个GPU。 主要涉及的函数:clGetPlatformIDs(),用...

FFmpeg 滤镜详解

FFmpeg Filter 1. 概念介绍 在多媒体处理中,术语滤镜(filter)指的是修改未编码的原始音视频数据帧的一种软件工具。 2. 基本原理 ● 在编码前,ffmpeg可以对raw(真实/原)音频和视频使用libavfilter库中的滤镜进行处理。(非压缩数据帧)● 多个滤镜可以组成滤镜链图(滤镜链图filtergraphs )。● 在ffmp...

[学习笔记]关于CUDA与OPENCL

最近突然感觉到opencl的重要性,于是准备拾起来,昨天重装了NVIDIA的驱动,嗯,比AMD的靠谱多了, 之前在使用CUDA5.5的时候,发现少了opencl,现在,额,在一些opencl开发人员博客的早先博文中看到, 确实如此,为此在这里还参加了一个petition活动:http://www.ipetitions.com/petition/opencl...

【FFMPEG】关于硬解码和软解码

一、一些命令 1、显示所有可用的硬件加速器 [root@tranCodeing ~]# ffmpeg -hwaccels ffmpeg version 4.1 Copyright (c) 2000-2018 the FFmpeg developers built with gcc 4.8.5 (GCC) 20150623 (Red Hat 4.8.5-...

DeepFaceLab: SSE,AVX, OpenCL 等版本说明!

Deep Fake Lab早期只有两个版本,一个是专门正对NVIDIA显卡的CUDA9的版本,另一个是支持CPU的版本。 三月初该项目作者对tenserFlow,Cuda的版本进行了升级,预编译的软件包也分成了三个版本,每个版本针对不同配置的电脑。 为了方便大家正确选择版本,下面对每个版本做一个简单的介绍。 作者解释 Available builds:...