OpenCL Cloo: ошибка отсутствия ресурсов

при запуске некоторого тестового кода в OpenCL (используя Cloo C#), я начал получать эти ошибки OutOfResource из OpenCL, а иногда Unity просто падает полностью, прежде чем я получу исключение. Я в основном повторно вызываю функцию ядра снова и снова с различным количеством глобальных/локальных рабочих элементов для проверки времени. Я оставляю аргументы одинаковыми и вызываю ядро, начиная с 2x2x2 global и 2x2x2 local и повторяя uperwards, проверяя только допустимые размеры. Иногда это работает нормально, но большинство в то время, когда он завершает около 30 или 40 вызовов Execute (), а затем аварийно завершает работу при следующем вызове Execute ().

Примечание: Execute относится к OpenCL.DLL на компьютере. Unity трассировки стека возвращает NULL я предполагаю из-за собственного кода.

кто-нибудь знает, что может быть причиной этого?

Примечание: эта версия Cloo является Cloo-Unity от GitHub, и я использую его в Unity. Эквивалентная функция OpenCL вызывается, когда я получаю ошибку clEnqueueNDRangeKernel (), но он называется Execute () в Cloo.

Код:

//Setup inputs one time...
foreach (var input in p_inputs)
{
     inputs.Add(input.Function, input);
     profiles.Add(input.Function, new RunProfile(input.Function, input.Weight));
     input.Input.Prepare(package[input.Function]);
}


//Profile...
DateTime start;
int g_state = 0;
int l_state = 0;
long[] g = new long[3] { 2, 2, 2 };
long[] l = new long[3] { 2, 2, 2 };
while(g[0] * g[1] * g[2] < Device.MaxWorkGroupSize)
{
       l[0] = 2; l[1] = 2; l[2] = 2; l_state = 0; //Reset locals
       bool proceed = true;
       while(proceed)
       {
           proceed = (l[0] != g[0] || l[1] != g[1] || l[2] != g[2]);

           if (CLUtilities.ValidateExecutionParameters(Device, g, l))
           {
               Debug.Log("Profiling Start: " + g.ToEnumeratedString() + " / " + l.ToEnumeratedString());
               foreach (var profile in profiles)
               {
                   start = DateTime.Now;
                   //Exception here when on (g=6x4x4, l=6x4x4) 
                   package.Execute(package[profile.Key], g, l);
                   package.Commands.Flush();
                   package.Commands.Finish();
                   float time = (float)(DateTime.Now - start).TotalMilliseconds;
                   profile.Value.AddRun(g, l, time);
               }
               Debug.Log("Profiling Ending: " + g.ToEnumeratedString() + " / " + l.ToEnumeratedString());
           }

           l[l_state] += 2;
           l_state = (l_state == 2) ? 0 : l_state + 1;
       }

    g[g_state] += 2;
    g_state = (g_state == 2) ? 0 : g_state + 1;
}

3 ответов


Извините, я не могу прокомментировать причину менее 50 повторений. но какую операционную систему вы используете? gpu? водитель? у меня похожие проблемы, вызванные opencl.dll я использовал win10 и Nvidia (x64). Также посмотрите на https://social.technet.microsoft.com/Forums/en-US/85680348-c2c4-40bc-9f39-9dcfeea331c0/windows-10-opencldll-error?forum=win10itprogeneral

кажется, что есть / была проблема со сжатием памяти в win10.

моя проблема была вызвана обновление win7 до win10 без обновления драйверов nvidia.


Я только что вернулся к публикации этого, но проблема оказалась связана с тем, что я не вспомнил ядро.SetArgument() каждый раз, когда я вызывал метод Execute (). Я первоначально сделал это, потому что я беспокоился, что он будет повторно копировать буфер, но, как оказалось, копия буфера не происходит в этом методе в любом случае (так что накладные расходы были небольшими в любом случае).


ваша видеокарта nvidia для отображения? Если nvidia является основной видеокартой, вам нужно отредактировать реестр, чтобы отключить watchdog.

для windows 7

system/current/control/graphicsdriver 
TdrLevel(DWORL) : 0