OpenCL / AMD: глубокое обучение

во время" googl'ING " и проведения некоторых исследований я не смог найти любой серьезные / популярные рамки / sdk для научных GPGPU-вычислений и OpenCL on AMD оборудование. Есть ли какая-либо литература и/или программное обеспечение, которое я пропустил?

особенно меня интересует глубокое изучение.

Я знаю deeplearning.net рекомендует NVIDIA оборудование и CUDA основы. Кроме того, все большие рамки глубокого обучения, которые я знаю, такие как Caffe, Феано, Факел, DL4J, ... сосредоточены на CUDA и не планируйте поддерживать OpenCL / AMD.

кроме того, можно найти множество научных работ, а также соответствующую литературу для CUDA на основе задач глубокого обучения, но почти ничего для OpenCL / AMD решений.

Is есть шанс, что новые или существующие научные рамки появятся для OpenCL / AMD решений в 2015/16?

Что такое хорошее начало для глубокое изучение С OpenCL / AMD? Есть литература? Учебники? Разные источники?

8 ответов


изменить 1 посмотреть Микаэль городе Руссон это ответ-Amazon теперь путь вперед, как вы можете "арендовать" вычислительную мощность от них.

Изменить 2 я создал Джонатан Служебная Библиотека-C++

В Разработке


- - - Aug 2017 Обновление прохладные новые вещи произошли на стороне AMD - - -

теперь фактически можно запустить любую библиотеку на большинстве аппаратных средств AMD Регистрация Здесь

по состоянию на 25 октября 2015

похоже, что AMD и другие распространили свои руки на разработку нескольких ускоренных фреймворков OpenCL для deeplearning. Так что да поддержка OpenCL теперь существует для deeplearning:)

Это список ускоренных OpenCL рамки или инструменты, которые были разработаны с учетом глубокого обучения в первую очередь. Я надеюсь, что они будут обновляться в течение предстоящих лет

мы знаем, что прямо сейчас (25 октября 2015 года) есть три основы глубокого обучения, которые очень популярны среди исследователей и видели некоторые коммерческие продукты

  1. Феано

  2. Caffe

  3. Факел


caffe имеет довольно хорошая поддержка OpenCL, потому что amd разработала полную версию caffe, которая поддерживает почти все функции caffe, а также активно развивается. он называется OpenCL Caffe. а вот и хранилище

OpenCL Caffe

Если вы думаете о производительности, то в соответствии с этим сайтом(Я не отмечал его сам) он дает около 261 изображений в секунду или 22.5 миллионов изображений в день в аппаратном обеспечении AMD R9 Fury(обучение). сравнить с nvidia K40, которая может обрабатывать 40 миллионов изображений в день. таким образом, согласно сайту, он может дать половину производительности за одну шестую денег.(учитывая, что k40-это карта 3000$, а R9 fury-около 600$). однако использование любой потребительской карты даст вам проблему с памятью (vram), которая очень важна в глубоком обучении.


Факел в последние дни также, похоже, имеет достойную поддержку OpenCL. Однако она поддерживается одним человеком. Он утверждает, что имеет полную поддержку всех функций факел. Однако это не дает представления о производительности. Вот хранилище. он активно поддерживается.

cltorch


В настоящее время, похоже, нет достойного бэкэнда opencl для Theano framework, но работа продолжается. и простые программы можно сделать с текущей версией.


есть некоторые другие рамки opencl для deeplearning тоже. Это займет некоторое время, чтобы разобраться в них, чтобы увидеть, если они работают правильно или нет.


альтернативой является использование экземпляров GPU в Amazon Web Services. Вы можете найти AMIs с уже установленными часто используемыми пакетами глубокого обучения. Например:

совет: используйте спотовые экземпляры, чтобы получить более дешевую цену (около 10 центов / час для g2.2xlarge).


PlaidML (https://github.com/plaidml/plaidml)-это полностью открытая среда глубокого обучения, которая работает поверх OpenCL и интегрируется с Keras, чтобы обеспечить знакомый пользовательский API. README в репо имеет более подробный статус, в настоящее время convnet inference on Linux хорошо поддерживается, но мы (http://vertex.ai) работают над расширением полноты и поддержки платформы так быстро, как мы можем. Наши машины непрерывной интеграции включают ассортимент AMD и графические процессоры NVIDIA, все Linux на данный момент, но мы также работаем над добавлением Mac и Windows.


Я пишу поддержку opencl 1.2 для Tensorflow. https://github.com/hughperkins/tensorflow-cl В настоящее время поддерживает:

  • умножение матрицы Бласа
  • градиенты
  • собственные операции, такие как: сокращения, argmin/argmax, операции на элемент (двоичные и унарные)

TensorFlow теперь есть поддержка OpenCL на план.

посмотреть: выпуск Github.

надеюсь, не так далеко от рабочей версии.


пожалуйста, проверьтеhttps://01.org/intel-deep-learning-framework - Intel® Deep Learning Framework (IDLF) обеспечивает унифицированную структуру для платформ Intel®, ускоряющих глубокие сверточные нейронные сети. Это с открытым исходным кодом, так что вы можете перенести его на оборудование AMD, а также. Классная вещь:он может работать на MacBook Pro с графикой Intel Iris.


Проверьте платформа ROCm, который управляется AMD. Это первая платформа с открытым исходным кодом HPC / Hyperscale-class для вычислений GPU, которая также независима от языка программирования.

в частности: