OpenCL / AMD: глубокое обучение
во время" googl'ING " и проведения некоторых исследований я не смог найти любой серьезные / популярные рамки / sdk для научных GPGPU-вычислений и OpenCL on AMD оборудование. Есть ли какая-либо литература и/или программное обеспечение, которое я пропустил?
особенно меня интересует глубокое изучение.
Я знаю deeplearning.net рекомендует NVIDIA оборудование и CUDA основы. Кроме того, все большие рамки глубокого обучения, которые я знаю, такие как Caffe, Феано, Факел, DL4J, ... сосредоточены на CUDA и не планируйте поддерживать OpenCL / AMD.
кроме того, можно найти множество научных работ, а также соответствующую литературу для CUDA на основе задач глубокого обучения, но почти ничего для OpenCL / AMD решений.
Is есть шанс, что новые или существующие научные рамки появятся для OpenCL / AMD решений в 2015/16?
Что такое хорошее начало для глубокое изучение С OpenCL / AMD? Есть литература? Учебники? Разные источники?
8 ответов
изменить 1 посмотреть Микаэль городе Руссон это ответ-Amazon теперь путь вперед, как вы можете "арендовать" вычислительную мощность от них.
Изменить 2 я создал Джонатан Служебная Библиотека-C++
В Разработке
-
tensorflow
is добавлять поддержка OpenCL после улучшенияEigen
и другие зависимости закончил -
theano
is добавление поддержки в OpenCL черезclBLAS
-
Caffe
находится в этапы развития of добавление поддержки OpenCL, но немного позадиtheano
в процессе, кажется
- - - Aug 2017 Обновление прохладные новые вещи произошли на стороне AMD - - -
теперь фактически можно запустить любую библиотеку на большинстве аппаратных средств AMD Регистрация Здесь
по состоянию на 25 октября 2015
похоже, что AMD и другие распространили свои руки на разработку нескольких ускоренных фреймворков OpenCL для deeplearning. Так что да поддержка OpenCL теперь существует для deeplearning:)
Это список ускоренных OpenCL рамки или инструменты, которые были разработаны с учетом глубокого обучения в первую очередь. Я надеюсь, что они будут обновляться в течение предстоящих лет
мы знаем, что прямо сейчас (25 октября 2015 года) есть три основы глубокого обучения, которые очень популярны среди исследователей и видели некоторые коммерческие продукты
Феано
Caffe
Факел
caffe имеет довольно хорошая поддержка OpenCL, потому что amd разработала полную версию caffe, которая поддерживает почти все функции caffe, а также активно развивается. он называется OpenCL Caffe. а вот и хранилище
Если вы думаете о производительности, то в соответствии с этим сайтом(Я не отмечал его сам) он дает около 261 изображений в секунду или 22.5 миллионов изображений в день в аппаратном обеспечении AMD R9 Fury(обучение). сравнить с nvidia K40, которая может обрабатывать 40 миллионов изображений в день. таким образом, согласно сайту, он может дать половину производительности за одну шестую денег.(учитывая, что k40-это карта 3000$, а R9 fury-около 600$). однако использование любой потребительской карты даст вам проблему с памятью (vram), которая очень важна в глубоком обучении.
Факел в последние дни также, похоже, имеет достойную поддержку OpenCL. Однако она поддерживается одним человеком. Он утверждает, что имеет полную поддержку всех функций факел. Однако это не дает представления о производительности. Вот хранилище. он активно поддерживается.
В настоящее время, похоже, нет достойного бэкэнда opencl для Theano framework, но работа продолжается. и простые программы можно сделать с текущей версией.
есть некоторые другие рамки opencl для deeplearning тоже. Это займет некоторое время, чтобы разобраться в них, чтобы увидеть, если они работают правильно или нет.
альтернативой является использование экземпляров GPU в Amazon Web Services. Вы можете найти AMIs с уже установленными часто используемыми пакетами глубокого обучения. Например:
- Факел:https://github.com/torch/torch7/wiki/Cheatsheet#ec2-public-ami
- Theano + Caffe: https://www.kaggle.com/forums/f/208/getting-started/t/11505/an-aws-ami-mainly-for-deep-learning
совет: используйте спотовые экземпляры, чтобы получить более дешевую цену (около 10 центов / час для g2.2xlarge).
PlaidML (https://github.com/plaidml/plaidml)-это полностью открытая среда глубокого обучения, которая работает поверх OpenCL и интегрируется с Keras, чтобы обеспечить знакомый пользовательский API. README в репо имеет более подробный статус, в настоящее время convnet inference on Linux хорошо поддерживается, но мы (http://vertex.ai) работают над расширением полноты и поддержки платформы так быстро, как мы можем. Наши машины непрерывной интеграции включают ассортимент AMD и графические процессоры NVIDIA, все Linux на данный момент, но мы также работаем над добавлением Mac и Windows.
Я пишу поддержку opencl 1.2 для Tensorflow. https://github.com/hughperkins/tensorflow-cl В настоящее время поддерживает:
- умножение матрицы Бласа
- градиенты
- собственные операции, такие как: сокращения, argmin/argmax, операции на элемент (двоичные и унарные)
TensorFlow теперь есть поддержка OpenCL на план.
посмотреть: выпуск Github.
надеюсь, не так далеко от рабочей версии.
пожалуйста, проверьтеhttps://01.org/intel-deep-learning-framework - Intel® Deep Learning Framework (IDLF) обеспечивает унифицированную структуру для платформ Intel®, ускоряющих глубокие сверточные нейронные сети. Это с открытым исходным кодом, так что вы можете перенести его на оборудование AMD, а также. Классная вещь:он может работать на MacBook Pro с графикой Intel Iris.
Проверьте платформа ROCm, который управляется AMD. Это первая платформа с открытым исходным кодом HPC / Hyperscale-class для вычислений GPU, которая также независима от языка программирования.
в частности:
для глубокого обучения см. https://rocm.github.io/dl.html
-
для OpenCL, см.:
полезные учебники можно найти здесь:https://rocm.github.io/tutorials.html