Tensorflow квантования

Я хотел бы оптимизировать график с помощью инструмента transform_graph Tensorflow. Я попытался оптимизировать график из зачисление средств (и другие с аналогичными архитектурами кодировщика-декодера). Однако оптимизированный график на самом деле медленнее при использовании quantize_weights и даже намного медленнее при использовании quantize_nodes. Из документации Tensorflow может быть никаких улучшений, или даже медленнее, при квантовании. Любая идея, если это нормально с графиком / программным обеспечением / оборудованием внизу?

вот моя системная информация для вашей справки:

  • платформа и дистрибутив ОС: Linux Ubuntu 16.04
  • TensorFlow установлен из: использование исходного кода TF (CPU) для преобразования графов, использование binary-python(GPU) для вывода
  • версия TensorFlow: оба используют r1.3
  • версия Python: 2.7
  • Базел версия: 0.6.1
  • версия CUDA / cuDNN: 8.0 / 6.0 (только вывод)
  • модель GPU и память: GeForce GTX 1080 Ti

Я могу опубликовать все сценарии, используемые для воспроизведения, если это необходимо.

2 ответов


похоже, что квантование в Tensorflow происходит только на процессорах. Смотри:https://github.com/tensorflow/tensorflow/issues/2807


У меня такая же проблема в среде ПК. Моя модель в 9 раз медленнее, чем не квантовать.

но когда я портирую свою квантованную модель в android-приложение, ее можно ускорить.

похоже, что текущая работа только на CPU и только базовый процессор ARM, такой как Android-телефон.