Что означает "массовая загрузка"?

переходя от статьи к статье, я везде вижу выражение "массовая загрузка".

Что это на самом деле (технически) в смысле?

Что это означает?

объяснение на основе вариантов использования приветствуется.

4 ответов


индексы обычно оптимизированы для вставки строк по одному за раз. Когда вы добавляете много данных сразу, вставка строк по одной может быть неэффективной. Например, с B-деревом оптимальным способом вставки одного ключа является очень плохой способ добавления к пустому индексу кучи данных.

вместо этого вы преследуете другую стратегию с B-деревьями. Вы отсортировать все данные, и группа ее в блоки. Затем вы можете построить новое B-дерево, преобразовав блоки в узел дерева. Хотя оба метода имеют одинаковую асимптотическую производительность, O(N log (n)), операция массовой нагрузки имеет гораздо меньший коэффициент.


массовая загрузка-это способ загрузки данных (обычно в базу данных) в "больших кусках". Когда вы можете ввести клиента или заказ на покупку или информацию о товарах в инвентаре по одному в систему, массовая загрузка берет файл с такой же информацией и загружает сотни/тысячи/миллионы записей за короткий период времени.

если конвертировать из одной СУБД в другую, вы надеетесь не вводить всю информацию в новую БД из старой ДЕЦИБЕЛ. Вместо этого вы сбрасываете информацию из старой БД в файл в формате, который может быть легко прочитан новой БД, а затем импортируете эти данные в новую БД.

вот что влечет за собой массовая загрузка (на уровне 35k футов, во всяком случае)


массовая загрузка используется для импорта/экспорта больших объемов данных. Обычно массовые операции не регистрируются, и целостность транзакций может работать не так, как ожидалось. Часто массовые операции обходят триггеры и проверки целостности, такие как ограничения. Это значительно повышает производительность для больших объемов данных.


следует помнить, что массовая загрузка подразумевает, что содержимое данных из источника в цель одинаково, но это верно только в том случае, если исходная система согласна. Для любого источника данных, и особенно для больших данных, исходные данные могут изменяться после чтения и передачи данных. Традиционно онлайн-системы должны отключаться или приостанавливать обновления, если требуется точный момент времени, соответствующий источнику.