Разница между Talend Open Studio для интеграции данных и Talend Open Studio для больших данных

Я смущен различными продуктами, которые предлагает Talend.

Кажется,Talend Open Studio for Data Integration и Talend Open Studio for Big Data являются одним и тем же продуктом, но только с различными компонентами, установленными по умолчанию. Это правда? Если я использую Talend Open Studio для интеграции данных и загружаю необходимые компоненты из Talend Exchange (например, для Google BigQuery), является ли это фактически тем же продуктом?

5 ответов


помимо различных разъемов, они отличаются по одной ключевой точке, кодовой базе, которую они генерируют.

Talend Open Studio для интеграции данных генерирует код Java, в то время как Talend Open Studio для больших данных может генерировать код сокращения карты, а также код Java.

посмотреть здесь для примера предложения больших данных Talend, показывающего, как генерировать задания кода сокращения карты.


речь идет не только о компонентах:

From:http://www.talend.com/products/data-integration

Особенности: Job Designer, Job Designer, 450 + Разъемы, Управление Версиями

From:http://www.talend.com/products/big-data

особенности: конструктор заданий, компоненты для HDFS, HBase, HCatalog, Hive, Свинья, Sqoop, Планировщик Заданий Hadoop, NoSQL Поддержка

Я не уверен, но я не думаю, что официальные компоненты можно найти на веб-сайте биржи Talend. Там вы найдете только компоненты, внесенные сообществом.


в Talend Open Studio для интеграции данных вы можете создать стандартное задание (означает, что непосредственно вы можете использовать компонент DI и в задней части будет создан java-код).

но Talend Open Studio для больших данных у вас есть возможность создать map / reduce job (означает, что на задней стороне карты/reduce code [фактически java map/reduce] будет сгенерирован код). В задании map/reduce все компоненты запускают как map, так и reduce на сервере talend. Как и в компоненте tmap, вы можете видеть карту и уменьшать панель задач под компонентом при его выполнении.


Talend не различает разъемы.Spark является differentator между TOS и лицензионной версии.

Open studio не поддерживает spark как в пакетном, так и в реальном времени.


Talend имеет различные открытые студийные продукты для различных требований.

Talend OS для интеграции данных-обслуживает требования к интеграции данных / ETL. Это не будет иметь компонентов, специфичных для больших данных.

Talend OS для больших данных-обслуживает большие требования к данным. Вы можете подключиться к Hadoop, Hive и другим компонентам больших данных. Помимо генерации кода Java, это также может генерировать код сокращения карты.

У вас также есть Talend OS для ESB, MDM и данных Качество которые поставляют еду к различным требованиям.