Разница между Talend Open Studio для интеграции данных и Talend Open Studio для больших данных
Я смущен различными продуктами, которые предлагает Talend.
Кажется,Talend Open Studio for Data Integration
и Talend Open Studio for Big Data
являются одним и тем же продуктом, но только с различными компонентами, установленными по умолчанию. Это правда? Если я использую Talend Open Studio для интеграции данных и загружаю необходимые компоненты из Talend Exchange (например, для Google BigQuery), является ли это фактически тем же продуктом?
5 ответов
помимо различных разъемов, они отличаются по одной ключевой точке, кодовой базе, которую они генерируют.
Talend Open Studio для интеграции данных генерирует код Java, в то время как Talend Open Studio для больших данных может генерировать код сокращения карты, а также код Java.
посмотреть здесь для примера предложения больших данных Talend, показывающего, как генерировать задания кода сокращения карты.
речь идет не только о компонентах:
From:http://www.talend.com/products/data-integration
Особенности: Job Designer, Job Designer, 450 + Разъемы, Управление Версиями
From:http://www.talend.com/products/big-data
особенности: конструктор заданий, компоненты для HDFS, HBase, HCatalog, Hive, Свинья, Sqoop, Планировщик Заданий Hadoop, NoSQL Поддержка
Я не уверен, но я не думаю, что официальные компоненты можно найти на веб-сайте биржи Talend. Там вы найдете только компоненты, внесенные сообществом.
в Talend Open Studio для интеграции данных вы можете создать стандартное задание (означает, что непосредственно вы можете использовать компонент DI и в задней части будет создан java-код).
но Talend Open Studio для больших данных у вас есть возможность создать map / reduce job (означает, что на задней стороне карты/reduce code [фактически java map/reduce] будет сгенерирован код). В задании map/reduce все компоненты запускают как map, так и reduce на сервере talend. Как и в компоненте tmap, вы можете видеть карту и уменьшать панель задач под компонентом при его выполнении.
Talend не различает разъемы.Spark является differentator между TOS и лицензионной версии.
Open studio не поддерживает spark как в пакетном, так и в реальном времени.
Talend имеет различные открытые студийные продукты для различных требований.
Talend OS для интеграции данных-обслуживает требования к интеграции данных / ETL. Это не будет иметь компонентов, специфичных для больших данных.
Talend OS для больших данных-обслуживает большие требования к данным. Вы можете подключиться к Hadoop, Hive и другим компонентам больших данных. Помимо генерации кода Java, это также может генерировать код сокращения карты.
У вас также есть Talend OS для ESB, MDM и данных Качество которые поставляют еду к различным требованиям.