Стек системы Pentaho против Майкрософт Би [закрыт]
моя компания активно инвестирует в стек MS BI (SQL Server Reporting Services, -Analysis Services и-Integration Services), но я хочу взглянуть на то, что, по-видимому, больше всего говорят об альтернативном Pentaho с открытым исходным кодом.
Я установил версию, и я получил ее и работает довольно безболезненно. Это хорошо. Но у меня нет времени, чтобы начать использовать его для реальной работы, чтобы получить полное представление о пакете.
У любого из вас есть какие-либо идеи о том, каковы плюсы и минусы Pentaho vs MS BI, или какие-либо ссылки на такие сравнения?
высоко ценится!
9 ответов
Я рассмотрел несколько стеков Bi, находясь на пути к выходу из бизнес-объектов. Многие мои комментарии являются предпочтениями. Оба набора инструментов превосходны. Некоторые вещи, как я предпочитаю шоколадную помадку мороженое брауни над простым шоколадом.
У Pentaho есть действительно умные ребята, работающие с ними, но Microsoft была на хорошо финансируемом и хорошо спланированном пути. Имейте в виду, что MS по-прежнему являются аутсайдерами на рынке баз данных. Оракул здесь король. Быть конкурсным MS было раздавая много вкусностей, когда вы покупаете базу данных и были вынуждены изобретать свою платформу пару раз. Я знаю, что речь идет не о базе данных, но битва за БД заставляет MS отдавать много, чтобы добавить ценность в свой стек.
1.) Платформа
SQL server не работает в Unix или Linux, поэтому они автоматически исключаются из этого рынка. Windows сейчас стоит примерно столько же, сколько некоторые версии или Unix. Windows довольно дешево и работает faily хорошо. Он дает мне столько же проблем, сколько Linux.
2.) И OLAP
Услуги анализа была обновлена в 2005 году (тока 2008) в 2000 версии. Это приказ magnatude более мощный над 2000. Пентахо (Мондриан) не так быстро, как когда вы становитесь большим. Он также имеет несколько функций. Это очень хорошо, но есть в нем инструменты. Оба поддерживают Excel в качестве платформы, которая является esscential. Версия MS более надежна.
3.) ETL
MS-DTS был заменил с помощью служб SSIS. Опять же, порядок увеличения magnatude в скорости, мощности и способности. Он контролирует любое и все движение данных или управление программой. Если он не может этого сделать, вы можете написать сценарий в Powershell. Наравне с Informatica в выпуске 2008 года.
Pentaho-намного лучше, чем раньше. Не так быстро, как хотелось бы, но я могу сделать почти все, что хочу.
4.) приборной панели
Системы Pentaho улучшилась в этом. Это как-то неудобно и недружелюбно развиваться, но там на самом деле не реальный экв для ср.
5.) reports
MS reports действительно мощный, но не все, что трудно использовать. Сейчас мне это нравится, но сначала я ненавидел это, пока не узнал немного лучше. Я использовал crystal reports, и MS report builder намного мощнее. В MS легко делать сложные вещи, но немного сложнее делать легкие вещи.
Пентахо немного неуклюж. Мне это совсем не нравилось, но ты можешь. Я нашел это слишком сложным. Я хочу, чтобы это был либо больше похоже на Crystal report builder или MS report builder, но это похоже на jasper. Я считаю, что это трудно. Это может быть предпочтением.
6.) ad hoc
MS-это был настоящий победитель для меня. Я тестировал его с моими пользователями, и они мгновенно влюбились в MS user report builder. Разница заключалась в том, что он был не только прост в использовании, но и продуктивен.
Пентахо-хорошая, но довольно старая школа. Он использует более типичную модель на основе мастера и имеет мощные инструменты но я ненавижу это. Это отличный инструмент для того, что это такое, но мы перешли от этого стиля, и никто не хочет возвращаться. Та же проблема, что и с logiXML. Интерфейс работал хорошо для того, что это было, но на самом деле не сильно отличается от того, что мы использовали 12 лет.
http://wiki.pentaho.com/display/PRESALESPORTAL/Methods+of+Interactive+Reporting
есть некоторые опытные люди, которые могут заставить Pentaho действительно работать хорошо, я просто нашел MS suite, чтобы быть больше продуктивный.
предупреждение - есть множество сайтов, где перечислены многочисленные недостатки, ошибки и раздражения с SSIS. Не уверен, почему SSIS вышел на первое место с сообщением , но прежде чем вы поставите свой проект на него, посмотрите, что люди должны сказать в блогосфере. Из моего опыта его о 20:1 разглагольствования о том, как ужасно SSIS работать с-я могу согласиться, а также, в настоящее время ищет любую альтернативу.
большой информация здесь? Я не пробовал Pentaho, но и планирую проверить его. Я опытный консультант MS BI, использую его с 1998 года. SSIS очень быстрый и очень мощный, но критика на месте. Я нашел следующие проблемы с SSIS:
(1) трудно отлаживать, вы получаете загадочные ошибки, которые могут не дать вам никакого намека на то, что и где проблема на самом деле.
(2) за предыдущий комментарий, Это самая дерьмовая среда разработки когда-либо! Я понятия не имею, о чем они думают.
(a) создайте таблицу со 100 или более столбцами и поместите на нее соединение слияния. Теперь вернитесь и попробуйте обновить соединение слияния (например, вытащить новый столбец). Это может занять несколько минут, даже на самой быстрой машине после нажатия кнопки ok на слиянии, чтобы сохранить изменения. У меня огромный поток данных с большим количеством широких записей и многими объединениями слияний. Добавление одного столбца в поток данных занимает более половины дня. Я обновляю слияние присоединяйтесь, а затем должны пойти сделать что-то еще и проверить 5-10 минут спустя, чтобы увидеть, если это сделано. Ответ Microsoft на это-разбить пакет на несколько пакетов, поместить данные в таблицу или двоичный файл между ними. Ну, если вы собираетесь диск между всеми шагами, вы можете хорошо сделать все это в SQL! Одна из основных целей инструмента ETL-это все это в памяти и избегать ввода-вывода диска
(b) конструктор откровенно падает иногда, теряя все ваши работа с момента последнего сохранения (я делаю ctrl-S во сне из-за этого)
(c) мне пришлось выяснить взлом и генерировать пакет SSIS XML в Excel для широких записей. У меня есть клиент здравоохранения, где записи столбцов 600 + являются обычным делом. Если вы пытаетесь определить формат файла с 600 столбцами в SSIS, вы должны ввести каждый столбец по одному за раз!!! Даже MS access позволяет вырезать и вставлять макет из электронной таблицы в макет файла, но не SSIS. Поэтому мне пришлось сгенерировать XML из макета и вставьте XML-код в нужное место в пакете. Уродливый способ сделать это, но он сохранил целые дни работы и множество ошибок.
(d) аналогично (c), если вам нужно обрезать все ваши столбцы, и у вас есть 600+ из них, угадайте, что? В производном компоненте столбца вы должны ввести trim (column1) 600+ раз! Теперь я делаю все простые преобразования, как это в SQL-запросе, чтобы получить данные, так как это может быть легко сгенерировано из листа Excel.
(e) Есть много причудливых вещей, компонентов, которые становятся невидимыми, иногда вы открываете пакет, и все компоненты полностью переставляются бессвязно.
(f) функция FTP, возможно, одна из самых распространенных вещей, которые вам нужны в ETL, слаба и поддерживает только простой ванильный FTP, который никто не использует. В наши дни все используют SFTP,FTPS, https и т. д... Поэтому почти каждая реализация требует использования стороннего приложения для передачи файлов, управляемого линией, пакет должен вызов.
(g) пытаясь CYA, подобно нелепой безопасности в Windows Vista, Microsoft сделала это чрезвычайно трудно на самом деле продвигать пакет служб SSIS из одной среды в другую. По умолчанию это глупая вещь "шифрование конфиденциальной информации с помощью пользовательского ключа", что означает, что она должна работать под той же учетной записью в среде, в которую вы ее перемещаете, как и среда, в которой Вы ее разработали, что редко бывает. Есть лучшие способы настройки но он всегда пытается вернуться к этой совершенно бесполезной защите безопасности.
(h) наконец, большинство этих проблем теперь находятся в 3-й версии, ясно указывая, что Microsoft не планирует их исправлять.
(i) отладка не так проста, как другие языки.
SSIS все еще имеет очень много преимуществ, но не без некоторой серьезной боли.
Я начал использовать MS Reporting Services много лет назад и просто люблю его. Я не пробовал решение отчетности Penaho, поэтому я не могу прокомментировать его. Я также не пробовал ни Analysis Services, ни альтернативу Pentaho.
недавно мне понадобилось решение ETL и, будучи знакомым с MSSQL и MSRS, казалось очевидным, что я рассмотрю и, вероятно, выберу службу интеграции MS. Но для меня МСИС была ужасна. В основном потому, что это не было интуитивным. Проведя пару дней пытаясь изучить инструмент, я решил искать альтернативу и наткнулся на интеграцию данных Pentaho, ранее известную как Kettle. Я запустил его в течение нескольких минут и сразу же создал свою первую трансформацию. Это просто работает.
по общему признанию, мои потребности довольно просты, но производительность была отличной, и сообщество кажется очень полезным.
Я использовал SSIS и Pentaho Kettle, и я настоятельно рекомендую использовать Pentaho Kettle для вашего инструмента ETL вместо SSIS.
мои причины: - поток SSIS-это задача к задаче. Чайник заставляет задуматься о строках данных, проходящих через систему. Подход Кеттла кажется мне более интуитивным. -ЕРИП-это плохо документированы. Такое случается. Но, похоже,есть много щелчков и настроек переменных. Очень сложно. Pentaho имеет форум сообщества, который весьма полезно. - Я доверяю Pentaho для интеграции с несколькими типами баз данных, включая SQL Server. Вы также можете использовать JDBC, что приятно. Кроме того, я использовал его для перехода между SQL Server и Oracle с одной стороны и Vertica с другой. Оно имеет Навальный затяжелитель доступный для его на Vertica. Это очень мило. - Я нашел это очень, очень трудно относительно говоря, чтобы получить пакет SSIS для запуска на сервере. Это просто не стоило моего времени. - Я обнаружил, что для Pentaho довольно легко отправить предупреждение или сообщение об ошибке человек или список людей. - Pentaho позволяет выполнять задачи на JavaScript для вещей, которые нуждаются в некоторой логике. Простой и легко сделать с языком, большинство из нас сталкивались.
Я не могу предложить никаких входных данных в стеке MS BI, но в самом последнем Баркемп Орландо, люди из Pentaho были там и говорили о своих продуктах, и это была чрезвычайно впечатляющая демонстрация.
тот факт, что это проект с открытым исходным кодом, который вы можете расширить, а также платный пакет для действительно хорошего обслуживания оставляет вам много вариантов. Они продемонстрировали некоторую оплачиваемую работу, которую они сделали для клиента, и они определенно wow'D толпа.
У меня также была возможность немного пообщаться с разработчиком, работающим на стороне хранения данных для Pentaho, и он был очень резким и был очень открыт для предложений и не имел проблем с ответами на любые вопросы.
Что касается компании, Pentaho действительно впечатлил меня как своей работой, так и тем, насколько дружелюбными и доступными были все их разработчики.
пару очков, чтобы добавить
- хотя есть оконная версия всех инструментов Pentaho, установка в windows является обременительной. Pentaho (особенно запуск и остановка сервера, который отделен от инструмента GUI) обычно используется в Linux, а не в Windows shop, и есть крутая кривая обучения, идущая от Windows к Linux.
- любой инструмент имеет кривую обучения, когда вы переходите к нему. когда вы привыкнете всегда нажимать OK и обновлять метаданные, когда у вас есть проблемы, SSIS не так уж и плохо. Пентахо тоже может быть чокнутым.
вопросы инструментов должны решаться с точки зрения более крупных культурных вопросов - какие магазины используют инструменты с открытым исходным кодом? по моему опыту я обнаружил, что, хотя магазины Microsoft кажутся более жесткими, когда у вас возникли проблемы со строкой подключения в магазине Microsoft, вы можете получить помощь.. в магазинах Pentaho и Linux его больше DYI.
кстати, следите за продажами Pentaho, которые делают демонстрации-все, что они шоу намного сложнее получить работу, чем кажется! :)
Если вы ищете надежную, недорогую альтернативу big boys LogiXML имеет dashboarding и специальную отчетность на платформе .NET. Мы используем их с конца 2006 года, когда Pentaho только начинал, но я не смотрел на него некоторое время.
недавно я попробовал pentaho с открытым исходным кодом BI. Я обнаружил, что это было крайне неуклюже. Это было не очень интуитивно, и время разработки заняло гораздо больше времени.
Он сильно отличается от решений Oracle или ms BI. Возможно, enterprise edition лучше.