Câu hỏi Pentaho và Microsoft BI Stack [đã đóng]


Công ty của tôi được đầu tư rất nhiều vào MS BI Stack (Dịch vụ báo cáo SQL Server, Dịch vụ -Analysis và Dịch vụ tích hợp), nhưng tôi muốn xem xét những gì dường như được nói nhiều nhất về Pentaho thay thế nguồn mở là như thế nào.

Tôi đã cài đặt một phiên bản, và tôi đã nhận nó lên và chạy khá đau đớn. Vì vậy, đó là tốt. Nhưng tôi đã không thực sự có thời gian để bắt đầu sử dụng nó cho công việc thực tế để có được một sự hiểu biết thấu đáo về gói.

Có ai trong số các bạn có hiểu biết gì về những ưu điểm và nhược điểm của Pentaho so với MS BI, hay bất kỳ liên kết nào đến những so sánh đó?

Nhiều đánh giá cao!


35
2017-09-29 21:36


gốc




Các câu trả lời:


Tôi đã xem xét nhiều ngăn xếp Bi trong khi trên một con đường để thoát khỏi đối tượng kinh doanh. Rất nhiều ý kiến ​​của tôi là sở thích. Cả hai bộ công cụ đều tuyệt vời. Một số điều là làm thế nào tôi thích sô cô la fudge kem brownie trên sô cô la đồng bằng.

Pentaho có một số người thực sự thông minh làm việc với họ nhưng Microsoft đã có một con đường được tài trợ tốt và được lên kế hoạch tốt. Hãy nhớ rằng MS vẫn là những kẻ yếu trong thị trường cơ sở dữ liệu. Oracle là vua ở đây. Để cạnh tranh MS đã cho đi rất nhiều goodies khi bạn mua cơ sở dữ liệu và đã bị buộc phải tái tạo lại nền tảng của họ một vài lần. Tôi biết điều này không phải là về cơ sở dữ liệu, nhưng trận chiến DB đã gây ra MS để cho đi rất nhiều để thêm giá trị cho ngăn xếp của họ.

1.) Nền tảng
Máy chủ SQL không chạy trên Unix hoặc Linux để chúng tự động bị loại trừ khỏi thị trường này. Windows có cùng mức giá với một số phiên bản hoặc Unix. Windows khá rẻ và chạy rất tốt. Nó mang lại cho tôi nhiều rắc rối như Linux.

2.) OLAP
Dịch vụ phân tích được tái phát minh vào năm 2005 (hiện tại là năm 2008) so với phiên bản 2000. Nó là một thứ tự của magnatude mạnh hơn 2000. Pentaho (Mondrian) không phải là nhanh khi bạn nhận được lớn. Nó cũng có vài tính năng. Nó là khá tốt nhưng có ít trong cách của các công cụ. Cả hai đều hỗ trợ Excel làm nền tảng mang tính tinh hoa. Phiên bản MS mạnh mẽ hơn.

3.) ETL
MS - DTS đã được thay thế bằng SSIS. Một lần nữa, thứ tự của magnatude tăng tốc độ, sức mạnh và khả năng. Nó kiểm soát bất kỳ và tất cả các chuyển động dữ liệu hoặc kiểm soát chương trình. Nếu nó không thể làm điều đó bạn có thể viết một kịch bản trong Powershell. Tương đương với Informatica trong bản phát hành năm 2008. Pentaho - Tốt hơn nhiều so với trước đây. Không nhanh như tôi muốn nhưng tôi có thể làm mọi thứ tôi muốn làm.

4.) bảng điều khiển
Pentaho đã cải thiện điều này. Đó là loại khó chịu và không thân thiện để phát triển nhưng có thực sự không phải là một equiv thực sự cho MS.

5.) báo cáo
MS báo cáo là thực sự mạnh mẽ nhưng không phải tất cả những gì khó sử dụng. Tôi thích nó bây giờ nhưng ghét nó lúc đầu, cho đến khi tôi biết nó tốt hơn một chút. Tôi đã sử dụng các báo cáo tinh thể và trình tạo báo cáo MS mạnh hơn rất nhiều. Nó rất dễ dàng để làm những việc khó khăn trong MS, nhưng một chút khó khăn hơn để làm những việc dễ dàng. Pentaho hơi vụng về. Tôi không thích nó chút nào nhưng bạn có thể. Tôi thấy nó quá phức tạp. Tôi ước nó giống như người xây dựng báo cáo Crystal hay người xây dựng báo cáo MS nhưng nó giống như jasper. Tôi thấy là khó khăn. Đó có thể là một sở thích.

6.) quảng cáo hoc
MS - đây là người chiến thắng thực sự đối với tôi. Tôi đã thử nghiệm nó với người dùng của tôi một họ ngay lập tức trong tình yêu với người sử dụng báo cáo MS builder. Điều làm nên sự khác biệt là nó không chỉ dễ sử dụng mà còn hiệu quả. Pentaho - là ngôi trường tốt nhưng khá cũ. Nó sử dụng mô hình dựa trên thuật sĩ điển hình hơn và có các công cụ mạnh mẽ nhưng tôi ghét nó. Nó là một công cụ tuyệt vời cho nó là gì, nhưng chúng tôi đã chuyển từ phong cách này và không ai muốn quay trở lại. Cùng một vấn đề tôi đã có với logiXML. Giao diện làm việc tốt cho những gì nó đã được nhưng không thực sự là một sự thay đổi từ những gì chúng tôi sử dụng 12 năm. http://wiki.pentaho.com/display/PRESALESPORTAL/Methods+of+Interactive+Reporting

Có một số người có kinh nghiệm ngoài đó có thể làm cho Pentaho thực sự chạy tốt, tôi chỉ tìm thấy bộ MS để làm việc hiệu quả hơn.


51
2017-10-01 17:01



Tuyệt vời và được viết tốt, cảm ơn! - Tomas
Stradas, bạn đang cung cấp thông tin tuyệt vời cho tất cả cộng đồng. Cũng viết, cảnh báo của bạn về những điều có thể không chính xác do sở thích của riêng bạn và việc tổ chức nội dung cung cấp một điểm tham chiếu tuyệt vời. Cảm ơn bạn đã dành thời gian cho việc này. - vmarquez
NagaMensh, bạn có thể cụ thể hơn không? Đường cong học tập là một chút dài so với DTS nhưng tôi tìm thấy SSIS là một công cụ cũng nghĩ ra. Informatica là so sánh gần nhất. Có những công cụ tốt khác cũng dễ sử dụng nhưng hầu hết chúng không mạnh mẽ. - Stradas
Có một đề xuất cho một trang Q & A dành riêng cho Business Intelligence. Theo dõi, đăng bài và hỗ trợ để làm cho nó lên. - bonCodigo
SQL Server hiện chạy trên Linux. - Muhammad Rehan Saeed


Cảnh báo - có rất nhiều trang web liệt kê rất nhiều thiếu sót, lỗi và phiền toái với SSIS. Không chắc chắn lý do tại sao SSIS xuất hiện trên cùng với bài đăng - nhưng trước khi bạn đặt cược dự án của mình trên đó, hãy xem những gì mọi người phải nói trong thế giới blog. Từ kinh nghiệm của tôi về việc tôi đọc về cách SSIS khủng khiếp làm việc với tôi như thế nào: Tôi cũng có thể đồng tình, hiện đang tìm kiếm bất kỳ giải pháp thay thế nào.


8
2018-04-04 23:16



SSIS có động cơ rất mạnh (nhanh / mạnh), nhưng có một trong những nhà thiết kế tồi tệ nhất mà tôi từng làm việc trong cuộc đời mình. Có vô số phiền toái nhỏ, ví dụ: nó có hàm RIGHT (), nhưng không có hàm LEFT ()! - adolf garlic
Vấn đề với SSIS là đường cong học tập - nó giống như đánh một bức tường gạch. Một khi bạn đã học được nó, mặc dù nó sẽ dễ dàng hơn, mặc dù gỡ lỗi vẫn còn khá diffacult - tôi chắc chắn rằng bạn có một gói thiết kế master / child và giữ cho mỗi gói càng nhỏ càng tốt (trong vòng lý do). - Mr Shoubs
@adolfgarlic: Chắc chắn, có một "trái". Nó được gọi là SUBSTRING () - John Fisher


Thông tin tuyệt vời ở đây? Tôi đã không cố gắng Pentaho nhưng và lập kế hoạch kiểm tra nó ra. Tôi là một chuyên gia tư vấn về MS BI dày dặn, sử dụng nó từ năm 1998. SSIS rất nhanh và rất mạnh mẽ nhưng những lời chỉ trích đã được đưa ra. Tôi đã tìm thấy các vấn đề sau với SSIS:

(1) Rất khó để gỡ lỗi, bạn nhận được các lỗi khó hiểu có thể không cung cấp cho bạn bất kỳ gợi ý nào về vấn đề và sự cố thực sự ở đâu.

(2) Mỗi ​​bình luận trước đây, đó là môi trường phát triển tồi tệ nhất từ ​​trước đến nay! Tôi không biết họ đang nghĩ gì.

(a) Tạo một bảng có từ 100 cột trở lên và đặt một hợp nhất tham gia vào nó. Bây giờ trở lại và cố gắng thực hiện một bản cập nhật cho việc kết hợp hợp nhất (như kéo một cột mới thông qua). Có thể mất vài phút, ngay cả trên máy nhanh nhất sau khi bạn nhấp vào ok trong quá trình hợp nhất để lưu thay đổi của bạn. Tôi có một dataflow lớn với rất nhiều hồ sơ rộng và nhiều hợp nhất tham gia. Thêm một cột vào luồng dữ liệu mất hơn nửa ngày. Tôi cập nhật một hợp nhất tham gia và sau đó phải đi làm cái gì khác và kiểm tra lại 5-10 phút sau đó để xem nếu nó được thực hiện. Phản ứng của Microsoft với điều này là chia nhỏ gói của bạn thành nhiều gói, đặt dữ liệu vào một bảng hoặc nhị phân giữa chúng. Vâng, nếu bạn đang đi đến đĩa giữa tất cả các bước, bạn có thể cũng làm toàn bộ điều trong SQL! Một trong những mục đích chính của một công cụ ETL là cho tất cả các công cụ này trong bộ nhớ và tránh đĩa I / O.

(b) Các nhà thiết kế hoàn toàn bị treo đôi khi, mất tất cả công việc của bạn kể từ lần lưu cuối cùng (tôi làm ctrl-S trong giấc ngủ của tôi bây giờ vì điều này)

(c) Tôi đã phải tìm ra một bản hack và tạo ra gói XML của SSIS trong Excel cho các bản ghi rộng. Tôi có một khách hàng chăm sóc sức khỏe, nơi 600+ hồ sơ cột là phổ biến. Nếu bạn cố gắng định nghĩa một định dạng tệp với 600 cột trong SSIS, bạn phải nhập từng cột một trong một lần! Ngay cả truy cập MS cũng cho phép bạn cắt và dán bố cục từ bảng tính vào bố cục tệp, chứ không phải SSIS. Vì vậy, tôi đã phải tạo XML từ bố cục và dán mã XML vào đúng vị trí trong gói. Cách xấu xí để làm điều đó nhưng nó lưu toàn bộ ngày làm việc và rất nhiều lỗi.

(d) Tương tự như (c), nếu bạn cần phải cắt tất cả các cột của bạn và bạn đã nói 600+ của họ, đoán những gì? Trong thành phần cột có nguồn gốc, bạn phải nhập trim (column1) 600+ lần! Bây giờ tôi làm tất cả các biến đổi đơn giản như thế này trong truy vấn SQL để lấy dữ liệu, vì nó có thể dễ dàng được tạo ra từ một trang tính Excel.

(e) Có nhiều điều kỳ quặc, thành phần biến thành vô hình, đôi khi bạn mở gói và tất cả các thành phần được sắp xếp lại hoàn toàn một cách không hoàn hảo.

(f) Tính năng FTP, có thể là một trong những thứ phổ biến nhất bạn cần trong ETL, yếu và chỉ hỗ trợ FTP thuần túy mà không ai sử dụng. Mọi người trong những ngày này sử dụng SFTP, FTPS, https, v.v ... Vì vậy, hầu như mọi việc triển khai đều yêu cầu sử dụng ứng dụng chuyển tệp truyền tải dòng bên thứ ba mà gói phải gọi.

(g) Cố gắng để CYA, tương tự như bảo mật vô lý trong Windows Vista, Microsoft đã làm cho nó cực kỳ khó khăn để thực sự thúc đẩy một gói SSIS từ môi trường này sang môi trường khác. Nó mặc định điều ngu ngốc này là "mã hóa thông tin nhạy cảm với khóa người dùng" có nghĩa là nó phải chạy dưới cùng một tài khoản trong môi trường mà bạn đang di chuyển nó tới môi trường bạn đã phát triển nó, điều hiếm khi xảy ra. Có nhiều cách tốt hơn để định cấu hình nhưng nó luôn cố gắng hoàn nguyên về bảo vệ bảo mật hoàn toàn vô dụng này.

(h) Cuối cùng, hầu hết các vấn đề này hiện có trong phiên bản thứ 3, cho thấy rõ ràng Microsoft không có kế hoạch sửa chữa chúng.

(i) Gỡ lỗi không dễ dàng như các ngôn ngữ khác.

SSIS vẫn có rất nhiều lợi ích, nhưng không có một số cơn đau nghiêm trọng.


7
2017-11-29 22:24



Đây là thông tin giá trị, cảm ơn. - Thor Hovden
Tôi đồng ý với nhiều điểm nêu lên về SSIS ở trên. Tôi băn khoăn về lý do tại sao MS nỗ lực rất nhiều trong việc tạo ra một sản phẩm hoàn toàn mới để thay thế DTS vào năm 2005 và sau đó về cơ bản đã để nó ở đó. Một trong nhiều điều khiến tôi thất vọng là sự vắng mặt của các kết nối cho các sản phẩm MS khác, ví dụ như không có đầu nối nguồn dữ liệu SharePoint mặc dù đây là nguồn dữ liệu rất phổ biến trong những ngày này (nhiều hơn là MS đã đăng kết nối SharePoint không được hỗ trợ như một mẫu mã, nhưng không bao giờ đầu tư nỗ lực cần thiết để làm cho nó trở thành một phần của sản phẩm cốt lõi). - Nathan


Tôi bắt đầu sử dụng Dịch vụ Báo cáo MS nhiều năm trước và chỉ thích nó. Tôi đã không thử giải pháp báo cáo của Penaho nên tôi không thể bình luận về nó. Tôi cũng không thử dùng Dịch vụ Phân tích hay phương án thay thế của Pentaho.

Gần đây tôi cần một giải pháp ETL và quen thuộc với MSSQL và MSRS nó dường như rõ ràng rằng tôi sẽ xem xét và có thể chọn MS tích hợp dịch vụ. Nhưng đối với tôi, MSIS là khủng khiếp. Chủ yếu là vì nó không trực quan. Sau khi dành một vài ngày cố gắng tìm hiểu công cụ, tôi quyết định tìm kiếm một giải pháp thay thế và đi qua Pentaho Data Integration, trước đây được gọi là Kettle. Tôi đã có nó và chạy trong vòng vài phút và ngay lập tức tạo ra sự biến đổi đầu tiên của tôi. Nó chỉ hoạt động.

Phải thừa nhận rằng nhu cầu của tôi khá đơn giản nhưng hiệu suất đã rất tuyệt vời và cộng đồng dường như rất hữu ích.


4
2017-11-02 04:53



Có một đề xuất cho một trang Q & A dành riêng cho Business Intelligence. Theo dõi, đăng bài và hỗ trợ để làm cho nó lên. - bonCodigo


Tôi đã sử dụng SSIS và Pentaho Kettle, và tôi sẽ khuyên bạn nên sử dụng Pentaho Kettle cho công cụ ETL của bạn thay vì SSIS.

Lý do của tôi: - lưu lượng của SSIS là nhiệm vụ cần thực hiện. Ấm đun nước khiến bạn suy nghĩ về các hàng dữ liệu chảy qua hệ thống. Cách tiếp cận của Kettle có vẻ trực quan hơn với tôi. -SSIS là tài liệu kém. Điều này xảy ra. Nhưng dường như có rất nhiều cách bấm và thiết lập các biến. Rất phức tạp. Pentaho có một diễn đàn cộng đồng khá hữu ích. -Tôi tin tưởng Pentaho để tích hợp với nhiều loại cơ sở dữ liệu, bao gồm SQL Server. Bạn cũng có thể sử dụng JDBC rất hay. Ngoài ra, tôi đã sử dụng nó để đi giữa SQL Server và Oracle trên một mặt và Vertica trên khác. Đô thị này có một bộ tải số lượng lớn có sẵn cho nó trên Vertica. Đó là khá tốt đẹp. -Tôi đã tìm thấy nó rất, rất khó khăn tương đối nói để có được một gói SSIS để chạy trên một máy chủ. Nó không xứng đáng với thời gian của tôi. -Tôi tìm thấy nó khá dễ dàng cho Pentaho để gửi một cảnh báo hoặc thông báo lỗi cho một người hoặc danh sách người. -Pentaho cho phép các tác vụ được thực hiện bằng JavaScript cho những thứ cần một số logic. Đơn giản và dễ dàng thực hiện với một ngôn ngữ mà hầu hết chúng ta đã gặp phải.


4
2018-04-15 15:48





Tôi không thể cung cấp bất kỳ đầu vào nào trên ngăn xếp MS BI nhưng tại thời điểm gần đây nhất Barcamp Orlando, những người từ Pentaho đã ở đó và nói về sản phẩm của họ và đó là một bản demo cực kỳ ấn tượng.

Thực tế là nó là một dự án mã nguồn mở mà bạn có thể mở rộng bản thân cũng như một gói trả tiền cho dịch vụ thực sự tốt khiến bạn có rất nhiều lựa chọn. Họ đã chứng minh một số công việc trả tiền họ đã làm cho một khách hàng và họ chắc chắn wow'd đám đông.

Tôi cũng đã có cơ hội trò chuyện một chút với một nhà phát triển làm việc về phía lưu trữ dữ liệu của Pentaho và anh ấy cực kỳ sắc bén và rất cởi mở với các đề xuất và không gặp vấn đề gì khi trả lời bất kỳ câu hỏi nào.

Vì vậy, như xa như một công ty đi, Pentaho thực sự gây ấn tượng với cả hai công việc của họ và làm thế nào thân thiện và tiếp cận tất cả các nhà phát triển của họ được.


3
2017-10-01 14:56





một vài điểm để thêm

  • Mặc dù có một phiên bản cửa sổ của tất cả các công cụ Pentaho thiết lập trong các cửa sổ là hợp lý. Pentaho (đặc biệt là bắt đầu và dừng máy chủ riêng biệt với công cụ GUI) thường được sử dụng trong Linux, không phải cửa sổ, và có đường cong học tập dốc từ Windows đến Linux.
  • bất kỳ công cụ nào đều có đường cong học tập khi bạn chuyển sang nó. khi bạn quen với việc luôn nhấp OK và làm mới siêu dữ liệu khi bạn gặp sự cố, SSIS không phải là xấu. Pentaho cũng có thể bị bong tróc.

Các câu hỏi về công cụ cần được giải quyết theo các câu hỏi văn hóa lớn hơn - loại cửa hàng nào sử dụng các công cụ nguồn mở? theo kinh nghiệm của tôi, tôi thấy rằng các cửa hàng Microsoft có vẻ cứng nhắc hơn, khi bạn gặp rắc rối với một chuỗi kết nối trong một cửa hàng Microsoft, bạn có thể nhận được trợ giúp .. trong Pentaho và các cửa hàng Linux nhiều hơn DYI.

BTW, hãy chú ý đến các nhân viên bán hàng của Pentaho đang thực hiện các bản demo - tất cả những thứ họ thể hiện đều khó khăn hơn nhiều để làm việc tốt hơn! :)


3
2018-04-26 18:35