Cài đặt pentaho trên window 7, 8, 10

Pentaho Data Intergration(PDI) là 1 tools ETL mạnh mẽ dùng để tổng hợp, chuyển đổi và xử lý dữ liệu – nằm trong nhóm công cụ dành cho BI của Pentaho. PDI hiện nay được công ty  phát triển có cả bản thương mại và bản dành cho cộng đồng, bản mới nhất dành cho cộng đồng là bản 8.0.

Đối với Pentaho thì ta không cần cài đặt nó mà có thể chay được ngay nhưng vẫn phải cần môi trường để cho nó có thể chạy được.

Để chạy được Pentaho PDI dành cho cộng đồng ta cần thực hiện các bước sau:
B1: Cài đặt môi trường JDK để Pentaho có thể chạy được
Tùy theo phiên bản Pentaho PDI ta có thể cài đặt phiên bản JDK phù hợp. Lựa chọn và tải JDK tại địa chỉ: JDK
Hiện tại tôi đang sử dụng phiên bản Pentaho PDI 7.0 với JDK 7
B2: Tải Pentaho PDI và giải nén
Tải phiên bản Pentaho PDI mới nhất tại địa chỉ: PDI
Hoặc các phiên bản cũ hơn: PDI OLD
B3: Tải các JDBC driver để Pentaho PDI có thể giao tiếp với các loại cơ sở dữ liệu
– Oracle: jdbc
– Sqlserver: sqljdbc
– MySQl: mysql-connector-java
B4: Đưa các JDBC driver vào thư muc: data-integration\lib
B5: Bật Pentaho PDI bằng cách chạy file: Spoon.bat trong thư mục: data-integration. Ta sẽ có giao diện chương trình như sau: