Tôi đã nghiên cứu cơ sở dữ liệu Redshift của Amazon như một sự thay thế có thể trong tương lai cho kho dữ liệu của chúng tôi. Kinh nghiệm của tôi luôn là sử dụng mô hình hóa chiều và các phương pháp của Ralph Kimball, vì vậy hơi lạ khi thấy Redshift không hỗ trợ các tính năng như kiểu dữ liệu nối tiếp cho các cột tăng tự động.
Tuy nhiên, có bài đăng blog gần đây từ blog AWS Big Data về cách tối ưu hóa Redshift cho lược đồ sao: https://bloss.aws.amazon.com/bigdata/post/Tx1WZP38ERPGK5K/Optimizing-for-Star-Schemas -và xen kẽ-Sắp xếp trên Amazon-Redshift
Câu hỏi tôi có là về cách thực hành tốt nhất để tải lược đồ sao trong Redshift là gì? Tôi không thể tìm thấy câu trả lời này trong bất kỳ tài liệu nào của Redshift.
Tôi đang nghiêng về việc nhập các tệp của mình từ S3 vào các bảng phân tầng và sau đó sử dụng SQL để thực hiện các phép biến đổi như tra cứu và tạo khóa thay thế trước khi chèn vào bảng đích.
Đây có phải là những gì người khác hiện đang làm? Có một công cụ ETL đáng giá tiền để làm điều này dễ dàng hơn?