Tôi khá xanh khi nói đến lĩnh vực này. Tôi là một nhà phân tích dữ liệu tại một bệnh viện nhỏ 8 tháng nay, ngoài bằng 2 năm trong lĩnh vực nghề nghiệp mới đối với tôi.
Tình hình
Chúng tôi có một "cơ sở dữ liệu" Cobol (Tôi sử dụng thuật ngữ cơ sở dữ liệu một cách nhẹ nhàng ...). Đó là một cơ sở dữ liệu phân cấp độc quyền. Chúng tôi có một giải pháp phần mềm thứ cấp cung cấp lớp SQL ODBC trên đầu trang để truy cập bên ngoài thông qua giao diện chuẩn. Nó có những gì tôi nghĩ là các lệnh tuân thủ SQL 99.
Cơ sở dữ liệu COBOL để SQL để lại rất nhiều mong muốn. Index được đặt trong đá. Vì vậy, nếu tôi muốn thực hiện bất kỳ truy vấn nào không được khóa trên một hoặc hai trường được lập chỉ mục (Index = Số bệnh nhân. Vì vậy, nếu tôi muốn truy vấn vào Ngày thừa nhận / Ngày xuất viện ... hãy quên đi) . Tham gia biến truy vấn 5 phút thành truy vấn 45 phút. Để nhiều truy vấn làm chậm REST của hệ thống gây ra những điều xấu.
Mặc dù hệ thống DOES có một hệ thống truy vấn nội bộ, nhưng đây không phải là thứ mà tôi cho là hoàn chỉnh. Nó có điểm mạnh và điểm yếu, nhưng vấn đề chính là hợp tác với thế giới bên ngoài mà tôi cũng cần gửi báo cáo.
Câu hỏi
Thứ tôi đang cố gắng xây dựng ... là Kho dữ liệu TSQL. Tôi muốn tạo một quy trình kéo dữ liệu vào môi trường SQL mà tôi có thể kiểm soát (thêm chỉ mục, sử dụng công cụ hiện đại như câu lệnh tình huống, không mất 15 phút cho các truy vấn "đơn giản").
Tôi đang tự hỏi một số tài nguyên tốt, hướng dẫn, công cụ mà các chuyên gia sẽ đề xuất là gì. Tình huống lý tưởng của tôi sẽ là tải "lịch sử" của tất cả dữ liệu vào cơ sở dữ liệu T-SQL, sau đó là tải dữ liệu mới hàng tuần. Sẽ không lý tưởng cho báo cáo "thời gian thực", nhưng phần lớn nhu cầu báo cáo của tôi sẽ được đáp ứng với dữ liệu cũ "hơi".
Tôi đã gặp rắc rối với ## Bảng tạm thời, Hợp nhất, cập nhật, v.v ... cố gắng xem thời gian tải và cập nhật là gì và không ... nhưng trước khi tôi quá sâu, tôi muốn tìm hiểu thêm khuyên bảo.