Tôi có cảm giác rằng hầu hết các hệ thống cơ sở dữ liệu bắt nguồn từ những năm 80 và các bảng thực hiện rập khuôn, các giao dịch ACID và các ràng buộc. Họ đã xây dựng trong tâm trí sự khan hiếm của bộ nhớ, đĩa và sức mạnh xử lý.
Tôi tự hỏi nếu có bất kỳ hệ thống lưu trữ (không cần thiết có thể truy cập thông qua SQL) có thể xử lý như sau:
- đồ thị (truy vấn a la SPARQL).
- ma trận (n-chiều) cũng thưa thớt. Hỗ trợ các thuật toán ma trận tầm thường như SVD, phân cụm.
- quản lý hiệu quả dữ liệu lớn (kích thước terabyte) không thay đổi liên tục; sự thay đổi đang diễn ra mặc dù các đợt hàng ngày.
- sử dụng các hệ thống đĩa lớn (14TB RAID5 ngày nay chưa đến 1500 đô la). Điều này có nghĩa là, nhiều không gian hơn cho các chỉ mục, kết quả được tính toán trước, v.v.
- sử dụng GPU / nhiều lõi / bộ xử lý / nút, cho một truy vấn và lập chỉ mục lớn.
Tôi biết hầu hết các mục được triển khai ở đâu đó (Apache Cassandra, SPARQL, Netezza, Exadata), nhưng tôi không có kiến thức về bất kỳ sản phẩm nào có thể thực hiện tất cả.