Nén cơ sở dữ liệu PostgreSQL


12

Tôi có một cơ sở dữ liệu PostgreSQL lớn với dung lượng hơn 500 GB, quá lớn. Có cách nào để nén cơ sở dữ liệu xuống kích thước dễ quản lý hơn không? Tôi đã cố gắng thực hiện điều này với SquashFS và cơ sở dữ liệu được nén xuống 177GB tuy nhiên PostgreQuery yêu cầu cơ sở dữ liệu có quyền truy cập ghi và hệ thống Squash là Chỉ đọc. Người dùng cơ sở dữ liệu có kinh nghiệm hơn có bất kỳ đề xuất để thực hiện mục tiêu này?

Cơ sở dữ liệu chứa dữ liệu GIS cho hành tinh và sẽ được sử dụng cục bộ trên một hệ thống được triển khai. Hiện tại nó nằm trên ổ SSD 1TB, tuy nhiên, tôi đang cố gắng tránh bị tát vào một ổ cứng bổ sung đơn giản chỉ để chứa một cơ sở dữ liệu lớn. Cơ sở dữ liệu thực hiện như mong muốn mà không có vấn đề gì, tôi chỉ đơn giản muốn nén nó xuống kích thước dễ quản lý hơn và tránh đặt nó vào một ổ đĩa riêng.


Tại sao nó quá lớn? Nếu bạn sắp hết dung lượng đĩa, thì bạn cần thêm nhiều đĩa vào hệ thống. Nếu có dữ liệu không còn cần thiết, bạn nên tìm cách lưu trữ dữ liệu đó. Mặt khác, có lẽ bạn có một vấn đề về hiệu năng có thể được hoặc không thể giúp đỡ bởi một DB nhỏ hơn.
RDFozz

2
Cơ sở dữ liệu chứa dữ liệu GIS cho hành tinh và sẽ được sử dụng cục bộ trên một hệ thống được triển khai. Hiện tại nó nằm trên ổ SSD 1TB, tuy nhiên, tôi đang cố gắng tránh bị tát vào một ổ cứng bổ sung đơn giản chỉ để chứa một cơ sở dữ liệu lớn. Cơ sở dữ liệu thực hiện như mong muốn mà không có vấn đề gì, tôi chỉ đơn giản muốn nén nó xuống kích thước dễ quản lý hơn và tránh đặt nó vào một ổ đĩa riêng.
MH21209

4
Đây là một câu hỏi khá hợp lý. Nó không nên được đóng lại.
Evan Carroll

Câu trả lời:


10

Hệ thống tập tin

Một phương pháp rất phổ biến để làm điều này là với hệ thống tập tin. BTRFS và ZFS hoạt động theo cơ sở dữ liệu ở cấp hệ thống tệp. Cả hai có thể được sử dụng trong một thiết bị loopback để bạn có thể cung cấp một vùng bảng nén mà không cần phân vùng khác. Có một số cảnh báo với điều này, nếu không gian bảng bị lỗi, nó cũng có thể mất cụm của bạn.

ZFS

ZFS là một trong những lớn ở đây. Đó là những gì tôi sẽ đi.

Xem thêm

Btrfs

Btrfs là một ứng cử viên mạnh mẽ nhưng nó đã phát triển tích cực trong một thời gian rất dài và việc thiếu các bản phân phối chính chọn nó như một mặc định khiến nhiều người đặt câu hỏi liệu nó có sẵn sàng cho "thời gian chính" hay không.

PostgreSQL

Phương pháp GIS (PostGIS)

  • Đối với Đa giác, một phương pháp là đơn giản hóa đa giác bằng cách thả các đỉnh với ST_Simplify.

  • Đối với Điểm, một phương pháp là phân cụm không gian .

Cả hai đều dẫn đến việc mất thông tin. PostGIS, giống như hầu hết các tính năng của cơ sở dữ liệu, không có tùy chọn "nén ma thuật" trong suốt.

cstore_fdw

Ngoài ra còn cstore_fdwcó một cửa hàng cột cung cấp nén. Nó có một hồ sơ hiệu suất khác nhau để ymmv.


2
Điều này thật đúng với gì mà tôi đã tìm kiếm. Tôi hiện đang triển khai lại cơ sở dữ liệu của mình trên ZFS. Cảm ơn bạn.
MH21209
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.