Tôi đã có một vài triệu hàng trong cơ sở dữ liệu của mình rồi. Tôi không biết về kiểu dữ liệu UUID của PostgreSQL khi tôi thiết kế lược đồ của mình.
Một trong các bảng có 16M hàng (khoảng 3,5M đến 4 M bản ghi mỗi phân đoạn), tăng khoảng 500 nghìn bản ghi mỗi ngày. Tôi vẫn có thể sử dụng hệ thống sản xuất trong vài giờ nếu cần thiết. Tôi sẽ không có sự sang trọng này trong một hoặc hai tuần.
Câu hỏi của tôi là, nó sẽ có giá trị để làm như vậy? Tôi đang tự hỏi về hiệu suất THAM GIA, sử dụng dung lượng ổ đĩa (toàn bộ gzip'd là 1,25 GiB), những thứ thuộc về bản chất đó.
Lược đồ bảng là:
# \d twitter_interactions
Table "public.twitter_interactions"
Column | Type | Modifiers
-------------------------+-----------------------------+-----------
interaction_id | character(36) | not null
status_text | character varying(1024) | not null
screen_name | character varying(40) | not null
twitter_user_id | bigint |
replying_to_screen_name | character varying(40) |
source | character varying(240) | not null
tweet_id | bigint | not null
created_at | timestamp without time zone | not null
Indexes:
"twitter_interactions_pkey" PRIMARY KEY, btree (interaction_id)
"twitter_interactions_tweet_id_key" UNIQUE, btree (tweet_id)
"index_twitter_interactions_on_created_at" btree (created_at)
"index_twitter_interactions_on_screen_name" btree (screen_name)
Triggers:
insert_twitter_interactions_trigger BEFORE INSERT ON twitter_interactions FOR EACH ROW EXECUTE PROCEDURE twitter_interactions_insert_trigger()
Number of child tables: 9 (Use \d+ to list them.)