Làm thế nào các cơ sở dữ liệu NoQuery như MongoDB có thể được sử dụng để phân tích dữ liệu? Các tính năng trong chúng có thể làm cho phân tích dữ liệu nhanh hơn và mạnh mẽ là gì?
Làm thế nào các cơ sở dữ liệu NoQuery như MongoDB có thể được sử dụng để phân tích dữ liệu? Các tính năng trong chúng có thể làm cho phân tích dữ liệu nhanh hơn và mạnh mẽ là gì?
Câu trả lời:
Thành thật mà nói, hầu hết các cơ sở dữ liệu NoQuery không phù hợp lắm với các ứng dụng trong dữ liệu lớn. Đối với đại đa số của tất cả các ứng dụng dữ liệu lớn, hiệu suất của MongoDB so với một cơ sở dữ liệu quan hệ như MySQL là đáng kể là đủ nghèo để bảo đảm tránh xa cái gì đó như MongoDB hoàn toàn.
Như đã nói, có một số thuộc tính thực sự hữu ích của cơ sở dữ liệu NoQuery chắc chắn hoạt động có lợi cho bạn khi bạn làm việc với các tập dữ liệu lớn, mặc dù khả năng những lợi ích đó vượt trội so với hiệu năng của NoQuery nói chung so với SQL để đọc hoạt động chuyên sâu (tương tự như các trường hợp sử dụng dữ liệu lớn điển hình) là thấp.
Cá nhân tôi có thể đề nghị bạn cũng kiểm tra cơ sở dữ liệu đồ thị như Neo4j cho thấy hiệu năng thực sự tốt đối với một số loại truy vấn nhất định nếu bạn đang tìm kiếm một phụ trợ cho các ứng dụng khoa học dữ liệu của mình.
json
là dữ liệu có cấu trúc hoàn toàn. Về mặt kỹ thuật, bạn có thể thực hiện bất kỳ loại phân tích dữ liệu nào trên đó, sử dụng cơ sở dữ liệu NOSQL thực sự không liên quan. Có những công cụ được xây dựng trên đỉnh của mongo, như analytica.
Một lợi ích của cách tiếp cận NoQuery không có lược đồ là bạn không cam kết sớm và bạn có thể áp dụng lược đồ phù hợp tại thời điểm truy vấn bằng cách sử dụng một công cụ thích hợp như Apache Drill . Xem bản trình bày này để biết chi tiết. MySQL sẽ không phải là lựa chọn đầu tiên của tôi trong một thiết lập dữ liệu lớn.
Xem xét, thử và thậm chí có thể sử dụng nhiều cơ sở dữ liệu. Đây không chỉ là vấn đề "hiệu suất" khi chơi ở đây. Nó thực sự sẽ đi xuống theo yêu cầu của bạn. Bạn đang nói về bao nhiêu dữ liệu? Những loại dữ liệu? bạn cần nó nhanh như thế nào Bạn đọc nhiều hơn hay viết nặng?
Đây là một điều bạn không thể làm trong cơ sở dữ liệu SQL: Tính toán tình cảm. http://www.sl slideshoware.net/shift8/mongodb-machine-learning
Tất nhiên tốc độ trong trường hợp đó có thể không đủ nhanh cho nhu cầu của bạn, nhưng đó là điều có thể. Với một số bộ nhớ đệm của các giá trị tổng hợp cụ thể, nó thậm chí còn được chấp nhận. Tại sao bạn sẽ làm điều này? Tiện.
Thuận tiện thực sự là một cái gì đó mà bạn sẽ bị thuyết phục bởi. Đó chính xác là lý do tại sao (theo ý kiến của tôi) cơ sở dữ liệu NoQuery đã được tạo. Hiệu suất tất nhiên, nhưng tôi đang cố gắng giảm điểm chuẩn và tập trung nhiều hơn vào các mối quan tâm khác.
Cơ sở dữ liệu MongoDB (và một số cơ sở dữ liệu khác của NoQuery) có một số tính năng rất mạnh như tích hợp / giảm bản đồ. Điều này có thể dẫn đến tiết kiệm cả về chi phí và thời gian khi sử dụng một cái gì đó như Hadoop. Hoặc nó có thể cung cấp một nguyên mẫu hoặc MVP để khởi động một doanh nghiệp lớn hơn.
Cơ sở dữ liệu đồ thị thì sao? Họ cũng là "NoQuery". Nhìn vào cơ sở dữ liệu như OrientDB. Nếu bạn muốn tranh luận về hiệu suất ... Tôi không nghĩ rằng bạn sẽ cho tôi thấy một cơ sở dữ liệu SQL nhanh hơn ở đó =) ... và cơ sở dữ liệu đồ thị có một số ứng dụng thực sự tuyệt vời dựa trên những gì bạn cần làm.
Quy tắc công nghệ (và internet) đừng quá thoải mái với một điều. Bạn sẽ bị giới hạn và tự đặt ra thất bại.