Có một cái không?
Tất cả các định nghĩa tôi có thể tìm thấy mô tả kích thước, độ phức tạp / sự đa dạng hoặc vận tốc của dữ liệu.
Định nghĩa của Wikipedia là người duy nhất tôi tìm thấy với một con số thực tế
Kích thước dữ liệu lớn là mục tiêu di chuyển liên tục, tính đến năm 2012, từ vài chục terabyte đến nhiều petabyte dữ liệu trong một tập dữ liệu.
Tuy nhiên, điều này dường như mâu thuẫn với định nghĩa MIKE2.0 , được tham chiếu trong đoạn tiếp theo, chỉ ra rằng dữ liệu "lớn" có thể nhỏ và 100.000 cảm biến trên máy bay chỉ tạo ra 3 GB dữ liệu có thể được coi là lớn.
IBM mặc dù nói rằng:
Dữ liệu lớn đơn giản hơn là vấn đề kích thước.
đã nhấn mạnh kích thước trong định nghĩa của họ .
O'Reilly cũng đã nhấn mạnh "volume, velocity and variety"
. Mặc dù được giải thích tốt và sâu hơn, định nghĩa dường như là một sự băm lại của những người khác - hoặc ngược lại tất nhiên.
Tôi nghĩ rằng một tiêu đề bài viết trên Tuần báo Máy tính tổng hợp một số bài viết khá tốt "Dữ liệu lớn là gì và làm thế nào để sử dụng nó để đạt được lợi thế cạnh tranh" .
Nhưng ZDNet chiến thắng với những điều sau từ năm 2012 :
Dữ liệu lớn Dữ liệu là một cụm từ dễ hiểu đang nổi lên từ thị trường điện toán hiệu năng cao của thị trường CNTT ... Nếu một người đọc qua các bài thuyết trình từ mười nhà cung cấp công nghệ, mười lăm định nghĩa khác nhau có thể sẽ được đưa ra. Mỗi định nghĩa, tất nhiên, có xu hướng hỗ trợ nhu cầu về các sản phẩm và dịch vụ của nhà cung cấp đó. Tưởng tượng rằng.
Về cơ bản "dữ liệu lớn" là "lớn" theo một cách nào đó hình dạng hoặc hình thức.
"Lớn" là gì? Có thể định lượng tại thời điểm hiện tại?
Nếu "lớn" là không thể chấp nhận được thì có một định nghĩa không chỉ dựa vào tính tổng quát?