Làm thế nào được đo tốc độ đĩa và những gì là nhanh? Một bản sao 1500 GB nên mất bao lâu?


11

Làm thế nào được đo tốc độ đĩa? Là Mbit hay Mbyte mỗi giây đọc? Trung bình ngày nay là gì và nhanh là gì và rất nhanh trong ngành?

Giả sử ai đó nói rằng phải mất một thời gian dài để tạo một bản sao của tệp 1500 GB (giả sử là tệp cơ sở dữ liệu), mất bao lâu để có một hệ thống chuyên nghiệp và làm thế nào để tính được tốc độ của đĩa cứng vào tài khoản ?

Câu trả lời:


19

Tốc độ đĩa thường được đo bằng;

  • Tốc độ quay tính bằng số vòng quay mỗi phút (thấp nhất là 4200 vòng / phút, sau đó là 5400, 7200, 10k và 15k - điều này không áp dụng cho SSD hoặc bộ nhớ flash).
  • Tốc độ giao diện là tốc độ nhanh nhất mà các thiết bị điện tử có thể cố gắng gửi dữ liệu tới bộ điều khiển đĩa (các phạm vi này từ 100MBps của ATA đến 150/300/600 Mbps của SATA, 2/4/8/16 Gbps của Fiber-Channel và thậm chí đến tốc độ PCIe lưu trữ dựa trên flash như FusionIO).
  • Thời gian tìm kiếm chỉ đơn giản là thời gian cần thiết để bắt đầu đọc hoặc ghi một khu vực cụ thể của đĩa - chúng có thể dao động từ 3-15ms cho các đĩa đến một phần nhỏ trong số này cho ổ SSD / flash.
  • Sau đó, chúng tôi đạt được tốc độ thực tế mà bạn có thể mong đợi, có bốn tốc độ bạn nên quan tâm; đọc tuần tự (đọc một khối dữ liệu rất lớn), ghi tuần tự (giống nhưng viết), đọc ngẫu nhiên (nhận dữ liệu từ tất cả các đĩa) và ghi ngẫu nhiên. Chúng khác nhau rất nhiều nhưng đối với các đĩa quay, bạn có thể mong đợi mọi thứ từ 25MBps đến 150MBps để đọc và ghi tuần tự và bất cứ thứ gì từ 3MBps đến 50Mps để đọc và ghi ngẫu nhiên. SSD thường nằm trong phạm vi 200MBps cho tuần tự và thường ít hơn một chút cho các hoạt động ngẫu nhiên. FusionIO có thể dễ dàng đạt 1GBps cho tất cả, nhưng thường nhỏ và đắt tiền.

Như bạn có thể thấy không có mức trung bình thực, nếu bạn muốn đề xuất mua gì, vui lòng quay lại với chúng tôi với càng nhiều thông tin càng tốt - điều này nên bao gồm ngân sách, loại ứng dụng, kích thước tập dữ liệu, cơ sở người dùng , phần cứng / HĐH cộng với bất cứ thứ gì bạn nghĩ sẽ hữu ích.

Đối với bản sao 1,5TB của bạn, tốt, nếu bạn đang thực hiện việc này với đĩa SATA 7200 vòng / phút gắn trên USB, bạn sẽ nhận được ít nhất 30MBps-40MBps hoặc hơn 1,5TB đầy đủ có thể mất hơn 10 giờ. Nếu đây là một hệ thống DAS / SAN chuyên nghiệp điển hình mà tôi mong đợi ở khu vực 100MBps, nghĩa là sẽ mất khoảng 3 giờ.

Hy vọng điều này sẽ giúp, ồ và chỉ cần làm rõ, MB = megabyte, Mb là megabits.


8

Có rất nhiều, rất nhiều biến liên quan đến các loại tính toán này. Hệ thống đĩa thế giới thực có rất nhiều phụ thuộc lẫn nhau. Chỉ trong một máy tính:

  • Tốc độ định mức thực tế của chính ổ đĩa (thường là RPM, 5200, 7200, 10K, 15K)
  • Hệ thống tập tin đang sử dụng
  • Có sử dụng hệ thống RAID hay không
    • Nếu có, hiệu suất của thẻ RAID
    • Loại RAID
  • Hệ điều hành đang sử dụng
  • Hoạt động đọc và ghi có đặc điểm hiệu suất hoàn toàn khác nhau
  • Tỷ lệ đọc / ghi cho các hoạt động
  • Đối với các hoạt động tuần tự, hệ số phân mảnh của lưu trữ

Như bạn có thể thấy, tốc độ của một đĩa là một trong nhiều yếu tố. Đó là một yếu tố lớn, nhưng vẫn là một trong nhiều. Nếu bản sao 1,5TB đó là tất cả trên cùng một đĩa, thì đĩa đó (có khả năng 95%) sẽ thực hiện hiệu suất đọc / ghi ngẫu nhiên 100%, thường biến thành các số liệu hiệu suất kém nhất. Nếu bản sao từ đĩa này sang đĩa khác và dữ liệu tuần tự 100% và đĩa đích hoàn toàn trống, điều này sẽ mang lại hiệu suất nhanh nhất có thể với hệ thống con đĩa này. Hiệu suất thế giới thực sẽ ở đâu đó giữa hai thái cực này.

Nếu bạn đang sao chép giữa hai máy chủ riêng biệt, thậm chí còn có nhiều yếu tố liên quan hơn.

Tôi có một mảng lưu trữ tại nơi làm việc có thể bão hòa các kênh SAS 3Gb (gigaBIT) khi thực hiện các hoạt động tuần tự phần lớn. Nếu tôi có 6Gb SAS thì có lẽ cũng rất gần để bão hòa những thứ đó. Đối với I / O ngẫu nhiên, hệ thống cụ thể này hoạt động rất khác nhau dựa trên hệ điều hành là gì (ví dụ OpenSolaris, có I / O ngẫu nhiên tồi tệ nhất và Linux XFS tốt nhất theo hệ số 3).

Có quá nhiều biến để trả lời câu hỏi này một cách dứt khoát.


3

Mất 1,5TB dữ liệu để sao chép phụ thuộc rất nhiều vào loại dữ liệu. Nếu bạn có vài 1.500 tệp 1GB, có thể sẽ chỉ mất vài giờ, nhưng nếu bạn có một tỷ rưỡi tệp 1KB thì có thể sẽ mất vài ngày.

Điều này là do hai thông số kỹ thuật cạnh tranh trên đĩa: thông lượng và thời gian truy cập trung bình. Một đĩa truyền thống có thông lượng 100MB / giây và thời gian truy cập 10ms là khá phổ biến. Nếu bạn có thể truyền dữ liệu tuần tự, bạn có thể nhận được 100MB / giây. Tuy nhiên, nếu bạn cần phải nhảy đến một nơi khác thì phải mất 10ms. Nếu bạn đã phát trực tuyến, bạn có thể đã ghi 1MB dữ liệu trong thời gian cần thiết để chuyển đến một vị trí khác.

Việc tạo một tệp có thể mất vài lần tìm kiếm, do đó, việc tạo tệp 1KB có thể "tốn" nhiều như truyền một vài MB dữ liệu.

Vì vậy, trong một số trường hợp, tốt hơn là thực hiện sao chép đĩa thô của thiết bị khối hơn là sao chép tại hệ thống tệp thông qua một cái gì đó như rsync. Nếu bạn có rất nhiều tệp, trong một hệ thống tệp có nghĩa là đầy đủ 50% trở lên, bạn thường chỉ nên sao chép thiết bị khối đầy đủ thông qua "dd", theo thời gian cần thiết. Tất nhiên, bạn không thể làm điều này trong khi hệ thống tệp được gắn kết, vì vậy điều này cũng có nhược điểm.

SSD có thể giúp giảm thiểu điều này, vì thời gian truy cập của chúng nhanh gấp khoảng 100 lần, nhưng ổ SSD MLC có vấn đề truy cập phức tạp tùy thuộc vào sự sẵn có của một khối các khối bị xóa trước. SSD SLC có thể giúp điều này.

Bộ điều khiển RAID với bộ đệm tích hợp có thể giúp tìm kiếm, cũng như mô-đun hạt nhân flashcache cho phép bạn lưu trữ thiết bị khối thông qua ổ SSD.

Các hệ thống RAID có thể cho phép nhiều tìm kiếm song song, giảm hiệu quả thời gian truy cập trung bình và cũng có thể song song hóa để tăng thông lượng. Nhưng hiệu suất tổng thể của bạn thường sẽ phụ thuộc vào số lượng tệp có liên quan.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.