Những lỗi SATA này có nguy hiểm không?


36

Tôi đang nhận được những lỗi này một cách rầm rộ và tôi không biết nó có bình thường hay không.

[39441.061856] ata3.00: failed to read SCR 1 (Emask=0x40)
[39441.061866] ata3.01: failed to read SCR 1 (Emask=0x40)
[39441.061892] ata3.15: exception Emask 0x10 SAct 0x0 SErr 0x280100 action 0x6 frozen
[39441.061897] ata3.15: irq_stat 0x08000000, interface fatal error
[39441.061904] ata3.15: SError: { UnrecovData 10B8B BadCRC }
[39441.061910] ata3.00: exception Emask 0x100 SAct 0x0 SErr 0x0 action 0x6 frozen
[39441.061917] ata3.01: exception Emask 0x100 SAct 0xe SErr 0x0 action 0x6 frozen
[39441.061923] ata3.01: failed command: READ FPDMA QUEUED
[39441.061933] ata3.01: cmd 60/a8:08:b0:48:62/00:00:00:00:00/40 tag 1 ncq 86016 in
[39441.061940] ata3.01: status: { DRDY }
[39441.061944] ata3.01: failed command: READ FPDMA QUEUED
[39441.061953] ata3.01: cmd 60/a8:10:b0:49:62/00:00:00:00:00/40 tag 2 ncq 86016 in
[39441.061959] ata3.01: status: { DRDY }
[39441.061963] ata3.01: failed command: READ FPDMA QUEUED
[39441.061972] ata3.01: cmd 60/58:18:58:4a:62/00:00:00:00:00/40 tag 3 ncq 45056 in
[39441.061978] ata3.01: status: { DRDY }
[39441.061987] ata3.15: hard resetting link
[39441.608302] ata3.15: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[39441.609090] ata3.00: hard resetting link
[39441.929246] ata3.00: SATA link up 3.0 Gbps (SStatus 123 SControl 320)
[39441.929333] ata3.01: hard resetting link
[39442.249184] ata3.01: SATA link up 3.0 Gbps (SStatus 123 SControl 320)
[39442.263242] ata3.00: configured for UDMA/133
[39442.277570] ata3.01: configured for UDMA/133
[39442.277725] ata3: EH complete

Tôi cũng đang dán smartctl -acho sda , sdbsdc .

Cảm ơn trước sự giúp đỡ của bạn.

Câu trả lời:


16

Mặc dù về cơ bản tôi đồng ý với câu trả lời của Geppettvs D'Constanzo , tôi sẽ đề nghị một số điều đầu tiên bạn có thể thử là

  1. Kiểm tra xem cáp SATA của bạn có được gắn chắc chắn và cắm vào ổ cắm trên bo mạch chủ và ổ cứng không.

  2. Thay thế cáp SATA của bạn. Cáp SATA là (tương đối) rẻ tiền và đôi khi bạn nhận được một " xấu ". Thường chỉ cần thay thế cáp là cách dễ nhất để chẩn đoán và giải quyết vấn đề như thế này.

(Mặc dù hơi bất ngờ khi cả hai dây cáp đều xấu cùng một lúc. Tuy nhiên, đó là một điều dễ dàng để kiểm tra vì vậy theo tôi có lẽ đáng để làm.)

Tôi chỉ thấy bạn pastbins chứa dữ liệu SMART cho ổ đĩa của bạn. Lưu ý số lượng lớn lỗi CRC bất ngờ cho các ổ đĩa sdbsdc. Tôi đề nghị bạn bắt đầu bằng cách kiểm tra cáp và kết nối cho các ổ đĩa đó.

junior@mediacenter:/$ sudo  smartctl -a /dev/sda
...
Model Family:     SAMSUNG SpinPoint M7E (AFT)
Device Model:     SAMSUNG HM321HI
...
199 UDMA_CRC_Error_Count    0x0036   200   200   000   Old_age  Always -    0

junior@mediacenter:/$ sudo  smartctl -a /dev/sdb
...
Model Family:     SAMSUNG SpinPoint F4 EG (AFT)
Device Model:     SAMSUNG HD204UI
...
199 UDMA_CRC_Error_Count    0x0036   100   100   000   Old_age  Always  -  57

junior@mediacenter:/$ sudo  smartctl -a /dev/sdc
...
Model Family:     SAMSUNG SpinPoint F4 EG (AFT)
Device Model:     SAMSUNG HD204UI
...
199 UDMA_CRC_Error_Count    0x0036   100   100   000   Old_age  Always  - 398

ĐƯỢC. Vì vậy, không phải là một latpop. ;-)
Tất nhiên, nếu điều này xảy ra trên máy tính xách tay hơn không áp dụng ở trên và tôi không chắc nên đưa ra lời khuyên nào. Có thể gỡ bỏ và cài đặt lại ổ cứng? Có lẽ nó chỉ cần được đặt lại trong ổ cắm của nó để cải thiện kết nối?


sbdsdc được kết nối trên cùng một cáp e-sata bên ngoài (Dock HDD Thermaltake Duo). tôi sẽ thay thế cáp e-sata của tôi.

Nó có thể là do cáp bị lỗi hoặc chất lượng thấp. Nó cũng có thể là cáp bằng cách nào đó được di chuyển, bị va đập, hoặc nói cách khác là bị giật trong khi ổ đĩa đang được sử dụng.


1
sbdsdccả hai đều được kết nối trên cùng một cáp e-sata bên ngoài (Dock HDD Thermaltake Duo). tôi sẽ thay thế cáp e-sata của tôi.
Marcos Junior

9

Có vẻ như bạn có Cáp nguồn / Dữ liệu SATA bị hỏng chất lượng kém. Điều này có thể gây ra CRC xấu. Chúng hoàn toàn không gây hại và bạn có thể sống với chúng nhưng bạn sẽ mất rất nhiều dữ liệu sớm.

Báo cáo SMART về các ổ đĩa cứng của bạn trông có vẻ lành mạnh, vì vậy tôi cho các vấn đề về nguồn điện dựa trên kinh nghiệm của tôi khi đặt 5 ổ đĩa cứng trong cùng một trường hợp / nguồn điện. Tôi đã hoàn thành việc sử dụng nguồn năng lượng bên ngoài (475W) cho 2 ổ đĩa và 600W của vỏ cho tất cả các trường hợp bao gồm cả ổ đĩa GPU, ổ đĩa quang và ổ cứng.

Dù sao, tôi khuyên bạn nên chạy một bản sao lưu đầy đủ trước khi bạn làm bất cứ điều gì khác. Nếu có thể, hãy sao chép ổ đĩa cứng của bạn, sau đó bạn nên kiểm tra dây cáp và điện áp nguồn.


Vì tò mò, GPU đó có phải là GPU đói lớn, mạnh mẽ không?
phi lý John

1
nVidia Quadro 4000, thực sự không đói.
Geppettvs D'Constanzo

1
Hấp dẫn. Tôi có PSU Antec (Neo-Eco) 400w, 5 ổ cứng, 2 ổ quang và NVIDIA GeForce 9500 GT và tôi không nghĩ mình gặp vấn đề gì liên quan đến nguồn điện. Tôi có lỗi ổ CRC , nhưng tôi nghĩ rằng chúng là do lỗi người dùng ngu ngốc mà tôi đã thực hiện một thời gian trước. (Bẻ cáp và như vậy.) Tôi không nhận thấy bất kỳ nhật ký cảnh báo nào trong các tin nhắn kernel của mình . Tuy nhiên, tôi đoán tôi nên theo dõi chặt chẽ hơn để đảm bảo an toàn.
phi lý John

1
1xIDE DVD-RW, 1xSATA DVD-RW và 1xSATA ROM Blu-Ray ROM bên này. 4 ổ cứng SATA và 1 IDE, GPU có mức tiêu thụ năng lượng 142 Watts. Tôi không thể nói rằng tôi hoàn toàn chắc chắn rằng đó là về các sự cố về nguồn điện nhưng khi tôi thêm Nguồn điện mới thì các sự cố đã biến mất. BTW, ổ đĩa của tôi dường như khỏe mạnh. Nhưng cảm ơn bạn đã làm cho tôi thấy điều đó. Ý kiến ​​của bạn thực sự được đánh giá cao ở bên này. Cảm ơn bạn!
Geppettvs D'Constanzo

1
Uh, 142 watt cho GPU là ... một cái gì đó. Toàn bộ hệ thống của tôi (thường) sử dụng ít hơn thế. Khi tôi gõ, hộp máy tính để bàn của tôi đang kéo ~ 117 watt. (Theo Kill-A-Watt mà tôi đã quên, tôi vẫn cắm nó vào. ;-)
phi lý John

4

Dường như có một vấn đề giữa một số phiên bản kernel và một số bộ điều khiển SATA.

Gần đây tôi đã bắt đầu gặp phải một vấn đề rất giống nhau (không chắc nó có giống như vậy không) trên một máy chủ web chạy Science Linux.

Thông tin chính xác và đầy đủ nhất mà tôi đã tìm thấy về vấn đề như vậy là lỗi launchpad này .

Tóm lại: Vô hiệu hóa NCQ dường như là cách giải quyết tốt nhất cho người dùng gặp vấn đề này.


3
Vô hiệu hóa NCQ là một giải pháp chung cho phần cứng lỗi. Dường như không có lỗi kernel.
psusi

$ #! + Đã hoạt động! Tất cả các thông báo lỗi của tôi đã biến mất và hệ thống của tôi đã ngừng hoạt động! Tôi hoàn toàn không đồng ý với việc không phải là lỗi kernel, vì tôi có thể sử dụng phiên bản kernel cũ hơn (tất cả các cách quay lại ít nhất là 2,6 series) mà không gặp sự cố. Tôi không thể tin rằng tôi đã không tìm thấy điều này sớm hơn!
reukiodo

1

Đây hầu như luôn là một ổ đĩa xấu, tôi có hàng ngàn ổ đĩa mà chúng tôi sử dụng và mặc dù những lỗi này không bao giờ khiến ổ đĩa bị lỗi nhưng chúng đã dẫn đến hỏng hệ thống tệp. Tôi nghĩ rằng nó thực sự có liên quan đến một vấn đề với bảng điều khiển trên ổ đĩa.

Tôi đã thử mọi cách để giải quyết vấn đề này, cách khắc phục là thay thế ổ đĩa và mọi thứ hoạt động trên cùng một dây cáp và bộ điều khiển.

Chúc may mắn


Sau hơn 30 năm khắc phục sự cố những thứ này để kiếm sống, tôi có thể đảm bảo với bạn rằng theo kinh nghiệm của tôi, đây hầu như luôn là một sợi cáp tinh ranh. Và vì chúng rẻ nên bạn thử trước.
Anh Cả Geek

0

Tôi biết chủ đề này đã cũ nhưng gần đây tôi đã gặp phải vấn đề tương tự trên một máy mới mua với 6 khe cắm sata. Tôi đã cài đặt cdrom và ổ cứng trên 2 khe sata gần nhau và sau đó tiến hành cài đặt ubfox mà không gặp lỗi cho đến khi tôi khởi động lại thì tôi thấy ata8: lỗi thiết lập lại liên kết cứng. Máy dừng lại đến thời điểm này không bao giờ phục hồi. Tôi đã thử khởi động lại một vài lần và nó không hoạt động. Và sau đó tôi đã cố gắng thay thế ổ cứng trên một trong 4 khe cắm có sẵn và nó hoạt động tốt mà không gặp rắc rối.


Bạn có nghĩa là bạn đã thay đổi cổng SATA mà ổ cứng đã được cắm vào, phải không? Hay bạn có nghĩa là thay thế toàn bộ ổ đĩa cứng bằng một cái khác? Tôi nghĩ đó là trước đây, nhưng chỉ cần kiểm tra hai lần
Xen2050

Đó là trước đây.
ultrajohn

0

Có cùng một vấn đề - trong trường hợp của tôi, điều này là do bộ chuyển đổi nguồn 4 chân sang SATA không được cắm một cách khít khao.



0

Tôi đã từng gặp vấn đề tương tự. Tôi đã thử mọi cách nhưng chỉ trên cổng j-micron trên asus p5k của tôi, tôi không có lỗi.

Nhưng khi tôi đặt ổ đĩa vào một nguồn cung cấp năng lượng khác thì nó đã hoạt động và các lỗi đã biến mất. Sau đó, tôi đặt ổ đĩa trở lại nguồn cung cấp năng lượng ban đầu của nó nhưng một đầu nối nguồn mới và nó cũng hoạt động.


0

Tôi biết chủ đề này là cũ, nhưng chỉ gặp vấn đề tương tự, đến đây từ google.

  • bắt đầu ata3.01: failed command: READ FPDMA QUEUEDkhởi động KecUNTU 16.04 livecd.
  • WINDOWS 7 sẽ hoạt động thất thường, hoạt động ổn trong một thời gian, nhưng đóng băng sau khi xem youtube.

Thay đổi cáp SATA không làm gì cả.
Thay thế PSU và vấn đề đã biến mất.


0

Lỗi này không có khả năng làm hỏng ổ cứng của bạn nhưng rất có khả năng làm hỏng (các) hệ thống tệp của bạn. Bắt đầu bằng cách xác định ổ đĩa nào đang ném lỗi. Điều này thường được xác định dễ dàng bằng một số cách tiếp cận như:

1) Ban hành lệnh dmesg | grep ata3và tìm kiếm mô hình và kiểu ổ đĩa cứng. (vì ata3 là cổng đưa ra lỗi trong tình huống của bạn. Điều chỉnh cho phù hợp) điều này sẽ cung cấp đầu ra tương tự như sau:

dmesg | grep ata3
[    4.756081] ata3: SATA max UDMA/133 abar m2048@0xf7f26000 port 0xf7f26200 irq 135
[    5.071981] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[    5.077850] ata3.00: HPA detected: current 1953523055, native 1953525168
[    5.077959] ata3.00: ATA-8: SAMSUNG HD103SJ, 1AJ10001, max UDMA/133
[    5.077960] ata3.00: 1953523055 sectors, multi 16: LBA48 NCQ (depth 32), AA
[    5.084057] ata3.00: configured for UDMA/133

Nhìn lướt qua cho thấy ổ đĩa được kết nối với ata3 là SAMSUNG HD103SJ

2) Ban hành lệnh dưới đây:

find -L /sys/bus/pci/devices/*/ata*/host*/target* -maxdepth 3 -name "sd*" 2>/dev/null | egrep block |egrep --colour '(ata[0-9]*)|(sd.*)'

Điều này sẽ cung cấp cả các cổng và tên thiết bị được tô sáng trên cùng một dòng như được thấy dưới đây:

đầu ra

Thật dễ dàng để thấy rằng thiết bị được kết nối với ata3 đã được gán tên sdb của thiết bị

3) cài đặt lsscsi với sudo apt install lsscsivà ban hành lệnhlsscsi

$ lsscsi
[0:0:0:0]    cd/dvd  ATAPI    iHAS124   F      CL9M  /dev/sr0 
[1:0:0:0]    disk    ATA      WDC WD2003FZEX-0 1A01  /dev/sda 
[2:0:0:0]    disk    ATA      SAMSUNG HD103SJ  0001  /dev/sdb 
[3:0:0:0]    disk    ATA      ST6000VN0033-2EE SC60  /dev/sdc 

Lưu ý rằng mục nhập đầu tiên trên mỗi dòng ở trên là scsi_host, channel, target_number và LUN. Nó được đặt trong ngoặc và mỗi phần tử được phân tách bằng dấu hai chấm. Khi có nhiều thiết bị SCSI, các mục của chúng được sắp xếp theo thứ tự tăng dần.

Chỉ cần thêm 1 vào số đầu tiên trong mỗi dòng đầu ra sẽ cung cấp cho bạn cổng ATA. Bạn có thể tìm thêm chi tiết lsscsi ở đâyở đây.

Vì trong trường hợp của bạn, chúng tôi đang thấy lỗi được ném trên cả 3.00 và 3.01, bạn có nhiều hơn một ổ đĩa được kết nối với cùng một cổng ATA. Bạn sẽ muốn kiểm tra cẩn thận kết nối với cả ata3.00 và ata3.01 Đây có thể là một vỏ ổ đĩa nhiều khoang được kết nối với cùng một cáp. Vì cả hai ổ đĩa đều bị lỗi, việc thay thế cáp vào khoang đa ổ nói trên sẽ loại bỏ sự cố cho cả hai ổ đĩa. Các thiết bị này thường có nguồn điện bên ngoài cũng có thể là thủ phạm và cần phải thay thế, nhưng cáp (là liên kết yếu nhất) cho đến nay vẫn là nguyên nhân gốc rễ của sự cố.

Nguồn:

Kinh nghiệm

https://linux.die.net/man/8/lsscsi

http://sg.danny.cz/scsi/lsscsi.html

https://serverfault.com/questions/244944/linux-ata-errors-translating-to-a-device-name/868943#868943

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.