Kiểm tra RAM không nhất quán - thủ phạm có khả năng nhất là gì? (tức là tôi nên chi tiền cho việc thay thế)


20
  • Bo mạch chủ: GA-B85M-DS3H-A
  • CPU: Core i5 4430
  • RAM: PNY XLR8 DDR3 32GB (4x8GB) 1600 MHz (MD32768K4D3-1600-X9)
  • PSU: EVGA 500 W1 80+

Vấn đề

Với tất cả 32GB RAM được cài đặt, hệ thống luôn bị lỗi MemTest86 + 6.2. Lỗi luôn xảy ra trong lần vượt qua đầu tiên và các lỗi nhanh chóng tăng lên hàng triệu lỗi. Cố gắng chạy các kết quả Windows trong các lần khởi động lại ngẫu nhiên và các lỗi Dừng (như dự kiến ​​với các lỗi RAM).

Những gì tôi đã thử

  • Kiểm tra một mô-đun PNY 8GB trong ổ cắm DIMM1. Hoàn thành thành công 4 lượt MemTest.
  • Kiểm tra một mô-đun PNY 8GB duy nhất trong ổ cắm DIMM2. Hoàn thành thành công 4 lượt MemTest.
  • Kiểm tra một mô-đun PNY 8GB trong ổ cắm DIMM3. Hoàn thành thành công 4 lượt MemTest.
  • Kiểm tra một mô-đun PNY 8GB duy nhất trong ổ cắm DIMM4. Hoàn thành thành công 4 lượt MemTest.
  • Kiểm tra riêng bốn DIMM PNY 8GB, riêng lẻ, trong ổ cắm DIMM1. Tất cả các mô-đun hoàn thành thành công 4 lượt MemTest.
  • Kiểm tra hai mô-đun PNY 8GB trong ổ cắm DIMM1 và DIMM2. Hoàn thành thành công 4 lượt MemTest.
  • Kiểm tra hai mô-đun PNY 8GB trong ổ cắm DIMM3 và DIMM4. Hoàn thành thành công 4 lượt MemTest.
  • Kiểm tra bo mạch chủ với bốn DIMM 2GB nổi tiếng trong tất cả các ổ cắm. Hoàn thành thành công 4 lượt MemTest.
  • Hoán đổi thứ tự của DIMM PNY trong ổ cắm. Không thay đổi - Lỗi MemTest vẫn xảy ra.
  • Tăng điện áp RAM bo mạch chủ từ 1,5v lên 1,65V. Không thay đổi - Lỗi MemTest vẫn xảy ra.
  • Chơi với nhiều kết hợp khác nhau của cài đặt thủ công RAM trong tiện ích thiết lập - bật / tắt cấu hình XMP, cài đặt trước "tăng độ ổn định", v.v. Không thay đổi, vẫn xảy ra lỗi MemTest.

Tôi nghĩ rằng tôi có thể loại trừ RAM xấu và ổ cắm RAM xấu. Lần duy nhất các bài kiểm tra MemTest thất bại là nếu cả bốn mô-đun 8GB được cài đặt đồng thời.

Tôi đã đo điện áp ra khỏi PSU và mọi thứ ở đó có vẻ ổn định ngay cả khi đã cài đặt cả bốn thanh.

Khi tôi viết bài này, tôi đã thử một tùy chọn cuối cùng là giảm tốc độ RAM thủ công xuống còn 1066 MHz trong BIOS. Cho đến nay, MemTest đã hoàn thành một lượt và là lần thứ hai không có lỗi. (Tất cả các thử nghiệm trên được thực hiện ở tốc độ RAM 1600 MHz.) Điều này có thể cho phép tôi sử dụng hệ thống, mặc dù tốc độ RAM chậm hơn một chút, nhưng dường như đây không phải là cách khắc phục vĩnh viễn.

Bất cứ khi nào xảy ra lỗi MemTest, chúng luôn xảy ra ở cùng một vị trí chính xác trên bus địa chỉ 64 bit:

Bit Error Mask: 00000000FF000000

Ngoài ra, lỗi KHÔNG BAO GIỜ xảy ra dưới hàng rào 4GB. Nói cách khác, tất cả các lỗi xảy ra trong không gian địa chỉ từ 4GB đến 32GB.

Tôi cho rằng đây là một vấn đề tương tác hoặc thời gian kỳ lạ với CPU và RAM và bo mạch chủ, vì các lỗi rất nhất quán, chỉ xảy ra trong một cấu hình cụ thể, dường như được giảm thiểu bằng cách làm chậm RAM và chỉ xảy ra trên hàng rào 4GB. Câu hỏi của tôi là: nhiều khả năng CPU hoặc bo mạch chủ của tôi là thủ phạm?

Tôi đã có ý định nâng cấp máy này lên Core i7-4790K, vì vậy nếu CPU là thủ phạm có khả năng (tôi biết rằng bộ điều khiển bộ nhớ nằm trên CPU trong các mô hình mới hơn này) thì nó hoạt động tốt vì tôi đang dự định nâng cấp dù sao đi nữa, nhưng tôi tự hỏi liệu có khả năng chính bo mạch chủ cũng có thể là một phần của vấn đề không. tức là tôi sẽ không muốn chi tiền cho CPU i7 chỉ để gặp vấn đề chính xác tương tự và phát hiện ra tôi cũng phải thay thế bo mạch chủ ...

Lời khuyên?


EDIT: Tốc độ RAM chậm hơn vẫn tạo ra lỗi, nhưng chỉ khi thử nghiệm đạt đến lần thứ ba. Tôi đã khởi động lại thử nghiệm chỉ với một CPU hoạt động chỉ để kiểm tra sự tương tác trên chính CPU.


Cách duy nhất để xác nhận nếu đó là bộ nhớ, mobo hoặc cpu là để kiểm tra ram trong một hệ thống tương thích khác.
Moab

2
Nếu vấn đề không di chuyển khi bạn di chuyển chip RAM, bo mạch chủ sẽ bị ném.
Joshua

1
Khi bạn chạy bộ nhớ này ở dạng kép hoặc khi bạn có 4 (8g) mô-đun, bạn có thể tắt nó SPD (tự động) và điều chỉnh thời gian một chút và làm cho nó hoạt động. nói rằng nó là 10,11,10,24 điều chỉnh nó thành 11,12,11,32 và thay vào đó hãy kiểm tra như vậy. (vâng, đây là phỏng đoán) Nếu nó hoạt động không ngừng 100%, thì nó ít có khả năng là vấn đề nhiệt hoặc vấn đề bo mạch chủ. Những người có mô-đun 4x8gig đã gặp sự cố mà bạn mô tả trước đây, nếu có hỗ trợ điều chỉnh điện áp và cpu không có chân bị uốn cong, đó có thể là một cách để làm cho các công cụ không có trong danh sách tương thích hoạt động. Vì vậy, kiểm tra điều đó và lấy lại cho chúng tôi.
Psycogeek

2
"Tốc độ RAM chậm hơn vẫn tạo ra lỗi, nhưng chỉ khi thử nghiệm đạt đến lần thứ ba" Trong bất kỳ điều nào trong số này, bạn có thực hiện thêm các bước để kiểm tra làm mát ram không? Ngay cả một quạt được thêm tạm thời hoặc quạt bên ngoài di chuyển không khí qua ram và công cụ điều chỉnh điện áp của nó, có thể kiểm tra xem nhiệt có phải là một trong những vấn đề không.
Psycogeek

@Psycogeek +1 để đề xuất sửa đổi thời gian. Một số mô-đun RAM không hoạt động tốt với các mô-đun khác theo thời gian (ngay cả cùng loại nhãn hiệu hoặc mô-đun). Tôi đã gặp vấn đề tương tự như OP và đã giải quyết bằng cách đặt thời gian theo cách thủ công.
Amziraro

Câu trả lời:


18

Điều này không có vẻ như bất kỳ thành phần nào bị lỗi, thay vào đó bạn đang sử dụng kết hợp không tương thích.

Có nhiều ổ cắm trên cùng một bus bộ nhớ làm tăng điện dung trên mỗi dòng dữ liệu và làm chậm thời gian tăng, điều này có thể khiến quá trình chuyển đổi đến muộn và bị sai. Hiện tượng này được các kỹ sư điện gọi là "quạt ra".

Điều này còn phức tạp hơn vì bên trong quạt ra mô-đun bộ nhớ. Số lượng và cấu trúc liên kết của các thiết bị DRAM trên mô-đun, được gọi là "xếp hạng", sẽ ảnh hưởng đến số lượng mô-đun bạn có thể kết nối song song thành công.

Các bo mạch chủ máy chủ hỗ trợ rất nhiều ổ cắm bộ nhớ thực sự yêu cầu bộ nhớ đệm, sử dụng mạng bộ đệm xếp tầng để hạn chế quạt ra (và do đó điện dung) mà mỗi người nhìn thấy. Có sự chậm trễ do chính bộ đệm gây ra, nhưng nó chỉ tăng logarit theo số lượng tải, trong khi đối với điện dung bộ nhớ không có bộ đệm tăng tuyến tính.

Wikipedia thảo luận về điều này: https://en.wikipedia.org/wiki/Memory_rank

Một số hướng dẫn sử dụng bo mạch chủ thực sự gọi loại này ra. Đối với những người khác, bạn có thể suy ra thông tin từ danh sách tương thích RAM. Ví dụ, bo mạch chủ ASUS Z170-A cho thấy thứ hạng kép (được gọi là DS = hai mặt trong hướng dẫn sử dụng) chỉ có thể được sử dụng trong hai khe cắm cùng một lúc trên bảng đó, trái ngược với khả năng sử dụng bốn DIMM xếp hạng một lần .

nhập mô tả hình ảnh ở đây


Giả sử đây là nguyên nhân của vấn đề, nó có giúp tắt SPD và điều chỉnh cài đặt thời gian chậm hơn một chút để bù cho thời gian tăng / giảm chậm hơn không?
Brhans

1
Tôi không chắc liệu điều này có thực sự đúng hay không. Bộ xử lý Haswell tiêu dùng thường hỗ trợ bốn cấp bộ nhớ cho mỗi kênh, đủ để cho phép bốn mô-đun hai mặt trong hai kênh bộ nhớ. Tại sao điều này sẽ là vấn đề? Điều này dường như cũng không giải thích được thực tế là các vấn đề chỉ xảy ra trên hàng rào 4 GB. Hơn nữa, hướng dẫn sử dụng của bo mạch chủ nói rằng chipset B85 bên dưới hỗ trợ bộ nhớ 32 GB và không đề cập đến bất kỳ giới hạn nào về số lượng xếp hạng bộ nhớ.
bwDraco

2
@bwDraco: Mặc dù bộ điều khiển bộ nhớ nằm trên CPU, bo mạch chủ cũng có vấn đề. Bố cục PCB có thể ảnh hưởng đến nó, kết hợp độ dài dưới tối ưu sẽ làm giảm biên pha trên các tín hiệu (đây cũng là lý do tại sao các lỗi tương quan với các vị trí byte hoặc bit nhất định). Việc hướng dẫn sử dụng bo mạch chủ không nói về xếp hạng không có nghĩa là tất cả các kết hợp đều được hỗ trợ, nó chỉ có nghĩa là hướng dẫn tào lao không đi sâu vào chi tiết.
Ben Voigt

1
@brhans: Không phải là thông số thời gian quan trọng, mà là tần số xung nhịp bộ nhớ, vì vấn đề nằm ở việc chuyển đổi giữa CPU và DIMM, không phải bên trong DRAM. SPD thường có một số cấu hình tương ứng với các tần số xung nhịp khác nhau, chọn một trong số các cấu hình khác nhau sẽ tốt hơn là hoàn toàn thủ công.
Ben Voigt

1
Chắc chắn có vẻ như một vấn đề toàn vẹn tín hiệu bo mạch chủ. Các mô-đun lớn hơn có thể có điện dung trên mỗi pin cao hơn các mô-đun nhỏ hơn, đặc biệt nếu bản thân các mô-đun là thứ hạng kép. Điều này có thể gây ra chính xác vấn đề này khi bạn điền đầy đủ các cấp bậc. Có thể cho một mô-đun có nhiều hơn một cấp bậc. Vì vậy, bốn cấp trên mỗi kênh có thể dễ dàng là hai mô-đun mật độ cao xếp hạng kép. Điều này có thể bị làm trầm trọng thêm bởi các đặc tính điện và định tuyến của dấu vết trên bo mạch chủ. Đề nghị của tôi: thử một bo mạch chủ khác.
alex.forencich 28/03/2016

9

Nghe có vẻ như là một vấn đề trong bộ điều khiển bộ nhớ tích hợp của bộ xử lý .

Trong các hệ thống hiện đại, bo mạch chủ không thực sự đóng vai trò quản lý bộ nhớ ngoài việc chỉ cung cấp một đường dẫn giữa các mô-đun bộ nhớ và bộ xử lý. Bộ nhớ được kết nối trực tiếp với bộ xử lý để giảm thiểu độ trễ; " cầu bắc " kết nối bộ nhớ với bộ xử lý trong các hệ thống cũ giờ là một phần của chính bộ xử lý. (Phần sụn hoặc PCH có thể kiểm soát cách bộ xử lý chạy RAM, nhưng nó không có nghĩa là nó gây ra lỗi bit theo cách bạn mô tả vì cuối cùng đó là trách nhiệm của bộ xử lý.) Do đó, điều đầu tiên tôi ' d nghi ngờ trong một tình huống như thế này là một IMC bị lỗi.

Trên thực tế, tôi sẽ rất ngạc nhiên nếu bo mạch chủ hoặc phần mềm hệ thống bị đổ lỗi cho các vấn đề bạn gặp phải.


Một pin bị cong thì sao?
Michael Hampton

6
@Michael: Một pin bị uốn cong cũng sẽ dẫn đến thất bại khi kiểm tra các mô-đun riêng lẻ.
Ben Voigt

4

Tôi thấy một số đánh giá xấu cho BIOS trên bo mạch chủ đó. Tôi sẽ bắt đầu bằng cách kiểm tra cập nhật BIOS. Không bao giờ tiết kiệm đồ trên bo mạch chủ.


BIOS là hiện tại. Phải thừa nhận rằng RAM không nằm trong danh sách "đủ điều kiện", nhưng nó có cùng thời gian với nhiều mô-đun khác được liệt kê ở đó.
fdmillion

Tôi sẽ xem xét thay thế bo mạch chủ sau đó. Nó không phải là hàng đầu, chỉ cần bắt đầu với một phạm vi giá bạn có thể đủ khả năng và tìm kiếm những người có nhiều đánh giá nhất (đọc chúng quá). Những người có cơ sở người dùng lớn nhất có nhiều khả năng sẽ hỗ trợ lâu dài cho các bản cập nhật BIOS và chipset.
Atoadaso

Bạn đã kiểm tra xem bo mạch chủ đó thậm chí có thể xử lý 32 GB bộ nhớ cùng một lúc không? Ngoài ra, bạn có thể tìm thấy chip quản lý bộ nhớ trên bo mạch chủ và tìm kiếm bộ nhớ dự kiến ​​có thể xử lý đúng cách.
milesrf

1

Có khả năng RAM cũng có thể bị lỗi, mặc dù có vẻ như không phải vậy. Tôi đã có một vấn đề gần đây với máy chủ nhà của tôi liên quan đến một tai nạn chết người với một ít trà đá ...

Tôi đã trải qua toàn bộ quá trình thay thế từng bộ phận riêng lẻ (2 CPU, mobo, powerupply và 2 ngân hàng RAM 16 GB (2x8GB)) và mọi thứ đều được kiểm tra tốt khi tôi chỉ sử dụng một ngân hàng RAM duy nhất với một CPU (trừ 1 CPU là bánh mì nướng).

Không quan trọng tôi đã sử dụng cấu hình nào, nó luôn hoạt động khi tôi có một CPU và ngân hàng RAM duy nhất (cho dù đó là 16GB hay 32GB RAM), nhưng khi tôi đặt vào CPU thứ 2 và chia RAM ra thì nó là 16GB mỗi ngân hàng, máy chủ không khởi động được.

Mãi cho đến khi tôi thay thế hoàn toàn một ngân hàng RAM thì cuối cùng nó cũng khởi động và chạy đúng cách, và kể từ đó.

tl; dr : Như @moab đã nêu trong nhận xét của mình, bạn không bao giờ có thể biết chắc chắn cho đến khi bạn kiểm tra mọi thành phần trong một hệ thống tương thích

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.