Tại sao chính xác các chip bắt đầu gặp trục trặc một khi chúng quá nóng?


26

Khi một con chip quá nóng, nó có thể bắt đầu gặp trục trặc - ví dụ, nhiều chương trình có thể bắt đầu bị lỗi khi một số hoặc tất cả các bộ phận trong máy tính bị quá nóng.

Chính xác thì điều gì xảy ra khiến chip bị trục trặc khi chúng quá nóng?

Câu trả lời:


26

Để mở rộng các câu trả lời khác.

  1. Dòng rò cao hơn: điều này có thể dẫn đến nhiều vấn đề nóng hơn và có thể dễ dàng dẫn đến sự thoát nhiệt.
  2. Tín hiệu cho tỷ lệ nhiễu sẽ giảm khi nhiễu nhiệt tăng : Điều này có thể dẫn đến tỷ lệ lỗi bit cao hơn, điều này sẽ khiến chương trình bị đọc sai và các lệnh bị hiểu sai. Điều này có thể gây ra hoạt động "ngẫu nhiên".
  3. Dopants trở nên di động hơn với nhiệt. Khi bạn có một con chip quá nóng hoàn toàn, bóng bán dẫn có thể ngừng là bóng bán dẫn. Điều này là không thể đảo ngược.
  4. Gia nhiệt không đều có thể làm cho cấu trúc tinh thể của Si bị phá vỡ. Một người bình thường có thể trải nghiệm bằng cách đặt kính qua sốc nhiệt độ. Nó sẽ vỡ tan, một chút cực đoan, nhưng nó minh họa điểm. Điều này là không thể đảo ngược.
  5. Bộ nhớ ROM phụ thuộc vào một tấm cách ly tích điện sẽ có thể mất bộ nhớ khi nhiệt độ tăng. Năng lượng nhiệt, nếu đủ cao, có thể cho phép các thiết bị điện tử thoát khỏi dây dẫn tích điện. Điều này có thể làm hỏng bộ nhớ chương trình. Điều này thường xuyên xảy ra với tôi trong quá trình hàn các IC đã được lập trình khi ai đó quá nóng chip.
  6. Mất kiểm soát bóng bán dẫn: Với đủ năng lượng nhiệt, các electron của bạn có thể nhảy bandgap. Chất bán dẫn là một vật liệu có một dải nhỏ để dễ dàng bắc cầu bằng các chất dẫn nhưng đủ lớn để nhiệt độ vận hành cần thiết không biến nó thành một dây dẫn trong đó khe hở nhỏ hơn năng lượng nhiệt của vật liệu. Đây là một sự đơn giản hóa và là cơ sở của một bài viết khác, nhưng tôi muốn thêm nó và đặt nó trong các từ của riêng tôi.

Có nhiều lý do hơn, nhưng những điều này làm cho một vài quan trọng.


Dường như thất bại về thời gian sẽ là một trong những "lý do" khác (điện trở dây có xu hướng tăng theo nhiệt độ, do đó, các đường thời gian giới hạn điện dung có thể vi phạm thời gian trường hợp xấu nhất được bảo đảm của chúng). Tất nhiên, DRAM cũng rò rỉ sạc (như bộ nhớ flash) nhanh hơn ở nhiệt độ cao hơn; không có sự bù trừ trong dữ liệu tốc độ làm mới có thể bị mất.
Paul A. Clayton

13

Vấn đề chính với hoạt động của IC ở nhiệt độ cao là dòng rò rỉ tăng lên rất nhiều của các bóng bán dẫn riêng lẻ. Dòng rò có thể tăng đến mức các mức điện áp chuyển mạch của thiết bị bị ảnh hưởng, do đó tín hiệu không thể truyền đúng trong chip và nó ngừng hoạt động. Họ thường phục hồi khi được phép hạ nhiệt, nhưng đó không phải là luôn luôn như vậy.

Các quy trình sản xuất cho hoạt động ở nhiệt độ cao (lên đến 300C) sử dụng công nghệ CMOS trên chất cách điện silicon vì độ rò rỉ thấp trong phạm vi nhiệt độ rất rộng.


9

Chỉ cần một bổ sung cho một số câu trả lời xuất sắc: Về mặt kỹ thuật, đó không phải là những người có khả năng di động nhiều hơn, đó là sự gia tăng nồng độ chất mang bên trong. Nếu bất cứ thứ gì mà các chất dẫn / chất mang trở nên kém di động hơn vì mạng tinh thể silicon bắt đầu "rung" do năng lượng nhiệt tăng làm cho các electron và lỗ trống khó truyền qua thiết bị hơn - sự tán xạ phonon quang học tôi tin rằng phsyics gọi nó nhưng tôi có thể sai.

Khi nồng độ chất mang bên trong tăng vượt quá mức pha tạp, bạn sẽ mất kiểm soát điện của thiết bị. Các chất mang bên trong là những chất có trước khi chúng ta xử lý silicon, ý tưởng về chất bán dẫn là chúng ta thêm các chất mang riêng để tạo ra các mối nối pn và những điều thú vị khác mà bóng bán dẫn làm. Silicon đứng đầu khoảng 150degC vì vậy RF tản nhiệt và bộ xử lý tốc độ cao là rất quan trọng vì 150degC không quá khó đạt được trong thực tế. Có một liên kết trực tiếp giữa nồng độ chất mang bên trong và dòng rò của thiết bị.

Giống như các mánh khóe khác đã chỉ ra, đây chỉ là một trong những lý do khiến các con chip thất bại - nó thậm chí có thể đi xuống một thứ đơn giản như một liên kết dây trở nên quá nóng và bật ra khỏi nó, có một danh sách rất nhiều thứ.


Khi tôi nói rằng các chất lỏng trở nên cơ động hơn, ý tôi là các nguyên tử vật lý, không phải là chất mang. Nút giao PN có thể trôi và ngừng là một diode với thời gian và nhiệt. Thứ hai, khi bạn nhận được nhiệt độ đủ cao, năng lượng nhiệt của bạn, tạo ra cả các phonon năng lượng cao tương tác với các electron và mức IR cao hơn nhiều trong cấu trúc, có thể cung cấp cho các electron năng lượng đủ cao để nhảy khoảng cách giữa các lớp dẫn và hóa trị . Si đứng đầu vì bandgap của nó sao cho 150degC sẽ cung cấp cho các electron khả năng nhảy.
Kortuk

Vâng, tôi nghĩ rằng chúng ta đang nói điều tương tự chỉ từ điểm xuất phát khác nhau.
SimonBarker

1
Cách bạn giải thích nghe có vẻ chính xác như thế nào sau khi sử dụng vật lý thiết bị, sau khi sử dụng một số thiết bị trạng thái rắn và lượng tử ứng dụng, tôi nói điều đó hơi khác một chút, nhưng cả hai chúng tôi đều biết những giải thích này quá mức. Tôi đã thêm một chút về điều này ảnh hưởng đến câu trả lời của tôi vì tôi nghĩ nó rất quan trọng, tôi đã cho bạn +1 đầu tiên của bạn, thứ mà bạn xứng đáng. Đây là một ảnh hưởng quan trọng vì nó dẫn đến chạy trốn nhiệt rất nhanh.
Kortuk

8

Mặc dù dòng rò tăng lên, tôi mong đợi một vấn đề lớn hơn đối với nhiều thiết bị dựa trên MOS là lượng dòng điện đi qua một bóng bán dẫn MOS ở trạng thái "bật" sẽ giảm khi thiết bị nóng lên. Để một thiết bị hoạt động chính xác, một bóng bán dẫn đang chuyển đổi một nút phải có khả năng sạc hoặc xả bất kỳ điện dung tiềm ẩn nào trong phần đó của mạch trước khi mọi thứ khác phụ thuộc vào nút đó đã được chuyển đổi. Giảm khả năng truyền hiện tại của bóng bán dẫn sẽ làm giảm tốc độ chúng có thể sạc hoặc xả các nút. Nếu một bóng bán dẫn không thể sạc hoặc xả một nút đủ trước khi một phần khác của mạch phụ thuộc vào nút đó đã được chuyển đổi, mạch sẽ gặp trục trặc.

Lưu ý rằng đối với các thiết bị NMOS, đã có sự đánh đổi trong thiết kế khi định cỡ các bóng bán dẫn kéo lên thụ động; kéo lên thụ động càng lớn, nút càng nhanh có thể chuyển từ thấp sang cao, nhưng càng lãng phí điện năng mỗi khi nút thấp. Do đó, nhiều thiết bị như vậy đã được vận hành gần rìa của hoạt động chính xác và các trục trặc dựa trên nhiệt là (và đối với thiết bị điện tử cổ điển, vẫn còn) khá phổ biến. Đối với các thiết bị điện tử CMOS thông thường, các vấn đề như vậy thường ít nghiêm trọng hơn; Tôi không có ý tưởng nào trong thực tế về mức độ mà họ đóng vai trò trong những thứ như bộ xử lý đa GHZ.


2
Đây là một hiệu ứng rất quan trọng, tôi đã định yêu cầu Kortuk thêm nó vào câu trả lời của mình. Một trong những yếu tố đằng sau thông số Tj tối đa cho bộ xử lý là ở trên Tj, bộ xử lý có thể không hoạt động ở tốc độ định mức. Đây cũng là lý do tại sao làm mát tốt hơn giúp ép xung.
Andy

Đoạn đầu tiên là lý do tại sao máy tính của bạn ngừng hoạt động khi trời nóng - nó chậm quá nhiều để theo kịp tần số đồng hồ.
W5VO

Trên thực tế, có một yếu tố khác có thể có vai trò trong các thiết bị NMOS, mặc dù tôi không mong đợi nó trong các thiết kế điển hình nhất: nhiều thiết bị NMOS có tốc độ xung nhịp tối thiểu , do yêu cầu sử dụng hoặc làm mới dữ liệu trong các nút lưu trữ động trước khi nó bị thoát ra ngoài do rò rỉ. Nếu dòng rò tăng theo nhiệt độ, tốc độ xung nhịp tối thiểu cũng sẽ tăng. Tôi nghi ngờ hầu hết các thiết bị được vận hành đủ trên tốc độ xung nhịp tối thiểu mà việc tăng tốc độ tối thiểu sẽ không thành vấn đề, nhưng tôi không chắc chắn.
năm11

@Andy, @ W5VO, tôi đã viết câu trả lời của tôi đêm qua và quên mất giữa chừng. Ca đêm làm tổn hại đến não của bạn.
Kortuk

2

Để bổ sung cho các câu trả lời hiện có, các mạch ngày nay rất nhạy cảm với hai hiệu ứng lão hóa sau (không chỉ các hiệu ứng này mà còn là các hiệu ứng chính trên các quy trình <150nm):

Bởi vì nhiệt độ làm tăng tính di động của chất mang, nó làm tăng hiệu ứng HCI và NBTI, nhưng nhiệt độ không phải là nguyên nhân chính gây ra NBTI và HCI:

  • HCI là do tần số cao
  • NBTI bằng điện áp cao

Hai hiệu ứng lão hóa silicon này gây ra cả thiệt hại có thể đảo ngược và không thể đảo ngược đối với các bóng bán dẫn (bằng cách ảnh hưởng / làm suy giảm chất nền cách điện) làm tăng ngưỡng điện áp bóng bán dẫn (Vt). Do đó, bộ phận sẽ yêu cầu điện áp cao hơn để duy trì cùng mức hiệu suất, điều này ngụ ý sự gia tăng nhiệt độ vận hành và, như đã nói trong các bài viết khác, rò rỉ cổng bóng bán dẫn sẽ xảy ra.

Tóm lại, nhiệt độ sẽ không thực sự làm cho phần tuổi nhanh hơn, đó là tần số và điện áp cao hơn (tức là ép xung) sẽ làm cho một phần tuổi. Nhưng lão hóa bóng bán dẫn sẽ đòi hỏi điện áp hoạt động cao hơn làm cho phần nhiệt nhiều hơn.

Corolary: hậu quả của việc ép xung là tăng nhiệt độ và điện áp cần thiết.


1

Lý do chung khiến các IC thất bại không thể đảo ngược là do kim loại Nhôm bên trong chúng được sử dụng để tạo ra các kết nối giữa các yếu tố khác nhau tan chảy và mở hoặc rút ngắn các thiết bị.

Đúng, dòng điện rò rỉ sẽ tăng lên, nhưng nhìn chung, chính vấn đề không phải là dòng điện rò rỉ, mà là sức nóng mà điều này gây ra và hậu quả là làm hỏng kim loại bên trong IC.

Mạch điện (ví dụ như nguồn điện, trình điều khiển dòng điện cao, v.v.) có thể bị hỏng vì ở điện áp cao, khi trình điều khiển bóng bán dẫn tắt nhanh, dòng điện bên trong được tạo ra gây ra sự cố của thiết bị hoặc phân phối điện không đều bên trong nó gây ra cục bộ sưởi ấm và thất bại kim loại tiếp theo.

Một số lượng lớn (1000) chu kỳ nhiệt lặp đi lặp lại có thể gây ra lỗi do sự không phù hợp giữa sự mở rộng cơ học của IC và gói, cuối cùng làm cho dây liên kết bị rách hoặc phân định vật liệu gói nhựa và sự cố cơ học tiếp theo.

Tất nhiên, một số lượng lớn các thông số kỹ thuật IC chỉ được chỉ định trong một phạm vi nhiệt độ nhất định và chúng có thể không nằm trong thông số kỹ thuật bên ngoài này. Tùy thuộc vào thiết kế, điều này có thể gây ra lỗi hoặc dịch chuyển tham số không thể chấp nhận (trong khi IC nằm ngoài phạm vi nhiệt độ) - điều này có thể xảy ra đối với nhiệt độ cực cao hoặc thấp.


Nhôm nóng chảy ở 660 ° C (1220 ° F). IC chết tốt trước khi đạt được nhiệt độ này.
Dmitry Grigoryev

Về cơ bản là không. Ở nhiệt độ dưới mức này, bạn chắc chắn có thể có hành vi điện không mong muốn; sưởi ấm quá mức và thoát nhiệt, nhưng điều này thực sự không gây ra sự cố vĩnh viễn cho đến khi một phần của mạch đạt đến nhiệt độ mà Al (hoặc kim loại khác) khuếch tán vào silicon. Điểm này (điểm eutectic) là khoảng 500-600 C. Hầu hết các thất bại khác đều có thể phục hồi. Thất bại bổ sung có thể được gây ra bởi sự cố điện cho phép điện áp quá mức được áp dụng cho cổng hoặc chu kỳ nhiệt của bóng bán dẫn (gây ra sự cố cơ học).
jp314

Tôi vẫn còn nghi ngờ. Ví dụ, IC thường chỉ định nhiệt độ hàn tối đa khoảng 300 ° C, vì vậy dường như vượt quá giới hạn đó là đủ để gây ra thiệt hại vĩnh viễn.
Dmitry Grigoryev
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.