16 lõi không được sử dụng trong số 80 lõi


11

Gần đây tôi phát hiện ra rằng máy chủ của chúng tôi không sử dụng tất cả 80 luồng nữa trong hệ thống. Có vẻ như nếu 16 lõi luôn ở chế độ chờ, mặc dù tải hệ thống cao.

Đó là máy chủ Dell powerEdge R900, với 4 ổ cắm, gấp 4 lần Xeon 10 nhân. Vì vậy, 40 lõi, với HT 80 chủ đề. (Intel (R) Xeon (R) CPU E7- 4850 @ 2.00GHz). Bộ nhớ hệ thống là 512GB Chạy Ubuntu 14.04.1 LTS. Tôi chưa khởi động lại máy chủ, tôi hy vọng sẽ tránh được điều này.

uname -a
Lắp ráp Linux 3.13.0-35-generic # 62-Ubuntu SMP Thứ Sáu, ngày 15 tháng 8 01:58:42 UTC 2014 x86_64 x86_64 x86_64 GNU / Linux

Tôi sẽ kiểm tra như sau:

Nhiệt độ đo bằng i7z: (nó không thể hiển thị 4 ổ cắm

Tốc độ Cpu từ cpuinfo 1994.00Mhz
Tần số thực (không có kế toán Turbo) 1994 MHz

Ổ cắm [0] - [lõi vật lý = 10, lõi logic = 20, lõi trực tuyến tối đa bao giờ = 10]
  Bộ nhân CPU 15x | | Tần số xung nhịp xe buýt (BCLK) 132,93 MHz
  TURBO ENABLED trên 10 lõi, siêu phân luồng ON
  Tần số tối đa mà không cần xem xét Turbo 2126.93 MHz (132.93 x [16])
  Hệ số nhân TURBO tối đa (nếu được bật) với số lõi 1/2/3/4/5/6 là 0x / 0x / 0x / 0x / 0x / 0x
  Tần số hiện tại thực 1994,02 MHz (Tối đa bên dưới)
        Core [core-id]: Freq thực tế (Nhiều.) C0% Dừng lại (C1)% C3% C6% Temp
        Lõi 1 [1]: 1994,01 (15,00x) 100 0 0 0 75
        Lõi 2 [5]: 1994.00 (15.00x) 100 0 0 0 77
        Lõi 3 [9]: 1994.02 (15.00x) 100 0 0 0 76
        Lõi 4 [13]: 1994.00 (15.00x) 100 0 0 0 77
        Lõi 5 [17]: 1994.00 (15.00x) 100 0 0 0 77
        Lõi 6 [21]: 1994.00 (15.00x) 97.7 0.404 0 1.86 77
        Lõi 7 [25]: 1994.00 (15.00x) 94.5 0 1 5.27 77
        Lõi 8 [29]: 1994.00 (15.00x) 100 0 0 0 76
        Lõi 9 [33]: 1994.00 (15.00x) 99.8 0 1 1 75
        Lõi 10 [37]: 1994.00 (15.00x) 100 0 0 0 73
  Tần số tối đa mà không cần xem xét Turbo 2126.93 MHz (132.93 x [16])
  Hệ số nhân TURBO tối đa (nếu được bật) với số lõi 1/2/3/4/5/6 là 0x / 0x / 0x / 0x / 0x / 0x
  Tần số hiện tại thực 1994,02 MHz (Tối đa bên dưới)
        Core [core-id]: Freq thực tế (Nhiều.) C0% Dừng lại (C1)% C3% C6% Temp
        Lõi 1 [1]: 1994.02 (15.00x) 100 0 0 0 74
        Lõi 2 [5]: 1994.00 (15.00x) 100 0 0 0 76
        Lõi 3 [9]: 1994.02 (15.00x) 100 0 0 0 76
        Lõi 4 [13]: 1994.00 (15.00x) 100 0 0 0 77
        Lõi 5 [17]: 1994.00 (15.00x) 100 0 0 0 76
        Lõi 6 [21]: 1994.00 (15.00x) 97 0 1 2.43 77
        Lõi 7 [25]: 1994.00 (15.00x) 92.9 0 1 6.81 77
C0 = Bộ xử lý đang chạy mà không dừng lại00x) 100 0 0 0 75
C1 = Bộ xử lý chạy với dừng (Trạng thái> C0 là trình tiết kiệm năng lượng) 1 1 75
C3 = Lõi chạy với PLL bị tắt và bộ đệm lõi bị tắt 0 0 73
C6 = Mọi thứ ở trạng thái lõi C3 + được lưu vào bộ đệm cấp cuối cùng
  Các giá trị trên bảng được tính theo tỷ lệ phần trăm trong 1 giây qua
[core-id] đề cập đến số lõi-id trong / Proc / cpuinfo
Thông báo 'Giá trị rác' được in khi đọc giá trị rác
  Ctrl + C để thoát

Nhàn rỗi: 16 lõi cuối cùng đều 100% không hoạt động:

mpstat -p TẤT CẢ 1:
Trung bình: CPU% usr% đẹp% sys% iowait% irq% soft% ăn cắp% khách% gnice% nhàn rỗi
Trung bình: tất cả 70,69 0,00 0,70 0,00 0,00 0,00 0,00 0,00 28,61
Trung bình: 0 92,93 0,00 0,00 0,00 0,00 0,00 0,00 0,00
Trung bình: 1 94,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00
Trung bình: 2 100,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00
Trung bình: 3 83,33 0,00 2,08 0,00 0,00 0,00 0,00 0,00 14,58
Trung bình: 4 100,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00
Trung bình: 5 100,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00
.................................................. ........
Trung bình: 64 0,00 0,00 0,00 0,00 0,00 0,00 0,00 100,00
Trung bình: 65 0,00 0,00 0,00 0,00 0,00 0,00 0,00 100,00
Trung bình: 66 0,00 0,00 0,00 0,00 0,00 0,00 0,00 100,00
Trung bình: 67 0,00 0,00 0,00 0,00 0,00 0,00 0,00 100,00
Trung bình: 68 0,00 0,00 0,00 0,00 0,00 0,00 0,00 100,00
Trung bình: 69 0,00 0,00 0,00 0,00 0,00 0,00 0,00 100,00
Trung bình: 70 0,00 0,00 0,00 0,00 0,00 0,00 0,00 100,00
Trung bình: 71 0,00 0,00 0,00 0,00 0,00 0,00 0,00 100,00
Trung bình: 72 0,00 0,00 0,00 0,00 0,00 0,00 0,00 100,00
Trung bình: 73 0,00 0,00 0,00 0,00 0,00 0,00 0,00 100,00
Trung bình: 74 0,00 0,00 0,00 0,00 0,00 0,00 0,00 100,00
Trung bình: 75 0,00 0,00 0,00 0,00 0,00 0,00 0,00 100,00
Trung bình: 76 0,00 0,00 0,00 0,00 0,00 0,00 0,00 100,00
Trung bình: 77 0,00 0,00 0,00 0,00 0,00 0,00 0,00 100,00
Trung bình: 78 0,00 0,00 0,00 0,00 0,00 0,00 0,00 100,00
Trung bình: 79 0,00 0,00 0,00 0,00 0,00 0,00 0,00 100,00

Số tải hàng đầu:

đầu trang - 17:41:48 lên 35 ngày, 6:28, 15 người dùng, tải trung bình: 77,69, 70,48, 62,73
Nhiệm vụ: Tổng cộng 1327, 44 chạy, 1281 ngủ, 2 dừng, 0 zombie
% Cpu (63): 63,7 us, 13,6 sy, 0,0 ni, 22,3 id, 0,2 wa, 0,0 hi, 0,2 si, 0,0 st
KiB Mem: 52837942 + tổng, 52553190 + đã sử dụng, 2848524 miễn phí, 535660 bộ đệm
Hoán đổi KiB: tổng số 78124032, 2105608 đã sử dụng, 76018416 miễn phí. 40637328 + Mem lưu trữ

Đôi khi% nhàn rỗi không còn là 100 nữa, nhưng ít hơn một chút, như bạn có thể thấy ở đây, nhưng chủ yếu là ở mức không hoạt động 100%.

Trung bình: CPU% usr% đẹp% sys% iowait% irq% soft% ăn cắp% khách% gnice% nhàn rỗi
Trung bình: tất cả 70,69 0,00 0,70 0,00 0,00 0,00 0,00 0,00 28,61
Trung bình: 64 0,13 0,00 0,00 0,00 0,00 0,00 0,00 99,87
Trung bình: 65 0,00 0,00 0,00 0,00 0,00 0,00 0,00 100,00
Trung bình: 66 0,00 0,00 0,63 0,00 0,00 0,00 0,00 0,00 97,37
Trung bình: 67 0,00 0,00 0,13 0,13 0,00 0,00 0,00 0,00 99,75
Trung bình: 68 0,00 0,00 0,00 0,00 0,00 0,00 0,00 100,00
Trung bình: 69 0,00 0,00 0,00 0,00 0,00 0,00 0,00 100,00
Trung bình: 70 0,00 0,00 0,00 0,00 0,00 0,00 0,00 100,00
Trung bình: 71 0,00 0,00 0,12 0,00 0,00 0,00 0,00 0,88 99,88
Trung bình: 72 0,00 0,00 0,00 0,00 0,00 0,00 0,00 100,00
Trung bình: 73 0,00 0,00 0,00 0,00 0,00 0,00 0,00 100,00
Trung bình: 74 0,00 0,00 0,00 0,00 0,00 0,00 0,00 100,00
Trung bình: 75 0,00 0,00 0,00 0,00 0,00 0,00 0,00 100,00
Trung bình: 76 0,00 0,00 0,00 0,00 0,00 0,00 0,00 100,00
Trung bình: 77 0,00 0,00 0,13 0,00 0,00 0,00 0,00 0,00 99,87
Trung bình: 78 0,00 0,00 0,00 0,00 0,00 0,00 0,00 100,00
Trung bình: 79 0,00 0,00 0,00 0,00 0,00 0,00 0,00 100,00

Tôi cũng đã chạy lệnh này để đảm bảo tất cả chúng đều trực tuyến:

cho COUNT trong `seq 01 79`; tạo tiếng vang 1> / sys / thiết bị / hệ thống / cpu / cpu $ {COUNT} / trực tuyến; 

Với chương trình HTop, tôi có thể hình dung một thanh sử dụng cpu cho mỗi luồng và thấy 64 thanh được lấp đầy và 16 thanh trống (16 thanh cuối cùng).

Khi tôi cố gắng bắt đầu một quy trình ở lõi> 63 cũng không thực hiện được:

root @ server: ~ # tasket -c 63 time
Cách sử dụng: time [-apvV] [-f format] [-o file] [--append] [--verbose]
       [- khả năng di chuyển] [--format = format] [--output = file] [--version]
       [--quiet] [--help] lệnh [arg ...]
root @ server: ~ # tasket -c 64 lần
tasket: thất bại trong việc thiết lập mối quan hệ của pid 0: Đối số không hợp lệ
root @ server: ~ # tasket -c 65 lần
tasket: thất bại trong việc thiết lập mối quan hệ của pid 0: Đối số không hợp lệ

Chủ đề liên quan: https://askubfox.com/questions/536541/ubfox-uses-only-2-out-of-4- Processor-cores

EDIT: Hóa ra các lõi bị tắt khi đang bay, nhưng không khởi động đúng cách. Dường như có các quy trình chạy trên các lõi không có sẵn này, nhưng không thể bắt đầu bất kỳ quy trình mới nào trên chúng. Theo nhật ký dmesg, các lõi bị vô hiệu hóa và được kích hoạt nhanh chóng. Tôi phải nói rằng đó là ý định tắt các lõi này, vì vậy chúng tôi đã vô hiệu hóa 'tính năng' này. Nhật ký ví dụ DMESG:

[Thứ hai, 12 tháng 1 12:42:40 2015] kvm: vô hiệu hóa ảo hóa trên CPU79
[Thứ hai, 12 tháng 1 12:42:40 2015] smpboot: CPU 79 hiện đang ngoại tuyến
....
[Thứ hai, 12 tháng 1 12:43:12 2015] smpboot: Khởi động Node 0 Bộ xử lý 79 APIC 0xf3
[Thứ hai, 12 tháng 1 12:43:12 2015] kvm: cho phép ảo hóa trên CPU79

Chúng tôi kích hoạt / vô hiệu hóa lõi thông qua:

cho COUNT trong `seq 64 79`; thực hiện echo 1> / sys / thiết bị / system / cpu / cpu $ {COUNT} / online; xong

Chúng tôi không bao giờ liên kết các lệnh này với 16 lõi không khả dụng của chúng tôi, vì thông thường các lệnh trên hoạt động đúng. (chúng tôi cũng đã thử vô hiệu hóa powermanager, nhưng điều này không giúp được gì)


1
Tại sao bạn hoặc công ty của bạn không sử dụng máy chủ Ubuntu thay vì Ubuntu cho các PC thông thường?
XperianX

1
Không phải là 16 lõi của bạn thực sự đang được sử dụng với dung lượng MAX, để lại 16 lõi ảo không có lề có thể sử dụng được.
nặc

1
Có phải tất cả 8 lõi (16 ảo) trên một CPU vật lý, hoặc chúng có trải đều trên tất cả 4 ổ cắm không? Nếu chúng nằm trên một CPU vật lý, có thể các lõi đó đã bị lỗi không?
Jibberish51

2
Tôi tự hỏi nếu một nơi nào đó trong hệ thống có mã đại diện cho mặt nạ ái lực CPU chỉ với 64 bit ngăn nó cho phép các tiến trình sử dụng 16 lõi cuối cùng.
kasperd

Cho rằng 80-16 = 64, đối với tôi có vẻ như có một số giới hạn nhân tạo ở đâu đó trên số lõi tối đa được sử dụng. Có thể bất cứ phần mềm nào bạn đang chạy đều được đặt tối đa 64 lõi hoặc có thể nó không thể tạo ra hơn 64 luồng.
Clonkex

Câu trả lời:


1

Không phải tất cả các chương trình có thể sử dụng nhiều chủ đề. php là một ví dụ. Nếu một tiến trình php cần nhiều CPU, chỉ có 1 CPU sẽ đạt tối đa. Và những người khác sẽ nhàn rỗi.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.