Tôi có một phần mềm được viết bằng một phần mềm đa luồng, thực hiện một loạt các mô phỏng mỗi ngày. Đây là một nhiệm vụ rất tốn CPU và tôi đã chạy chương trình này trên các dịch vụ đám mây, thường là trên các cấu hình như 1GB mỗi lõi.
Tôi đang chạy CentOS 6.7 và /proc/cpuinfo
cho tôi biết rằng bốn lõi VPS của tôi là 2,5 GHz.
processor : 3
vendor_id : GenuineIntel
cpu family : 6
model : 63
model name : Intel(R) Xeon(R) CPU E5-2680 v3 @ 2.50GHz
stepping : 2
microcode : 1
cpu MHz : 2499.992
cache size : 30720 KB
physical id : 3
siblings : 1
core id : 0
cpu cores : 1
apicid : 3
initial apicid : 3
fpu : yes
fpu_exception : yes
cpuid level : 13
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ss syscall nx pdpe1gb rdtscp lm constant_tsc arch_perfmon rep_good unfair_spinlock pni pclmulqdq ssse3 fma cx16 pcid sse4_1 sse4_2 x2apic movbe popcnt tsc_deadline_timer aes xsave avx f16c rdrand hypervisor lahf_lm abm arat xsaveopt fsgsbase bmi1 avx2 smep bmi2 erms invpcid
bogomips : 4999.98
clflush size : 64
cache_alignment : 64
address sizes : 40 bits physical, 48 bits virtual
power management:
Với sự gia tăng của tỷ giá hối đoái, VPS của tôi bắt đầu đắt hơn và tôi đã đạt được một "thỏa thuận tuyệt vời" trên các máy chủ kim loại đã qua sử dụng.
Tôi đã mua bốn chiếc HP DL580 G5 , với bốn chiếc Intel Xeon X7350. Về cơ bản, mỗi máy có lõi 16x 2,93 GHz và 16 GB, để giữ những thứ như đám mây VPS của tôi .
processor : 15
vendor_id : GenuineIntel
cpu family : 6
model : 15
model name : Intel(R) Xeon(R) CPU X7350 @ 2.93GHz
stepping : 11
microcode : 187
cpu MHz : 1600.002
cache size : 4096 KB
physical id : 6
siblings : 4
core id : 3
cpu cores : 4
apicid : 27
initial apicid : 27
fpu : yes
fpu_exception : yes
cpuid level : 10
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall lm constant_tsc arch_perfmon pebs bts rep_good aperfmperf pni dtes64 monitor ds_cpl vmx est tm2 ssse3 cx16 xtpr pdcm dca lahf_lm dts tpr_shadow vnmi flexpriority
bogomips : 5866.96
clflush size : 64
cache_alignment : 64
address sizes : 40 bits physical, 48 bits virtual
power management:
Về cơ bản có vẻ như rất nhiều, vì tôi có thể ngừng sử dụng VPS để thực hiện các công việc hàng loạt này. Bây giờ nó là thứ kỳ lạ ...
- Trên VPS tôi đã chạy 1,25 luồng trên mỗi lõi, giống như tôi đã làm trên kim loại trần. (Chủ đề thêm 0,25 là để bù thời gian nhàn rỗi do sử dụng mạng.)
- Trên VPS của tôi, sử dụng tổng số lõi 44x 2,5 GHz, tôi nhận được gần 900 mô phỏng mỗi phút.
- Trên DL580 của tôi, sử dụng tổng số lõi 64x 2,93 GHz, tôi chỉ nhận được 300 mô phỏng mỗi phút.
Tôi hiểu DL580 có bộ xử lý cũ hơn. Nhưng nếu tôi đang chạy một luồng trên mỗi lõi và máy chủ kim loại trần có lõi nhanh hơn, tại sao nó hoạt động kém hơn VPS của tôi?
Tôi không có trao đổi bộ nhớ xảy ra trong bất kỳ máy chủ.
TOP cho biết bộ xử lý của tôi đang chạy ở mức 100%. Tôi nhận được tải trung bình là 18 (5 trên VPS).
Đây sẽ là cách này, hoặc tôi đang thiếu một cái gì đó?
Chạy lscpu cho tôi 1.6GHz trên máy chủ kim loại trần của tôi. Điều này đã được nhìn thấy trên /proc/cpuinfo
là tốt.
Là thông tin này là chính xác, hoặc nó được liên kết với một số quản lý năng lượng không chính xác?
[BARE METAL] $ lscpu
Architecture: x86_64
CPU op-mode(s): 32-bit, 64-bit
Byte Order: Little Endian
CPU(s): 16
On-line CPU(s) list: 0-15
Thread(s) per core: 1
Core(s) per socket: 4
Socket(s): 4
NUMA node(s): 1
Vendor ID: GenuineIntel
CPU family: 6
Model: 15
Stepping: 11
**CPU MHz: 1600.002**
BogoMIPS: 5984.30
Virtualization: VT-x
L1d cache: 32K
L1i cache: 32K
L2 cache: 4096K
NUMA node0 CPU(s): 0-15
[VPS] $ lscpu
Architecture: x86_64
CPU op-mode(s): 32-bit, 64-bit
Byte Order: Little Endian
CPU(s): 4
On-line CPU(s) list: 0-3
Thread(s) per core: 1
Core(s) per socket: 1
Socket(s): 4
NUMA node(s): 1
Vendor ID: GenuineIntel
CPU family: 6
Model: 63
Stepping: 2
**CPU MHz: 2499.992**
BogoMIPS: 4999.98
Hypervisor vendor: KVM
Virtualization type: full
L1d cache: 32K
L1i cache: 32K
L2 cache: 256K
L3 cache: 30720K
NUMA node0 CPU(s): 0-3