Có một hộp Linux.
Có một thiết bị Netapp xấu phục vụ lưu trữ.
Chúng nằm trong cùng một mạng con, vì vậy về mặt lý thuyết, không cần định tuyến.
Vấn đề: Đôi khi chúng ta có thể đạt LIF của netapp, từ hộp Linux, đôi khi chúng ta không thể (theo tcpdump, nó chỉ không đáp ứng).
Câu hỏi: điều gì có thể gây ra vấn đề như vậy?
CẬP NHẬT # 1 : đã tạo số liệu thống kê về thời điểm tốt, xấu, với:
while true; do (nc -w 1 -z IPADDRESSHERE 22 && printf "good\t") || printf "bad\t"; date; sleep 1; done > testing.txt
Vì vậy, trong mỗi giây, netcat cố gắng kết nối từ hộp Linux -> với Netapp.
# grep -w bad testing.txt | wc -l; grep -w good testing.txt | wc -l
520
480
#
Khi thử 1000 lần, chúng tôi đã nhận được SSH 520 lần và 480 lần nó đã hết thời gian, vì vậy khoảng ~ 52% tốt, ~ 48% xấu. Có thể 50-50%? Có thể là một số vấn đề như failover?
CẬP NHẬT # 2 : điều thú vị khác là Netapp xấu không thể được ping, trong khi tất cả các Netapp khác đều có thể ping được.