Tìm nguyên nhân truyền lại TCP trong mạng LAN


25

Xin chào các cư dân của Lỗi máy chủ

Tôi gặp vấn đề khó chịu với mạng LAN gồm khoảng 100 máy tính, 2 máy chủ miền Windows và 12 điện thoại VoIP. Vì cài đặt của họ khoảng một năm trước, mỗi tuần hoặc lâu hơn, chúng tôi nhận thấy một điện thoại VoIP tự đặt lại - đôi khi ở giữa một cuộc gọi. Đồng thời thường có dấu hiệu mất kết nối tạm thời trên máy tính: đóng băng trong trình thám hiểm trong khi truy cập chia sẻ mạng, lỗi trong phần mềm quản trị của chúng tôi do mất kết nối với máy chủ cơ sở dữ liệu.

Tôi đã thực hiện một số giám sát của Wireshark về kết nối giữa VoIP PBX và phần còn lại của mạng. Wireshark nhặt một cụm các gói TCP được truyền lại tại thời điểm chúng tôi ghi lại khởi động lại điện thoại. Nhật ký Wireshark hiển thị khoảng 2 cụm truyền lại mỗi ngày từ 5 gói đến hàng trăm. Những người trong mỗi cụm chủ yếu là giữa tổng đài và một số bộ điện thoại VoIP, nhưng không phải lúc nào cũng là cùng một bộ. Thông thường việc truyền lại cùng một lúc là cho các điện thoại được kết nối với cùng một công tắc, nhưng đôi khi việc truyền lại xảy ra cùng với các điện thoại ở hai đầu đối diện của mạng. Thường có một số truyền lại trùng hợp khi truyền lưu lượng TCP, ví dụ giữa máy khách và máy chủ tệp.

Sự tăng đột biến trong truyền lại và đặt lại điện thoại không tương quan tốt với khi mạng được tải nặng. Chúng dường như xảy ra nhiều hơn một chút vào ban ngày, nhưng hầu hết vào buổi tối, khi lưu lượng truy cập nên giảm. Chúng xảy ra một cách hợp lý thường vào đêm khuya khi hầu hết các máy tính bị tắt và lưu lượng nên thấp nhất.

Bạn có ý tưởng nào có thể giúp chẩn đoán nguyên nhân của các vấn đề như thế này không? Một điều tôi chưa thử, nhưng nên có, là cập nhật phần sụn của tất cả các công tắc.


1
Mô hình chuyển mạch gì? Làm thế nào để số liệu thống kê, memeory, vv trông? Bạn có trên một miền phát sóng không? Làm thế nào gần với thông lượng tối đa bạn nhìn thấy trên mạng?
Zypher

Bạn đang sử dụng giao thức VoIP nào? Ngoài ra, sử dụng UDP hay TCP?
Chris S

Tất cả các công tắc là 3Com: Baseline 2924 - PWR Plus (3CBLSG24PWR) x 2, 4200 (3C17304A) x 3, 4200 (3C17304) x 2, 2824-SPF Plus (3C16487), 2250 plus (3C16476CS). Tôi không nghĩ họ đưa ra số liệu thống kê về bộ xử lý hoặc bộ nhớ, nhưng tôi rất hài lòng khi tìm hiểu cách khác. Vâng, chúng tôi đang ở trên một miền phát sóng. Tôi không biết về thông lượng, tôi sẽ xem xét nó.
Siêu thực

Câu trả lời:


17

Truyền lại TCP thường là do tắc nghẽn mạng. Tìm kiếm một số lượng lớn các gói phát sóng tại thời điểm xảy ra sự cố. Nếu tỷ lệ lưu lượng phát sóng trong bản chụp của bạn cao hơn khoảng 3% tổng lưu lượng truy cập, thì bạn chắc chắn bị tắc nghẽn. Tìm các chương trình phát sóng cả lớp vật lý (ARP) và lớp mạng (độ phân giải tên) trên mạng. Nếu bạn tìm thấy một khối lượng lưu lượng phát sóng lớn, bạn có thể theo dõi nó đến nguồn từ dữ liệu chụp.


9
Ngoài ra, việc truyền lại TCP không phải là nguyên nhân gây ra sự cố của bạn, chúng là một triệu chứng của sự cố.
joeqwerty

Tôi nên đã đề cập rằng tôi đã xem qua các chương trình phát sóng UDP và chúng không tương quan với việc truyền lại. Một vài trong số các sự kiện truyền lại trùng với các đột biến trong các chương trình phát sóng UDP, nhưng hầu hết thì không. Tôi đã có một cái nhìn khác và thấy rằng các chương trình phát sóng UDP không vượt quá 1,5% lưu lượng truy cập (khoảng 350 gói) trong bất kỳ phân đoạn thời gian 10 phút nào và việc đạt đến mức đó là rất hiếm. Tuy nhiên tôi đã không nhìn vào các chương trình phát sóng ethernet. Tôi hiện đang chạy một kịch bản để lọc tất cả các bản ghi nhật ký của tôi. Là quy tắc 3% của phát sóng UDP và phát sóng ethernet riêng lẻ hoặc kết hợp?
Siêu thực

1
3% không thực sự là một quy tắc. Đó là những gì tôi đã nói và những gì tôi đã thấy trong môi trường của chính mình. Tôi đã nghe các con số từ 10 đến 20% nhưng tôi thấy rằng một khi nó vượt quá 3 đến 5% thì nó thường gây ra vấn đề. Bạn cần xem xét tất cả lưu lượng phát: ethernet, mạng và phát đa hướng, vì tất cả đều có thể gây tắc nghẽn. Về cơ bản, bất kỳ lưu lượng nào được phát đến tất cả các cổng chuyển đổi là lưu lượng cần được phân tích và giảm hoặc loại bỏ.
joeqwerty

Tôi vẫn chưa có một biểu đồ đẹp nào để kiểm tra mối tương quan tốt trong một thời gian dài, nhưng các chương trình phát sóng ethernet có vẻ khá hứa hẹn. Một bản ghi có truyền lại chỉ có hơn 3% chương trình phát sóng, khoảng 6% khác. Tôi đã tìm thấy ít nhất một vấn đề: một máy chủ cũ đang đưa ra một dòng liên tục các gói ARP vô cớ.
Siêu thực

1
Tôi đã tìm thấy các mục ARP quá mức bằng cách sử dụng bộ lọc Wireshark của arp- và để chỉ xem các mục phát sóng, sử dụng bộ lọc củaeth.addr==ff:ff:ff:ff:ff:ff
mlhDev

2

Thu thập số liệu thống kê lưu lượng truy cập cho các thiết bị chuyển mạch của bạn có thể cho thấy bạn có những khoảng thời gian bạn đang chạy hoặc gần công suất. Điều này có thể dẫn đến thử lại khi các phản hồi không quay trở lại trong thời gian chờ khởi động (thường là 3 giây). Điều này làm tăng tắc nghẽn trong giây lát cho đến khi các cơ chế giảm thiểu tắc nghẽn khởi động.

Tìm kiếm những người sử dụng phương tiện truyền thông trực tuyến vì điều đó có thể hấp thụ băng thông nhanh chóng.

Bạn có thể giảm thiểu sự cố cho điện thoại bằng cách định hình lưu lượng. Điều này sẽ chỉ di chuyển vấn đề cho người dùng khác.


2

Âm thanh như một vòng lặp cây kéo dài hoặc một cơn bão phát sóng đối với tôi, đặc biệt là nếu truyền lại và các vấn đề được cục bộ hóa cho cùng một công tắc (khác nhau). Khi nó xảy ra, trạng thái cổng trên thiết bị L2 của bạn là gì? Có lẽ là một chuyển đổi xấu hoặc ưu tiên cầu gốc xấu? Vấn đề thú vị.


Cảm ơn bạn đã nhắc tôi đọc về những cây bao trùm, về điều mà tôi đang thờ ơ. Tuy nhiên tôi không nghĩ rằng nó có thể là một vòng lặp cây bao trùm, bởi vì chúng tôi không có bất kỳ liên kết dự phòng nào trong mạng của chúng tôi (có thể là một vấn đề trong chính nó). Theo "trạng thái cổng trên thiết bị L2 của bạn", tôi có phải bạn muốn nói các cổng mà công tắc đã bật là kết quả của thuật toán cây bao trùm không? Chúng tôi chưa tự cấu hình một cây cầu gốc, liệu có nên làm như vậy không?
Siêu thực

Làm quen với STP là một ý tưởng hay, nhưng nếu bạn chắc chắn rằng bạn không có bất kỳ liên kết dư thừa nào, thì STP sẽ không là vấn đề.
joeqwerty

Vâng, nếu bạn không có các liên kết dư thừa, nó sẽ không thành vấn đề. Theo các trạng thái cổng, vâng, ý tôi là chuyển tiếp / bị chặn / học tập.
McJeff

2

Có thể bạn đã giải quyết vấn đề này vì nó đã quá lâu nhưng về cơ bản bạn cần kích hoạt "cổng nhanh" trên các cổng có điểm cuối (điện thoại voip, máy trạm, máy chủ). Một điện thoại có thể gửi PDU vì vậy nếu anh chàng đó khởi động lại, nó sẽ gây ra sự hội tụ STP, do đó làm cho bảng FDB bị xóa và tất cả các thiết bị đều trải qua 4/5 bước STP thú vị. Bằng cách đặt các cổng có điểm cuối vào "cổng nhanh", họ bỏ qua việc chờ và chuyển sang chế độ chuyển tiếp.


1

Hy vọng rằng điện thoại của bạn nằm trên một mạng con và Vlan khác với các máy tính khác?


Không, chúng nằm trên cùng một mạng con IP và tôi khá chắc chắn rằng cùng một Vlan. Đây có phải là một vấn đề nghiêm trọng? Nó chắc chắn có vẻ như nó sẽ là một ý tưởng tốt. Tôi có thể thấy nó sẽ tách các miền phát sóng cho điện thoại và mọi thứ khác. Nó sẽ có bất kỳ lợi thế khác?
Siêu thực

Có, tôi chắc chắn sẽ đặt điện thoại trên một Vlan chuyên dụng.
Greg Askew

1

Nó cũng có thể là một thiết bị bị lỗi như một công tắc bị lỗi. Do truyền lại có tương quan với điện thoại / máy tính trên một công tắc cụ thể hoặc một phần của mạng không?

Chỉ để mở rộng câu trả lời của tôi một chút. Không phải tất cả các công tắc được tạo ra bằng nhau, ngay cả khi chúng có cùng thông số kỹ thuật. Một số có thể đối phó với tải cao hơn nhiều so với những người khác vì họ có bộ xử lý nhanh hơn bên trong. Nó có thể là thiết bị chuyển mạch của bạn không hoàn toàn lên cấp.

Tôi sẽ bắt đầu bằng cách đặt một số điện thoại VOIP rắc rối nhất của bạn lên công tắc vật lý của riêng họ và xem liệu đặt lại trên những điện thoại đó có tiếp tục không. Nếu nó biến mất thì bạn đang trên đường giải quyết nó rất sớm.


Tôi ước họ đã làm. Dường như có vấn đề nhất với các thiết bị được kết nối với hai thiết bị chuyển mạch, nằm ở hai đầu đối diện của mạng. Tuy nhiên, cũng có truyền lại đáng kể cho điện thoại trong các phần khác của mạng.
Siêu thực
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.