Gần đây sau khi nâng cấp một số mạch MetroE (kết nối L2) từ 100Mbps lên 1Gbps, tôi nhận thấy rằng việc chuyển tệp lớn không thành công giữa một số trang web; tuy nhiên, việc chuyển chỉ thất bại theo hướng. Ví dụ, hãy xem xét ví dụ sau đây.
Từ -> Tới
A -> B = Thất bại
B -> A = Thành công
A -> C = Thành công
C -> A = Thành công
B -> C = Thành công
C -> B = Thành công
Mỗi trang web là một phân đoạn được định tuyến phía sau một công tắc L3 được đặt tại trang web. Công tắc L3 kết nối với bộ chuyển đổi phương tiện CPE của nhà cung cấp, lần lượt kết nối với mạng của nhà cung cấp thông qua cáp quang. Định tuyến tĩnh được sử dụng giữa các công tắc L3.
*Site A* *Site B*
L3 Switch <-> CPE <--- Provider ---> CPE <-> L3 Switch
|
CPE
|
L3 Switch
*Site C*
Nhà cung cấp đã thực hiện kiểm tra đầu cuối của các mạch từ CPE và báo cáo không mất. Tuy nhiên, tôi thấy nhiều ACK trùng lặp trong một gói chụp trên máy chủ trước khi chuyển thất bại.
Nếu tôi loại bỏ các công tắc L3 khỏi phương trình và kết nối trực tiếp hai máy chủ với thiết bị CPE tại mỗi trang web, việc truyền tệp hoàn tất thành công.
Host A <-> CPE <--- Provider ---> CPE <-> Host B
Nếu tôi đặt máy chủ ở hai bên của bộ chuyển đổi L3, định tuyến interVlan hoạt động mà không gặp trở ngại và quá trình truyền tệp hoàn tất thành công.
Host A1 <-> L3 Switch <-> Host A2
Vấn đề dường như chỉ xảy ra khi dữ liệu đi qua nhà cung cấp giữa hai phân đoạn được định tuyến.
Host A <-> L3 Switch <-> CPE <--- Provider ---> CPE <-> L3 Switch <-> Host B
Tôi đã xác minh một số điều - thống kê giao diện sạch (không có lỗi), mức sử dụng cpu và bộ nhớ thấp, tốc độ và kết hợp song công (máy khách và CPE), bảng MAC và ARP chính xác, v.v.
Điều gì có thể là vấn đề?
Cập nhật 1
Các gói bắt giữ từ máy chủ A và B có thể được tìm thấy tại URL sau:
https://www.dropbox.com/sh/5m2yohgxieelo59/AADed-0EWOkdmFIe0qT45_uQa
Sự cố ban đầu xảy ra khi sử dụng các công tắc Juniper EX3200 chạy 12.3R6.6. Sau đó tôi đã hạ cấp các công tắc xuống 11.4R6.6, nhưng điều này không giải quyết được vấn đề.
Tôi đã có thể sao chép sự cố bằng cách sử dụng các công tắc Juiper EX2200 chạy 12.3R6.6 và 11.4R6.6. Tôi cũng có thể sao chép sự cố bằng cách sử dụng các công tắc Dell 6224 chạy 3.3.11.2.
Hiện tại, chỉ CPE (ge-0/0/0) và một máy chủ duy nhất (ge-0/0/1) được kết nối với Juniper EX3200 tại mỗi trang web. Trong khi khắc phục sự cố, tôi đã loại bỏ cấu hình của bất kỳ tham số ngoại lai nào, do đó cấu hình khá cơ bản. Cấu hình về cơ bản là giống nhau ở mỗi loại, nhưng với các địa chỉ IP khác nhau. Dưới đây là một đoạn.
# show interfaces
ge-0/0/0 {
unit 0 {
family ethernet-switching {
port-mode access;
vlan {
members WAN;
}
}
}
}
ge-0/0/1 {
unit 0 {
family ethernet-switching {
port-mode access;
vlan {
members LAN;
}
}
}
}
vlan {
unit 10 {
description WAN;
family inet {
address 192.168.X.X/27;
}
}
unit 100 {
description LAN;
family inet {
targeted-broadcast;
address 172.X.X.1/22;
}
}
}
# show vlans
WAN {
vlan-id 10;
l3-interface vlan.10;
}
LAN {
vlan-id 100;
l3-interface vlan.100;
}
Cập nhật 2
Hôm nay tôi nhận thấy rằng nếu tôi quét một tệp từ bộ chuyển đổi L3, Juniper EX3200, tại trang A sang L3, Juniper EX3200, tại trang B, việc chuyển scp cũng bị ảnh hưởng bởi sự cố.
Tôi thấy điều này đặc biệt thú vị vì quá trình chuyển đổi bắt nguồn từ giao diện CPE phải đối mặt với Vlan WAN, bởi vì nếu tôi kết nối Vlan giữa các trang bị ảnh hưởng thông qua các chuyển đổi EX3200, thì việc chuyển tập tin thành công giữa các máy chủ tại trang A và B.