Sợi quang tai ương đường dài


52

Tôi cần một đôi mắt tươi.

Chúng tôi đang sử dụng một tuyến cáp quang dài 15km mà qua đó fibrechannel và 10GbE được ghép kênh (CWDM quang thụ động). Đối với FC, chúng tôi có các laser đường dài phù hợp tới 40km ( Skylane SFCxx0404F0D ). Bộ ghép kênh bị giới hạn bởi các SFP có thể làm tối đa. Kênh truyền hình 4Gb. Công tắc FC là một loạt thổ cẩm 5000. Các bước sóng tương ứng là 1550,1570,1590 và 1610nm đối với FC và 1530nm đối với 10GbE.

Vấn đề là vải 4GbFC gần như không bao giờ sạch. Đôi khi họ ở trong một thời gian thậm chí với rất nhiều lưu lượng truy cập trên chúng. Sau đó, họ có thể đột nhiên bắt đầu tạo ra các lỗi (RX CRC, mã hóa RX, chênh lệch RX, ...) ngay cả khi chỉ có lưu lượng biên trên chúng. Tôi đang đính kèm một số lỗi và biểu đồ giao thông. Lỗi hiện đang theo thứ tự 50-100 lỗi mỗi 5 phút khi có lưu lượng 1Gb / s.


Quang học

Dưới đây là sản lượng điện của một cổng được tóm tắt (được thu thập bằng cách sử dụng sfpshowtrên các công tắc khác nhau)

Đơn vị SITE-A = uW (microwatt) SITE-B
****** / TÌM KIẾM
FAB1
SW1 TX 1234.3 RX 49.1 SW3 1550nm (không)
      RX 95.2 TX 1175.6
FAB2
SW2 TX 1422.0 RX 104.6 SW4 1610nm (ok)
      RX 54.3 TX 1468.4      

Điều tôi thấy tò mò ở điểm này là sự bất cân xứng về mức độ sức mạnh. Trong khi SW2 truyền với 1422uW mà SW4 nhận được với 104uW, SW2 chỉ nhận được tín hiệu SW4 với công suất ban đầu tương tự chỉ với 54uW.

Ngược lại cho SW1-3.

Dù sao, các SFP có độ nhạy RX xuống tới -18dBm (khoảng 20uW) vì vậy trong mọi trường hợp nó sẽ ổn ... Nhưng không có gì.

Một số SFP đã được nhà sản xuất chẩn đoán là trục trặc (1550nm được hiển thị ở trên với "ko"). Những cái 1610nm rõ ràng là ổn, chúng đã được thử nghiệm bằng cách sử dụng một trình tạo lưu lượng. Các dòng thuê cũng đã được thử nghiệm nhiều lần. Tất cả là trong dung sai. Tôi đang chờ thay thế nhưng vì một số lý do tôi không tin rằng nó sẽ làm mọi thứ tốt hơn vì những thứ tốt dường như cũng không tạo ra lỗi ZERO.

Trước đó đã có thiết bị hoạt động liên quan (một số loại trả lại 4GFC) trước khi đưa tín hiệu lên đường dây. Không biết tại sao. Thiết bị đó đã bị loại vì sự cố nên giờ chúng tôi chỉ có:

  • các tia laser đường dài trong công tắc,
  • (mới) Cáp monomode 10m LC-SC đến mux (cho mỗi loại vải),
  • dòng thuê,
  • điều tương tự nhưng đảo ngược ở phía bên kia của liên kết.


Công tắc FC

Đây là một cấu hình cổng từ thổ cẩm portcfgshow(rõ ràng là như vậy ở cả hai bên)

Số khu vực: 0
Cấp tốc độ: 4G
Điền từ (Đang hoạt động) 0 (Không sử dụng)
Điền từ (Hiện tại) 0 (Không sử dụng)
AL_PA Offset 13: TẮT
Cổng trung kế ON
LS đường dài
Liên kết VC bắt đầu TẮT
Khoảng cách mong muốn 32 Km
Bộ đệm dành riêng 70
Đã khóa L_Port TẮT
Đã khóa G_Port TẮT
Đã tắt E_Port TẮT
Đã khóa E_Port TẮT
Chế độ ISL R_RDY TẮT
RSCN bị loại bỏ
Tắt liên tục TẮT
LOS TOV cho phép TẮT
Khả năng NPIV BẬT
QOS E_Port TẮT
Cổng tự động vô hiệu hóa: TẮT
Giới hạn tỷ lệ TẮT
TẮT cổng EX
Cổng gương TẮT
Phục hồi tín dụng TRÊN
Bộ đệm F_Port TẮT
Độ trễ lỗi: 0 (R_A_TOV)
Giới hạn PP NPIV: 126
Chế độ CSCTL: TẮT

Việc buộc các liên kết đến 2GbFC không tạo ra lỗi, nhưng chúng tôi đã mua 4GbFC và chúng tôi muốn có 4GbFC.

lỗi và biểu đồ giao thông

Tôi không biết tìm ở đâu nữa. Bất kỳ ý tưởng những gì để thử tiếp theo hoặc làm thế nào để tiến hành?

Nếu chúng ta không thể làm cho 4GbFC hoạt động một cách đáng tin cậy, tôi tự hỏi những người làm việc với 8 hoặc 16 làm gì ... Tôi không cho rằng "một vài lỗi ở đây và ở đó" có thể chấp nhận được.

Oh và BTW, chúng tôi đang liên lạc với tất cả các nhà sản xuất (công tắc FC, MUX, SFP, ...) Ngoại trừ SFP được thay đổi (một số đã được thay đổi trước đó) không ai có đầu mối. Thổ cẩm SAN Health cho biết vải vẫn ổn. MUX, tốt, nó thụ động, nó chỉ là một lăng kính, tự nhiên là tốt nhất.

Bất kỳ bức ảnh trong bóng tối?


PHỤ LỤC: Trả lời câu hỏi của bạn

@ Chopper3: Đây là thế hệ thứ hai của thổ cẩm thể hiện vấn đề. Trước đây chúng tôi có 5000, bây giờ chúng tôi có 5100. Ban đầu khi chúng tôi vẫn còn MUX hoạt động, chúng tôi đã thuê một tia laser có tuổi thọ cao một lần để đưa nó vào công tắc trực tiếp để thực hiện các thử nghiệm trong một ngày, trong ngày đó tất nhiên là sạch. Nhưng như tôi đã nói, đôi khi nó sạch như thế. Và đôi khi không. Các công tắc thay thế có nghĩa là xây dựng lại toàn bộ SAN với những công tắc chỉ để kiểm tra. SFP thay thế, họ cũng khó đến như vậy.

@longneck: Đường dây được cho thuê. Đó là một sợi tối (9um monomode) vì vậy không có ai khác trên đó. Chắc chắn có mối nối. Tôi không thể đi và nhìn nhưng tôi phải tin rằng họ đã được thực hiện một cách chính xác. Như tôi đã nói, dòng này đã được kiểm tra và kiểm tra lại (sử dụng máy đo độ phản xạ miền thời gian quang). Rõ ràng là bạn không có tất cả các thiết bị này bởi vì nó quá đắt.

@mdpc: Loại cáp "sai" theo bạn là gì? Lên đến công tắc tất cả mọi thứ là monomode, vâng. Các kết nối là những người chính xác quá. Vâng tôi biết có những cái màu xanh lá cây trong đó sợi bị cắt ở một góc nhất định, vv Nhưng chúng tôi có những cái chính xác cho tất cả những gì tôi biết.


Báo cáo tiến độ số 1

Chúng tôi đã có hai loại vải (= 2x2 công tắc) với thổ cẩm 5100 với FabricOS 6.4.1 và hai loại vải (một công tắc 2x4 khác) trên FabricOS 7.0.2.

Trên các ISL dài hạn (một trong mỗi loại vải), hóa ra với FOS 6.4.1, nó đặt ra các cảnh báo về khoảng cách xa về cài đặt VC init và từ đó điền từ. Nhưng đó chỉ là những cảnh báo. FOS 7.0.2 yêu cầu bạn thực hiện sửa đổi đối với VCI và từ khóa cho các liên kết đường dài.

Đặt FOS 6.4.1 thành cài đặt LS (khoảng cách tĩnh khoảng cách xa) với cài đặt VCI và từ khóa sai khiến toàn bộ cấu trúc không hoạt động (bị mắc kẹt trong vòng lặp SCN, sử dụng fabriclog -sđể xem, bạn không thấy nó ở bất kỳ nơi nào khác, không có lỗi cổng quầy hoặc bất cứ điều gì tăng).

Hiện tại tôi đang cung cấp cho một loại vải với IMHO các cài đặt chính xác hơn và nó dường như hoạt động tốt, trong khi một loại khác không có nhiều lưu lượng truy cập vẫn có lỗi ở đây và đó.

tiến độ1

Nói ngắn gọn:

  • Chúng tôi đã loại bỏ phần hoạt động của MUX (phần trả về FC).
  • Chúng tôi đang đặt SFP đường dài vào thiết bị cuối.
  • Để chắc chắn, chúng tôi đã mua cáp monomode mới để kết nối thiết bị đầu cuối với phần thụ động còn lại của MUX.
  • Chúng tôi hiện đang thử một số cấu hình đường dài.

Nó gần như là ma thuật đen. Tất cả mọi thứ xảy ra chủ yếu là theo kinh nghiệm, dường như không ai biết được lý do chính xác để làm điều gì đó. ("Chúng tôi đã thử điều này, và nó không hoạt động, sau đó chúng tôi đã thử nó và nó đã hoạt động, vì vậy chúng tôi bị mắc kẹt với điều đó." Nhưng dường như không ai thực sự biết tại sao.)

Tôi sẽ cập nhật cho bạn.


Báo cáo tiến độ số 2

Chúng tôi đã nhận được các laser mới cho một trong các loại vải được bảo hành. Nó cực kỳ sạch ngay cả trên 4GbFC.

Chúng đang truyền với tốc độ khoảng 2mW (3dBm) trong khi những cái khác chỉ ở mức 1,5mW (1,5dBm) mặc dù điều đó thực sự là đủ.

Loại vải khác (nơi mà các tia laser rõ ràng vẫn ổn) vẫn tạo ra một hoặc hai CRC không thường xuyên.

Sử dụng sfpshowSFP tạo ra các lỗi RX thực tế cho thấy

Trạng thái / Ctrl: 0x82
Cờ báo động [0,1] = 0x5, 0x40
Cờ cảnh báo [0,1] = 0x5, 0x40

Bây giờ tôi sẽ phải tìm hiểu điều đó có nghĩa là gì. Không chắc chắn nếu nó đã ở đó trước đó.

Vâng, trước tiên tôi sẽ xóa đầu mình với một tuần nghỉ phép. số 8-)


8
Trước hết, câu hỏi tuyệt vời, chính xác những gì trang web này là dành cho, được thực hiện tốt. Thứ hai, bạn có quyền truy cập vào các công tắc / SFP thay thế - lý tưởng là một kiểu / mô hình khác mà bạn có thể trao đổi để kiểm tra không?
Chopper3

4
Cập nhật tuyệt vời, tiếp tục công việc tốt, ước gì tôi có một số gợi ý hoặc lời khuyên nhưng bạn đang đi đúng hướng, rất vui khi tìm thấy một người dùng mới trên SF, người biết công cụ của họ :)
Chopper3

1
Có sự thống nhất về thời gian và thời gian xảy ra lỗi không? Có phải chúng luôn xảy ra vào N giờ? Họ có luôn kéo dài X phút không? Bạn có thể tương quan chúng với thời tiết, các sự kiện thể thao gần đó, hoặc hiện tượng khác? Các vấn đề không liên tục là những lỗi khó khăn nhất để đè bẹp, và tôi thường bắt đầu tấn công chúng bằng cách vẽ biểu đồ thời gian và thời lượng chúng xảy ra trên bảng trắng. Hy vọng rằng patters xuất hiện có thể tương quan với các hiện tượng khác .
dotancohen

2
Bạn đang theo dõi chúng trên một bảng trắng, hiển thị cho mọi người ? Tôi sẽ không nhấn, nhưng tôi đánh giá cao nó. Giống như bạn đã nói, bạn cần một đôi mắt mới và có thể ai đó trong tổ chức của bạn sẽ thấy mô hình xuất hiện từ thời gian / thời lượng, và không nhất thiết là từ các triệu chứng.
dotancohen

1
Xin chào Marki. Tôi không hoàn toàn quen thuộc với những gì bạn đang nói, nhưng bởi bản cập nhật cuối cùng của bạn, có vẻ như vấn đề đã được khắc phục bởi SFP thay thế? Nếu vậy, có lẽ là một ý tưởng tốt để gửi bài này như một câu trả lời và đặt câu hỏi mới nếu bạn có vấn đề hơn nữa.
Mark Henderson

Câu trả lời:


4

Ok, tôi đoán tôi cần đăng một câu trả lời. Trong một từ đó là: nhấn mạnh .

Vấn đề không được giải quyết 100% theo ý thích của tôi, vì chúng tôi vẫn có một lỗi với 1 (một) lỗi CRC không thường xuyên. Một cái khác là sạch sẽ. Nhưng tôi có thể sống với điều đó.

Trong mọi trường hợp, chúng tôi sẽ không tiếp tục sử dụng các đơn vị CWDM trong một thời gian rất dài, mà chuyển sang sử dụng bộ ghép kênh DWDM thụ động vào năm tới vì cơ sở hạ tầng của chúng tôi sẽ thay đổi rất nhiều. Rõ ràng laser DWDM cũng rẻ hơn so với các loại CWDM. Ồ chúng ta sẽ thấy và có lẽ tôi sẽ gặp nhiều vấn đề khi hỏi bạn :-)


Cập nhật Không phải ở trên, chúng tôi đã mua lại CWDM và nó thực sự ít tốn kém hơn. AFAICS cho một số ứng dụng nhất định, tuy nhiên, bạn phải sử dụng DWDM vì không có laser CWDM cho nó. Cuối cùng, chúng tôi đã cố gắng đến gần nhà sản xuất nhất có thể và toàn bộ mọi thứ chỉ bằng khoảng 1/5 giá so với mua từ nhà phân phối hoặc thậm chí là nhà tích hợp.


Vì vậy, tôi có thể kết luận, nếu bạn đã mua một giải pháp không hoạt động như mong đợi: nhấn mạnh. Về mặt kỹ thuật, chúng tôi đã làm hai việc

  • xóa phần hoạt động của MUX (không thể nói tôi hối tiếc về điều đó, nhưng cũng không chắc đó có phải là một nguồn lỗi khác hay không)
  • kiểm tra các SFP một cách xuyên suốt

(Và tất nhiên tất cả các chẩn đoán tiêu chuẩn, thay đổi từng thứ một, xem điều gì xảy ra, v.v., không cần phải nói với bạn điều đó.

Trong trường hợp này phải mất một thời gian dài để khẳng định nhưng cuối cùng chúng tôi đã đạt đến mức mà chính nhà sản xuất bỏ qua một vài người và một số thiết bị để thực hiện kiểm tra giúp. Và tất nhiên chúng tôi đã có nhà tích hợp trả tiền đó, vì phần cứng của chúng tôi đang được bảo trì. Vì vậy, đây là một thách thức thương mại nhiều như nó là một thách thức kỹ thuật.

Tái bút Ồ và, những lá cờ mà tôi đã đề cập trong bản cập nhật mới nhất của tôi không cho thấy điều gì xấu, nhưng tôi không nhớ chính xác ý nghĩa của chúng. Khi tôi tìm thấy tuyên bố tôi sẽ cập nhật câu trả lời cho đầy đủ.


Cuối cùng, những lá cờ có nghĩa là một cái gì đó xấu sau tất cả. Rõ ràng là không chắc chắn phía nào của liên kết là nguyên nhân gây ra lỗi. Vì vậy, cặp đó cũng phải được thay đổi.

Oh và BTW, bộ thu phát DWDM 8GbFC chỉ rẻ hơn so với CWG 8G ;-) Cách rẻ nhất để sử dụng là 4GbFC trên CWDM và sau đó sử dụng trung kế ISL (nếu bạn có giấy phép)


Tôi đã không nhìn thấy điều này khi nó được hỏi, thật không may. Tôi không thể nói với bạn chắc chắn rằng điều này sẽ giúp ích, nhưng nếu bạn đang sử dụng các từ khóa nhàn rỗi, bạn sẽ gửi rất nhiều ánh sáng. Điều này có nghĩa là mỗi khung không sử dụng đang kéo rất nhiều năng lượng và tạo ra nhiều nhiệt trên SFP, tôi nghĩ vậy. Thay đổi từ khóa sang một số chế độ khác (tôi sử dụng chế độ 3, nhưng tôi có một công tắc khác và SFP) có thể cho phép bạn đẩy nhiều thông lượng hơn với ít lỗi hơn.
Basil

@Basil Tôi biết sử dụng từ chính xác là một vấn đề đối với đồng bộ hóa từ tại 8GFC nhưng tôi đã nghĩ về nó theo cách này ...
Marki

Chúng tôi khuyên bạn nên sử dụng bất cứ lúc nào - theo như tôi có thể nói, đó là câu hỏi về việc khung hình nhàn rỗi khiến SFP của nó tạo ra bao nhiêu nhiễu.
Basil
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.