Thật khó để đưa ra câu trả lời cụ thể vì 90% công việc này là kinh nghiệm dạy cho bạn biết nên tìm loại vấn đề nào và 90% còn lại là biết tìm Google trên đâu để có gợi ý về nơi bắt đầu.
Tôi thường thử các công cụ túi giấy như để khách hàng thể hiện vấn đề (chủ yếu là để loại trừ các vấn đề về ngón tay và bất kỳ vấn đề nào khách hàng có thể mô tả vấn đề của mình), sau đó cố gắng sao chép vấn đề trên một máy tính khác. Làm điều đó thường cung cấp cho bạn cái nhìn sâu sắc về nơi để tìm.
Đừng quên vấn đề khắc phục khởi động lại, đặc biệt là đối với các hệ thống Windows, ngay cả ngày nay. Nó đã từng như thế này đến mức tôi sẽ hỏi mọi người "Bạn đã khởi động lại chưa? Hãy thử điều đó và cho tôi biết nếu vấn đề vẫn còn" - điều này đã khắc phục một tỷ lệ rất lớn các vấn đề tôi được hỏi.
Thường xuyên có trái cây treo thấp trong các vấn đề về độ phân giải DNS và kết nối cơ bản (ACL trên bộ định tuyến, lỗ hổng không khí trong mạng, ping / traceroutes / mtrs đến các trang web từ xa, v.v.).
Đối với các dịch vụ bạn có quyền kiểm soát trực tiếp, chạy nagios hoặc thứ gì đó để đảm bảo dịch vụ thực sự đang chạy có thể thường xuyên kích hoạt bạn khắc phục sự cố trước khi khách hàng nói với bạn về chúng. Bạn cũng có thể muốn được thu thập số liệu thống kê, trực tiếp thông qua munin hoặc một cái gì đó, hoặc thông qua SNMP đến một cái gì đó như Cacti.
Tôi thường cố gắng để Cacti chạy với ít nhất tất cả các công tắc và tường lửa cốt lõi của mình; khi có thể, tôi chạy Cacti chống lại mọi thứ tôi có thể. Trong những trường hợp này, tôi thường tìm kiếm những thứ như số lỗi cổng hoặc lưu lượng truy cập quá mức. Biểu đồ tường lửa từ một số thiết bị có thể cho bạn thấy việc sử dụng CPU và các phiên đồng thời; bạn sẽ học được ở ngưỡng nào thiết bị tường lửa của bạn bắt đầu có vấn đề.
Tường lửa của bạn có thể đăng nhập vào thiết bị nhật ký hệ thống; nếu vậy, hãy đăng nhập mọi thứ bạn có thể và xem qua những gợi ý. Điều này sẽ dễ dàng hơn nếu bạn chạy một cái gì đó như syslog-ng hoặc rsyslog hoặc splunk cho phép bạn phân chia nhật ký của mình một chút thay vì xử lý một tệp nguyên khối.
Tôi cũng cố gắng chạy nfsen với ít nhất là bên trong tường lửa của tôi và đường lên tới nhà cung cấp internet nếu có thể. Điều này cho phép bạn quay ngược thời gian để xem xét các phiên để xem ai đang làm gì; điều này đôi khi có thể bắt gặp những hành vi thú vị.