Hiện tại tôi đang chạy một lệnh như thế này, để có được nội dung được yêu cầu nhiều nhất:
grep "17\/Jul\/2011" other_vhosts_access.log | awk '{print $8}' | sort | uniq -c | sort -nr
Bây giờ tôi muốn xem các chuỗi tác nhân người dùng, nhưng vấn đề là chúng bao gồm một số khoảng trắng. Đây là một dòng tệp nhật ký điển hình. UA là phần cuối cùng được phân định bằng dấu ngoặc kép:
example.com:80 [ip] - - [17/Jul/2011:23:59:59 +0100] "GET [url] HTTP/1.1" 200 6449 "[referer]" "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/534.30 (KHTML, like Gecko) Chrome/12.0.742.122 Safari/534.30"
Có một công cụ tốt hơn awk cho điều này?