Tôi có một tệp HTML lớn có nhiều đánh dấu giống như thế này: <p class="MsoNormal" style="margin: 0in 0in 0pt;"> <span style="font-size: small; font-family: Times New Roman;">stuff here</span> </p> Tôi đang cố gắng thực hiện tìm kiếm và thay thế Vim để loại bỏ tất cả class=""và style=""nhưng tôi gặp …
Tôi đang cố gắng sử dụng sed để dọn sạch các dòng URL để chỉ trích xuất tên miền. Từ đó: http://www.suepearson.co.uk/product/174/71/3816/ Tôi muốn: http://www.suepearson.co.uk/ (có hoặc không có dấu gạch chéo, không thành vấn đề) Tôi đã thử: sed 's|\(http:\/\/.*?\/\).*|\1|' và (thoát khỏi bộ định lượng không tham lam) …
Tôi tìm thấy hướng dẫn tuyệt vời này về các biểu thức chính quy và trong khi tôi trực giác hiểu được các số lượng "tham lam", "miễn cưỡng" và "sở hữu" làm gì, dường như có một lỗ hổng nghiêm trọng trong sự hiểu biết của tôi. Cụ thể, …
Tôi đang sử dụng jQuery. Tôi có một chuỗi với một khối các ký tự đặc biệt (bắt đầu và kết thúc). Tôi muốn có được văn bản từ khối ký tự đặc biệt đó. Tôi đã sử dụng một đối tượng biểu thức chính quy để tìm trong chuỗi. …
Tôi muốn grep trận đấu ngắn nhất và mô hình nên giống như: <car ... model=BMW ...> ... ... ... </car> ... Có nghĩa là bất kỳ ký tự nào và đầu vào là nhiều dòng.
Làm thế nào để tôi tạo một regex python như "(.*)"vậy, đưa ra các "a (b) c (d) e"trận đấu python "b"thay vì "b) c (d"? Tôi biết rằng tôi có thể sử dụng "[^)]"thay vì ".", nhưng tôi đang tìm kiếm một giải pháp tổng quát hơn để giữ …
Tôi đang cố gắng tách một chuỗi thành hai phần bằng regex. Chuỗi được định dạng như sau: text to extract<number> Tôi đã sử dụng (.*?)<và <(.*?)>hoạt động tốt nhưng sau khi đọc vào regex một chút, tôi mới bắt đầu tự hỏi tại sao tôi cần ?các biểu thức. …