Tôi có một tập tin với mẫu
<span class="WebRupee">Rs.</span>\n29\n<br/><font style="font-size:smaller;font-weight:normal">\n3 days\n</font></td>, <td class="pricecell"><span class="WebRupee">Rs.</span>\n59\n<br/><font style="font-size:smaller;font-weight:normal">\n7 days\n</font></td>, <td class="pricecell"><span class="WebRupee">Rs.</span>\n99\n<br/><font style="font-size:smaller;font-weight:normal">\n12 days\n</font></td>
Tôi muốn các giá trị 29, 3 ngày, 59, v.v.
về cơ bản là giá trị giữa \n value \n
Tôi đã tham khảo nhiều nơi nhưng tôi không biết làm cách nào để thoát khỏi các ký tự.
Tôi đã thử: - grep -o '\n.*\n' o.txt
Nhưng nó không hoạt động
... but I think that's just as wrongheaded as demanding every trivial HTML processing task be handled by a full-blown parsing engine.
. Việc sử dụng một biểu thức thông thường để lấy một số văn bản từ một tệp không phải là một tội ác. Tôi đã nghe rất nhiều người thuyết giáo rằng bạn không nên làm điều đó, nhưng hoàn toàn không có gì sai khi thực hiện nó ở quy mô nhỏ nếu bạn biết bạn đang làm gì.