Tôi đang cố phân tích một tài liệu có số tham chiếu nằm rải rác trong đó.
Văn bản văn bản văn bản {4: 2} văn bản đáng kinh ngạc hơn {4: 3} muộn hơn nhiều về {222: 115} và một số văn bản nữa.
Các tham chiếu sẽ luôn được gói trong ngoặc và sẽ luôn có dấu hai chấm giữa hai. Tôi đã viết một biểu thức để tìm thấy chúng.
{[0-9]:[0-9]}
Tuy nhiên, điều này rõ ràng thất bại ngay khi bạn bắt gặp một số có hai hoặc ba chữ số và tôi gặp khó khăn trong việc tìm ra điều đó nên là gì. Sẽ không bao giờ có nhiều hơn 3 chữ số {999: 999} là kích thước tối đa để xử lý.
Bất cứ ai cũng có một ý tưởng về một biểu thức thích hợp để xử lý này?
regex
thẻ.