Làm cách nào để xóa HTML khỏi tài liệu MS Word 2010 bằng Tìm / Thay thế Ký tự / Regex?


1

Tôi tìm thấy một trang web để giúp tôi chọn tên miền. Tôi có danh sách rút gọn mà tôi không thể xuất, nhưng trước tiên tôi cần chia sẻ danh sách này với một số thành viên khác trong nhóm. Nó cũng sẽ không cho phép tôi sao chép và dán danh sách các tên miền.

Với kiến ​​thức hạn hẹp của mình, tôi đã nhấp vào kiểm tra phần tử, chỉnh sửa dưới dạng HTML, sao chép và dán vào MS Word 2010. Sau đó, tôi còn lại một bó HTML trông như thế này:

<div id="cartList">
<div id="cartdomain_mydomain1.com" class="wordDiv">
    <img class="deleteImage" src="/images/trans.gif">
    <button class="buyButton">Buy</button>
    <div title="mydomain1.com">mydomain1.com</div>
</div>
<div id="cartdomain_mydomain2.com" class="wordDiv">
    <img class="deleteImage" src="/images/trans.gif">
    <button class="buyButton">Buy</button>
    <div title="mydomain2.com">mydomain2.com</div>
</div>

Làm cách nào để xóa tất cả mã HTML để tôi chỉ còn lại với mydomain1.com, mydomain2.com trong danh sách văn bản thuần túy?


Chào mừng đến với Siêu người dùng. Câu hỏi của bạn không tệ; nó chỉ cần được cải thiện Vui lòng dành một phút để đọc Cách hỏi , sau đó chỉnh sửa câu hỏi của bạn để bao gồm các chi tiết phù hợp về những gì bạn đã cố gắng tự mình.
CharlieRB

Chà, tôi đã nhấn ctrl + h và thử chơi với nó nhưng tôi nhận ra tôi không biết gì về regex và hy vọng ai đó có thể giúp tôi với cú pháp thích hợp?
dùng325124

Lần tới, hãy sử dụng các công cụ phù hợp hơn, cho phép
regrec

Câu trả lời:


0

Đảm bảo mở bảng điều khiển " Khác >> " và chọn " Sử dụng ký tự đại diện ". Sau đó, bạn có thể sử dụng biểu thức này:

Tìm cái gì :\<div id="cartdomain?*\<div title="([!"]*)"?*\</div\>?*\</div\>

Thay thế bằng :\1

Khi nhấp vào "Thay thế tất cả", bạn sẽ bị bỏ lại với dòng đầu tiên ( <div id="cartList">) theo sau là mọi thứ có trong tham số "tiêu đề".

MS2010 không sử dụng cú pháp regex tiêu chuẩn và rất hạn chế. Cách thức hoạt động của biểu thức là:

  • <>là những dấu phân cách đặc biệt, chúng phải được thoát với\
  • ?*về cơ bản là tương đương với .*?: nó phù hợp với bất kỳ số lượng nhân vật nào, không tham lam
  • dấu ngoặc đơn được sử dụng để xác định khối bắt giữ, được gọi là \1trong With:trường
  • [!"]* có nghĩa là "bất kỳ số nào của bất kỳ ký tự nào không phải là trích dẫn kép"

Đợi đã, đã quên nhấp vào "sử dụng ký tự đại diện" - hoạt động rất tốt, cảm ơn bạn.
dùng325124

@ user325124 À, quên chi tiết này: D Nếu nó hoạt động, bạn có thể (upvote và) xác nhận câu trả lời!
m4573r
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.