Chuyển đổi html trong các ô cột thành văn bản


1

Tôi có một cột trong Excel mô tả. Các mô tả này có định dạng HTML và cần phải chuyển đổi HTML thành văn bản thuần túy, bằng cách loại bỏ tất cả các thẻ HTML.

Tôi không biết cách của mình xung quanh Excel, vì vậy giải pháp thay thế mà tôi đã nghiên cứu sẽ là sử dụng hàm php fgetcsv và html2text, sau đó xuất dưới dạng Excel.

Có lẽ đây có thể là một giải pháp dài hơi nếu có một số mã cài đặt / VBA trên Excel sẽ thực hiện thủ thuật.

Bất kỳ trợ giúp rất hoan nghênh.

Ví dụ về dữ liệu HTML trong Excel:

<p> <strong><span style="font-size: 16px"><u>Socket & See LTKIT10 Lamp Test Adaptor Kit</u></span></strong> </p> <p> This fantastic product from Socket & See is ideal for Electricians testing light fittings. </p> <p> The Socket & See LTKIT10 is five adaptors that allow for easy connection and testing at light fittings: </p> <p> LTBC 02, LTES 04, LTMBC 06, LTMES 08, LTGU 10 </p> <p> Presented with 2 x 120cm, 4mm test leads in a protective carry pouch. </p> <br/> 
<p> <strong>Features of Socket & See LTKIT10:</strong> </p> <ul> <li>Allows easy, safe connection to light fittings </li> <li>The fastest way to check insulation/continuity/loop/polarity </li> <li>High quality low ohn 4mm connectors </li> <li>Safer and saves time: leave the light fitting in place </li> <li>Easier/better connection allows hands-free </li> <li>No broken connections </li> <li>Great for use in awkward/high situations </li> <li>No damage to fittings</li></ul> <br/> <p> <strong>What's included:</strong> </p> 
<p> Bayonet Fitting, GU10, Small Edison Screw, Small Bayonet Fitting, Edison Screw Fitting, 2 x 120cm, 4mm Test Leads, Protective Carrier Pouch<br /> </p>

Chào mừng đến với Siêu người dùng. Không rõ những gì bạn đang yêu cầu. Khi bạn nói "được chuyển đổi thành văn bản" , bạn có nghĩa là bạn muốn xóa các thẻ HTML? Excel không phải là trình soạn thảo HTML, vì vậy không có chức năng đặc biệt nào để xóa thẻ. Bạn đã thử Find & Replacechưa
CharlieRB

Hoặc, để biết thêm CharlieRB, xem digocodigo.com/2012/03/ Khăn
Dave

Cảm ơn câu trả lời của bạn CharileRB, ý tôi là "chuyển đổi thành văn bản" là để các thẻ được sọc và cũng được tạo thành văn bản.
secuaz

Nếu bạn có trang được định dạng HTML, bạn có thể nhập dữ liệu vào excel bằng cách sử dụng menu Từ Từ Web Web trong Dữ liệu> Nhận nhóm Dữ liệu Ngoài. Hộp thoại Truy vấn Web mới bật lên mở ra - nhập URL và chọn nhập. Bấm vào Mũi tên Vàng bên cạnh các bảng mà bạn muốn đưa vào Excel dưới dạng văn bản và Nhập.
Antony

Câu trả lời:


1

Sao chép tất cả các thẻ và văn bản, dán vào tệp văn bản, thay đổi tệp mở rộng từ txt sang html, mở bằng trình duyệt, sao chép nội dung từ trang web và dán vào excel.


Không phải là một giải pháp thực tế là ai đó có hàng trăm hoặc thậm chí hàng ngàn hàng dữ liệu.
Omy
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.