Làm thế nào chúng ta có thể sao chép văn bản từ Wikipedia mà không cần các phần trích dẫn [1]


9

Nếu chúng tôi sao chép văn bản từ một trang Wikipedia , đây gần như là những gì chúng tôi nhận được:

Khoảng cách câu là khoảng cách ngang giữa các câu trong văn bản sắp chữ. Đây là một vấn đề của quy ước đánh máy. [1] Kể từ khi giới thiệu loại in di động ở châu Âu, các quy ước khoảng cách câu khác nhau đã được sử dụng trong các ngôn ngữ có bảng chữ cái có nguồn gốc Latinh. [2] Chúng bao gồm một không gian từ bình thường (như giữa các từ trong câu), một không gian mở rộng duy nhất, hai không gian đầy đủ và gần đây nhất là trong phương tiện kỹ thuật số, không có khoảng trắng. [3] Mặc dù phông chữ kỹ thuật số hiện đại có thể tự động điều chỉnh một không gian từ duy nhất để tạo khoảng cách trực quan và nhất quán theo dấu câu cuối, [4] hầu hết các cuộc tranh luận là về việc có nên nhấn phím cách của bàn phím một hoặc hai lần giữa các câu không. [5]

Tôi không muốn sao chép các phần [1][2]vv Đây thực sự là những gì tôi muốn sao chép:

Khoảng cách câu là khoảng cách ngang giữa các câu trong văn bản sắp chữ. Đây là một vấn đề của quy ước đánh máy. Kể từ khi giới thiệu kiểu in di động ở châu Âu, các quy ước khoảng cách câu khác nhau đã được sử dụng trong các ngôn ngữ có bảng chữ cái có nguồn gốc Latinh. Chúng bao gồm một không gian từ bình thường (như giữa các từ trong câu), một không gian mở rộng duy nhất, hai không gian đầy đủ và gần đây nhất là trong phương tiện kỹ thuật số, không có khoảng trắng. Mặc dù phông chữ kỹ thuật số hiện đại có thể tự động điều chỉnh một không gian từ duy nhất để tạo khoảng cách trực quan và nhất quán theo dấu chấm cuối, phần lớn tranh luận là về việc có nên nhấn phím cách của bàn phím một hoặc hai lần giữa các câu không.

Câu trả lời được chọn dưới đây sử dụng regex nhưng nó không hoạt động mọi lúc . (Nếu bản thân văn bản thực sự chứa []regex không nên xóa chúng.)

Có giải pháp nào tốt hơn không?


Đó là những tài liệu tham khảo có lẽ rất quan trọng vì chúng thường hỗ trợ độ tin cậy của thông tin được trình bày. Bao gồm các tài liệu tham khảo là hữu ích, đặc biệt là các nhà nghiên cứu.
Randolf Richardson

@Randolf Bao gồm các tài liệu tham khảo có thể hữu ích, đặc biệt là cho các nhà nghiên cứu. không dành cho những người bình thường chỉ muốn thông tin
Pacerier

Tính năng tìm kiếm và thay thế trình xử lý văn bản của bạn, có thể được gọi từ macro, có thể có ích ở đây.
Keith

Nhân tiện, tôi đã đưa ra câu hỏi của bạn, bởi vì tôi nghĩ đó là một câu hỏi hay. Về tài liệu tham khảo, nhiều người mong đợi được gặp họ, đặc biệt là các giáo sư trong trường đại học (nếu bạn dự định tham dự một, bạn gần như chắc chắn sẽ thấy rằng hầu hết các giáo sư sẽ mong đợi các tài liệu tham khảo được đưa vào bất kỳ tài liệu nghiên cứu nào bạn viết, và có lẽ bạn sẽ nghe các sinh viên khác nói về các tài liệu tham khảo theo thời gian).
Randolf Richardson

@Randolf ý tôi là tôi chỉ muốn lưu trữ thông tin để đọc và sử dụng trong tương lai.
Pacerier

Câu trả lời:


9

Một bookmarklet là bạn của bạn ...

Tạo một dấu trang trình duyệt mới và sao chép mã javascript bên dưới vào nó - khi bạn muốn sao chép một số văn bản từ wikipedia, chỉ cần nhấp vào nó trước và nó sẽ xóa tất cả các trường hợp của [n] để đáp ứng yêu cầu của bạn trong câu hỏi.

javascript:function a (){document.body.innerHTML=document.body.innerHTML.replace(/<sup\b[^>]*>(.*?)<\/sup>/gi, "" );return;}; a();

Đằng sau hậu trường, nó chỉ thực hiện tìm kiếm biểu thức thông thường và thay thế tất cả <sup>...</sup>các thẻ HTML trên trang.

Tôi đã thử điều này trong IE7 và nó hoạt động tốt, vì vậy hy vọng cũng sẽ ổn trong các trình duyệt khác.

Tôi sẽ tin vào chủ đề SO này khi chỉ cho tôi đi đúng hướng - Tôi biết một bookmarklet là con đường để đi, nhưng chưa bao giờ viết một cái trước đó.


1
+1, đây là cách duy nhất tôi có thể nghĩ để làm điều này. Ngay cả các phần mở rộng trình duyệt bổ sung cũng sẽ phải sử dụng một số loại phân tích Javascript để làm điều này (và thực tế là hầu hết làm).
Đột phá
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.