Có thể tìm kiếm các trang MediaWiki bằng các biểu thức thông thường không?


9

Tôi muốn tìm kiếm các cụm từ bằng cách sử dụng các cụm từ thông dụng trên các trang web như Wikipedia và Wikimedia Commons. có khả năng làm cái này không?

Ví dụ truy vấn tìm kiếm regex: (facebook | google) (lịch sử công ty | trang web)

Bạn đã có thể làm điều tương tự trên Google ( như đã trình bày ở đây ), vì vậy tôi muốn biết liệu Wikipedia có khả thi hay không.


Bạn có sẵn sàng tải xuống vài gigabyte dữ liệu và thực hiện tất cả các bộ lọc trên máy tính của riêng bạn không?
Svick

Dường như có thể thực hiện việc này bằng AutoWikiBrowser: en.wikipedia.org/wiki/Wikipedia:AutoWikiBrowser/
Anderson Green

Bạn có thể sử dụng AWB để tìm kiếm một trang nhất định (hoặc một tập hợp các trang), nhưng không phải toàn bộ wiki, mà tôi cho rằng đó là những gì bạn muốn.
Svick

Có, tôi muốn tìm kiếm toàn bộ wiki. Có công cụ nào trên máy chủ công cụ cho việc này không?
Anderson Green

Câu trả lời:


3

Có thể tìm kiếm Wikipedia (hoặc bất kỳ trang web nào khác mà công cụ tìm kiếm có thể truy cập) bằng các biểu thức chính quy đơn giản, miễn là bạn dựa vào công cụ tìm kiếm. Truy vấn tìm kiếm Google sau đây tìm kiếm Wikipedia cho các kết quả của biểu thức chính quy (Yahoo|Google|Microsoft):

https://www.google.com/#hl=vi&sclient=psy-ab&q=site:en.wikipedia.org+(google+OR+yahoo+OR+microsoft)&oq=site:en.wikipedia.org+(google+OR + yahoo + OR + microsoft) & gs_l = hp.3 ... 87411.96861.2.97076.26.24.2.0.0.0.79.1141.24.24.0 ... 0.0 ... 1c.1.7.psy-ab.s2oGD_2LKy4 & pbx = 1 & bav = trên .2, hoặc.r_cp.r_qf. & Bvm = bv.44158598, d.dmg & fp = dc8abc04c054405e & biw = 1366 & bih = 639



2

Nó có sẵn và được cung cấp bởi CirrusSearch (dựa trên ElasticSearch ), công cụ tìm kiếm được sử dụng trong các trang MediaWiki và nền tảng Wikimedia.

Một số ví dụ sử dụng:

Lưu ý: Tham khảo hướng dẫn đầy đủ và nguồn - trên Wikipedia: Trợ giúp: Tìm kiếm # Search_opes_syntax .

Đối với câu hỏi của bạn:

Toán tử logic

Công cụ tìm kiếm hỗ trợ logic boolean trong các tìm kiếm. Các toán tử logic bao gồm ký tự "-" (dấu trừ) cho "logic không", AND, OR và các dấu ngoặc đơn nhóm: (_).

Logic HOẶC phải được đánh vần bằng chữ in hoa; toán tử AND được giả sử cho tất cả các thuật ngữ (cách nhau bởi khoảng trắng), nhưng vốn AND là tương đương.

Ví dụ khác:

  • Đơn giản AND, OR: "credit card" OR "payment card", "credit card" AND "payment card"- sẽ hoạt động như mong đợi.
  • Hậu tố dấu ngã ký tự cho tìm kiếm mờ ( "âm thanh như") - Ví dụ, tìm kiếm charlie~ parker~lợi nhuận Charlie Parker, Charles Palmer, Charley Parks(lên đến hai sự khác biệt nhân vật, chưa kể là người đầu tiên).
  • Tìm kiếm ký tự đại diện - tìm kiếm face*e- bắt đầu bằng facevà kết thúc bằng một cái eở giữa. nhập mô tả hình ảnh ở đây

Đọc thêm

Đọc thêm về công cụ tìm kiếmtiện ích mở rộng này để tiết lộ đầy đủ chức năng và tính năng của chúng.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.