Có cách nào để tìm kiếm trong Google bằng cách sử dụng biểu thức chính quy (regex) không?


60

Sẽ rất hữu ích nếu Google cung cấp một tìm kiếm biểu thức thông thường .

Có cách nào để làm việc này không?

(OBS: Tôi không nói về biểu thức thông thường giả như site:, filetype:, AND, ORhoặc "Text". Tôi muốn tìm kiếm với một biểu thức chính quy như .+[]^).

Ví dụ: có một ứng dụng, một trang web hoặc một công cụ Google để tìm kiếm những thứ như thế *.stackexchangenào không?

Câu trả lời:


24

Tính năng này không có sẵn trong Tìm kiếm Google cổ điển và nó không có trong lộ trình của Google. Bạn có thể tìm hiểu thêm về chủ đề này khi xem video Google Google có triển khai khả năng tìm kiếm với các biểu thức thông thường không?

Tuy nhiên, có một ngoại lệ. Google Code Search hỗ trợ các biểu thức thông thường. Tất nhiên, mục tiêu tìm kiếm cho công cụ tìm kiếm chủ đề này chỉ được giảm xuống thành mã nguồn.

Điều đáng nói là một số từ khóa tìm kiếm của Google có thể thay thế một phần biểu thức thông thường. Ví dụ: nếu bạn muốn tìm kiếm bất kỳ biến thể hai từ nào của "tìm kiếm HẠN", bạn có thể sử dụng toán tử ký tự đại diện.

search *

sẽ tìm thấy kết quả cho tìm kiếm và bất kỳ (một) từ nào khác. Tôi thường sử dụng nó để kiểm tra các quy tắc hoặc từ đồng nghĩa tiếng Anh cơ bản (ví dụ: "dễ như *" ).



Câu trả lời này hiện đã hơi lỗi thời: xem câu trả lời này để biết ví dụ về tìm kiếm biểu thức chính quy của Google.
Anderson Green

11

Tìm kiếm của Google có thể trả về kết quả khớp của một số biểu thức chính quy đơn giản. Ví dụ: truy vấn tìm kiếm

"(gray|red) (wolf|fox)"

dường như tương đương với

("gray wolf" OR "red fox" OR "red wolf" OR "gray fox")

Bạn có thể thấy đầu ra của truy vấn tìm kiếm này ở đây .


Tôi đang tìm kiếm một loại thuốc hoặc tên hóa học. Tôi có thể đọc "heme ?? llnate" - nơi các dấu hỏi không đọc được. Google không thể giúp đỡ.
SDsolar

7

SymbolHound có một tìm kiếm kho lưu trữ mã nguồn mở , tương tự như tùy chọn Tìm kiếm mã Google hiện đã ngừng, ngoài tìm kiếm web bao gồm biểu tượng, lập chỉ mục các trang web liên quan đến lập trình như Stackoverflow.


1
Nếu bạn được liên kết với SymbolHound, vui lòng cho biết điều này trong hồ sơ của bạn. Cảm ơn!
codbadger

5

Bạn có thể viết một phần mềm để:

  1. Lấy các từ khóa từ biểu thức chính quy;
  2. Google các từ khóa và nhận được một danh sách kết quả;
  3. Thu thập dữ liệu từng URI kết quả và lọc nó với biểu thức chính quy hoàn chỉnh.

Hãy nghiên cứu một trường hợp: từ site:gog.comtìm tất cả các trò chơi có tiếng nói tiếng Tây Ban Nha.

Biểu thức chính quy là:

Audio[^:]*:[^.,]*Spanish

Nó sẽ phù hợp, ví dụ:

Audio lanuage: English, German, Spanish, French.

Và không khớp:

Audio language: only-English. Text language: Spanish.

Bước 1. Hãy để phần mềm của bạn tìm kiếm cái này trên Google:

site:gog.com audio Spanish inurl:game

inurl:game ở đây có nghĩa là chỉ tìm kiếm trong các trang mô tả trò chơi

Bước 2. Nhận 300 liên kết kết quả và bò vào mỗi một trong số chúng.

Bước 3. Lọc kết quả với biểu thức chính quy định:

Audio[^:]*:[^.,]*Spanish

Điều này nên dễ dàng để xây dựng. Thực tế tôi không hiểu tại sao tôi không thể tìm thấy thứ gì đó đã được xây dựng theo cách đó.

Vì các công cụ tìm kiếm không đủ khả năng tài nguyên để quét dữ liệu của họ với biểu thức thông thường, công việc bẩn thỉu này thuộc về bạn và máy tính của bạn sẽ làm điều đó với những gì công cụ tìm kiếm đã cung cấp.


+1. Cảm ơn nhiều. Đây là một ý tưởng rất thú vị, trên thực tế. Vấn đề chính là có lẽ chúng ta sẽ cần các cụm hiệu suất cao để làm một cái gì đó thực sự thú vị.
GarouDan

Heh, tôi đang viết phần mở rộng này ngay bây giờ.
Navin

4

Không, rất tiếc là không :(. Về lý thuyết bạn có thể tạo công cụ tìm kiếm của riêng mình và thực hiện nó, nhưng điều đó sẽ khá khó khăn.


1

Chỉ để tham khảo, trợ giúp của Google về các nhà khai thác tìm kiếm có ở đây .

Thật thú vị, "-" vẫn là một toán tử để loại trừ từ, nhưng họ đã loại bỏ "+" như một toán tử, được sử dụng trong quá khứ để yêu cầu một cụm từ tìm kiếm nhất định. Rõ ràng, "Toán tử + đã ngừng hoạt động khi Google+ được khởi chạy, bởi vì + là cần thiết như một nhân vật có thể tìm kiếm hơn là một toán tử." ( Https://support.google.com/websearch/2/2466433 )




-3

Nếu bạn biết VBA, bạn có thể viết một số mã để lấy dữ liệu từ web sang Excel. Tôi chạy chương trình cả ngày lẫn đêm và có thể nhận được hàng triệu kết quả. Sau đó, bạn có thể lọc từ những kết quả đó.


2
trời ơi ... tha thứ cho tội lỗi của chúng ta
beppe9000
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.