Ai đó có thể chỉ cho tôi đi đúng hướng? Tôi thực sự không có kinh nghiệm viết mã nhưng tôi là người học nhanh. Tôi không cố nói điều đó sẽ dễ dàng nhưng tôi hy vọng ai đó có thể giúp tôi ...
Ai đó có thể chỉ cho tôi đi đúng hướng? Tôi thực sự không có kinh nghiệm viết mã nhưng tôi là người học nhanh. Tôi không cố nói điều đó sẽ dễ dàng nhưng tôi hy vọng ai đó có thể giúp tôi ...
Câu trả lời:
Tôi đã viết cái này cho một blog mà tôi đã từng quay trở lại khi .... nó không còn trên web nữa nên .. đây rồi! :
Cách viết công cụ tìm kiếm
Darren Rửng tại probolgger.net đang tổ chức Dự án Viết nhóm về bất cứ điều gì "Cách thực hiện". Đây là một trong số ít các blog mà tôi đọc thường xuyên vì vậy tôi nghĩ tại sao không viết một cái gì đó đáng đọc để thay đổi, thay vào đó là câu nói bạo lực tiêu chuẩn của tôi, nơi cuối cùng tôi sẽ đe dọa sẽ đâm Hugo Chaves vào cổ họng.
Tôi quyết định viết "Cách viết công cụ tìm kiếm". Tôi chọn chủ đề này vì hai lý do:
Khách hàng của tôi là nhà bán lẻ trực tuyến có quy mô đáng kể, vì vậy tôi không tìm kiếm toàn bộ trang web chỉ trang web của họ, cụ thể hơn là các sản phẩm được bán trên trang web của họ. Không có kỹ thuật tương tự nào có thể được sử dụng để viết phức tạp hơn được sử dụng để tìm kiếm trên internet. Tôi biết đây không phải là một blog công nghệ vì vậy tôi sẽ không đi sâu vào các kỹ thuật, tôi cũng sẽ không thảo luận về các yêu cầu về phần cứng \ xử lý hoặc thu thập dữ liệu web.
Tôi đang sử dụng một kỹ thuật khá đơn giản, tôi có bảng (tblKeywords) với ba trường:
Điều đầu tiên tôi làm là thu thập các từ riêng lẻ từ bất kỳ nơi nào có liên quan. Đối với khách hàng của tôi, tôi sẽ kéo từ bảng sản phẩm. Cụ thể từ các trường Itemid, ItemName, ItemShortDes mô tả, ItemLongDes mô tả, Nhà sản xuất, Nhà sản xuất ,U1, Category1, Category2, Category3 ect. Nếu bạn đang lập chỉ mục các trang web, bạn có thể lấy dữ liệu từ văn bản trang, tiêu đề trang, URL hoặc liên kết trên các trang khác liên kết trở lại trang đang được lập chỉ mục.
Giá trị trọng lượng được xác định bởi nơi từ khóa đến từ. Ví dụ: trong trường hợp của tôi, SKU của Sản phẩm của Vật phẩm sẽ có trọng lượng 100, trong khi một từ từ Tên vật phẩm có thể có trọng số 25. Một từ trong ItemLongDes mô tả có thể có trọng số 5. Nếu bạn đang lập chỉ mục các trang web từ tiêu đề trang có thể có trọng số 75 trong khi một từ in đậm từ văn bản trang có thể có trọng số 10. Nếu một từ được lặp lại nhiều lần hoặc \ và ở nhiều nơi bạn sẽ tăng trọng lượng cho mỗi lần nó xảy ra. Ví dụ: Nếu từ "Áo" xuất phát từ hai vị trí cho ItemId = 12345, ItemName (trọng lượng 25) và xuất hiện hai lần trong ItemLongDes mô tả (Trọng lượng 5 x2 = 10), từ "áo" sẽ có tổng trọng lượng 35 cho ItemId = 12345.
Nếu ai đó thực hiện tìm kiếm "áo hồng", tôi sẽ tìm kiếm bảng của mình cho tất cả các trường hợp của từ "Màu hồng" hoặc "Áo" và Tổng trọng lượng. Hiển thị các mục có tổng trọng lượng cao nhất trên đầu trang.
SQL:
Select Itemid, sum(weight) as totWeight from tblKeywords
group by itemId having keyword in ('pink','shirt')
Vì vậy, ở đây bạn có nó, một công cụ tìm kiếm cơ bản (và nhanh chóng). Tất nhiên còn nhiều việc phải làm, chẳng hạn như loại bỏ dấu câu, Mã HTML và các từ khóa vô giá trị như "và", "nếu", "hoặc". Điều này không giải quyết việc tìm kiếm các cụm từ chính, nhưng bạn có thể sử dụng một hệ thống tương tự cho các cụm từ nếu bạn có thể tìm ra nơi chúng bắt đầu và kết thúc.
Các công cụ tìm kiếm được xây dựng dựa trên trình thu thập dữ liệu web , bạn sẽ cần tìm ra cách xây dựng một trong những trình hút này trước khi bạn có thể phát triển trang web để hiển thị kết quả của nó (bạn sẽ cần một cơ sở dữ liệu nhanh, hiệu quả để đi cùng với nó).
Bản thảo giới thiệu được phân phối miễn phí về Giới thiệu thông tin sẽ là tài liệu tham khảo chính của bạn. Nó xử lý tìm kiếm (truy xuất thông tin) từ cấp độ cơ bản đến nâng cao.
Đây là khóa học giới thiệu về CS sẽ bắt đầu vào ngày 20, tôi khuyên bạn nên xem thử, nó được cung cấp miễn phí.