logo

Máy tìm kiếm giúp chúng ta tìm kiếm thông tin dựa trên cơ sở gì?

Câu hỏi: Máy tìm kiếm giúp chúng ta tìm kiếm thông tin dựa trên cơ sở gì?

Trả lời: 

Máy tìm kiếm là công cụ trên Internet giúp chúng ta tìm kiếm thông tin dựa trên cơ sở các từ khóa liên quan đến vấn đề cần tìm

Máy tìm kiếm giúp chúng ta tìm kiếm thông tin dựa trên cơ sở gì?

Cùng Top lời giải tìm hiểu về máy tìm kiếm nhé!


Máy tìm kiếm là gì?

      Bộ máy tìm kiếm (Search Engine – viết tắt là SE) là công cụ được xây dựng trên nền tảng web cho phép người sử dụng tìm kiếm thông tin. Là nơi mà bạn tìm thấy bất kỳ thông tin nào bằng cách gõ các cụm từ hoặc từ tìm kiếm. Bộ máy tìm kiếm sẽ trả về một danh sách kết quả các trang web liên quan đến cụm từ mà bạn gõ.

      Máy tìm kiếm không thể tìm được bất kì thông tin nào ta quan tâm bởi lẽ có những thông tin mang vấn đề liên quan đến chính phủ, tôn giáo, khủng bố mang các tính chất nhạy cảm cao và sẽ không được phép xuất hiện trên Internet. Nếu những thông tin bạn quan tâm là phổ biến, hợp lệ thì bạn có thể tìm kiếm được Internet.

      Cơ sở dữ liệu mà máy truy tìm sử dụng thường được bổ sung cập nhật định kì bằng cách quét (scan), điều chỉnh, thêm bớt nội dung và chỉ số hoá lại tất cả các trang mà nó có thể tìm gặp trên Internet.

      Ngày nay, với số lượng các trang Web lên đến hàng tỉ, nên việc tìm ra số trang có chứa nội dụng đòi hỏi của từ khoá có thể lên đến hàng triệu trang. Do đó, việc hiển thị các trang tìm thấy theo đúng thứ tự quan trọng của các trang và theo mong muốn của người dùng cũng là một trở ngại lớn đòi hỏi sự chắt lọc từ máy truy tìm và sự khéo léo về cách thức đặt ra từ khoá từ người dùng máy.

      Một bộ máy tìm kiếm dữ liệu là một hệ thống phần mềm máy tính giúp con người tìm kiếm thông tin được lưu trữ trên hệ thống máy tính như mạng Internet, hoặc máy tính cá nhân. Máy tìm cho phép người sử dụng yêu cầu các thông tin với những hạn chế nhất định (thường được miêu tả bởi từ hoặc cụm từ) và nhận về một danh sách các liên kết siêu văn bản thỏa mãn các hạn chế. Máy tìm sử dụng hệ thống chỉ mục để có thể tìm kiếm nhanh chóng và hiệu quả. Máy tìm thường được hiểu là máy tìm những thông tin công khai trên mạng, nếu không có những khả năng cao hơn. Ngoài ra còn có các loại máy tìm khác như máy tìm doanh nghiệp tìm thông tin trên mạng nội bộ, máy tìm cá nhân tìm thông tin trên máy tính cá nhân, và máy tìm di động.

      Một số máy tìm còn khai thác thông tin trong các nhóm tin, các cơ sở dữ liệu lớn, hay trong các hệ thống thư mục mở như DMOZ.org. Khác với hệ thống thư mục mạng được duy trì bởi con người, máy tìm hoạt động dựa vào các thuật toán


Phân loại máy tìm kiếm

* Theo phương thức hoạt động

- Kiểu máy nhện (spider): Cơ sở dữ liệu của các máy truy tìm được cập nhật hoá bởi các phần mềm đặc biệt thường gọi là "robot", "spider" hay "Webcrawler". Các phần mềm này sẽ tự động dò tìm và phân tích từ những trang có sẵn trong cơ sở dữ liệu để kiếm ra các liên kết (link) từ các trang và trở lại bổ sung dữ liệu cho chính nó sau khi phân tích. Phần mềm này cũng sẽ báo cáo về các liên kết đã bị đào thải. Từ khoá được bỏ vào là để cho máy truy tìm lục kiếm trong bảng chỉ số của nó. Kết quả tốt nhất sau khi phân hạng sẽ được xếp ở thứ tự đầu tiên. Trang thông dụng nhất dùng nguyên tắc này là http://www.google.com

- Kiểu máy truy tìm ảo (meta-search engine): Ngày nay, người ta có thể lợi dụng các máy truy tìm sẵn có để thiết kế thành một loại máy truy tìm mới gọi là máy truy tìm ảo. Nguyên tắc của loại máy truy tìm này khá đơn giản. Nó không có cơ sở dữ liệu. Khi hoạt động thì nó sẽ gửi từ khóa đến các máy truy tìm khác một cách đồng loạt và nhận về tất cả các kết quả tìm được. Nhiệm vụ tiếp theo chỉ là phân tích và phân hạng lại các tài liệu tìm được cho thân chủ. Ưu điểm của loại máy truy tìm này là lợi dụng cơ sở dữ liệu của các máy truy tìm khác để tìm ra nhiều kết quả hơn và nhanh hơn. Nhưng vì loại này chỉ tồn tại nếu có các máy truy tìm nguyên thủy nên gọi là meta- (tiền tố meta có nghĩa là "siêu hình" hay "ảo"). Điển hình loại này là MetaCrawler.

- Kiểu thư mục đối tượng (subject directory): Còn gọi là máy truy tìm theo phân lớp (hierarchical search engine) - máy truy tìm này phân lớp sẵn các đối tượng vào các thư mục và người dùng sẽ lựa theo kiểu rẽ nhánh từ từ cho đến khi tìm ra các trang Web mà mình muốn. Kiểu này dễ cho người truy cập nhưng có điểm yếu là nó không thể bao gồm hết mọi chủ đề mà họ muốn kiếm ra. Hơn nữa, sự phân loại đôi khi không được đầy đủ và chính xác. Điển hình của loại này là http://www.yahoo.com

- Kiểu cơ sở dữ liệu đặc biệt hay còn gọi là bất khả kiến Web (invisible Web): Đặc điểm của loại này là dữ liệu kiếm ra không thực sự có từ địa chỉ trang Web cụ thể qua các máy truy tìm; dữ liệu này tồn tại trong các cơ sở dữ liệu của một máy tính hay mạng ở đâu đó trên Internet mà các trang Web được phép sử dụng. Đặc biệt, các trang Web nghiên cứu của các đại học hay học viện như http://lii.org Lưu trữ 2008-06-11 tại Wayback Machine, http://www.academicinfo.net và http://infomine.ucr.edu Lưu trữ 2011-06-13 tại Wayback Machine thuộc kiểu này.

- Sau này nhiều máy truy tìm hỗ trợ người dùng qua nhiều cách thức khác nhau nên người ta ít thấy ranh giới phân chia của các máy truy tìm nữa mà thay vào đó là các hệ thống máy truy tìm lại bao gồm nhiều kiểu chức năng khác nhau. Chẳng hạn như http://www.yahoo.com không còn đơn thuần là một máy truy tìm theo kiểu thư mục đối tượng mà bên cạnh đó nó cũng cung cấp luôn cả kiểu máy nhện cho người dùng.

* Theo chức năng

Theo cách phân loại này thì tùy theo đối tượng tìm kiếm mà có:

- Kiếm địa chỉ trang Web

- Kiếm địa chỉ thư điện tử

- Kiếm thông tin riêng về một người

- Kiếm thông tin về một tổ chức

- Kiếm việc làm

- Kiếm bản đồ...

icon-date
Xuất bản : 05/11/2021 - Cập nhật : 05/11/2021