Thursday, May 4, 2017

Thuật toán RankBrain

Hôm nay, chúng ta sẽ tìm hiểu tất cả mọi thứ về thuật toán RankBrain của Google, đây cũng 1 trong 3 yếu tố xếp hạng quan trọng nhất của công cụ tìm kiếm số 1 thế giới.



Google sử dụng một hệ thống trí tuệ nhân tạo gọi là RankBrain để xếp hạng các website trên kết quả tìm kiếm của mình. Chúng ta sẽ đặt ra câu hỏi làm sao để các công trình trí tuệ nhân tạo này có thể xếp hạng được website? Và bài viết này của tôi sẽ giải đáp về các vấn đề này, đó cũng là tất cả những gì chúng ta cần biết về RankBrain.

RankBrain là gì?


RankBrain là tên do Google đặt cho một hệ thống trí tuệ nhân tạo "máy học" được dùng để giúp họ xử lý kết quả tìm kiếm.

Máy học là gì?


Máy học là nơi một máy tính tự dạy cho nó làm sao để thực hiện được một công việc nào đó, mà không cần thiết đến con người phải dạy nó hoặc lập trình chi tiết tỉ mỉ như trước đây.

Trí tuệ nhân tạo là gì?


Trí tuệ nhân tạo còn gọi là AI (viết tắt của từ  artificial intelligence) là nơi máy tính có thể thông minh như con người, nó có thể tiếp thu kiến thức từ việc học tập qua giảng dạy, dựa trên những gì nó đã biết và thông qua các kết nối mới.

Tất nhiên AI chỉ tồn tại trong tiểu thuyết khoa học viễn tưởng. Trong thực tế, AI được sử dụng để chỉ các hệ thống máy tính được thiết kế để tìm hiểu và thực hiện các kết nối.

AI khác với cách học máy như thế nào? Về RankBrain, có vẻ như chúng ta chúng khá đồng bộ. Bạn có thể nghe thấy chúng cả hai đã sử dụng hoán đổi cho nhau, hoặc bạn có thể nghe thấy việc học máy đã sử dụng để mô tả loại cách tiếp cận trí tuệ nhân tạo đang được sử dụng.

RankBrain là cách mới mà Google dùng để xếp hạng kết quả tìm kiếm?


Không. RankBrain là một phần của thuật toán "tìm kiếm tổng thể của Google", một chương trình máy tính được sử dụng để sắp xếp thông qua hàng tỷ trang mà nó biết và tìm những trang được coi là có liên quan nhất cho các truy vấn cụ thể.

Tên của thuật toán tìm kiếm của Google là gì?



Nó được gọi là Hummingbird, như tôi đã thông báo trong quá khứ. Trong nhiều năm, thuật toán tổng thể không có tên chính thức. Nhưng vào giữa năm 2013, Google đã cải tiến lại thuật toán đó và đặt tên cho nó là Hummingbird. Để tìm hiểu thêm về thuật toán HummingBird và các thuật toán chính khác của Google các bạn đọc bài viết Làm thịt 9 thuật toán khét tiếng của Google?

Vậy RankBrain là một phần của thuật toán tìm kiếm Hummingbird của Google?


Đó là sự hiểu biết của tôi. Hummingbird là thuật toán tìm kiếm tổng thể, giống như một chiếc xe có một động cơ tổng thể trong đó. Động cơ có thể được tạo thành từ các bộ phận khác nhau, chẳng hạn như bộ lọc dầu, bơm nhiên liệu, bộ tản nhiệt,... Như vậy, Hummingbird bao gồm nhiều phần khác nhau, và RankBrain là một trong những phần quan trọng nhất.

Hummingbird cũng chứa các phần khác có tên quen thuộc với những người trong không gian SEO, chẳng hạn như Panda, Penguin và Payday được thiết kế để chống lại spam, Pigeon được thiết kế để cải thiện kết quả tìm kiếm địa phương, Top Heavy được thiết kế để giảm hạng các trang quảng cáo, Mobile Friendly được thiết kế để thưởng các trang thân thiện với điện thoại di động và Pirate được thiết kế để chống lại vi phạm bản quyền.

Tôi nghĩ thuật toán của Google được gọi là "PageRank"


PageRank là một phần của thuật toán Hummingbird tổng thể bao gồm một cách cụ thể để cho trang tín dụng dựa trên liên kết từ các trang khác chỉ vào chúng.

Trở lại thời điểm công cụ tìm kiếm bắt đầu, vào năm 1998, PageRank là thuật toán đặc biệt bởi vì đó là tên đầu tiên mà Google từng đưa ra cho một trong những phần của thuật toán xếp hạng quan trọng của họ.

Những "tín hiệu" mà Google sử dụng để xếp hạng?


Tín hiệu là những thứ mà Google sử dụng để giúp xác định cách xếp hạng các trang web. Ví dụ, nó sẽ đọc nội dung trên một trang web, do đó các từ ngữ được sử dụng trong bài viết là một tín hiệu. Nếu một số từ được in đậm, đó có thể là một tín hiệu khác được ghi nhận. Các tính toán được sử dụng như là một phần của PageRank, như vậy điểm PageRank được sử dụng như một tín hiệu. Nếu một trang được lưu ý là thân thiện với thiết bị di động, thì đó cũng là một tín hiệu giúp website lên top cao hơn.

Tất cả các tín hiệu này được xử lý bởi các phần khác nhau trong thuật toán Hummingbird tìm ra các trang hiển thị để phản hồi các tìm kiếm khác nhau trên Google Search.

Có bao nhiêu tín hiệu?

Google đã liên tục nói đến việc có hơn 200 tín hiệu xếp hạng chính được đánh giá, lần lượt có thể có tới 10.000 biến thể hoặc tín hiệu phụ. Họ thường chỉ nói rằng "hàng trăm" các yếu tố, như họ đã thông báo đến webmaster toàn cầu.

Nếu bạn muốn có một hướng dẫn trực quan hơn về các tín hiệu xếp hạng, hãy xem bảng tuần hoàn các yếu tố SEO thành công của SEL được tôi dịch về. Đó là một bảng tổng hợp các kiến thức theo tôi là rất hay, bất kỳ ai cũng nên đọc khi tham gia vào SEO. Kiến thức trong bảng tuần hoàn SEO hoàn toàn đáng tin cậy 100% bởi Search Engine Land là trang tin tức SEO số 1 thế giới, nơi hội tụ của các chuyên gia SEO hàng đầu toàn cầu.

RankBrain là tín hiệu xếp hạng quan trọng thứ 3?


Đúng thế. Google khẳng định rằng hệ thống xếp hạng RankBrain là quan trọng thứ 3 trong số các yếu tố đánh giá tổng thể 1 website của họ.

  •  Corrado cho biết RankBrain là một trong số hàng trăm tín hiệu đi vào một thuật toán xác định kết quả xuất hiện trên trang tìm kiếm của Google và vị trí chúng được xếp hạng.  Trong vài tháng nó đã được triển khai, RankBrain đã trở thành tín hiệu quan trọng thứ ba đóng góp vào kết quả của một truy vấn tìm kiếm, ông nói.\

Vậy 2 tín hiệu quan trọng số 1 và số 2 là gì?


Theo dự đoán của cá nhân tôi thì backlink vẫn là yếu tố quan trọng nhất, bởi Google sử dụng số liên kết như số biểu quyết một website được xếp hạng cao. Đối với tín hiệu quan trọng thứ hai, tôi đoán đó sẽ là nội dung của bài viết, Google sẽ đếm số từ trên nội dung và nó sẽ đọc để xem nội dung đó nói về vấn đề gì.

Để biết được 2 tín hiệu quan trọng hàng đầu các bạn đọc bài viết 3 yếu tố xếp hạng quan trọng nhất của Google do tôi viết.

RankBrain xử lý vấn đề gì?


Từ thông báo của Google, RankBrain chủ yếu được sử dụng như là một cách giải thích các tìm kiếm mà mọi người gửi đến để tìm các trang có thể không có những từ chính xác đã được tìm kiếm.

Google đã có cách xác định kết quả mà không có từ ngữ nào trong bài viết liên quan đến truy vấn của người dùng?


Đúng thế, Trong một thời gian rất dài, Google đã có thể tìm ra được những kết quả từ các website mà không có từ ngữ giống với truy vấn mà người dùng nhập vào tìm kiếm. Ví dụ: Những năm trước đây, khi bạn tìm kiếm từ "giày" thì họ sẽ không bao giờ đưa ra một kết quả tìm kiếm có từ "giày dép" bởi 2 từ này về mặt kỹ thuật rõ ràng là khác nhau. Nhưng với Stemming Google đã thông minh hơn nhiều, nó có thể hiểu rằng "những đôi giày" và "giày" hay "chạy" và "đang chạy" là một biến thể của nhau.

Google cũng có khả năng hiểu được các từ đồng nghĩa, ví dụ như bạn tìm kiếm từ khóa "thể dục" nó cũng có thể hiểu rằng đó là "thể thao". Thậm chí, Google thông minh đến mức có thể phân biệt được Apple là công ty công nghệ khác so với apple là quả táo!

Đối với Knowledge Graph (sơ đồ tri thức) thì sao?


Sơ đồ tri thức ra mắt vào năm 2012, là một cách mà Google thậm chí còn thông minh hơn về các kết nối giữa các từ. Quan trọng hơn, nó đã học được cách tìm kiếm "điều không phải là chuỗi", như Google đã mô tả nó.

Các chuỗi có nghĩa là chỉ tìm kiếm các chuỗi ký tự, chẳng hạn như các trang phù hợp với chính tả của "Obama". Mọi thứ có nghĩa là thay vào đó, Google hiểu được khi ai đó tìm kiếm "Obama", có thể họ có nghĩa là Tổng thống Mỹ Barack Obama, một người thực tế có liên hệ với người khác, địa điểm và mọi thứ.

Sơ đồ tri thức là cơ sở dữ liệu về sự kiện về mọi thứ trên thế giới và mối quan hệ giữa chúng. Đó là lý do tại sao bạn có thể thực hiện tìm kiếm như "vợ của Obama được sinh ra khi nào" và nhận được câu trả lời về Michele Obama như dưới đây mà không bao giờ sử dụng tên của cô ấy:

RankBrain làm thế nào để tùy chỉnh các truy vấn?


Các phương pháp Google đã sử dụng để tinh chỉnh các truy vấn nói chung quay trở lại với một số người ở nơi nào đó đang làm việc, hoặc là đã tạo ra danh sách bắt nguồn hoặc danh sách từ đồng nghĩa hoặc tạo ra các kết nối cơ sở dữ liệu giữa các sự vật. Nhưng phần lớn nó phụ thuộc vào lao động của con người.

Vấn đề là Google xử lý ba tỷ lần tìm kiếm mỗi ngày. Năm 2007, Google cho biết 20% đến 25% các truy vấn đó chưa bao giờ được nhìn thấy. Năm 2013, con số này đã giảm xuống còn 15%, Google đã xác nhận với webmaster toàn cầu. Tuy nhiên, 15% trong số 3 tỷ vẫn là một số lượng lớn các truy vấn chưa từng được tìm kiếm bởi bất kỳ người tìm kiếm nào - 450 triệu mỗi ngày.

Trong số đó có thể phức tạp, nhiều truy vấn từ, còn được gọi là truy vấn "đuôi dài". RankBrain được thiết kế để giúp giải thích tốt các truy vấn đó và dịch chúng một theo một cách hiệu quả đằng sau hậu trường , để tìm ra những trang liên quan nhất cho người tìm kiếm.

Như Google đã nói, nó có thể thấy các mẫu giữa những tìm kiếm phức tạp dường như không liên quan để hiểu chúng thực sự giống nhau như thế nào. Do đó, việc học này cho phép nó hiểu rõ hơn các tìm kiếm phức tạp trong tương lai và liệu chúng có liên quan đến các chủ đề cụ thể hay không. Quan trọng nhất, từ những gì Google đã nói, nó có thể kết hợp các nhóm tìm kiếm này với kết quả mà họ nghĩ rằng những người tìm kiếm sẽ thích nhất.

Google không cung cấp ví dụ về các nhóm tìm kiếm hoặc cung cấp chi tiết về cách RankBrain hoạt động như thế nào. Nhưng sau này, RankBrain có thể hiểu được một tìm kiếm mơ hồ để đưa ra một kết quả cụ thể tốt hơn.

Tích hợp RankBrain, với mức độ mà nó được cho là tín hiệu quan trọng thứ ba, là một thay đổi lớn. 

Khi nào thuật toán RankBrain bắt đầu hoạt động?


Google đã thông báo rằng họ đã đang triển khai dần dần RankBrain vào đầu năm 2015 và nó đã xuất hiện trên toàn cầu đến thời điểm tôi viết bài này.

Những truy vấn nào bị ảnh hưởng?


Vào tháng 10 năm 2015, Google thông báo rằng "một phần rất lớn" của 15% các truy vấn mà nó thường không bao giờ nhìn thấy được xử lý bởi RankBrain. Trong ngắn hạn, 15% hoặc ít hơn đã được xử lý.

Vào tháng 6 năm 2016, tin tức nổi lên rằng RankBrain đang được sử dụng cho mọi truy vấn mà Google xử lý. 

RankBrain luôn luôn học hỏi?


Google cho biết tất cả những điều mà RankBrain làm là ngoại tuyến. Nó được học hỏi hàng loạt các lịch sử tìm kiếm để đưa ra những tiên đoán kết quả cho sau này.

Những dự đoán được kiểm tra, nếu được chứng minh là tốt thì phiên bản mới của RankBrain sẽ hoạt động. Sau đó chu kỳ học ngoại tuyến và kiểm tra lại được lặp lại.

No comments:

Post a Comment

Sóc lọ thường xuyên có tốt không? Thủ dâm đúng cách

Sóc lọ là gì ? Nếu như được thực hành hợp lý, đều đặn thì sở hữu ích cho sức khoẻ nam giới như: khi tự sướng sẽ đạt được khoái cảm giúp cho ...

Bài viết được quan tâm nhiều