Что из себя представляет алгоритм Google BERT и как он работает
Издание Search Engine Land опубликовало FAQ по BERT, чтобы собрать воедино все, что известно об алгоритме Google, и ответить на самые распространенные вопросы.
- Когда Google выкатил алгоритм BERT?
BERT начал выкатываться 21 октября 2019 года для запросов на английском языке, а также для избранных сниппетов.
Алгоритм будет распространяться на все языки, для которых работает поиск Google, но точные сроки пока неизвестны.
Модель BERT также используется для улучшения избранных фрагментов в 25 странах.
- Что такое BERT?
BERT (от Bidirectional Encoder Representations from Transformers) — это технология, основанная на нейросетях, помогающая понимать и обрабатывать естественный язык. Она используется Google для того, чтобы лучше различать контекст в поисковых запросах. Например, в словосочетаниях «nine to five» и «a quarter to five» предлог «to» имеет два разных значения, которые не всегда очевидны для поисковых систем. BERT помогает различать языковые нюансы, чтобы обеспечить более релевантные результаты.
BERT – это технология с открытым исходным кодом. Это значит, что любой может использовать ее для обучения собственных систем языковой обработки и других задач.
- Как работает BERT?
Особенности BERT заключаются в том, что технология обучается на основе всего набора слов в предложении или запросе. Ранее нейросети обучались на упорядоченной последовательности слов (слева направо или слева направо и справа налево). BERT позволяет языковой модели изучать контекст слова на основе всех окружающих его слов.
Google показал несколько примеров, как BERT может менять результаты поиска. По запросу «math practice books for adults» (учебники по математике для взрослых) ранее в выдаче появлялись книги для 6-8 классов. Теперь выдача стала более релевантной.
- Использует ли Google алгоритм BERT для обработки всех запросов?
Нет. BERT используется примерно для 10% поисковых запросов на английском языке в США. В частности, BERT будет использоваться «для более длинных, более разговорных запросов или запросов, где предлоги имеют большое значение». Для запросов с названиями брендов или коротких запросов BERT использоваться не будет.
- В чем отличие BERT от RankBrain?
BERT и RankBrain — это два отдельных алгоритма. RankBrain работает параллельно с обычными алгоритмами и используется для корректировки результатов, рассчитанных этими алгоритмами. RankBrain смотрит на запрос и находит похожие прошлые запросы. А затем соотносит текущие результаты поиска с этими прошлыми запросами и вносит корректировки.
Также RankBrain помогает Google интерпретировать поисковые запросы, чтобы отобразить результаты, которые не содержат точных ключевых слов из запроса. Например, в следующем примере Google понял, что речь идет об Эйфелевой башне, хотя ее название не фигурирует в запросе.
BERT работает по иному принципу. Он изучает контент до и после ключевого слова, чтобы учесть весь контекст и понять смысл.
BERT может применяться самостоятельно или совместно с RankBrain, или любым другим алгоритмом, или не использоваться вообще в зависимости от условий поиска.
- На какие продукты Google может повлиять BERT?
Так как алгоритм относится к поиску, но он может затронуть голосового помощника Assistant при ответе на запросы и показе избранных сниппетов.
Пока BERT не используется для рекламы, но в случае интеграции алгоритма в рекламные сервисы может улучшиться релевантность объявлений.
- Как оптимизировать сайт для BERT?
Google сообщает, что нет ничего, что можно было бы оптимизировать для BERT. Поисковик рекомендует сосредоточиться на создании качественного контента, отвечающего запросам и ожиданиям пользователей.
Михаил Шакин, автор блога shakin.ru, во время блиц-интервью на конференции Optimization 2019 порекомендовал сосредоточиться на развитии экспертизы:
Надо развивать экспертизу, привлекать экспертов для написания статей. Многие сайты пострадали из-за этого. Статьи безлики, на сайтах часто не указывается даже автор статьи. В экспертных тематиках (таких как медицина, юриспруденция и т.п.) это просто недопустимо. Обязательно должен быть специалист-автор, у него должны быть публикации, интервью, выступления. Google все это отдельно отслеживает. Если специалист не дотягивает до какого-то уровня, то сайт считается мусорным.
Сайрус Шепард говорил, что BERT выбирает сайты с одними и теми же фактами. Если топовые игроки упоминают тот или иной факт по варианту А, а ваш сайт упоминает его по варианту Б, то ваш сайт, скорее всего, будет проигрывать только потому, что вы идете вразрез с общим мнением.
Источник: Search Engine Land
Случилось что-то важное? Поделитесь новостью с редакцией.
-
Каргту один из крупнейших и ведущих университетов РК. 8 факультетов, более 50 специальностей, около 7000 студентов. Огромнейшие достижения вуза и студентов. Уютные кабинеты, большие лабораторные, новейшая техника, высококвалифицированные учителя, большие и комфортные общежития и большой музей с историей вуза. www.kstu.kz/
-
В своём блоге Google сообщает о том, что его целью является понять, что хочет найти человек в Глобальной сети и, вне зависимости от формулировки запроса, подобрать самую актуальную информацию по этому вопросу. Для поиска, да и для вебмастеров это и хорошо, и плохо. Но то, что качество сайтов будет гораздо выше это точно. BERT определит куда мы движемся то ли к глобализации, то ли к деградации … За информацию спасибо.