Издание Search Engine Land опубликовало FAQ по BERT, чтобы собрать воедино все, что известно об алгоритме Google, и ответить на самые распространенные вопросы.
BERT начал выкатываться 21 октября 2019 года для запросов на английском языке, а также для избранных сниппетов.
Алгоритм будет распространяться на все языки, для которых работает поиск Google, но точные сроки пока неизвестны.
Модель BERT также используется для улучшения избранных фрагментов в 25 странах.
BERT (от Bidirectional Encoder Representations from Transformers) — это технология, основанная на нейросетях, помогающая понимать и обрабатывать естественный язык. Она используется Google для того, чтобы лучше различать контекст в поисковых запросах. Например, в словосочетаниях «nine to five» и «a quarter to five» предлог «to» имеет два разных значения, которые не всегда очевидны для поисковых систем. BERT помогает различать языковые нюансы, чтобы обеспечить более релевантные результаты.
BERT – это технология с открытым исходным кодом. Это значит, что любой может использовать ее для обучения собственных систем языковой обработки и других задач.
Google показал несколько примеров, как BERT может менять результаты поиска. По запросу «math practice books for adults» (учебники по математике для взрослых) ранее в выдаче появлялись книги для 6-8 классов. Теперь выдача стала более релевантной.
Нет. BERT используется примерно для 10% поисковых запросов на английском языке в США. В частности, BERT будет использоваться «для более длинных, более разговорных запросов или запросов, где предлоги имеют большое значение». Для запросов с названиями брендов или коротких запросов BERT использоваться не будет.
BERT и RankBrain — это два отдельных алгоритма. RankBrain работает параллельно с обычными алгоритмами и используется для корректировки результатов, рассчитанных этими алгоритмами. RankBrain смотрит на запрос и находит похожие прошлые запросы. А затем соотносит текущие результаты поиска с этими прошлыми запросами и вносит корректировки.
Также RankBrain помогает Google интерпретировать поисковые запросы, чтобы отобразить результаты, которые не содержат точных ключевых слов из запроса. Например, в следующем примере Google понял, что речь идет об Эйфелевой башне, хотя ее название не фигурирует в запросе.
BERT работает по иному принципу. Он изучает контент до и после ключевого слова, чтобы учесть весь контекст и понять смысл.
BERT может применяться самостоятельно или совместно с RankBrain, или любым другим алгоритмом, или не использоваться вообще в зависимости от условий поиска.
Так как алгоритм относится к поиску, но он может затронуть голосового помощника Assistant при ответе на запросы и показе избранных сниппетов.
Пока BERT не используется для рекламы, но в случае интеграции алгоритма в рекламные сервисы может улучшиться релевантность объявлений.
Google сообщает, что нет ничего, что можно было бы оптимизировать для BERT. Поисковик рекомендует сосредоточиться на создании качественного контента, отвечающего запросам и ожиданиям пользователей.
Михаил Шакин, автор блога shakin.ru, во время блиц-интервью на конференции Optimization 2019 порекомендовал сосредоточиться на развитии экспертизы:
Надо развивать экспертизу, привлекать экспертов для написания статей. Многие сайты пострадали из-за этого. Статьи безлики, на сайтах часто не указывается даже автор статьи. В экспертных тематиках (таких как медицина, юриспруденция и т.п.) это просто недопустимо. Обязательно должен быть специалист-автор, у него должны быть публикации, интервью, выступления. Google все это отдельно отслеживает. Если специалист не дотягивает до какого-то уровня, то сайт считается мусорным.
Сайрус Шепард говорил, что BERT выбирает сайты с одними и теми же фактами. Если топовые игроки упоминают тот или иной факт по варианту А, а ваш сайт упоминает его по варианту Б, то ваш сайт, скорее всего, будет проигрывать только потому, что вы идете вразрез с общим мнением.
Источник: Search Engine Land