Google стал умнее распознавать варианты написания одного и того же объекта, но обозреватель Пол Шапиро замечает, что он еще не совершенен.Моя жена пришла ко мне с проблемой. Ей нравились праздничные, причудливые и потенциально подходящие пижамы Хануки. Но в Google не было достаточно вариантов при однократном написании имени праздника, поэтому она сказала мне, что систематически просматривает все варианты написания списка покупок. Я был очень удивлен этим - я ожидал, что Google будет достаточно умным, чтобы признать, что это альтернативные варианты написания одной и той же вещи, особенно post-Hummingbird. Ясно, что это было не так. Некоторые предпосылки для тех, кто этого не знает: Ханука на самом деле является транслитерированным словом с иврита. Поскольку у иврита есть свой собственный алфавит, существует множество описаний, которые можно использовать для ссылки на него: Ханука, Ханука и Ханука - все приемлемые варианты написания того же праздника. Итак, когда кто-то ищет «пижаму Хануки» или «пижаму хануки», Google действительно должен быть достаточно умным, чтобы понять, что они разные варианты написания одной и той же концепции и дают почти одинаковые результаты. Но Google не делает! Я предполагаю, что это происходит для других праздников и названий из других культур, и мне было бы интересно узнать, испытывают ли у других читателей те же проблемы с ними. Почему я удивляюсь, что Google возвращает разные результаты для разных написаний? Ну, с введением Графа знаний (и Hummingbird), Google сигнализировал об изменении для SEO. Больше, чем когда-либо прежде, мы могли бы начать думать о поисковых запросах не только как строки ключевых слов, но и как взаимосвязанные концепции реального мира. Что я имею в виду? Когда кто-то ищет «Авраама Линкольна», они более чем вероятно ищут сущность, представляющую 16-го президента Соединенных Штатов, вместо появления слов «Авраам» и «Линкольн» или их дядю также назвали Абрахамом Линкольн. И если они ищут «вечеринку Линкольна», Google знает, что мы, вероятно, обсуждаем политические партии, а не партии в городе Линкольн, штат Массачусетс, потому что это концепция, тесно связанная с исторической сущностью Авраам Линкольн. Точно так же Google, безусловно, может понять, что, когда мы используем ключевое слово Hanukkah, оно относится к объекту праздника и что различные варианты написания также относятся к одному и тому же объекту. Несмотря на различные варианты написания, разные поиски фактически означают одно и то же. Но, увы, как продемонстрировала моя жена, чтобы выполнить другой поиск каждого написания праздника, чтобы обнаружить все ее варианты пижамы Хануки, Google не делал лучшую работу. Итак, насколько широко распространена проблема поиска Хануки / Хануки / Хануки? Вот несколько результатов поиска для предметов Хануки: Как видно из первого снимка экрана, некоторые крупные розничные торговцы, такие как Target, Macy's и JCPenney, на первой странице Google. Тем не менее, на снимках экрана они в основном отсутствуют - и сайты, такие как PajamaGram и Etsy, занимают доминирующее положение в выдаче СИП. Это означает, что магазины, ориентированные на уже малочисленную демографию покупателей хануки, фактически уменьшают количество потенциальных клиентов, используя только одно правописание на своей странице. (Действительно, по моему ключевому инструменту по выбору, хотя «Ханука» имеет самый высокий объем поиска всех вариантов при 301,100 глобальных ежемесячных поисковых запросах, все остальные комбинации написания еще составляют значительные 55 500 поисковых запросов, что означает, что розничные продавцы, оптимизирующие для обоих условий, могут быть наблюдая на 18 процентов больше трафика.)

Исследование изменений правописания и наблюдений

Поскольку я всегда любопытный человек, я хотел исследовать это явление немного дальше. Я построил небольшой простой инструмент, чтобы показать, насколько похожи страницы результатов поиска (SERP) для двух разных запросов, изучая, какие листинги отображаются в обеих SERP. Если мы рассмотрим пять общих описаний Хануки, мы увидим следующее: Ключевое слово 1 Ключевое слово 2 SERP сходство Ханука Ханука 90,00% Ханука Ханука 20,00% Ханука Hannukkah 20,00% Ханука ханука 30,00% Ханука Ханука 20,00% Ханука Hannukkah 20,00% Ханука ханука 30,00% Ханука Hannukkah 90,00% Ханука ханука 80,00% Hannukkah ханука 80,00% Инструмент показывает что-то довольно интересное здесь: не только результаты разные, но и в зависимости от орфографии, результаты могут быть только на 20 процентов идентичными, то есть восемь из 10 списков на первой странице совершенно разные. Затем мне стало любопытно, почему условия не были канонизированы друг к другу, поэтому я посмотрел на Wikidata - один из основных источников данных, которые Google использует для своего Графа знаний. Как оказалось, существует сущность со всеми вариантами: Затем я проверил API поиска Google Knowledge Graph, и стало очень ясно, что Google может быть смущен: Ключевое слово resultScore @Я бы имя Описание @тип Ханука 8.081924 кг: / м / 0vpq52 Любовь Ханука Песня Ю-Тан [MusicRecording, Thing] Ханука 16.334606 кг: / м / 06xmqp_ A Rugrats Chanukah ? [Вещь] Ханука 11.404715 кг: / м / 0zvjvwt Ханука Песня Лорны [MusicRecording, Thing] Hannukkah 11.599854 кг: / м / 06vrjy9 Hannukkah Книга Дженнифер Близин Гиллис [Книга, Вещь] ханука 21,56493 кг: / м / 02873z Ханука Гарри Вымышленный персонаж [Вещь] Значения resultScore - которые, согласно документации API, указывают «насколько хорошо объект соответствует ограничениям запроса» - очень низки. В этом случае объект не очень хорошо соответствовал. Это было бы согласуется с переменными результатами, если бы не тот факт, что для всех вариантов написания с помощью Freebase ID / m / 022w4 возвращается код знания, отличный от того, что возвращается из API-интерфейса Knowledge Graph. Таким образом, в этом случае кажется, что API не может быть надежным средством оценки проблемы. Перейдем к некоторым другим наблюдениям. Интересно отметить, что при поиске Ханука, Google подталкивал пользователей к результатам Хануки. При поиске Ханнуки и Ханнукки Google подтолкнул пользователей к результатам Хануки. Таким образом, Google, похоже, группирует рукописи Хануки вместе, основываясь на том, начинаются ли они с «H» или «Ch». Ханука, Ханнука и Ханука были также единственными вариациями, которые получили особое отношение к изображению меноры Хануки:

Что розничный торговец, продающий продукцию Хануки, должен

Ясно, что если мы хотим полностью охватить условия (и моя жена, чтобы найти вашу пижаму Хануки), мы не можем полагаться только на оптимизацию для наивысшего изменения объема поиска по ключевому слову, поскольку Google, похоже, не рассматривает все варианты как полностью одинаковые , Лучше всего включить фактическую строку для каждого варианта правописания где-то на странице, вместо того, чтобы полагаться на Google, чтобы понимать их как варианты одной и той же вещи. Если вы меньший игрок, имеет смысл расставить приоритеты в оптимизации одного из менее популярных вариантов орфографии, так как органическая конкуренция может быть не такой значительной. (Конечно, это не препятствует вам использовать варианты орфографии в дополнение к этому для возможности выигрыша для нескольких написаний.) На минимальном уровне вы можете включить правописание, начинающееся с H- и Ch, и надеяться, что Google в большинстве случаев направит пользователей к той же самой SERP.

Будущий эксперимент

Я начал эксперимент, чтобы увидеть, может ли включение структурированных данных в свойства sameAs быть потенциальным средством для того, чтобы заставить Google понять одно правописание как сущность, исключая необходимость включения различных вариантов написания. На данный момент еще слишком рано знать результаты теста, и они неубедительны, но я с нетерпением жду возможности поделиться этими результатами в будущем. Мнения, выраженные в этой статье, принадлежат авторам гостевых изданий, а не обязательно поисковым системам. Здесь перечислены авторы работ.
Share To:

celcumplit

Post A Comment:

0 comments so far,add yours