Автоматически сцепляем ключевые фразы с посадочными страницами с помощью скрипта

Специалисты, регулярно настраивающие кампании контекстной рекламы, не понаслышке знают, насколько трудоемким может быть процесс сцепки — или мэтчинга — адреса страницы с ключевой фразой. Для чистоты эксперимента будем понимать под многостраничным сайтом по-настоящему МНОГОстраничный сайт, состоящий как минимум из сотен посадочных страниц.

Многим специалистам хочется иметь инструмент, который мог бы помочь справится с этой задачей. Способ, описанный в этой статье, не требует навыков программирования или продвинутых технических знаний.

Решать задачу мэтчинга ключевых фраз и посадочных страниц мы будем с помощью небольшого скрипта, написанного на языке Python. Для работы с ним рекомендую установить пакет Anaconda со средой Jupyter Notebook, т. к. помимо ядра языка данный пакет содержит целый набор внешних модулей.

Механика работы скрипта

Механизм работы скрипта очень простой. Он берет ключевую фразу и пробегает по всем описаниям страниц, ища то описание, слова в котором максимально полно пересекаются со словами из ключевой фразы. Небольшая схематическая иллюстрация ниже поможет понять работу скрипта на небольшом примере. Отметим, что скрипт не работает со словоформами, т. е. он работает с точными соответствиями слов и является регистронезависимым.

Несмотря на простоту идеи, лежащей в основе механики скрипта, результат работы получается достаточно адекватным даже по «человеческим» меркам.

Алгоритм работы скрипта
Алгоритм работы скрипта

Подготовка данных

Время работы скрипта измеряется секундами и минутами, но для успешной работы скрипта вам нужно подготовиться. Вам понадобятся:

  1. Список ключевых фраз, для которых вы подбираете страницы.

  2. Список адресов посадочных страниц и их описания (название продукта, модели, артикул и т. д.)

Чтобы корректно сцепить ключевую фразу с посадочной страницей нам нужен список слов, который бы характеризовал данную страницу. В подавляющем большинстве случаев достаточно будет заголовка h1 и артикула или модели товара, если они выведены в отдельные поля. Как видно из примера на скриншоте «ДИЗЕЛЬНЫЙ ПОГРУЗЧИК TCM FD 115-3» заключен в тег h1, класс b1c-name.

Сбор описаний страниц

Такую информацию может выгрузить технический специалист, поддерживающий сайт, обычно значения этих полей хранятся в специальной базе данных с карточками товаров. Либо же вы можете спарсить данные самостоятельно или заказать парсинг у стороннего специалиста.

Работа скрипта достаточно жестко запрограммирована для того, чтобы им могли пользоваться в специалисты с разным уровнем подготовки.

Отработка скрипта

Перед началом работы необходимо создать отдельную папку и разместить в ней файл ppc_sci.url_matcher.py со скриптом (.py — стандартный файл языка Python), который вы можете скачать по ссылке.

В эту же рабочую папку вам необходимо разместить файл links.xlsx с двумя листами:

  • лист url_descriptions, содержащий два столбца: поле URL с адресами посадочных страниц и поле DESCRIPTION с описанием страниц:

    Лист со страницами и описаниями

  • лист keywords с одним столбцом KEYWORD с ключевыми фразами:

    Лист с ключевыми фразами

Итого в папке перед началом работы должно быть два файла:

Подготовка папки

Также у вас должен быть установлен стандартный пакет Anaconda, а также предустановлены модули pandas и openpyxl.

Для начала создайте рабочую тетрадь .ipynb в папке с подготовленными файлами.

Рабочая тетрадь

Перед началом отработки скрипта закройте файл links.xlsx. Введите в ячейку рабочей тетради команду %run ppc_sci.url_matcher.py и нажимите кнопку Run.

Ввести команду

Появившийся текст «Лист ’keywords_url’ записан в исходный файл ’links.xlsx’.» означает, что скрипт успешно сработал.

Результат работы скрипта будет размещен на вновь созданном листе keywords_url в исходном файле links.xlsx.

Результат выполнения скрипта

Немного про быстродействие

Для теста был выбран массив из 834 посадочных страниц с их описаниями и 17125 ключевых фраз. На ноутбуке средней мощности среднее время работы скрипта составило 49 секунд.

Скорость работы скрипта

Некоторым коллегам, которые опробуют данный скрипт, покажется, что происходит некая «магия», на самом деле скрипт достаточно примитивный и человеком со средними навыками программирования достаточно быстро. Если у вас есть желание разрабатывать подобные скрипты для автоматизации рабочих процессов, записывайтесь на базовый курс PPC-Scientist.

Ваши вопросы по работе скрипта, а также предложения и идеи новых скриптов оставляйте в комментариях к статье. Всем успехов в настройке

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: