Семантичне SEO з використанням ШІ з Корай Губуром
Семантичне SEO з використанням штучного інтелекту або іншими словами, оптимізація семантичного пошуку, це більш продвинутий підхід до оптимізації пошукових систем (SEO). Він використовує силу штучного інтелекту (ШІ), англ. AI, та семантичної технології для покращення точності та відповідності результатів пошуку шляхом розуміння наміру користувача та контекстуального значення термінів, які є у пошуковому просторі.
Тема настільки широка, що неможливо детально роз’яснити її в межах одного вебінару. Корай Губур згадав кілька важливих пунктів, до яких додалися висновки Роберта Ніччіала. Кіт Шерлок також трохи помурчав для уточнення. І все. Я пропоную вам переглянути весь вебінар на YouTube: https://www.youtube.com/watch?v=81pe-YM9iRI
Презентація Корай Губур або завантажте її тут:
Презентація Роберта Ніччіал або завантажте її тут:
Основні висновки. Все нижче – це моє особисте розуміння
Вартість ранжування вебсайту не може бути вищою за вартість його неранжування.
Цей принцип, що вперше був представлений Кораєм під час SEO Mastery Summit в Сайгоні у березні 2023 року, корелює вартість з тематичним авторитетом. Навіть якщо контент дуже якісний (завдяки релевантності і відповідності), витрати, пов’язані з індексацією, скануванням та ранжуванням — або пошуком — можуть бути занадто високими. Google ранжує вас зовсім не через те, що ви йому дуже подобаєтесь. Вони будуть ранжувати вас лише тоді, коли це є вигідним для них. Пам’ятайте, Google – рекламна компанія.
Це пояснює, чому великі веб-сайти, такі як Amazon, часто перевершують за ранжуванням менші, навіть якщо вони є конкурентами Google. Більші сайти відповідають на мільйони запитів, тому для Google ефективніше по вартості надавати їх контент у численних результатах, порівняно з використанням мільйонів менших вебсайтів як джерела відповіді на лише один запит серед мільйонів інших.
Відповідність запиту
Простіше кажучи, ваша відповідь на запит має бути не лише релевантною, але й належно структурованою, і вона повинна включати ключові терміни з запиту. Між триграмою, витягнутою з запиту, та вашою відповіддю на нього не повинно бути прогалини. Ви можете глибше вивчити цю тему в патенті: Оцінка кандидатів у відповідні пасажі.

Оптимізація LLM для SEO
Цей процес можна розбити на сім ключових кроків:
- Точне налаштування LLM.
- Розробка тематичної карти.
- Створення семантичної мережі контенту.
- Генерація контенту
- Включення людської участі
- Покращення вашої бази знань
- Перетворення вашого вебсайту в розмовний ШІ.
Щоб повністю або частково виконати ці кроки, вам спершу потрібно створити надійну базу знань, а потім приступити до її вербалізації. Важливо охороняти цю інформацію, тримаючи її в таємниці. І оскільки семантика не залежить від мови, ви можете використовувати різні мови для будування бази.
Оптимізація невеликих речей на всьому сайті створює велику різницю.
Використання мови та контексту для покращення SEO
Мультиланцюгове міркування — це концепція штучного інтелекту та машинного навчання, яка передбачає зв’язування низки фактів, висновків або умовиводів для досягнення висновку. Завдяки багатоланцюжковому обґрунтуванню ви допомагаєте пошуковій системі екстраполювати значення наданого контенту. Наприклад, коли ви згадуєте сувенірний магазин Букінгемського палацу, мається на увазі, що валюта за товари буде вказана в фунтах.
Трюк тут полягає в тому, щоб утримувати ваш контент якомога більш чітким. Нечіткість ускладнює розуміння вашого контенту пошуковими системами та може змусити їх використовувати більш вартісні алгоритми або навіть відмовитись від індексації вашої сторінки. Google використовує різні рівні серверів для веб-сайтів, причому веб-сайти вищої якості обслуговуються з кращих серверів для забезпечення їх збереження.
Використовуйте мовні вбудовування/ембедінги, які є числовими представленнями мови. Схожі мови створюють ближчі ембедінги, навіть якщо вони належать до різних мов, тому що пошукові системи здатні розуміти семантику через мови. Цю ідею візуалізує проекція ембедінгів, яка може допомогти покращити ваш контент, виявляючи відповідні зв’язки.
При створенні тематичної карти, пройдіться по вебсайту і створіть проекцію ембедінгів. За відстанню між ними ви зрозумієте, наскільки вони відповідають один одному. Якщо у вас на вебсайті різні контексти, вам потрібно охопити перетинаючі області між ними. Google припускає, що якщо ви хочете створити вебсайт, що охоплює різні сфери, ви також повинні торкнутися перетинаючих областей.
Koray ввів концепції макро- та мікроконтекстів у документах, використовуючи приклад слів “ультразвуковий”, “очисники” та “автомобілі”. Якщо ви використовуєте лапки для пошуку як “шестикутник”, так і “ультразвуковий”, основний контекст – це “тип ультразвукової хвилі”.
NLP та налаштування релевантності для SEO
Тонко налаштуйте обрану вами попередньо навчену мовну модель для виконання конкретних завдань, які ви від неї очікуєте. Ви можете використовувати Інструмент Інтерпретації Навчання Google для маніпуляції відносинами слів в моделі. Змінюючи відстань між різними поняттями, ви можете вплинути на розуміння моделі їх зв’язків.
Завжди пам’ятайте, що важливо не тільки те, що ви говорите, але й як ви це говорите. Структура речень та порядок слів впливають на класифікацію та розуміння пошукової системи. Дивіться на це як на математичне завдання, тому що ви маєте справу з алгоритмами. Не слідуйте сліпо всім цим рекомендаціям зосередитись на “чудовому контенті”. Воно так не працює.
Що таке налаштування релевантності? Ідея тут полягає в тому, що те ж саме повідомлення можна передати, використовуючи різні структури речень та порядки слів. Залежно від пошукового запиту, на який ви націлені, ви можете віддати перевагу одній структурі перед іншою. Наприклад, якщо ви націлені на пошуковий запит, що включає “фінансовий радник”, ви, можливо, захочете використовувати структуру речення, яка акцентує більше уваги на “фінансовому раднику”, а не на “сім’ях”. Тут мається на увазі, що він радить сім’ям. Але в першу чергу є фінансовим радником.
Правильне використання ШІ
Роберт пропонує сприймати AI, зокрема великі мовні моделі, як GPT-4, як потужний обробник мови, а не як джерело знань. Оскільки ці моделі базуються на ймовірностях, вони здатні виробляти контент подібної якості, що викликає “інфляцію” контенту в інтернеті.
Один із способів зробити ці моделі більш ефективними – використовувати метод на основі зворотного зв’язку. Це передбачає надання вихідних даних, отримання виводу від ШІ, надання відгуку на основі виводу, а потім тонке налаштування вихідних даних на основі відгуку.
Однак, враховуючи застарілу базу даних GPT-4, є необхідність постачати йому найновішу інформацію та структури даних. Замість того, щоб покладатися виключно на автоматизовану базу даних ШІ, рекомендується доповнювати її додатковими даними для кращого виводу.
Генерація контенту, який буде схожим на людський
- Витягніть важливу інформацію з існуючого контенту, наприклад з опису товару, щоб повідомити ШІ про тему.
- Використовуйте ці дані як вхідні дані для моделі ШІ, попросивши її згенерувати огляд або подібний контент.
- Чим детальніше та конкретніше ваши вхідні дані, тим вищої якості виводу ви можете очікувати від ШІ.
Цей процес, якщо його виконувати масштабно, може швидко генерувати багато контенту. Однак, перегляньте свої цілі, перш ніж робити це. Ваша мета не просто створювати контент, а задовольняти наміри користувача – справжню причину, чому хтось щось шукає.
Джерела даних для витягу інформації та її подачі в ШІ для генерації контенту
Їх дуже багато. Роберт конкретно згадав наступні:
- Apify: Цей сервіс має на меті створити API для кожного вебсайту в світі, надаючи численні джерела даних.
- Rapid API: Він пропонує велику кількість даних для побудови вашої бази знань.
- Google: Витягуючи інформацію з розділу “Люди також запитують” та заголовків вебсайтів, ви можете зрозуміти, як Google з’єднує пов’язані питання та контент.
Використовуйте ембедінги ключових слів на основі результатів Google, а не інших моделей. Ви можете групувати питання з розділу “Люди також запитують” від Google, розширюючи їх для навчання Google нових асоціацій між питаннями.
Чим більший розмір вхідних даних, тим краще, оскільки більш детальні вхідні дані призводять до кращих вихідних даних.
Будьте інженером SEO
Тепер легше розуміти та маніпулювати видачею Google завдяки прогресу в технологіях та доступності даних. Інженери SEO навіть можуть створювати свої пошукові системи, використовуючи бази даних, як-от Common Crawl, та специфічні алгоритми релевантності.
Інженерний підхід до SEO-спеціалістів є ключовим, оскільки він забезпечує конкурентну перевагу та приносить користь агентствам та спільнотам в галузі SEO.
Навчання та доопрацювання вашої моделі
Серед своїх конкурентів виберіть вебсайт, який Google використовує як еталон для вашої ніші. Він має проходити всі новлення або інші зміни алгоритму неушкодженим. Витягніть з нього дані та навчіть на його контенті свою модель. Ви можете використовувати OpenAI або інші інструменти для ембедінгів та доопрацювання. Налаштуйте свій стиль та словник, щоб імітувати свого найуспішнішого конкурента. Створіть шаблони для відповіді на кожний тип питань, які може мати ваш користувач. Використовуйте моделі мови для заповнення конкретних слів в цих шаблонах. Також ви можете використовувати NLP для кращих результатів. Хоча великі мовні моделі та графи знань не залежать від мови, порядок слів та контекст можуть відрізнятися в різних мовах.
Щоб створити тематичну карту, вам потрібно врахувати, які поняття потребують окремих сторінок, а які можна групувати разом.
Використовуйте бібліотеки NLP, такі як SiameseBERT з фреймворком SentenceBERT для оптимізації форматів відповідей та структур речень для різних типів питань. Ці бібліотеки можуть оцінювати ваші відповіді, дозволяючи вам зрозуміти, яка структура речення дає найкращі результати.
Зворотні посилання
Коли методи семантичного SEO та тематичного авторитету поєднуються зі зворотніми посиланнями, вартість будівництва посилань може значно знизитися, а ранжування конкретних документів може стати простішим. Ненатуральна побудова зворотних посилань також може вимагати постійних доповнень, щоб здатися природніми, що може бути тягарем.
Якщо правильно використовувати семантичне SEO, можна створювати менше посилань, рідше, але при цьому все ще домінувати в ніші. Будівництво зворотних посилань – це насправді гра на бюджет – чим більше ресурсів у вас є, тим більше посилань ви можете створити. Однак галузь рухається в напрямку майбутнього, де сигнали користувачів можуть бути ціннішими, ніж сигнали зворотних посилань. Це означає, що акцент має бути зроблений на якісний контент, точну семантику та сильні сигнали від користувачів, а не просто на збільшення кількості зворотних посилань.
Замість висновку
- Фокусуйтесь на промптах: При роботі з мовними моделями важливо думати про подачу на рівні промптів, давайте моделі якомога більше знань на вхідній стороні, а потім очікуйте хороших результатів на вихідній стороні. Краще поекспериментуйте з вхідними даними і зосередьтеся на якості, а не на кількості, ніж очікувати результатів від кількох випадкових речень.
- Розуміння основних потреб пошукових систем: Замість простого імітування найкращих веб-сторінок, важливо розуміти, що фундаментально потрібно пошуковим системам, особливо для майбутньої екосистеми пошуку. Це розуміння буде корисним протягом довгого часу.
- Врахування вартості: Важливо подумати про те, скільки коштує для Google, Bing і вас бачити ваш вебсайт. Подумайте, куди ви інвестуєте свій час, адже ваш час також щось коштує.