Лемма - незмінна, вихідну форму слова. Для іменників це називний відмінок і однина, для дієслів - форма слова, що відповідає на питання «що робити?».
Лематизації - процес виявлення лем, який застосовується пошуковими системами при індексації сайтів . Вона часто використовується для морфологічного аналізу текстів і є однією з прикладних дисциплін мовознавства.
Цей процес дозволяє зберігати інформацію про кожній сторінці у себе в індексі у вигляді набору слів, наведених, по суті, до єдиного знаменника.
Лематизації застосовується для прискорення індексації та формування відповіді на пошуковий запит , За рахунок скорочення словоформ, необхідних до вивчення, аналізу і розбору пошукачем. Ви можете ввести: «куплю футболку» або «купити футболку» - пошуковик перетворює ці слово в «купити футболка», таким чином, видаючи один і той же результат для різних по написанню й однакових за змістом запитів.
Крім прискорення індексації, пошуковики використовують лематизації для оцінки унікальності контенту розділяючи вміст сторінки на шингли і аналізуючи потім леми в межах кожного з них. Програма шукає обраний набір лем в інших текстах, які також пройшли перший пункт. У разі знаходження збігів, леми другого тексту визнаються неунікальні.
Лематизації в SEO допомагає оптимізаторів підібрати семантичне ядро для сайту. Роль технології в цьому процесі в тому, що:
Дивіться також:
- пасаж