Как анализируется текст по закону Ципфа?



Механизмы поисковых систем таковы, что искусственно сгенерированный текст распознается как неестественный и исключается из верхних позиций поисковой выдачи. Как определить уровень естественности текста? Американский лингвист Джордж Ципф вывел закон естественности текста, согласно которому частота использования слова в тексте обратно пропорциональна его порядковому номеру. То есть второе слово встречается вдвое реже первого, третье – втрое реже первого и так далее.

На основе этого нехитрого математического метода можно провести анализ любого текста на естественность. Естественным считается такой текст, который соответствует данному правилу на 30-50 процентов. Чем выше процентный показатель, тем естественнее выглядит текст. В интернете уже существуют специальные онлайновые ресурсы, с помощью которых можно выполнить анализ текста по закону Ципфа. Статьи с показателем менее 30 процентов поисковыми системами отбраковываются.


Насколько можно доверять результатам анализа текста по Ципфу?



Анализ текста по закону Ципфа – это обычный статистический анализ, учитывающий особенности использования слов среднестатистическим носителем языка. Разумеется, из правил бывают исключения. Если попробовать оценить по закону Ципфа некоторые произведения известных писателей, показания могут сильно удивить. Впрочем, язык классиков не стремится укладываться в среднестатистическую речь.

Анализ текста по Ципфу требуется всем, кто так или иначе связан с продвижением вебсайтов. Это и копирайтеры, и веб-программисты, и сео-оптимизаторы. Высокие показатели естественности текста с большой вероятностью обеспечат статье место в топе поисковой системы. Чтобы написать текст с хорошими показателями анализа по закону Ципфа, нужно помнить, что ключевые слова должны быть использованы с большими разрывами. Нередко заказчики требуют от исполнителей создание текстов с заданными ключевыми словами и определенной частотой использования. Такой текст наверняка будет иметь низкий показатель по анализу Ципфа. Правильное техническое задание – это когда заказчик дает только сами ключи, не ограничивая копирайтера по числу их использования в тексте. Тогда достаточно определиться с тем, какое слово будет встречаться в тексте чаще всего, а все остальные включать в статью, исходя из его частоты употребления.