Компьютерная помощь. Закон ципфа и фрактальная природа социальных и экономических явлений

Джордж Ципф

Основным источником информации в интернете являются тексты. Естественно, что и продвижение сайтов в поисковые ТОПы по большей части связано с правильным написанием подобного контента. Но написать текст мало – надо еще и оформить его согласно разнообразным SEO правилам и рекомендациям. Из них можно выделить наиболее популярные и всеми используемые:

Минимум тошноты, воды и спама.
Правильная структура размещаемого материала (заголовки, списки).
Вписывание ключей.

Это все азы, поэтому их использует большая часть оптимизаторов. Но сайтов на просторах интернета становится все больше, поэтому некоторые из их владельцев ищут другие варианты для успешности продвижения своего продукта. И здесь часть из них вспоминают про некий закон Ципфа. Но мало того, что они начинают затачивать собственные сочинения под сервис, работающий на основе утверждений английского ученого, жившего хрен знает сколько лет назад, так они еще и заставляют наемных копирайтеров ломать себе голову над ним!

Но доктор Айтупит бдит, поэтому, аки Черный Плащ, спешит на помощь интернет писакам, чтобы разобраться с эффективностью данного метода по продвижению сайтов в Топы самых известных поисковиков.

Проверка по закону Ципфа

По сути, только две важнейших характеристики:

Тошноту проверяемого контента.
Естественность.

Первый минус этого продукта заключается именно в показателях тошноты: разработчики явно не учли, что существует классическая и академическая вариация этой SEO характеристики. А большинству людей, работающих в этой сфере, известно, что для снижения показателей каждого из вариантов используются совершенно разные способы (об этом доктор Айтупит постарается рассказать в одной из следующих своих ). Но «Ципфо-сервис» не сообщает об этом своим пользователям, что иногда может привести к некоторым затруднениям. Не буду долго мучить и скажу, что в данном случае подразумевается только классическая тошнота.

Переходим к «Естественности». Что оно такое? Я долго искал адекватную информацию по этому вопросу. Но нашел только постоянное переписывание каких-то заумных слов, понять смысл которых невозможно без пары бутылок пива. Нет, конечно, может быть я и тупой, но каждый из вас способен понять это:

«..эмпирическая закономерность распределения частоты слов естественного языка: если все слова языка (или просто достаточно длинного текста) упорядочить по убыванию частоты их использования, то частота n-го слова в таком списке окажется приблизительно обратно пропорциональной его порядковому номеру n (так называемому рангу этого слова, см. шкала порядка). Например, второе по используемости слово встречается примерно в два раза реже, чем первое, третье - в три раза реже, чем первое, и так далее..»

Эмпирическая, блин, закономерность… Это же надо было такое написать! Ну да ладно – Сатана ему не простит. Не это самое интересное! Интересно то, что автором сего изречения является американский лингвист, который жил в середине прошлого века, когда об интернете знал только Джордж Лукас и Леонид Ильич Брежнев. То есть, существуют люди, которые считают, что современные поисковики просто обязаны выполнять анализ по закону Ципфа? Пардонте, Мусье, но с хрена ли?..

Наверное, некоторые читатели после вышенаписанных слов решат, что автор сего опуса является типичным балаболом? Я постараюсь привести достойные аргументы, чтобы переубедить вас!

– Требование соответствия параметров текста закону Ципфа или, если быть точным, всяческим “сервисам”, якобы проверяющим тексты на такое соответствие – профанация чистейшей воды. Такое условие является бессмысленным как с точки зрения качества текста, так и с точки зрения его оптимизации для поисковых систем.

– Проверка по Ципфу – это сродни SEO-амулетам и фен-шую – слышал звон, да не знаю, где он. А так как в SEO вообще много псевдонаучной мистификации из-за изначальной закрытости алгоритмов поисковых систем, то проверка по Ципфу очень гармонично присоседилась к более релевантным показателям качества – плотности ключей и уникальности, результаты которых в свою очередь тоже нужно принимать постольку-поскольку.

Никаких домыслов с моей стороны – честно скоммунизженные слова, написанные по поводу данного закона!

И я готов подписаться под каждым словом Жеки с Адвего. Давайте пофантазируем. Представьте, что перед вами стоит некий автомат. Вам требуется подойти и набрать на его табло произвольную комбинацию цифр. Правильного числа никто не знает, поэтому каждый раз размер выигрыша разнится. Некоторые люди просто вводят значения и уходят, другие начинают изобретать какие-то системы: танцуют румбу, три раза плюют строго под углом в пятнадцать градусов, съедают козюльку, засохшую три дня назад и так далее. И тут одну из последних везет – он срывает куш! Почему ему повезло – хрен знает. Может просто угадал комбинацию, а может козюлька волшебная была. Но на следующий день этот человек приходит к автомату и устанавливает рядом столик, за которым предлагает всем желающим обязательно попробовать перед набором цифры его методику…

Все равно не убедил? Тогда воспользуюсь тяжелой артиллерией – проведу эксперимент.

Наглядная проверка текста по закону Ципфа

Для предстоящей работы я решил взять несколько разных ключевых фраз и проверить тексты на соответствие закону Ципфа, расположенные в разных местах ТОПа нашей отечественной поисковой системы Yandex. Приступим.

Первый ключ – «Строительство домой из бруса».

Выбираю сайт, который расположен вверху поискового рейтинга, делаю анализ:

Что имеем: естественность – 80, тошнота – 5.9.

Перехожу на страницу ниже в поисковике, выбираю сайт из третьего десятка, провожу анализ:

Результат: естественность – 82, тошнота – 6.16.

Опускаюсь на десяток позиций ниже и повторяю процедуру:

Итог: Е – 86, Т – 8.6.

Но в ТОПе то другое стоит! Мало? Повторяем проверку. Берем следующий ключ. Допустим – лечение геморроя.

Результат: Е – 70, Т – 11.23.

Ниже на два десятка позиций:

Итог: Е – 91, Т – 4.90.

Еще на страницу ниже:

Результат: Е – 91, Т – 4.12.

Заключение

Как видно из проведенного анализа, лучшие показатели естественности текстовых материалов по закону Ципфа совершенно не дают гарантию на успешность конкуренции с текстами, расположенными на других интернет-ресурсах. Впрочем, решать все равно вам…

Среди критериев оценки качества текста основным считается его естественность. Проверку этого показателя можно провести с помощью математического метода, который обнаружил американский лингвист Джордж Ципф.

Проверка по закону Ципфа - это метод оценки естественности текста, определяющие закономерность расположения слов, где частота слова обратно пропорциональна его месту в тексте.

Первый закон Ципфа "ранг - частота"

С = (Частота вхождения слова х Ранг частоты) / Число слов.

Если взять соотношение слова на ранг частоты, то величина (С) будет неизменной, причем это верно для документа на любом языке, внутри каждой языковой группы значение будет постоянным.

Значимые для документа слова, определяющие его тематику, находятся в середине гиперболы. Слова, используемые наиболее часто, также как и низкочастотные, не несут решающего смыслового значения.

Второй закон Ципфа "количество - частота"

Частота слова и его число в тексте также связаны друг с другом. Если построить график, где Х - частота слова, Y - число слов данной частоты, форма кривой будет неизменной.

Принцип написания хорошего текста предполагает, что его необходимо сделать наиболее понятным при использовании наименьшего количества слов.

Закон показывает общее свойство для любого языка, т.к. всегда будет определенное количество наиболее часто встречающихся слов.

Проверить SEO-текст на естественность нужно обязательно, если при написании использовались ключевые слова, чтобы он был интересным и понятным для большой аудитории читателей. Также этот показатель имеет значение при ранжировании сайтов поисковыми системами, которые определяют соответствие текста ключевым запросам, распределяя слова по группам важных, случайных и вспомогательных.

Подробнее:

Зависимость между частотой встречаемости слова в тексте f, и его местом в частотном словаре (рангом) r, обратно пропорциональная. Чем больше ранг слова (чем дальше оно находится от начала словаря), тем меньше частота его встречаемости в тексте.
График такой зависимости - гипербола, которая при небольших значениях рангов очень резко спадает, а затем, в области малых значений частоты встречаемости, f, тянется очень далеко, постепенно, но очень незаметно, уменьшаясь по мере роста ранга, r.
Если частота встречаемости одного слова 4 на миллион, а частота другого - 3 на миллион, не имеет значения, что ранги этих слов различаются в тысячу раз. Эти слова употребляются настолько редко, что многие носители языка их даже не слышали.
Однако эта дальняя область примечательна тем, что слово, находящееся здесь, может очень легко многократно уменьшить значение своего ранга. Даже самое маленькое увеличение частоты встречаемости слова резко сдвигает его положение к началу частотного словаря.
В терминах этого закона мерой популярности слова является его положение в частотном словаре языка. Более популярное слово находится ближе к началу словаря, чем менее популярное.
Он отражает зависимость частоты использования слова в языке от его места в частотном словаре. Популярные слова языка употребляются чаще. С математической точки зрения, график этой зависимости является гиперболой с резким подъемом по мере приближения к началу координат и длинным, пологим, почти горизонтальным, «хвостом». БОльшая часть слов языка размещается именно в этом «хвосте». Здесь место слова в частотном словаре, если и изменяет частоту использования этого слова в языке, то совсем не на много.
Но как только положение слова в частотном словаре достигает того места на гиперболе, где по мере приближения к началу координат начинается существенный подъем кривой, ситуация изменяется. Теперь небольшое изменение частоты встречаемости слова уже не приводит к значительным изменениям его ранга, то есть положение слова в частотном словаре перестает изменяться. Значит, рост популярности слова затормозился. Для того, чтобы он продолжался, следует предпринять специальные меры для того, чтобы повысить частоту встречаемости слова. Например, если слово - название товара, необходимо потратить средства на рекламную компанию (

В течение прошлого века загадочный математический феномен, называемый законом Ципфа, позволял с большой точностью предсказывать изменение размеров городов-гигантов по всему миру. Штука в том, что никто не понимает, как и почему работает этот закон…

Вернёмся в 1949 год. Лингвист Джордж Ципф (Зипф) заметил странную тенденцию в использовании людьми определённых слов в языке. Он обнаружил, что небольшое количество слов используется постоянно, а подавляющее большинство – очень редко. Если оценить слова по популярности, открывается поразительная вещь: слово первого разряда всегда используется вдвое чаще, чем слово второго разряда и втрое чаще, чем слово третьего разряда.
Ципф обнаружил, что это же правило действует в распределении доходов людей в стране: самый богатый человек имеет вдвое больше денег, чем следующий богач и так далее.
Позже стало понятно, что этот закон также работает в отношении размера городов. Город с самым большим населением в любой стране в два раза больше, чем следующий по размеру город и так далее. Невероятно, но закон Ципфа действовал абсолютно во всех странах мира на протяжении прошлого столетия.

Просто взгляните на численность самых больших городов России. Численность населения Москвы примерно в 2 раза больше, чем Санкт-Петербурга.
Пол Кругман, писавший о применении закона Ципфа к городам, превосходно подметил: часто экономическую теорию обвиняют в создании сильно упрощённых моделей сложной, беспорядочной действительности. Закон Ципфа показывает, что всё обстоит с точностью до наоборот: мы применяем слишком сложные, беспорядочные модели, а действительность поразительно аккуратна и проста.

Закон силы

В 1999 году экономист Ксавье Габэ написал научный труд, в которой описывал закон Ципфа как “закон силы”.
Габэ отметил, что этот закон сохраняется, даже если города растут в хаотическом порядке. Но эта ровная структура ломается, как только вы переходите к городам, не входящим в разряд мегаполисов. Небольшие города с численностью населения около ста тысяч человек, по всей видимости, подчиняются другому закону и показывают более объяснимое распределение размеров.

Можно задаться вопросом, что же имеется в виду под определением «город»? Ведь, например, Бостон и Кембридж считаются двумя разными городами, так же, как Сан-Франциско и Окленд, разделённые водой. У двух шведских географов тоже возник такой вопрос, и они стали рассматривать так называемые «естественные» города, объединённые населением и дорожными связками, а не политическими мотивами. И они обнаружили, что даже такие «естественные» города подчиняются закону Ципфа.

Почему закон Ципфа работает в городах?

Так что же заставляет города быть столь предсказуемыми в количестве населения? Никто точно не может это объяснить. Нам известно, что города расширяются за счёт иммиграции, иммигранты стекаются в большие мегаполисы, потому что там больше возможностей. Но иммиграции недостаточно, чтобы объяснить этот закон.
Есть также экономические мотивы, поскольку в больших городах делают большие деньги, а закон Ципфа работает и для распределения доходов. Однако, чёткого ответа на вопрос это по-прежнему не даёт.
В прошлом году группа исследователей обнаружила, что у закона Ципфа всё же есть исключения: закон работает, только если рассматриваемые города связаны экономически. Это объясняет, почему закон действует, например, для отдельной европейской страны, но не для всего ЕС.

Как же растут города

Существует ещё одно странное правило, применимое к городам, оно имеет отношение к тому, каким способом города потребляют ресурсы, когда растут. Вырастая, города становятся более стабильными. Например, если город удваивается в размере, требуемое ему число бензоколонок не увеличивается вдвое.
Город будет вполне комфортно жить, если количество бензоколонок увеличится примерно на 77%. В то время, как закон Ципфа следует определённым социальным законам, этот закон более близок к природным, например, к тому, как животные потребляют энергию, становясь взрослее.

Математик Стивен Строгац описывает это так:
Сколько калорий в день нужно мыши по сравнению со слоном? Оба они млекопитающие, таким образом, можно предположить, что на клеточном уровне они не должны сильно отличаться. И действительно, если вырастить в лаборатории клетки десяти различных млекопитающих, у всех этих клеток будет одинаковая скорость метаболизма, они не запоминают на генетическом уровне, какого размера в действительности их хозяин.
Но если взять слона или мышь как полноценное животное, функционирующее скопление миллиардов клеток, то на одно и то же действие клетки слона будут расходовать гораздо меньше энергии, чем клетки мыши. Закон метаболизма, названный законом Кляйбера, утверждает, что метаболические потребности млекопитающего растут пропорционально его массе тела в 0,74 раза. Эти 0,74 очень близки к 0,77, наблюдаемым у закона, управляющего количеством бензоколонок в городе.
Совпадение? Может быть, но скорее всего нет.
Всё это ужасно захватывающе, но, пожалуй, менее таинственно, чем закон Ципфа. Не так сложно понять, почему город, являющийся, по сути, экосистемой, хоть и построенной людьми, должен подчиняться естественным законам природы. Но закон Ципфа не имеет аналога в природе. Это социальное явление и оно имеет место только на протяжении последних ста лет.
Всё, что мы знаем, это то, что закон Ципфа действует и для других социальных систем, включая экономическую и лингвистическую. Таким образом, возможно, есть какие-то общие социальные правила, создающие этот странный закон, и когда-нибудь мы сможем их понять. Тот, кто разгадает этот ребус, возможно, обнаружит ключ к предсказанию намного более важных вещей, чем рост городов. Закон Ципфа может быть лишь небольшим аспектом глобального правила социальной динамики, которое определяет то, как мы общаемся, торгуем, образуем сообщества и многое другое.

В процессе выборов избиратели выражают свое отношение к тем или иным политическим деятелям или партиям, отдавая свой голос за того или иного кандидата или партию. Возникает вопрос – существуют ли какие-либо закономерности, описывающие распределение голосов избирателей между различными кандидатами или партиями? Если никаких закономерностей нет, то возможны любые соотношения между числами голосов, полученных кандидатами или партиями, а также между этими числами голосов и, например, явкой избирателей или числом недействительных бюллетеней. Если же существуют определенные закономерности в распределении голосов, то возможны не все варианты их распределения. На материале многих выборов в самых различных странах была выявлена статистическая связь, существующая между числами голосов, полученных на выборах различными кандидатами и партиями. Было установлено, что эта связь описывается следующей простой зависимостью:

Если по одной оси отложить в логарифмическом масштабе число голосов N(i), полученных каждым кандидатом, а по другой оси, также в логарифмическом масштабе, место i, занятое тем же кандидатом в ходе выборов, то полученные точки с достаточным приближением располагаются вдоль прямой линии:

ln N(i) = A - B x lni (1)

Справедливость приведенного уравнения была подтверждена в серии работ российских специалистов по математической политологии (Собянин, Суховольский, 1995), выполнивших анализ результатов выборов народных депутатов России в 1990 году, выборов Президента России в 1991 и 1996 годах, а также данных о выборах в ряде стран, начиная с выборов президента Франции в 1848 году, где победил Луи-Наполеон Бонапарт.

Этот математический результат нетривиален по своей природе. Специалистам – физикам, химикам, металлургам, демографам, экологам и представителям многих других областей знания, имеющих дело с большими массивами статистических данных, хорошо известно, что указанная численная закономерность носит общий характер и описывает ситуацию "свободной конкурентной борьбы" за распределение конечного количества каких-либо условных "благ". Оказывается, все мыслимое многообразие объектов, ситуаций и причинно-следственных связей не меняет характера этой зависимости: коль скоро имеется свободная конкуренция, ее результаты в любом случае укладываются на "логарифмическую прямую" – меняются лишь константа A и крутизна наклона прямой B. И наоборот: коль скоро имеются отклонения от условий свободной конкуренции, точки неминуемо отклоняются от прямой – и тем дальше, чем значительнее "факторы несвободы". Так, например, "конкуренция" городов за численность проживающего в них населения приводит в цивилизованных странах именно к такой зависимости. Между тем, в СССР такие города, как Москва, Ленинград и некоторые другие центры значительно отклонялись от "прямой свободной конкуренции" – вследствие административных ограничений, связанных с паспортным режимом. Аналогичным образом, свободная конкуренция приводит к той же зависимости между размерами крупнейших состояний и "местом", занимаемым их владельцами в списке таких состояний – разумеется, в тех частях света, где такие списки существуют. В точности таков же известный зоологам закон распределения хищников по массе (при отсутствии антропогенных факторов), и т.д.

Впервые закономерности этого рода установил итальянский социолог и математик В.Парето, занимаясь распределением жителей страны по величине их богатства; впоследствии к подобным же выводам пришел американский лингвист Дж.К. Ципф, изучая распределение частоты употребления слов в текстах. Различные варианты написанного выше соотношения носят название закона Ципфа – Парето. Методы анализа, связанные с изучением ранговых распределений, получили широкое распространение в лингвистике, наукометрии, экологии. Соблюдение соотношения (1) для избирательного процесса означает, что существует "свободная конкуренция" всех кандидатов, имеющих возможность беспрепятственно объяснять избирателям свои политические взгляды и политическую платформу.

Выполнение закона Ципфа – Парето для избирательного процесса означает, что каждый из кандидатов, каждая из партий и политических групп избирателей, голосующих по определенному типу, обладает своей собственной политической платформой, не перекрывающейся со всеми остальными. Имеющиеся кандидаты должны перекрывать все возможные предпочтения, имеющиеся у избирателей; тогда доля избирателей, ищущих свой выбор вне предлагаемого списка кандидатов, достаточно мала, и уравнение (1) с высокой точностью описывает распределение голосов избирателей. В противном случае в распределении (1) могут возникнуть пустые "ниши", и весь анализ усложняется.

Расчет параметров A и B, входящих в уравнение (1), производится по данным о численности избирателей, голосовавших за разных кандидатов или за разные политические группы, с помощью методов регрессионного анализа. Параметр A в уравнении (1) представляет собой логарифм числа избирателей, отдавших свои голоса за кандидата-лидера. Величина B – коэффициент предпочтения – характеризует наклон прямой (1) и служит численной мерой однородности выбора избирателей. Если B = 0, это означает, что у избирателей нет никаких предпочтений одних партий или кандидатов перед другими, и что все они получили на выборах одинаковое число голосов. Напротив, при больших значениях крутизны B партии-аутсайдеры получают очень мало голосов по сравнению с партиями-лидерами (однако, на практике параметр B почти никогда не бывает больше единицы). Если же замечаются отклонения от прямой типа (1), то при сделанных выше предположениях это указывает на отсутствие условий свободной политической конкуренции. Это может быть вызвано либо наличием каких-то дополнительно действующих внешних факторов, например, запугивания избирателей возможными политическими и экономическими репрессиями в случае голосования (или неголосования) за того или иного кандидата, либо прямой фальсификацией результатов выборов при подсчете голосов в избирательных комиссиях разного уровня. На рисунке 2 приведен типичный график рангового распределения численности голосовавших на выборах в России. Как можно видеть, между численностями различных групп избирателей и рангами этих групп (т.е. местами кандидатов) в логарифмических координатах (по обеим осям) практически наблюдается линейная связь.

Тип распределения голосов, поданных за различных кандидатов или партии, помогает выявить фальсификацию результатов выборов. В простейшем случае фальсификации, если в урны подброшено какое-то число бюллетеней, заполненных в пользу какого-то кандидата или партии, то оказывается, что ранговое распределение числа голосов, поданных за отдельных кандидатов, не изображается прямой. Но если исключить данные о кандидате, в пользу которого проводились фальсификации, то для остальных кандидатов (или партий) ранговое распределение будет соответствовать теоретическому. В рассматриваемом случае можно оценить число подброшенных бюллетеней по разнице между числом голосов, полученных таким кандидатом по официальным данным, и числом, найденным из уравнения рангового распределения после исключения данных, относящихся к упомянутому кандидату. На рисунке 3 приведено распределение голосов, поданных – по данным избирательной комиссии – за кандидатов на должность главы администрации Липецкой области на выборах, состоявшихся весной 1993 года. Это распределение очевидным образом далеко от прямой. В этом случае суд, прошедший в 1995 году, подтвердил наличие фальсификаций в пользу кандидата, занявшего первое место.

Здравствуйте, уважаемые читатели! Закон Ципфа поможет проверить текст на естественность. Так, по крайней мере, считается. Что за «естественность» на нашу голову? Нужно ли контролировать еще и этот показатель, насколько важен он для продвижения сайта? Корректно ли происходит его определение онлайн сервисами? Со всеми этими вопросами хорошо бы разобраться. В сети гуляют различные, порой самые противоположные мнения по этому поводу. Вставлю ка, и я свои «пять копеек» и попробую изложить собственные подходы к этой Ципфе.

Почему вдруг про закон - в женском роде? Да потому что мне так и хочется сравнить детище лингвиста и филолога Джорджа Кингсли Зипфа с хитромудрой лисой, которая правдами и неправдами проникает в нашу «лубяную избушку» - копирайтинг и начинает там качать права. Но сначала немного предыстории с математикой и статистикой. Но, не пугайтесь, друзья, я и сама не из сильных вычислителей, так что не буду мучить ни вас, ни себя.

Закон Ципфа и глобальные закономерности

Дж. К. Зипф сам себя называл специалистом по статистической социальной … экологии. Интересное сочетание, не правда ли? Он пытался исследовать закономерности социальных явлений с точки зрения статистики и математики больших чисел. И ему это в какой-то степени удалось. Так на примере сопоставления частотности употребления слов английского языка с их номером в «табеле о рангах» ученый выявил, что соблюдается обратно пропорциональная зависимость. Грубо говоря, слово, которое занимает вторую строчку в списке по частоте употребления, используется в два раза реже, чем первое; третье - в три раза и так далее. С точки зрения математики эта функциональная зависимость описывается распределением Парето. Для каждого языка, разумеется, вводятся свои константы и коэффициенты.

Эта же закономерность прослеживается и в некоторых экономических категориях, например, распределении доходов богатейших людей мира. Кроме того, численность населения опять-таки крупнейших городов большинства стран мира тоже выстраивается в шеренгу, обозначенную тем же Зипфом. С некоторыми отклонениями, с учетом всевозможных возмущающих факторов, но закон каким-то непостижимым образом работает. Не хочу останавливаться долго на обсуждении этого феномена. Нас загадочный зверь Ципфа интересует все-таки даже не с точки зрения лингвистики, а со стороны применимости его к небольшим выборкам слов, каковыми являются наши статьи.

Стоит ли проверять тексты по закону Ципфа

Заметьте друзья, в предыдущем разделе мы говорили о растущих мегаполисах или капиталах богачей, употребляя превосходную степень. На одном из сайтов я даже нашла сведения, что уже для городов со средней численностью населения выкладки Зипфа не работают. То же и с экономикой: для фирм, имеющих доходы менее 10 млн $/год, закон «ранг/частотность» тоже не срабатывает. Что касается лингвистических изысканий, то целая языковая группа - подборка нехилая. Английский насчитывает, например, около миллиона слов. И там, да, соотношение частотности и употребляемости этих слов идеально выстраивает гиперболу. Но вот что-то я нигде не нашла ограничений для применения Ципфы к выборкам слов небольшого объема.

Однако, простое чувство логики подсказывает, что если уж средние (с населением в сотни тысяч) города или фирмы с доходами менее 10 млн (бедненькие!) не могут выступать апологетами зипофских расчетов, то для чего мучить наши тексты. Ведь и тысяча слов наберется в них нечасто. Так средняя статья на 3 тыс. знаков б/п содержит примерно 400-500 слов. И какую же закономерность пытаемся мы отыскать среди подобной группы?

Нет, возможно, что разработчики онлайн-сервисов для проверки текстов по закону Ципфа попытались как-то учесть тот факт, что наши статьи трудно назвать семантическими мегавыборками. Но если бы это им удалось, то тогда тут дело пахло бы Нобелевской премией! Такая поправка к открытию знаменитого ученого уж точно требовала бы по крайней мере добавки фамилии вундеркинда, типа - закон Ципфа-Пупкина. Звучит? Но звуков фанфар мы не слышали.

И опять логика вкупе с некоторым жизненным опытом подсказывает: разработчики поисковых алгоритмов ранжирования немного заигрались. Понимаю их нелегкую задачу: каждый член команды должен постоянно доказывать свою эффективность, креативность, фонтанировать идеями. Вот и дофонтанировались они на нашу голову.

Эксперименты ретивых оптимизаторов

Ну, не нужно стрелять из пушки по нашим статьям-воробышкам: не годятся наши опусы для ваших с Зипфом экспериментов, уважаемые разработчики. На малых выборках эти закономерности притянуты за уши. Это, конечно, сугубо мое мнение. В сети мне попадались и противоположные: закон Ципфа, мол, улучшил позиции сайта в выдаче, тексты стали заметно интереснее и так далее, в том же духе. Многие пытаются анализировать ТОП на соответствие распределению Ципфа и делать на этой основе какие-то выводы. Стоп, господа! На фоне около восьмиста факторов, которые поисковики учитывают при ранжировании, вы пытаетесь отследить влияние одного? Ну, это никуда не годится! Исследования так не проводят, их результаты нельзя признать корректными.

При всем моем негативном отношении не к Ципфе (науку я уважаю), а к неоправданным попыткам поверить в очередной раз гармонию алгеброй, я не раз анализировала свои работы на естественность в онлайн сервисах. По просьбе заказчиков, разумеется. Могу сказать, что живой человеческий язык без канцеляризмов, штампов и тавтологии очень легко помогает преодолеть зипофские барьеры. Достичь 70-80 % естественности текста - это совсем нетрудно. Желающие могут проверить свои тексты например. Заниматься этим постоянно, думаю, не нужно. Тем более, не стоит делать ставку на лису-Ципфу для продвижения. Честное слово, друзья, не тратьте время и энергию на антинаучные эксперименты.

Настоящий текст имеет 87% естественности. Достаточно. Думаю, что даже если я догоню показатели до 98%, то это нисколько не повлияет на позиции в выдаче. По моим прогнозам, этой статье ТОП не светит. Ну, и ладно, зато сказала, о чем хотела.

До свидания, друзья.

Ваш гид по стране Копирайтинг GALANT.