Комп'ютерна допомога. Закон ципфу та фрактальна природа соціальних та економічних явищ

Джордж Ціпф

Основним джерелом інформації в Інтернеті є тексти. Природно, що і просування сайтів у пошукові ТОПи здебільшого пов'язане з правильним написаннямподібного контенту. Але написати текст мало – треба ще й оформити його відповідно до різноманітних SEO правил та рекомендацій. З них можна виділити найбільш популярні та всіма використовувані:

  • Мінімум нудоти, води та спаму.
  • Правильна структура матеріалу, що розміщується (заголовки, списки).
  • Вписування ключів.

Це все ази, тому їх використовує більшість оптимізаторів. Але сайтів на просторах інтернету стає все більше, тому деякі з їхніх власників шукають інші варіанти для успішного просування свого продукту. І тут частина з них згадують про закон Ципфа. Але мало того, що вони починають заточувати власні творипід сервіс, що працює на основі тверджень англійського вченого, який жив хрін знає скільки років тому, так вони ще й змушують найманих копірайтерів ламати собі голову над ним!

Але доктор Айтупіт бдить, тому, як Чорний Плащ, поспішає на допомогу інтернет писакам, щоб розібратися з ефективністю даного методуз просування сайтів в Топи найвідоміших пошукових систем.

Перевірка згідно із законом Ципфа

По суті, лише дві найважливіші характеристики:

  • Нудоту контенту, що перевіряється.
  • Природність.

Перший мінус цього продукту полягає саме у показниках нудоти: розробники явно не врахували, що існує класична та академічна варіація цієї SEO характеристики. А більшості людей, які працюють у цій сфері, відомо, що для зниження показників кожного з варіантів використовуються абсолютно різні способи(Про це доктор Айтупіт постарається розповісти в одній з наступних своїх). Але «Ципфо-сервіс» не повідомляє про це своїм користувачам, що іноді може призвести до деяких труднощів. Не довго мучитиму і скажу, що в даному випадкумається на увазі лише класична нудота.

Переходимо до "Природності". Що таке? Я довго шукав адекватну інформацію з цього питання. Але знайшов лише постійне переписування якихось хитромудрих слів, зрозуміти зміст яких неможливо без пари пляшок пива. Ні, звичайно, може бути я і тупий, але кожен із вас здатний зрозуміти це:

«..емпірична закономірність розподілу частоти слів природної мови: якщо всі слова мови (або просто достатньо довгого тексту) упорядкувати за зменшенням частоти їх використання, то частота n-го слова в такому списку виявиться приблизно обернено пропорційною його порядковому номеру n (так званому рангу цього слова див. шкала порядку). Наприклад, друге по використаності слово зустрічається приблизно вдвічі рідше, ніж перше, третє - втричі рідше, ніж перше, і так далі.

Емпірична, млинець, закономірність... Це ж треба було таке написати! Ну та гаразд – Сатана йому не пробачить. Не це найцікавіше! Цікаво те, що автором цього вислову є американський лінгвіст, який жив у середині минулого століття, коли про інтернет знав лише Джордж Лукас та Леонід Ілліч Брежнєв. Тобто існують люди, які вважають, що сучасні пошукові системи просто зобов'язані виконувати аналіз згідно із законом Ципфа? Пардонте, Мусьє, але з хрону?..

Напевно, деякі читачі після вищенаписаних слів вирішать, що автор цього опусу є типовим балаболом? Я намагатимусь навести гідні аргументи, щоб переконати вас!

– Вимога відповідності параметрів тексту закону Ципфа або, якщо бути точним, усіляким “сервісам”, які нібито перевіряють тексти на таку відповідність – профанація чистої води. Така умова безглузда як з точки зору якості тексту, так і з точки зору його оптимізації для пошукових систем.

- Перевірка по Ципфу - це схоже на SEO-амулети і фен-шую - чув дзвін, та не знаю, де він. А оскільки в SEO взагалі багато псевдонаукової містифікації через початкову закритість алгоритмів пошукових систем, то перевірка по Ципфу дуже гармонійно приєдналася до більш релевантних показників якості – щільності ключів та унікальності, результати яких у свою чергу теж потрібно приймати остільки.

Жодних домислів з мого боку – чесно комунізовані слова, написані з приводу цього закону!

І я готовий підписатися під кожним словом Жекі з Адвего. Давайте пофантазуємо. Уявіть, що перед вами стоїть автомат. Вам потрібно підійти та набрати на його табло довільну комбінацію цифр. Правильного числаніхто не знає, тому щоразу розмір виграшу відрізняється. Деякі люди просто вводять значення і йдуть, інші починають винаходити якісь системи: танцюють румбу, три рази плюють строго під кутом у п'ятнадцять градусів, з'їдають козюльку, що засохла три дні тому і таке інше. І тут одну з останніх таланить – він зриває куш! Чому йому пощастило – хрін знає. Може, просто вгадав комбінацію, а може, козюлька чарівна була. Але наступного дня ця людина приходить до автомата і встановлює поруч столик, за яким пропонує всім охочим обов'язково спробувати перед набором цифри його методику.

Все одно не переконав? Тоді скористаюсь важкою артилерією – проведу експеримент.

Наочна перевірка тексту згідно із законом Ципфа

Для майбутньої роботия вирішив взяти кілька різних ключових фразта перевірити тексти на відповідність закону Ципфа, розташовані у різних місцях ТОПу нашої вітчизняної пошукової системи Yandex. Приступимо.

Перший ключ - "Будівництво додому з бруса".

Вибираю сайт, який розташований угорі пошукового рейтингу, роблю аналіз:

Що маємо: природність – 80, нудота – 5.9.

Переходжу на сторінку нижче в пошуковій системі, вибираю сайт з третього десятка, проводжу аналіз:

Результат: природність – 82, нудота – 6.16.

Опускаюся на десяток позицій нижче та повторюю процедуру:

Підсумок: Е – 86, Т – 8.6.

Але в ТОПі щось інше стоїть! Мало? Повторюємо перевірку. Беремо наступний ключ. Допустимо – лікування геморою.

Результат: Е - 70, Т - 11.23.

Нижче на два десятки позицій:

Підсумок: Е – 91, Т – 4.90.

Ще на сторінку нижче:

Результат: Е - 91, Т - 4.12.

Висновок

Як видно з проведеного аналізу, найкращі показники природності текстових матеріалів за законом Ципфа не дають гарантію на успішність конкуренції з текстами, розташованими на інших інтернет-ресурсах. Втім, вирішувати все одно вам...


Серед критеріїв оцінки якості тексту основним вважається його природність. Перевірку цього показника можна провести за допомогою математичного методу, який виявив американський лінгвіст Джордж Ципф

Перевірка згідно із законом Ципфа- це метод оцінки природності тексту, що визначають закономірність розташування слів, де частота слова обернено пропорційна його місцю в тексті.

Перший закон Ципфа "ранг - частота"

З = (Частота входження слова х Ранг частоти)/Кількість слів.

Якщо взяти співвідношення слова на ранг частоти, то величина (С) буде незмінною, причому це правильно для документа будь-якою мовою, всередині кожної мовної групи значення буде постійним.

Значні документа слова, що визначають його тематику, перебувають у середині гіперболи. Слова, використовувані найчастіше, як і низькочастотні, не несуть вирішального смислового значення.

Другий закон Ципфа "кількість - частота"

Частота слова та його число у тексті також пов'язані один з одним. Якщо побудувати графік, де Х – частота слова, Y – число слів цієї частоти, форма кривої буде незмінною.

Принцип написання гарного текступрипускає, що його необхідно зробити найбільш зрозумілим під час використання найменшої кількостіслів.

Закон показує загальна властивістьдля будь-якої мови, т.к. завжди буде певну кількістьнайчастіше слів.

Перевірити SEO-текст на природність потрібно обов'язково, якщо під час написання використовувалися ключові словащоб він був цікавим і зрозумілим для великої аудиторіїчитачів. Також цей показник має значення при ранжируванні сайтів пошуковими системами, які визначають відповідність тексту ключовим запитам, розподіляючи слова за групами важливих, випадкових та допоміжних.

Докладніше:

  • Залежність між частотою народження слова в тексті f, і його місцем в частотному словнику(рангом) r, обернено пропорційна. Чим більший ранг слова (що далі воно знаходиться від початку словника), тим менша частота його народження в тексті.
  • Графік такої залежності - гіпербола, яка при не великих значенняхрангів дуже різко спадає, а потім, в області малих значень частоти народження, f, тягнеться дуже далеко, поступово, але дуже непомітно, зменшуючись у міру зростання рангу, r.
  • Якщо частота одного слова 4 на мільйон, а частота іншого - 3 на мільйон, не має значення, що ранги цих слів різняться в тисячу разів. Ці слова вживаються настільки рідко, що багато носіїв мови їх навіть не чули.
  • Однак ця далека область примітна тим, що слово, що знаходиться тут, може дуже легко зменшити значення свого рангу. Навіть найменше збільшення частоти народження слова різко зрушує його положення до початку частотного словника.
  • У термінах цього закону мірою популярності слова є його положення у частотному словнику мови. Більш популярне слово знаходиться ближче до початку словника, ніж найпопулярніше.
  • Він відбиває залежність частоти використання слова у мові з його місця у частотному словнику. Популярні словамови вживаються частіше. З математичної точки зору графік цієї залежності є гіперболою з різким підйомом у міру наближення до початку координат і довгим, пологим, майже горизонтальним, «хвістом». Більша частинаслів мови розміщується саме у цьому «хвості». Тут місце слова у частотному словнику, якщо змінює частоту використання цього слова у мові, то зовсім небагато.
  • Але як тільки положення слова в частотному словнику досягає того місця на гіперболі, де в міру наближення до початку координат починається суттєвий підйом кривої, ситуація змінюється. Тепер невелика зміначастоти народження слова вже не призводить до значних змін його рангу, тобто положення слова в частотному словнику перестає змінюватися. Отже, зростання популярності слова загальмувалося. Для того, щоб він продовжувався, слід вжити спеціальних заходів для того, щоб підвищити частоту слова. Наприклад, якщо слово – назва товару, необхідно витратити кошти на рекламну компанію (

Протягом минулого століття загадковий математичний феномен, званий законом Ципфа, дозволяв великою точністюпередбачати зміну розмірів міст-гігантів у всьому світі. Штука в тому, що ніхто не розуміє, як і чому працює цей закон.

Повернемося 1949 року. Лінгвіст Джордж Ціпф (Зіпф) помітив дивну тенденцію у використанні людьми певних слів у мові. Він виявив, що не велика кількістьслів використовується постійно, а переважна більшість – дуже рідко. Якщо оцінити слова за популярністю, відкривається разюча річ: слово першого розряду завжди використовується вдвічі частіше, ніж слово другого розряду і втричі частіше ніж слово третього розряду.
Ципф виявив, що це правило діє в розподілі доходів людей у ​​країні: найбагатша людина має вдвічі більше грошей, ніж наступний багатій і таке інше.
Згодом стало зрозуміло, що цей закон також працює щодо розміру міст. Місто з самим великим населеннямв будь-якій країні вдвічі більше, ніж наступне за розміром місто і таке інше. Неймовірно, але закон Ципфа діяв абсолютно у всіх країнах світу протягом минулого сторіччя.

Просто погляньте на чисельність самих великих містРосії. Чисельність населення Москви приблизно 2 разу більше, ніж Санкт-Петербурга.
Пол Кругман, який писав про застосування закону Ципфа до міст, чудово помітив: часто економічну теоріюзвинувачують у створенні сильно спрощених моделейскладної, безладної дійсності. Закон Ципфа показує, що все відбувається з точністю до навпаки: ми застосовуємо дуже складні, безладні моделі, а реальність вражає акуратна і проста.

Закон сили

1999 року економіст Ксав'є Габе написав наукова праця, У якій описував закон Ципфа як “закон сили”.
Габе зазначив, що цей закон зберігається, навіть якщо міста ростуть у хаотичному порядку. Але ця рівна структура ламається, як тільки ви переходите до міст, що не входять до розряду мегаполісів. Невеликі містаз чисельністю населення близько ста тисяч осіб, мабуть, підкоряються іншому закону і показують більш зрозумілий розподіл розмірів.

Чи можна запитати, що ж мається на увазі під визначенням «місто»? Адже, наприклад, Бостон і Кембридж вважаються двома різними містами, як і Сан-Франциско і Окленд, розділені водою. У двох шведських географів теж виникло таке питання, і вони почали розглядати так звані «природні» міста, об'єднані населенням та дорожніми зв'язками, а не політичними мотивами. І вони виявили, що навіть такі «природні» міста підпорядковуються закону Ципфа.

Чому закон Ципфа працює у містах?

То що змушує міста бути настільки передбачуваними у кількості населення? Ніхто точно не може це пояснити. Нам відомо, що міста розширюються за рахунок імміграції, іммігранти стікаються у великі мегаполіси, бо там більше можливостей. Але імміграції недостатньо, щоб пояснити цей закон.
Є також економічні мотиви, оскільки в великих містахроблять великі гроші, а закон Ципфа працює й у розподілу доходів. Проте, чіткої відповіді питання це як і не дає.
Минулого року група дослідників виявила, що закон Ципфа все ж має винятки: закон працює, тільки якщо розглянуті міста пов'язані економічно. Це пояснює, чому закон діє, наприклад, для окремої європейської країни, але не для всього ЄС.

Як же ростуть міста

Існує ще одне дивне правило, Що стосується міст, воно має відношення до того, яким способом міста споживають ресурси, коли ростуть. Виростаючи, міста стають стабільнішими. Наприклад, якщо місто подвоюється в розмірі, потрібне йому число бензоколонок не збільшується вдвічі.
Місто цілком комфортно житиме, якщо кількість бензоколонок збільшиться приблизно на 77%. У той час, як закон Ципфа слідує певним соціальним законам, цей закон ближчий до природних, наприклад, до того, як тварини споживають енергію, стаючи дорослішими.

Математик Стівен Строгац описує це так:
Скільки калорій на день потрібно миші порівняно зі слоном? Обидва вони ссавці, таким чином, можна припустити, що на клітинному рівнівони повинні сильно відрізнятися. Якщо виростити в лабораторії клітини десяти різних ссавців, у всіх цих клітин буде однакова швидкість метаболізму, вони не запам'ятовують на генетичному рівні, якого розміру насправді їх господар.
Але якщо взяти слона або мишу як повноцінну тварину, що функціонує скупчення мільярдів клітин, то на одну і ту ж дію клітини слона витрачатимуть набагато менше енергії, ніж клітини миші. Закон метаболізму, названий законом Кляйбера, стверджує, що метаболічні потреби ссавця зростають пропорційно до його маси тіла в 0,74 рази. Ці 0,74 дуже близькі до 0,77, які спостерігаються у закону, який управляє кількістю бензоколонок у місті.
Збіг? Можливо, але швидше за все немає.
Все це дуже захоплююче, але, мабуть, менш таємниче, ніж закон Ципфа. Не так складно зрозуміти, чому місто, яке є, по суті, екосистемою, хоч і побудованою людьми, має підкорятися природним законам природи. Але закон Ципфа немає аналога у природі. Це соціальне явище і воно має місце лише протягом останніх ста років.
Все, що ми знаємо, це те, що закон Ципфа діє для інших соціальних систем, включаючи економічну та лінгвістичну. Таким чином, можливо, є якісь спільні соціальні правила, що створюють цей дивний закон, і колись ми зможемо їх зрозуміти. Той, хто розгадає цей ребус, можливо, виявить ключ до передбачення набагато важливіших речей, ніж зростання міст. Закон Ципфа може бути лише невеликим аспектом глобального правила соціальної динаміки, яке визначає те, як ми спілкуємося, торгуємо, утворюємо спільноти та багато іншого.

У процесі виборів виборці висловлюють своє ставлення до тих чи інших політичним діячамабо партіям, віддаючи свій голос за того чи іншого кандидата чи партію. Постає питання – чи існують якісь закономірності, що описують розподіл голосів виборців між різними кандидатами чи партіями? Якщо жодних закономірностей немає, то можливі будь-які співвідношення між числами голосів, одержаних кандидатами чи партіями, а також між цими числами голосів і, наприклад, явкою виборців чи числом недійсних бюлетенів. Якщо ж існують певні закономірності у розподілі голосів, то можливі в повному обсязі варіанти їх розподілу. На матеріалі багатьох виборів у самих різних країнахбуло виявлено статистичний зв'язок, який існує між числами голосів, отриманих на виборах різними кандидатами та партіями. Було встановлено, що цей зв'язок описується такою простою залежністю:

Якщо по одній осі відкласти в логарифмічному масштабі число голосів N(i), отриманих кожним кандидатом, а по іншій осі, також у логарифмічному масштабі, місце i, зайняте тим самим кандидатом під час виборів, то отримані точки з достатнім наближенням розташовуються вздовж прямої лінії. :

ln N(i) = A - B x lni (1)

Справедливість наведеного рівняння було підтверджено у серії робіт російських фахівцівз математичної політології (Собянін, Суховольський, 1995), які здійснили аналіз результатів виборів народних депутатів Росії у 1990 році, виборів Президента Росії у 1991 та 1996 роках, а також даних про вибори у ряді країн, починаючи з виборів президента Франції у 1848 році, де переміг Луї-Наполеон Бонапарт

Цей математичний результатнетривіальний за своєю природою. Фахівцям – фізикам, хімікам, металургам, демографам, екологам та представникам багатьох інших галузей знання, що мають справу з великими масивами статистичних даних, добре відомо, що зазначена чисельна закономірність має загальний характерта описує ситуацію "вільної конкурентної боротьби" за розподіл кінцевої кількостібудь-яких умовних "благ". Виявляється, все можливе різноманіття об'єктів, ситуацій і причинно-наслідкових зв'язків не змінює характеру цієї залежності: якщо є вільна конкуренція, її результати в будь-якому випадку вкладаються на "логарифмічну пряму" - змінюються лише константа A і крутість нахилу прямої B. І навпаки: Якщо є відхилення від умов вільної конкуренції, точки неминуче відхиляються від прямої - і тим далі, чим значніші "чинники несвободи". Так, наприклад, "конкуренція" міст за чисельність населення, що проживає в них, призводить в цивілізованих країнах саме до такої залежності. Тим часом у СРСР такі міста, як Москва, Ленінград та деякі інші центри значно відхилялися від "прямої вільної конкуренції" – внаслідок адміністративних обмежень, пов'язаних із паспортним режимом. Аналогічним чином, вільна конкуренція призводить до тієї ж залежності між розмірами найбільших станів і "місцем", яке їх займають власники у списку таких станів – зрозуміло, у тих частинах світу, де такі списки існують. В точності такий же відомий зоологам закон розподілу хижаків за масою (за відсутності антропогенних факторів), і т.д.

Вперше закономірності цього встановив італійський соціолог і математик В.Парето, займаючись розподілом жителів країни за величиною їхнього багатства; згодом до подібних висновків дійшов американський лінгвіст Дж.К. Ципф, вивчаючи розподіл частоти вживання слів у текстах. Різні варіантинаписаного вище співвідношення звуться закону Ципфа – Парето. Методи аналізу, пов'язані з вивченням рангових розподілів, отримали широке розповсюдженняу лінгвістиці, наукометрії, екології. Дотримання співвідношення (1) для виборчого процесуозначає, що існує "вільна конкуренція" всіх кандидатів, які мають можливість безперешкодно пояснювати виборцям свої політичні поглядита політичну платформу.

Виконання закону Ципфа – Парето для виборчого процесу означає, що кожен із кандидатів, кожна з партій та політичних груп виборців, які голосують за певним типом, має свою власну політичну платформу, яка не перекривається з усіма іншими. Наявні кандидати повинні перекривати всі можливі переваги, які є у виборців; тоді частка виборців, які шукають свій вибір поза пропонованим списком кандидатів, досить мала, і рівняння (1) з високою точністю описує розподіл голосів виборців. В іншому випадку у розподілі (1) можуть виникнути порожні "ніші", і весь аналіз ускладнюється.

Розрахунок параметрів A і B, що входять до рівняння (1), здійснюється за даними про чисельність виборців, які голосували за різних кандидатів або за різні політичні групи за допомогою методів регресійного аналізу. Параметр A у рівнянні (1) є логарифмом кількості виборців, які віддали свої голоси за кандидата-лідера. Величина B – коефіцієнт переваги – характеризує нахил прямої (1) і є чисельною мірою однорідності вибору виборців. Якщо B = 0, це означає, що у виборців немає переваг одних партій чи кандидатів перед іншими, і що всі вони отримали на виборах однакове числоголосів. Навпаки, при великих значеннях крутості B партії-аутсайдери отримують дуже мало голосів у порівнянні з партіями-лідерами (проте, на практиці параметр B майже ніколи не буває більше одиниці). Якщо ж помічаються відхилення від прямого типу (1), то при зроблених вище припущеннях це вказує на відсутність умов вільної політичної конкуренції. Це може бути викликано або наявністю якихось додатково діючих зовнішніх факторів, наприклад, залякування виборців можливими політичними та економічними репресіями у разі голосування (або неголосування) за того чи іншого кандидата, або прямою фальсифікацією результатів виборів при підрахунку голосів у виборчих комісіях різного рівня. На малюнку 2 наведено типовий графік рангового розподілу чисельності тих, хто голосував на виборах у Росії. Як можна бачити, між чисельностями різних груп виборців та рангами цих груп (тобто місцями кандидатів) у логарифмічних координатах (по обох осях) практично спостерігається лінійний зв'язок.

Тип розподілу голосів, поданих за різних кандидатів чи партій, допомагає виявити фальсифікацію результатів виборів. У найпростішому випадку фальсифікації, якщо до урн підкинуто якесь число бюлетенів, заповнених на користь якогось кандидата чи партії, то виявляється, що ранговий розподіл числа голосів, поданих за окремих кандидатів, не є прямою. Але якщо виключити дані про кандидата, на користь якого проводилися фальсифікації, то для інших кандидатів (або партій) ранговий розподіл відповідатиме теоретичному. У даному випадку можна оцінити кількість підкинутих бюлетенів за різницею між числом голосів, отриманих таким кандидатом за офіційними даними, і числом, знайденим із рівняння рангового розподілу після виключення даних, які стосуються згаданого кандидата. На малюнку 3 наведено розподіл голосів, поданих – за даними виборчої комісії – за кандидатів на посаду голови адміністрації Липецької областіна виборах, що відбулися навесні 1993 року. Цей розподіл явно далеко від прямої. У цьому випадку суд, що пройшов у 1995 році, підтвердив наявність фальсифікацій на користь кандидата, який посів перше місце.

Здрастуйте, шановні читачі! Закон Ципфа допоможе перевірити текст на природність. Так, принаймні вважається. Що за "природність" на нашу голову? Чи потрібно контролювати ще й цей показник, наскільки важливим є він для просування сайту? Чи правильно відбувається його визначення онлайн сервісами? З усіма цими питаннями добре було б розібратися. У мережі гуляють різні, часом найпротилежніші думки з цього приводу. Вставлю, і я свої «п'ять копійок» і спробую викласти власні підходи до цієї Ципфе.

Чому раптом про закон – у жіночому роді? Та тому що мені так і хочеться порівняти дітище лінгвіста і філолога Джорджа Кінгслі Зіпфа з хитромудрою лисицею, яка правдами і неправдами проникає в нашу луб'яну хатинку- копірайтинг і починає там качати права. Але спочатку трохи передісторії з математикою та статистикою. Але, не лякайтеся, друзі, я і сама не з сильних обчислювачів, так що не мучитиму ні вас, ні себе.

Закон Ципфу та глобальні закономірності

Дж. К. Зіпф сам себе називав фахівцем зі статистичної соціальної... екології. Цікаве поєднання, чи не так? Він намагався дослідити закономірності соціальних явищз погляду статистики та математики великих чисел. І йому це певною мірою вдалося. Так, на прикладі зіставлення частотності вживання слів англійської мовиз їхнім номером у «табелі про ранги» вчений виявив, що дотримується назад пропорційна залежність. Грубо кажучи, слово, яке займає другий рядок у списку за частотою вживання, використовується вдвічі рідше, ніж перше; третє - втричі і таке інше. З погляду математики ця функціональна залежністьописується розподілом Парето. Для кожної мови, зрозуміло, запроваджуються свої константи та коефіцієнти.

Ця ж закономірність простежується й у деяких економічних категоріяхнаприклад, розподіл доходів найбагатших людейсвіту. Крім того, чисельність населення знову-таки найбільших містбільшості країн світу теж вишиковується в шеренгу, позначену тим самим Зіпфом. З деякими відхиленнями, з урахуванням всіляких факторів, що обурюють, але закон якимось незбагненним чином працює. Не хочу зупинятись довго на обговоренні цього феномену. Нас загадковий звірЦипфа цікавить все-таки навіть не з погляду лінгвістики, а з боку його застосування до невеликих вибірок слів, якими є наші статті.

Чи варто перевіряти тексти згідно із законом Ципфа

Зауважте друзі, в попередньому розділіми говорили про зростаючі мегаполіси або капітали багатіїв, вживаючи чудовий ступінь. На одному з сайтів я навіть знайшла відомості, що вже для міст середньою чисельністюнаселення викладки Зіпфа не працюють. Те саме і з економікою: для фірм, які мають доходи менше 10 млн. $/рік, закон «ранг/частотність» теж не спрацьовує. Що стосується лінгвістичних досліджень, то ціла мовна група- Добірка нехила. Англійська налічує, наприклад, близько мільйона слів. І там, так, співвідношення частотності та вживаності цих слів ідеально вибудовує гіперболу. Але щось я ніде не знайшла обмежень для застосування Ципфи до вибірок слів невеликого обсягу.

Однак, просте почуття логіки підказує, що якщо вже середні (з населенням у сотні тисяч) міста чи фірми з доходами менше 10 млн (бідненькі!) не можуть виступати апологетами зипофських розрахунків, то навіщо мучити наші тексти. Адже й тисяча слів набереться в них нечасто. Так, середня стаття на 3 тис. знаків б/п містить приблизно 400-500 слів. І яку ж закономірність намагаємося ми знайти серед такої групи?

Ні, можливо, що розробники онлайн-сервісів для перевірки текстів згідно із законом Ципфа спробували якось врахувати той факт, що наші статті важко назвати семантичними мегавибірками. Але якби це їм удалося, то тоді тут справа пахла б Нобелівською премією! Така поправка до відкриття знаменитого вченого точно вимагала б принаймні добавки прізвища вундеркінда, типу - закон Ципфа-Пупкіна. Звучить? Але звуків фанфар ми не чули.

І знову логіка разом із деяким життєвим досвідомпідказує: розробники пошукових алгоритмів ранжирування трохи загралися. Розумію їхнє нелегке завдання: кожен член команди повинен постійно доводити свою ефективність, креативність, фонтанувати ідеями. От і дофонтанували вони на нашу голову.

Експерименти оптимізаторів.

Ну, не потрібно стріляти з гармати за нашими статтями-горобцями: не годяться наші опуси для ваших із Зіпфом експериментів, шановні розробники. На малих вибірках ці закономірності притягнуто за вуха. Це, звичайно, суто моя думка. У мережі мені траплялися й протилежні: закон Ципфа, мовляв, покращив позиції сайту у видачі, тексти стали помітно цікавішими і так далі, так само. Багато хто намагається аналізувати ТОП на відповідність розподілу Ципфа та робити на цій основі якісь висновки. Стоп, панове! На тлі близько восьмиста факторів, які пошуковики враховують під час ранжування, ви намагаєтеся відстежити вплив одного? Ну, це нікуди годиться! Дослідження не проводять, їх результати не можна визнати коректними.

При всьому моєму негативному відношенніне до Ципфи (науку я поважаю), а до невиправданих спроб повірити в черговий раз гармонію алгеброю, я не раз аналізувала свої роботи на природність онлайн сервіси. На прохання замовників, зрозуміло. Можу сказати, що живий людська мовабез канцеляризмів, штампів та тавтології дуже легко допомагає подолати зипофські бар'єри. Досягти 70-80% природності тексту - це неважко. Бажаючі можуть перевірити свої тексти, наприклад. Займатися цим постійно, гадаю, не потрібно. Тим більше, не варто робити ставку на лисицю-Ципфу для просування. Чесне слово, друзі, не витрачайте час та енергію на антинаукові експерименти.

Цей текст має 87% природності. Достатньо. Думаю, що навіть якщо я наздожену показники до 98%, то це не вплине на позиції у видачі. За моїми прогнозами, цій статті ТОП не світить. Ну, та гаразд, зате сказала, про що хотіла.

До побачення друзі.

Ваш гід по країні Копірайтінг GALANT.



Останні матеріали розділу:

Перше ополчення у смутні часи презентація
Перше ополчення у смутні часи презентація

Слайд 1Смутний час Слайд 2На початку XVII століття Російська держава була охоплена пожежею громадянської війни та глибокою кризою. Сучасники...

Слова паразити у дитячій мові
Слова паразити у дитячій мові

Однією з найважливіших проблем сучасного суспільства є проблема мови. Ні для кого не секрет, що останнім часом наша мова зазнала...

Презентація для уроків літературного читання у початковій школі про Е
Презентація для уроків літературного читання у початковій школі про Е

Слайд 2 04.11.2009р. Н.С. Папулова 2 Олена Олександрівна Благініна. (1903-1989) – російський поет, перекладач. Слайд 3 Дочка багажного касира на...