Частотний словник російської. Визначення терміна "частотний словник"

Матеріал з Вікіпедії – вільної енциклопедії

Частотний словник(або частотний список) - набір слів цієї мови (або підмови) разом з інформацією про частоту їхньої зустрічальності. Словник може бути відсортований за частотою, за алфавітом (тоді для кожного слова буде вказана його частота), за групами слів (наприклад, перша тисяча найбільш частотних слів, за нею друга тощо), за типовістю (слова, частотні для більшості текстів), і т. д. Частотні списки використовуються для викладання мови, створення нових словників, додатків комп'ютерної лінгвістики, досліджень у галузі лінгвістичної типології, і т.д.

Побудова частотних списків

Зазвичай частотні словники будуються на основі корпусів текстів: береться набір текстів, представницький для мови в цілому, для деякої предметної областіабо даного автора (див. Частотний словник Грибоєдова) і з нього витягуються словоформи, леми та частини мови (останні витягуються у разі, якщо корпус має морфологічну розмітку).

Проблеми при створенні частотних списків полягають у:

  • відтворюваності (чи будуть результати ідентичні на іншому аналогічному корпусі),
  • сплесках частоти окремих слів(Частота слова в одному тексті може вплинути на його позицію в частотному списку),
  • складності визначення позиції менш частотних слів, що дає можливості ранжувати їх раціонально; наприклад, слово білібердавходить до 20 000 найбільш частотних слів, тоді як слово хрюкнутизнаходиться поза списком перших 40 тисяч.

Всі ці проблеми пов'язані з тим, що зі статистичного погляду мова є велика кількістьрідкісних подій (Закон Ципфа), у результаті невелика кількість слів зустрічається дуже часто, а переважна більшість слів мають дуже невисоку частоту. Частота слова і(найчастішого слова російської мови) приблизно в 10 разів вище частоти слова о, яке у свою чергу зустрічається у 100 разів частіше за такі звичайні слова як подорож, старістьабо мода.

Для опису сплесків частоти можна використовувати метафору хобіту (Адам Кілгарріфф спочатку використовував відносно рідкісне англійське слово whelk, вид морського молюска, англ. whelk ): якщо кілька текстів у корпусі про хобіти, це слово вживатиметься майже у кожному реченні. В результаті його частота в цих текстах буде порівнянна з частотою службових слів, але й у частотному списку великого корпусу, до якого входять такі тексти, це слово матиме неправдоподібно високий ранг. Такі сплески частоти можна оцінювати за допомогою коефіцієнта варіації: відношення стандартного відхилення до середньої частоти.

Порівняння корпусів

Частотні словникизабезпечують можливість порівняти два корпуси, щоб визначити слова найбільш характерні для кожного з них. У зв'язку з тим, що розміри корпусів можуть бути різні, більш надійна оцінка частоти слів полягає в приведенні їх до чмс (частота мільйон словоформ, англ. ipm, instances per million words ). Слово імає частоту близько 30 000 год. старість- близько 30.

Для визначення набору ключових слів, Що відрізняють один корпус від іншого можна використовувати різні статистичні заходи: хі-квадрат, відношення правдоподібності (англ. Likelihood-ratio test ) і т.п.

Див. також

Напишіть відгук про статтю "Частотний словник"

Література

  • Adam Kilgarriff// International Journal of Lexicography. - 1997. - № 10 (2). – P. 135-155.
  • Ляшевська О. Н., Шаров С. А.. – М.: Азбуковник, 2009. – 1087 с. - ISBN 978-5-91172-024-7.
  • Частотний словник // Велика радянська енциклопедія: [30 т.] / гол. ред. А. М. Прохоров. - 3-тє вид. -М. : Радянська енциклопедія, 1969-1978.
  • Частотний словник російської / Під ред. Л. Н. Засоріна. – М.: Російська мова, 1977.
  • // Лермонтовська енциклопедія/АН СРСР. Ін-т русявий. літ. (Пушкін. Будинок); Наук.-ред. рада вид-ва «Рад. Енцикл.». – М.: Рад. Енцикл., 1981. – С. 717-774.
  • Шаров С. А. .
  • Штейнфельдт Е. А.Частотний словник сучасної російської літературної мови. - М., 1973.

Посилання

Уривок, що характеризує Частотний словник

Зупинені піхотні солдати, товплячись у розтоптаному біля мосту бруду, з тим особливим недоброзичливим почуттям відчуженості та глузування, з яким зустрічаються зазвичай різні пологивійськ, дивилися на чистих, хизуватих гусар, що струнко проходили повз них.
– Ошатні хлопці! Аби тільки на Подновинське!
- Що від них користі! Тільки напоказ і водять! – говорив інший.
- Піхота, не пилюки! – жартував гусар, під яким кінь, загравши, бризнув брудом у піхотинця.
- Проганяв би тебе з ранцем переходу два, шнурки щось повитерлися б, - обтираючи рукавом бруд з обличчя, говорив піхотинець; - а то не людина, а птах сидить!
— То б тобі тебе, Зикін, на коня посадити, спритний би ти був, — жартував єфрейтор над худим, скрюченим від тяжкості ранця солдатиком.
– Дубинку між ніг візьми, ось тобі й кінь буде, – озвався гусар.

Решта піхоти поспішно проходила мостом, опираючись воронкою біля входу. Нарешті візки всі пройшли, тиснява поменшала, і останній батальйон вступив на міст. Одні гусари ескадрону Денисова залишалися з того боку мосту проти ворога. Ворог, далеко видно з протилежної гори, знизу, від мосту, не був ще видно, тому що з лощини, якою текла річка, горизонт закінчувався протилежним піднесенням не далі півверсти. Попереду була пустеля, де десь ворушилися купки наших роз'їзних козаків. Раптом на протилежному піднесенні дороги з'явилися війська в синіх капотах та артилерія. То були французи. Роз'їзд козаків риссю відійшов під гору. Всі офіцери і люди ескадрону Денисова, хоч і намагалися говорити про стороннє і дивитися на всі боки, не переставали думати тільки про те, що було там, на горі, і безперестанку все вдивлялися в плями, які вони визнавали за ворожі війська. Погода після полудня знову проясніла, сонце яскраво спускалося над Дунаєм і навколишніми темними горами. Було тихо, і з тієї гори зрідка долинали звуки ріжків та криків ворога. Між ескадроном та ворогами вже нікого не було, крім дрібних роз'їздів. Порожній простір, сажнів за триста, відділяв їх від нього. Ворог перестав стріляти, і тим ясніше відчувалася та сувора, грізна, неприступна і невловима риса, яка поділяє два ворожі війська.
«Один крок за цю межу, що нагадує межу, що відокремлює живих від мертвих, і – невідомість страждання і смерть. І що там? хто там? там, за цим полем, і деревом, і дахом, освітленим сонцем? Ніхто не знає і хочеться знати; і страшно перейти цю межу, і хочеться перейти її; і знаєш, що рано чи пізно доведеться перейти її і дізнатися, що там, з того боку риси, як і неминуче дізнатися, що там, з того боку смерті. А сам сильний, здоровий, веселий і роздратований і оточений такими здоровими та роздратовано жвавими людьми». Так якщо і не думає, то відчуває будь-яка людина, що знаходиться на увазі ворога, і це почуття надає особливий блиск і радісну різкість вражень усьому, що відбувається в ці хвилини.
На бугрі у ворога з'явився димок пострілу, і ядро, свистячи, пролетіло над головами гусарського ескадрону. Офіцери, що стояли разом, роз'їхалися на місця. Гусари старанно почали вирівнювати коней. В ескадроні все замовкло. Усі поглядали вперед на ворога та на ескадронного командира, чекаючи на команду. Пролетіло інше, третє ядро. Очевидно, що стріляли по гусарах; але ядро, рівномірно швидко свистячи, пролітало над головами гусар і вдарялося десь позаду. Гусари не оглядалися, але при кожному звуку пролітаючого ядра, ніби по команді, весь ескадрон зі своїми різноманітними обличчями, стримуючи дихання, поки летіло ядро, підводився на стременах і знову опускався. Солдати, не повертаючи голови, косилися один на одного, з цікавістю дивлячись на товариша. На кожному обличчі, від Денисова до горниста, здалося біля губ і підборіддя одне загальна рисаборотьби, роздратування та хвилювання. Вахмістр хмурився, оглядаючи солдатів, ніби загрожуючи покаранням. Юнкер Миронов нагинався під час кожного прольоту ядра. Ростов, стоячи на лівому фланзі на своєму зворушеному ногами, але видному Грачику, мав щасливий вигляд учня, викликаного перед великою публікою до іспиту, в якому він впевнений, що відзначиться. Він ясно і ясно оглядався на всіх, ніби просячи звернути увагу на те, як він спокійно стоїть під ядрами. Але і в його обличчі та ж риса чогось нового і суворого, проти його волі, показувалася біля рота.
– Хто там кланяється? Юнкег "Міг"онів! Hexoг"шо, на мене дивіться"! - Закричав Денисов, якому не стояло на місці і який крутився на коні перед ескадроном.
Курносе і чорноволосе обличчя Васьки Денисова і вся його маленька збита фігурка з його жилистим (з коротким пальцем, покритим волоссям) пензлем руки, в якій він тримав ефес витягнутої наголо шаблі, було таке саме, як і завжди, особливо надвечір, після випитих двох пляшок. Він був тільки звичайнісінький червоний і, задерши свою волохату голову вгору, як птахи, коли вони п'ють, безжально втиснувши своїми маленькими ногами шпори в боки доброго Бедуїна, він, ніби падаючи назад, поскакав до іншого флангу ескадрону і хрипким голосомзакричав, щоб оглянули пістолети. Він під'їхав до Кірстена. Штаб ротмістр, на широкій і статечній кобилі, кроком їхав назустріч Денисову. Штаб ротмістр, зі своїми довгими вусами, був серйозний, як і завжди, тільки очі його блищали більше, ніж звичайно.

Частотні словники - це словники, у яких містяться числові показники вживаності слів; слова в них розташовуються залежно від частоти вживання слів у текстах певної довжини. Цей порівняно новий типлексикографічних видань у Останніми рокамистав особливо активно розвиватися у зв'язку з впровадженням у лексикографію нових технологій.

Частотні словники дають великий матеріалдля вирішення низки загальнотеоретичних та прикладних лінгвістичних проблем, вони необхідні при складанні навчальних словників, розробки підручників, лінгвометодичної адаптації текстів.

Першим у вітчизняному мовознавстві частотним словником був «Частотний словник сучасної російської мови» Е.А. Штейнфельдт, складений за матеріалами сучасної літератури, преси, радіопередач (50-60-ті рр. XX ст.) та адресований насамперед викладачам російської мови як нерідної. У ньому представлені дані про частотність слів, отримані з урахуванням обробки текстів обсягом 400 000 слів. Словник містить слова, що покривають до 80%. різних текстів. Крім звичайних вказівок на кількість вживань, наводиться кількість текстів, у яких дане слововідзначено. Даються статистичні характеристикидеяких морфологічних категорій. Словник Е.А. Штейнфельдт став основою для складання багатьох навчальних тлумачних словниківта словників-мінімумів.

«Частотний словник російської» під редакцією Л.Н. Засоріною є зведенням статистичних даних про лексичному складісучасної російської. Словник був складений на основі обробки засобами обчислювальної техніки 1 млн слововжитків; він охоплює не лише мову художньої літератури, але також публіцистичну та ділову мову, що існувала у сфері масової комунікації. Хронологічні рамкисловника, як зазначають укладачі, «обіймають епоху від творів Леніна та Горького до 60-х років», тому дослідники одержують цінний матеріал для вивчення лексики радянської доби. Алфавітно-частотний словник включає всі лексеми, що зустрілися в текстах, кожна лексична одиниця має кількісними характеристиками. Частотний словарь містить слова із частотою 10 і від, всього 9044 одиниці, які у порядку зменшення частот. Різноманітні статистичні характеристики одиниць словника створюють основу вивчення статистичної структури словникового складуросійської, визначення меж основний лексики. У додатку наводиться той, хто має велике практичне значенняперелік омографів та граматичних омонімів.

Сучасні бази даних дали сильний імпульс розвитку частотних словників. «Частотний словник сучасної російської мови» О. М. Ляшевської та С. А. Шарова заснований на колекції текстів Національного корпусу російської мови, які представляють сучасну російську мову періоду 1950-2007 рр. Обсяг вибірки, де побудовано більшість розділів словника, становить 92 млн слововжитків. У словнику міститься різноманітна статистична інформаціяпро 50 000 номінальних та 3000 власних імен та абревіатур. Наводяться частотні списки лексики, характерної для публіцистики, усного мовленнята інших функціональних стилів, а також списки найбільш уживаних іменників, прикметників, дієслів та слів інших частин мови. Електронна версіясловника опубліковано на сайті Інституту російської мови ім. В. В. Виноградова Російської академіїнаук (http://dict.ruslang.ru).

Проект «Частотного словника словоформ російської мови» А. В. Венцова і Є. В. Грудьової є першою в історії складання частотних словників російської спробу організувати за частотою не лексеми, а акцентно розмічені словоформи. Словник складено з урахуванням одномільйонного Корпусу російської літературної мови (www.narusco.ru). У проекті представлено повний описсловника та його основні розділи у вигляді обмежених вибірок.

У «Частотному тематичному словнику „Міський громадський транспорт 44» Г.А. Мартиновича представлені результати дистрибутивно-статистичного аналізу однієї понятійної області – 74 521 000 слововжитків, вилучених із корпусу російських газетвідділу машинного фонду російської Інституту російської ім. В. В. Виноградова, та 29 500 прикладів з текстів 9 російських газет за 1997 р.

Багато частотних словників носять прикладний характер і адресовані насамперед упорядникам програм, словників-мінімумів, навчальних посібників з російської. Одні з них фіксують загальновживану лексику, інші пов'язані зі спеціальною чи жанрово та стилістично закріпленою частиною словникового складу.

«Частотний словник сучасної російської» П.І. Харакоза складається з двох частин, що являють собою два різних частотних словника, виконаних на різному мовному матеріалі: один на текстах підручників початкових класів, інший - на дитячому матеріалі розмовної мови. У першій частині представлено 5025 слів, що становлять 91,6% всіх слововжитків у 15 підручниках. Слова представлені у частотних та алфавітних списках. У другій частині представлено 2830 слів побутової дитячої розмовної мови, розташованих за частотою та алфавітом.

Словник "2830 слів, найбільш вживаних в російській розмовній мові" відображає ядро ​​найбільш вживаних слівсучасної розмовної мови; він складений на основі аналізу живої розмовної мови, записаної на магнітну плівку (1964-1966 рр.). Загальний об'єм зібраного матеріалу 400 000 слововжитків. Список представлений у двох варіантах - за алфавітом та за поширеністю.

«Список найбільш уживаних слів російської» під редакцією З.П. Даунене включає слова першої тисячі 13 частотних словників та списків російської мови, складених на основі різноманітних матеріалів. Список налічує 3917 слів, що включає як знаменні, так і службові слова. Поруч із кожним словом вказуються джерела, у яких воно зафіксовано, і кількість цих джерел, що дозволяє виділити найбільш уживану лексику.

У «Частотний словник мови газети» Г.П. Полякової та Г.Я. Солганика виявились включеними 1997 слів, що мають частоту не менше 12 у газетних текетах довжиною 200 000 слововжитків. У словнику представлений загальний списокслів за спадною частотою, що покриває в середньому 80-83% газетного тексту.

«Комплексний частотний словник російської наукової та технічної лексики» П.М. Денисова та ін містить списки 3047 найбільш уживаних слів російської наукової та технічної літератури(Частотний, алфавітний, інверсійний, з угрупованням частинами мови), а також таблиці, що дозволяють судити про поширеність тих чи інших граматичних явищ у мові науково-технічної літератури.

"Частотний словник загальнонаукової лексики" включає 2074 слова. В основу словника покладено текст 400 000 слів (словоформ). Джерелами стали підручники для вузів шести галузей знання: математики, фізики, хімії, біології, медицини, геології з географією. З кожного джерела брався один уривок обсягом 2000 словоформ. Було обстежено 200 таких вибірок. Слова представлені у частотних та алфавітних списках.

Виданням зведеного, узагальнюючого типу є книга «Лексичні мінімуми російської», створена за редакцією В. В. Морковкіна. Відкривається словник списком «Основні структурні лексичні одиниці російської мови», який поєднує неповнозначні слова та словосполучення, що забезпечують функціонування повнозначних сліві формують модальну структуру тексту (наприклад, бувати, у вигляді, на увазі, якраз, як тільки, крім того, власне, таким чином, хоча, цілий і т.п.). Далі йдуть переліки слів наростаючого обсягу, що охоплюють лексичне ядро ​​сучасної російської мови: 1) 500 найуживаніших російських слів, 2) 1000 найуживаніших російських слів, 3) 1500 слів, 4) 2000 слів, 5) 0 0 7) 3500 слів. Третя частина книги є тематичний словник-мінімум сучасної російської мови, мета якої - доцільно організувати і уявити сукупності найважливіших російських слів, необхідні забезпечення продуктивних видів мовної діяльності- говоріння та листи. Важливу частину книги становить розділ, що становить порівняльну та узагальнену цінність найбільш уживаних слів російської за даними 8 частотних словників. Таким чином, словник є цінним посібником для методистів та викладачів російської мови, які займаються складанням навчальних посібників, книг для читання, які готують практичні матеріалидля навчальної роботи.

p align="justify"> Особливе місце серед частотних словників займають словники, які можуть бути використані в автоматичних інформаційно-пошукових системах. Так, «Частотний словник індексування» (під редакцією Л. В. Сахарного) складено для вирішення інформаційно-пошукових завдань. Матеріалом для словника послужили 1660 рефератів з електровимірювальних приладів (загалом близько 105 тис. слововжитків). Принципи складання словника можна застосовувати до будь-якої галузі знань. В основу словника покладена нова для лексикографії одиниця - гіперлексема (деяка безліч однокорінних лексем однієї або різних частинмови, пов'язаних між собою відносинами трансформації, похідності: інерція, інерційність, інерційність ; зуб, зубець, зубчастий, зубцевий). У словнику гіперлексеми розташовані за рівнем частотності.

«Частотний словник семантичних множників російської» Ю.Н. Караулова складено за матеріалами визначень у тлумачних словниках сучасної російської мови. Одиницями рахунку у ньому є семантичні множники, які у вигляді сегментів повнозначних слів, є компонентами дефініцій. Відображаючи статистичну та семантичну структуруправої частини тлумачних словників, частотний словник може використовуватися для досліджень в області лексичної семантики, а також у практиці лексикографії та інформаційного пошуку. У вступної статтіпоказано можливості застосування словника знаходження смислового зв'язку слів при автоматичному побудові російського тезауруса.

"Частотний словник мови масової комунікації" Б. В. Кривенко є першим досвідом частотного словника, побудованого на матеріалі не тільки письмових текстів (газета "Комсомольська правда", районні газети), але і промови(Радіо, телебачення, кінохроніка). Словник дає синхронний зріз лексичного рівня мови газети, інформаційних передач радіо та телебачення за 1965-1985 роки. Загальна довжина текстової вибірки 71164 слововживання. У словнику представлені списки слів зі спадання частотності, списки слів за абеткою. Перші місця у списку найчастіших слів (за винятком службових слів та займенників) займають слова рік, робота, країна, день, колгосп, справа, час, партія, новий, рада, робітник, радянський, народ, район, сьогодні, місто, організація, людина, голова, секретар, великий, область, ім'я, світ, республіка, план.Частотність слів у мові засобів масової інформаціїчудово відбиває особливості радянського політичного дискурсу, набір ідеологем радянського часу. « Статистичний словникросійської газети» А.Я. Шайкевича та ін. дає уявлення про частотність лексики в газетах 90-х років. XX ст. Ці ж мети переслідує словник О. В. Голованя.

Дослідження частотності лексичних одиниць дозволяє зробити важливі висновки про особливості мови та стилю письменника. Невипадково в останні роки видано велику кількість частотних словників мови художніх творівросійських письменників та поетів (див. розділ «Авторські словники»).

Вінцов Л.В., Грудьова Є.В. Частотний словник словоформ російської: проект. Череповець: Череповець, держ. ун-т, 2008. 204 с.

Голован О. В. Частотний словник сучасної мовизасобів масової інформації: навчальний посібник. Барнаул: Вид-во Алт. держ. техн. ун-ту ім. І.І. Повзунова, 2006. 622 с.

Граудіна Л.К., Іцкович В.А., Катлінська Л.П. Граматичні варіанти: досвід частотного словника / Ріс. акад. наук, Ін-т лінгв, дослід. М: Наука, 1971. 102 с.

Денисов П.М., Морковкін В.В., Саф'ян Ю.А. Комплексний частотний словник російської наукової та технічної лексики. М: Російська мова, 1978. 406 с.

Караулов Ю.М. Частотний словник семантичних множників російської / відп. ред. С.Г. Бархударів. М: Наука, 1980. 207 с.

Комплексний навчальний словник. Лексична основа російської мови: / В. В. Морковкін, Н.О. Бьоме, І.А. Дорогонова, Т.Ф. Іванова, І.Д. Успенська; за ред. В.В. Морковкіна. М.: ACT, 2004. 880 с. .

Кривенко Б. В. Частотний словник масової комунікації. Воронеж: Вид-во Воронеж, ун-ту, 1992. 218 з.

Кудашева М.А., Левіна Р.І. Частотний словник найбільш уживаних дієприкметників з геології, мінералогії, кристалографії, геодезії: навчальний посібник. Л.: Ленінгр. гірничий ін-т ім. Г. В. Плеханова, 1974. 29 с.

Лексичні мінімуми сучасної російської / В. В. Морковкін, Ю.А. Саф'ян, Є.М. Степанова, І.В. Дорофєєва; за ред. В. В. Морковкіна; Ін-т русявий. яз. ім. А.С. Пушкіна. М.: Російська мова, 1985. 608 с.

Лексичний мінімум з російської як іноземної: базовий рівень: загальне володіння / упоряд. Н.П. Андрюшина, Т.В. Козлова.

4-те вид., Випр. та дод. СПб.: Золотоуст, 2004. 111 с. (Тест з російської як іноземної). [Те ж у 2001 р.].

Лексичний мінімум з російської як іноземної: другий сертифікаційний рівень: загальне володіння / упоряд. Н.П. Андрюшина (відп. ред.) [та ін]. 3-тє вид. СПб. : Золотоуст, 2011. 162 с. (Російська державна систематестування громадян зарубіжних країнз російської мови). [Те ж у 2009 р.].

Лексичний мінімум з російської як іноземної: перший сертифікаційний рівень: загальне володіння / сост. Н.П. Андрюшина (відп. ред.) [та ін]. 5-те вид., Випр. та дод. СПб.: Золотоуст,

2011. 195 с. (Російська державна система тестування громадян зарубіжних країн з російської). [Те ж у 2002, 2005 рр.].

Лексичний мінімум з російської як іноземної: елементарний рівень: загальне володіння / упоряд. Н.П. Андрюшина, Т.В. Козлова. 4-те вид., Випр. СПб. : Золотоуст, 2012. 79 с. (Тест з російської як іноземної). [Те ж у 2000, 2004 рр.].

Ляшевська О.М., Шаров С. А. Частотний словник сучасної російської мови (на матеріалах Національного корпусу російської мови) [статистична інформація про 50 000 номінальних та 3000 власних імен та абревіатур] / Ріс. акад. наук, Ін-т русявий. яз. ім. В. В. Виноградова. М: Азбуковник, 2009. 1087 с.

Мартінович Г.А. Частотний тематичний словник "Міський громадський транспорт". СПб. : Філол. фак. С.-Петерб. держ. ун-ту,

Полякова Г.П., Солганік Г.Я. Частотний словник газети . М: Вид-во Мийок. держ. ун-ту, 1971. 281 с.

Саф'ян Ю.А. Частотний словник російської технічної лексики. Єреван: Барцрагуйн дпроц, 1971. 128 с.

Система лексичних мінімумівсучасної російської: 10 лексичних списків: від 500 до 5000 найважливіших російських слів / Держ. ін-т русявий. яз. ім. А.С. Пушкіна; сост. Т.Ф. Богачова, Н.М. Луцька, В. В. Морковкін, З.П. Попова; за ред. В. В. Морковкіна. М: Астрель: ACT, 2003. 768 с.

Список найбільш уживаних слів російської / сост. Л.Г. Вишнякова, З.П. Даунене, Т.П. Ішанова, Р.М. Нефьодова; за заг. ред. З.П. Даунене. М.: Акад. пед. наук СРСР, НДІ виклад. русявий. яз. у нац. школі, 1974. 160 с.

Тер-Місакянц 3. Т. Частотний словник математичної лексики / за ред. В.М. Григоряна, Р.С. Манучаряна. Єреван: Єреван, держ. ун-т, 1973. 67 с.

Харакоз П.І. Частотний словник сучасної російської. Фрунзе: Мектеп, 1971. 180 с.

Частотний словник геологічної лексики: навчальний посібник/уклад. В.І. Рубкалева, М.А. Кудашева, Є.М. Вал [та ін]; наук. ред. В.І. Рубкальова. Л.: Ленінгр. гірничий ін-т ім. Г. В. Плеханова, 1973. 64 с.

Частотний словник індексування / за заг. ред. Л. В. Цукрового.

Перм: Вид-во Перм. ун-ту, 1974. 828 с.

Частотний словник загальнонаукової лексики/уклад. М.І. Зикіна, В.І. Крупчанова, М.М. Нахабіна [ідр.]; за ред. Є.М. Степанової. М: Вид-во Мийок. держ. ун-ту, 1970. 87 с. Частотний словник російської [близько 40 000 слів] / за ред. Л.М. Засоріною; сост. В.А. Аграєв, В.В. Бородін, Л.М. Засоріна, В.М. Муратова, Е.В. Тисенка; спец. наук. ред. М.І. Привалова. М: Російська мова, 1977. 934 с.

Шайкевич Л.Я., Андрющенко В.І., Ребецька Н.А. Статистичний словник російської газети: (1990-ті роки) / Ріс. акад. наук, Ін-т русявий. яз. ім. В.В. Виноградова. М.: Мови слов'янської культури: видавець А. Кошелєв, 2008. Т. 1. 578 с. (Studia philologica).

Шилова Г.Є., Стернін І.А. Частотний словник іншомовних слів: (за матеріалами публіцистики) / Воронеж, держ. ун-т, міжрегіон, центр комунікатив. дослідні. Воронеж: Витоки, 2005. 126 с. Штейнфельдт Е.А. Частотний словник сучасної української літературної мови: довідник для викладачів російської мови / за ред. В.А. Іцковича. М.: Прогрес, 1973. 228 с. .

Шурпаєва М.І. Диференційований словник-мінімум російської мови за видами мовної діяльності для початкових класів дагестанської національної школи. Махачкала: Дагучпедгіз, 1982. 153 с.

ЧАСТОТНИЙ СЛОВНИК

вид словника (Див. Словник) (зазвичай одномовного), у якому лексичні одиниці характеризуються з погляду ступеня їх уживаності в сукупності текстів, представницьких або мови в цілому, або окремого функціонального стилю(Див. Стиль), або одного автора. Залежно від типу лексичні одиниці різняться Ч. с. словоформ, слів (лексем), основ слів (використовуються в інформатиці), слів у певних значеннях(семантичний Ч. с.), словосполучень. Розрізняються абсолютні та відносні характеристикивживаності лексичної одиниці (x).Абсолютною характеристикою є частота ( f) даної лексичної одиниці ( х), рівна числу вживань хв обстеженій сукупності текстів f(x). У Ч. с. наводиться або f(x), або нормована частота

де N -кількість досліджених слів тексту. Відносною характеристикою уживаності лексичної одиниці є або її ранг (кількість лексичних одиниць, які в даному Ч. с. більшою чи меншою точністю. У більшості Ч. с. наводяться і абсолютні та відносні характеристики. Ч. с. використовуються для створення ефективних методикнавчання мови, виділення ключових слів (в інформатиці), до створення раціональних кодів (теоретично зв'язку).

Літ.:Єрмоленко Г. Ст, Лінгвістична статистика. Короткий нариста бібліографічний покажчик, Алма-Ата, 1970; Штейнфельдт Еге. А., Частотний словник сучасної російської мови, М., 1973; Частотний словник російської, під ред. Л. Н. Засоріної, М., 1977; Kučera Н., Francis W., Computational analysis of present-day American English, Providence, 1967; Kvantitativni lingvistika, Statni knihovna ČSSR, 1964-1972; Meier Н., Deutsche Sprachstatistik, Bd 1-2, Hildesheim, 1964; Dictionnaire des fréquences vocabulaire littéraire des XIX та XX siecles, v. 1-4, P.- Nancy, 1971 (Centre de recherche pour un trésor de la langue française); Bailey R., Doležel L., Annotated bibliography of statistical stylistics, Ann Arbor, 1968.

У останні десятиліттяу межах лексикографії складається новий напрямок – лексикографічна статистика. Лексикографічна статистика займається створенням частотних словників і вирішує пов'язані з цим завданням теорії та методики створення такого словника.

Частотні словники є списки слів, у яких зазначені частоти їх вживання, тобто. цифри, що показують, скільки разів це слово зустрічається у текстах.

Перші у вітчизняній лексикографії частотні словники з'явилися торік у 60-ті р. ХХ століття. Так було в 1963 р. в Таллінні було видано «Частотний словник сучасної російської» З. А. Штейнфельдт. Словник містить 2500 найуживаніших слів. Цей словник багато років служив джерелом визначення лексичних мінімумів для авторів шкільних підручниківросійської мови у національній школі.

Відомі та інші частотні словники, що вийшли у 60-ті – 70-ті рр.: «2380 найбільш уживаних слів російської розмовної мови» (1968), «Частотний словник загальнонаукової лексики» під ред. В. М. Степанової (1970), «Частотний словник мови газети» Г. П. Полякової та Г. Я. Солганика (1971), «Комплексний частотний словник російської наукової та технічної лексики, 3047 слів» П. Н. Денісова, В .В. Морковкіна, Ю. Л. Саф'яна (1978).

Під час створення частотних словників дедалі частіше почали використовувати можливості обчислювальної техніки. Це підняло лексикографічну статистику на якісно новий рівень.

Своєрідним результатом роботи з аналізу частотності слів російської мови стало видання «Частотного словника російської» під ред. Л. Н. Засоріної (1977). Словник містить 40 000 слів. Укладачі мали на меті визначити межі активного словникового складу і дати достатньо повні відомостіпро жанрову диференціацію сучасної лексики.

Частотний словник складається з двох частин: власне частотний список, який фіксує слова в порядку їх спадних частот, та алфавітно-частотний список, в якому ці ж слова розташовані в алфавітному порядку.

Алфавітно-частотний словник цього словника містить такі характеристики:

1) частоту:

· загальну частоту по всій вибірці;

· Частоту за жанрами (I - газетно-журнальні тексти; II - драматургія; III - наукові та публіцистичні тексти; IV - художня проза).

2) кількість текстів за жанрами, у яких зустрілося це слово.

Наприклад:

Таблиця 2

У частотному словарі слова розташовані в порядку зменшення частот. Наприклад:

Таблиця 3

Частотні словники можуть бути використані для вивчення різних аспектівлексики. За даними частотних словників виділяються слова з високою частотністю та низькочастотні слова. Це дозволяє виявити ядро ​​та периферію лексики, розмежувати активний та пасивний запас, визначити стилістичну приналежністьта жанрову приуроченість лексики, її соціально-вікове розшарування. Облік статистичних даних є важливим при вирішенні проблеми нормалізації мови, при виборі кола слів для включення до словника навчальних словників, при перекладі текстів з однієї мови на іншу.

В якому відібрано найбільш уживані слова (звичайно в межах декількох тисяч). Як посібник для викладачів було видано “Частотний словник сучасної російської літературної мови” Еге. А. Штейнфельдт (1963 р.). У словнику, що містить 2500 слів, дається список слів за частотою, списки слів частинами мови, із зазначенням частотності деяких форм, і загальний список слів за абеткою. У 1968 р. вийшов словник "2380 найбільш уживаних слів російської розмовної мови", підготовлений викладачами російської Університету дружби народів ім. Патріса Лумумби. Більш повним за складом є виданий США частотний словник Г.Г. Йоссельсона (1953 р.), побудований на різноманітному за жанрами матеріалі з загальною кількістюслів близько одного мільйона і містить 5230 слів, що наводяться у двох списках; у першому вказану кількість слів розбито на шість груп у порядку спадної частотності вживання, у другому слова розташовані в алфавітному порядку, із зазначенням номера групи, в якій слово подано у першому списку. Оцінюючи і використання цього словника слід пам'ятати, що майже половина обстежених текстів належить до дореволюційному періоду (з них 25% до періоду 1830-1900 рр.), тому лінгвостатистичні висновки, що випливають з цього матеріалу, у багатьох випадках не відображають сучасне слововживання. Особливий вибір матеріалу є у двох частотних словниках Фр. Маліржа. Один із них (1951 р.) створений на матеріалі радянських газетта журналів 1948 р., інший (1961 р.) побудований на аналізі текстів листів радянських школярів до чехословацьких; обидва переслідують навчальні цілі. У 1970 р. вийшов “Частотний словник загальнонаукової лексики” за редакцією Є. М. Степанової, а 1971 р. “Частотний словник мови газети” Р. П. Полякової і Р. Я. Солганика. Етимологічний словник. Словник, що містить слова з поясненням їхнього походження. Першим російським етимологічним словником був “Корнеслов російської, порівняного з усіма найголовнішими слов'янськими прислівниками і двадцятьма чотирма іноземними мовами” ф. С. Шимкевича (1842 р.). У словнику розроблено 1378 коренів повсякденних російських слів, у часто є довільні зіставлення і помилкові твердження. Наступним у хронологічному порядкубув “Досвід словника російської порівняно з мовами індоєвропейськими” М. Іююмова (1880 р.), який стояв також невисокому теоретичному рівні. Вище за якістю, хоча невільним від неправильних пояснень, був “Порівняльний етимологічний словник російської” М. У. Горяєва (1892 р.). Найбільш відомий з дореволюційних видань "Етимологічний словник російської мови" А. Г. Преображенського (за життя автора вийшло в 1910-1916 рр. 14 випусків, об'єднаних у два томи; закінчення було опубліковано в 1949 р. в "Працях Інституту російської мови ”; словник повністю перевиданий фотомеханічним способом). Словник містить пояснення етимології багатьох загальновживаних російських слів та частини запозичених. Як ті, так і інші групуються за первісними словами або корінням. При словах, що рідко зустрічаються, зазвичай наводяться посилання на письменників. Хоча словник далеко не сповнений і містить чимало застарілих для нашого часу або просто невірних пояснень, він і зараз є важливим посібником з етимології. У 1961 р. вийшов “Короткий етимологічний словник російської” М. М. Шанського, У. У. Іванова і Т. У. Шанської, під редакцією З. Р. Бархударова. Словник, виданий як науково-популярний посібник для вчителя середньої школи, містить етимологічне тлумачення загальновживаних слів сучасної російської літературної мови, що входять до неї активний запас. При поясненні російських слів зазвичай наводиться послідовність словотворчого процесу (друге видання вийшло 1971 р., третє, виправлене і доповнене,- 1975 р.). Для шкільної практики призначалися тауже пробний "Шкільний етимологічний словник", створений колективом мовознавців Калінінського державного педагогічного інститутупід керівництвом Г. М. Мілейковської і який розглядає 180 коренів (1957 р.), і словник "Чому не інакше?" Л. В. Успенського, що містить цікаві розповіді про життя слів (1967). У 1970 р. з'явився "Етимологічний словник російської мови" Г. П. Циганенко, виданий у Києві. Словник має науково-популярний характер і як довідкового посібникапризначений для вчителів-словесників та учнів середньої школи. З 1963 р. став виходити окремими випусками "Етимологічний словник російської мови", робота над яким ведеться в етимологічному кабінеті Московського державного університетупід керівництвом М. М. Шанського. Словник, призначений для фахівців-філологів, передбачається видати у восьми основних та двох додаткових томах, у яких буде дана етимологія діалектизмів та застарілих слів. Етимологічні дослідженняу сфері російської проводяться і там. У 1950-1958 рр. у Гейдельберзі окремими випусками вийшов тритомний. "Російський етимологічний словник" М. Фасмера (у 1964-1973 рр.. під назвою "Етимологічний словник російської мови" з доповненнями перекладача О. Н. Трубачова він був виданий російською мовою в чотирьох томах у Москві). Цей словник є найбільшим зі словників даного типуі містить, крім загальних іменників, досить велику кількість імен осіб і географічних назв. Проте словник не вільний від неточностей, помилок, невиправданих зіставлень. Нині розпочато видання багатотомного “Етимологічного словника слов'янських мов. Праслов'янський лексичний фонд”, що здійснюється за редакцією О. М. Трубачова. У першому випуску (1974 р.) міститься передмова з викладом принципів реконструкції праслов'янської лексики, списки літератури та власне словник. До типу етимологічних словниківпримикає “Короткий топонімічний словник” В. А. Ніконова, що містить відомості про походження та долю близько 4 000 назв найбільших географічних об'єктівСРСР та зарубіжних країн (1966 р.), а також

"Словник російських особистих імен" М. А. Петровського, що включає близько 2600 особистих імен і повідомляє відомості про їх походження (1967 р.), і "Словник назв жителів (РРФСР)" (під редакцією А. М. Бабкіна), в якому зібрано близько 6000 назв мешканців населених пунктів Російської Федераціїта назв мешканців столиць союзних республік(1964 р.), “Словник назв жителів СРСР” (під редакцією А. М. Бабкіна та Є. А. Левашова), у додатку якого наводиться також перший досвід зборів назв жителів міст розвинених країн (1975 р.).



Останні матеріали розділу:

Атф та її роль в обміні речовин У тварин атф синтезується в
Атф та її роль в обміні речовин У тварин атф синтезується в

Способи отримання енергії в клітці У клітці існують чотири основні процеси, що забезпечують вивільнення енергії з хімічних зв'язків при...

Вестерн блотінг (вестерн-блот, білковий імуноблот, Western bloting) Вестерн блоттинг помилки під час виконання
Вестерн блотінг (вестерн-блот, білковий імуноблот, Western bloting) Вестерн блоттинг помилки під час виконання

Блоттінг (від англ. "blot" - пляма) - перенесення НК, білків та ліпідів на тверду підкладку, наприклад, мембрану та їх іммобілізація. Методи...

Медіальний поздовжній пучок Введення в анатомію людини
Медіальний поздовжній пучок Введення в анатомію людини

Пучок поздовжній медіальний (f. longitudinalis medialis, PNA, BNA, JNA) П. нервових волокон, що починається від проміжного і центрального ядра.