Можливості використання машинного перекладу у роботі перекладача у професійній сфері. Текст наукової роботи на тему «Машинні системи перекладу: якість та можливості використання»

1947 – дата народження машинного перекладу (МП) як наукового напряму. Уоррен Уівер, директор відділення з природничих наук Рокфеллерівського фонду, написав листа Норберту Вінеру, в якому розглядав завдання перекладу текстів з одних мов на інші як ще одну область застосування техніки дешифрування. За цим листом було багато дискусій.

1947 - А. Бут та Д. Бріттен розробили докладний «код»
для послівного машинного перекладу.

1948 - Р. Річенс запропонував правила розбиття словоформ
на основу та закінчення.

1952 - перша конференція з МП у Массачусетському технологічному інституті.

1954 - представлена ​​перша система МП - IBM Mark II - російсько-англійська, яка мала словник у 250 одиниць та 6


граматичних правил. Наступне десятиліття було часом бурхливого розвитку МП.

1967 - спеціально створена США Комісія Національної Академії наук, з реальної ситуації з перекладами США і показників вартості різних способів перекладу, дійшла висновку у тому, що машинний переклад нерентабелен. Доповідь суттєво загальмувала розвиток МП загалом.

70-ті роки - відродження інтересу до робіт у галузі МП. З розвитком обчислювальної техніки виникли нові можливості машинної реалізації лінгвістичних алгоритмів.

80-ті роки - час роботи персональних комп'ютерів значно подешевшало, машинний переклад став економічно вигідним.

90-ті роки - відзначається чергове зростання інтересу до машинного перекладу, що з появою і бурхливим розвитком Internet/ Intranet. Переваги використання машинного перекладу є особливо очевидними при отриманні онлайнового перекладу.

У 1990 р. Ларрі Чаїлдс, спеціаліст з машинного перекладу, запропонував наступну класифікацію систем машинного перекладу:

FAMT (Fully-automated machine translation) - повністю авт
томатизований машинний переклад;

НАМТ (Human-assisted machine translation) – машинний
переклад за участю людини;

МАНТ (Machine-assisted human translation) - переклад, осу
людина з використанням комп'ютера.

Як перекладає комп'ютер

Машинний переклад - це така специфічна сфера застосування комп'ютерів, у проблемах якої майже кожен почувається більш-менш фахівцем.

По-перше, очевидно, що що більше словник, то краще переклад, отже, перша проблема - проблема створення великих словників для систем.


По-друге, ясно, що система має перекладати пропозиції на кшталт «Привіт, як справи?». Значить, ще одна проблема – навчити систему розпізнавати стійкі звороти.

По-третє, зрозуміло, що пропозиція для перекладу пишеться за певними правилами, за певними правилами перекладається, а отже є ще одна проблема: записати всі ці правила у вигляді програми. Ось, власне, і все.

Найцікавіше, що ці проблеми дійсно є основними при розробці систем машинного перекладу, інша річ, що методи їх вирішення відомі далеко не всім і не такі прості, як може здатися.

Словник

Методи організації великих баз даних досить добре розроблені, але для перекладу не менше, а можливо, і важливіше правильно структурувати інформацію, яка приписується елементу бази, правильно вибрати цей елемент. Скільки, наприклад, записів у словнику має відповідати звичайному російському слову програма? І взагалі, великий словник – це словник, що містить багато словникових статей, чи словник, що дозволяє розпізнати багато слів із тексту?

При найближчому розгляді виявляється, що, наприклад, іменники російською змінюються за відмінками і за числами, тобто. для одного іменника може існувати до 12 різних форм, а для дієслів та прикметників, як правило, існує ще більша кількість різних форм (понад тридцять). Отже, щоб перекладати речення, що містять слова "програму", "програмі", "програми" і т.д., добре було б мати спосіб співвіднесення словникової статті з автоматичного словника для слова "програма" з відповідною словоформою з тексту. Тому для опису і вхідної, і вихідної мови в системі має існувати певний формальний метод опису морфології, на якому ґрунтується вибір одиниці словника.

Проте розробка опису морфології дозволяє вирішити лише проблему те, що є заголовком словникової статті, яким відбувається ідентифікація одиниці тексту і одиниці словника. Але ж ідентифікація слова з тексту зі словниковою статтею відбувається не задля ідентифікації, вона необхідна для виконання програмою власне процедур перекладу. Яка ж інформація потрібна у словниковій статті та як мають бути описані правила перекладу для того, щоб програма перекладала?

Граматика

Тут необхідно зробити невеликий історичний відступ, оскільки машинний переклад як область прикладної лінгвістики має драматичну історію. У 1950-х роках практично з появою перших обчислювальних машин виникла ідея машинного перекладу, до речі, термін «машинний переклад» існує саме з тих часів. Простота завдання, що здається, породила деяку лінгвістичну ейфорію, і було розпочато кілька глобальних проектів зі створення систем перекладу для різних мов. Жоден з них не призвів до створення працюючих систем, і в 1967 р. спеціальна комісія Національної Академії наук США оголосила машинний переклад неперспективним і не заслуговує на фінансування. Тільки на початку 80-х років лінгвісти більш-менш оговталися від такого суворого вердикту і відновили дослідження в галузі МП. Звичайно, багато в чому це пожвавлення було пов'язане з розвитком обчислювальної техніки взагалі і з інтересом до проблем штучного інтелекту як застосування комп'ютерів зокрема.

Глобальні проектияк і раніше були орієнтовані рішення завдання перекладу загалом. Вони розглядалися розробка описи лексичних одиниць у словнику та розробка алгоритмів перекладу як різні завдання. З'явилося багато лінгвістичних робіт, які пропонують структуру опису властивостей живого слова у словниковій статті машинного словника. Не з'яви-


лялось лише реальних комерційних систем, у яких ці дослідження хоч якось поєднувалися б. Всі системи, які так чи інакше існували, мали скромне доповнення «експериментальна» чи «прототип». Але реально жодна з таких систем ніколи не була доопрацьована до системи масового використання. Це відбувалося тому, що застосовувані методи опису перекладу при перенесенні їх у природне середовище (тобто при застосуванні до довільних текстів) суперечили методам, пропонованим для формування словникових статей.

В той же час локальні проектибули орієнтовані рішення лише вузьких завдань. Установкою розробників було отримання хоч якихось практичних результатів.

Хоча обидва ці підходи не дали комерційних систем, роботи, які проводились у цьому напрямі, дозволили усвідомити складність завданняі, принаймні, встановити вузькі місця у подібних розробках. Так чи інакше, але саме з локальних проектів з'явилися системи перекладу, які зараз пропонують кінцевий користувач.

Виявилося, що дуже продуктивно розглядати систему перекладу не як транслятор, завданням якого є переклад тексту, допустимого з погляду вхідної граматики, а як деяку складну систему, завданням якої є отримання результату при довільних вхідних даних, у тому числі й для текстів, які не є правильними для граматики, з якою працює система.

Замість прийнятого лінгвістичного підходу, що передбачає виділення послідовних процесів аналізу та синтезу пропозиції, в основу архітектури систем було покладено уявлення процесу перекладу як процесу з об'єктно-орієнтованою організацією, що ґрунтується на ієрархії оброблюваних компонентів пропозиції.

Спочатку пояснимо деякі визначення. Разом з розвитком машинного перекладу як галузі прикладної лінгвістики з'явилися і класифікаціїсистем. Стало прийнято ділити системи переведення на системи типу TRANSFER та системи типу

INTERLINGUA. Цей поділ ґрунтується на особливостях архітектурних рішень для лінгвістичних алгоритмів.

Алгоритми перекладу для систем типу TRANSFER будуються як композиція трьох процесів: аналіз вхідної пропозиції в термінах структур вхідної мови, перетворення цієї структури на аналогічну структуру вихідної мови (TRANSFER) і потім синтез вихідної пропозиції отриманої структури.

Системи типу INTERLINGUA припускають апріорі наявність деякої метамови структур (INTERLINGUA), якою можна описати всі структури як вхідної, так і вихідної мов у загальному випадку. Тому алгоритм перекладу у системі типу INTERLINGUA передбачається як простіший: аналіз вхідної пропозиції в термінах метамови і потім синтез із метаструктури відповідної пропозиції вихідної мови. «Єдина» складність у цьому випадку – розробити саму метамову та описати природну мову у відповідних термінах.

Незважаючи на те, що ця класифікація існує і в середовищі розробників машинного перекладу вважається хорошим тоном запитати, до якого типу належить ваша система, не було розроблено ще жодної реальної системи, заснованої на принципі INTERLINGUA.

Хотілося б сподіватися, що ці відомості дозволять потенційним користувачам систем перекладу зрозуміти, що створення системи машинного перекладу - завдання не таке просте і, що називається, наукомістке. Отже, кількість дійсно придатних для використання систем перекладу, яка може з'являтися в одиницю часу, є принципово обмеженою.

2.2.3. Класифікація систем

1. Системи машинного перекладу (МП)

Системи машинного перекладу – програми, що здійснюють повністю автоматизований переклад. Головним


Критерієм програми є якість перекладу. Крім цього, для користувача важливою є зручність інтерфейсу, легкість інтеграції програми з іншими засобами обробки документів, вибір тематики, утиліта, поповнення словника. З появою Інтернету основні постачальники систем МП включили у свої продукти web-інтерфейси, забезпечивши їх інтеграцію з іншим програмним забезпеченням та електронною поштою, що дозволило застосовувати механізми МП для перекладу web-сторінок, електронних листів і онлайнових розмовних сеансів.

2. Системи з функцією Translation Memory (TM)

Системи з функцією Translation Memory (TM) надають кошти так званого Machine-assisted human translation (МАНТ) - перекладу, виконуваного людиною з допомогою машини.

Вони засновані на технології Translation Memory (TM) на противагу МП, машинному перекладу. Ідея полягає у зберіганні бази даних перекладів, зроблених професійним перекладачем, щоб у процесі перекладу пропонувати людині вже готовий переклад фрази чи шматка тексту, якщо він вже одного разу перекладено. Причому збіг фрази не обов'язково має бути буквальним, а може визначатися критеріями «схожості», закладеними в програму, з можливістю їхнього налаштування користувачем. ТМ-програми дуже корисні в ситуаціях, в яких необхідно зробити переклад оновленої версії документа, який було переведено раніше. Така потреба виникає за підтримки мультимовних сайтів. Програма швидко виявить у документі місця, що зазнали змін з часу попередньої версії документа, і людині залишиться перекласти лише ці частини, що змінилися. ТМ-програми значно підвищують ефективність роботи перекладача, позбавляючи його від рутинної роботи, що повторюється. У багатьох фірмах, що займаються перекладом, володіння однією з таких програм є суттєвим критерієм прийому працювати.


3. Контрольована мова та машинний переклад на основі бази знань

У системах на основі контрольованої мови реалізовано перехід від вільної вхідної мови до контрольованої вхідної мови. Контроль вхідної мови передбачає певні обмеження лексики, граматики, семантики. Контрольована вхідна мова використовується для спрощення виразів вихідного тексту, щоб підвищити якість перекладу.

■-

4. On-line перекладачі

Служби онлайнового перекладу виконують переклад у вікні броузера, не вимагаючи установки програми на комп'ютер користувача. Достатньо багато посилань на безкоштовні сервіси машинного перекладу із вказівками напрямів перекладів наведено за адресою http://rivendel. com/~ric/resources/free. html.

Як правило, існує обмеження на обсяг тексту, що вводиться.

Безкоштовний онлайновий переклад можна зробити також за адресами:

http://www.t-mail.com/;

http://www.freetranslation.com/.

5. Словники on-line

Найбільш повний список словників представлений за адресою http://members.aol.com/Mgierhake/trans.html. У словниках on-line існує можливість пошуку, є рядок введення та меню для вибору вхідної та вихідної мови. Серед словників даного виду відомі LOGOS ONLINE DICTIONARY (англійська, французька, німецька, іспанська, італійська, чеська), TRADOS MultiTerm, Langenscheid's New College Dictionary on-line і т.д.

6. Послуги з перекладу в Інтернеті

Практично кожна компанія – виробник систем МП пропонує послуги з перекладу. Наприклад, на сторінці

Languge Partners International (http://www.languagepartners.com/reg-forms/inq-trans.html) організовано службу перекладів, яка обробляє будь-який електронний документ за допомогою систем МП та відправляє назад без редагування. Користувач може надати терміни для поповнення словника на свою тематику (за додаткову плату) або сам його створити. Швидкість перекладу – 1 робочий день. Вартість – 0,04 долара за слово (приблизно 8 доларів за сторінку). За додаткову плату надаються послуги сканування. Напрями перекладу: англійська-французька-англійська, англійська-німецька-англійська, англійська-італійська-англійська, англійська-іспанська-англійська, англійська-португальська-англійська, англійська-японська-англійська, англійська-російська-англійська. Однак найчастіше користувачеві надається можливість вибору: отримати лише машинний переклад, або машинний переклад з наступним редагуванням професійним перекладачем, або переклад, виконаний професійним перекладачем. Такі сервіс можна зустріти за адресою http://www.plustranslation.com/ (сервіс компанії Transparent Language). Ціна варіюється від 0,01 долара за слово при машинному перекладі до 0,38 за перекладу за участю перекладача. Подібні послуги є у SYSTRAN, L&H, Langscheidt, Language Engineering Corporation.

2.2.4. Інноваційні технології компанії ПРОМТ

Провідні співробітники компанії ПРОМТ почали займатися дослідженнями в галузі прикладної лінгвістики та вивчати моделі побудови систем машинного перекладу понад 20 років тому наприкінці 1970-х років. Дослідження велися у лабораторії інженерної лінгвістики ЛДПІ ім. А.І. Герцена (нині педагогічний університет). Накопичений теоретичний багаж ліг в основу технологій МП, що розробляються в компанії ПРОМТ.


За 10 років з моменту заснування компанії ПРОМТ вдалося створити передові технології МП, в основі яких закладено сучасні лінгвістичні алгоритми, розробки в галузі математичного моделювання та нейронних мереж. На основі цих технологій були розроблені системи машинного перекладу, які за якістю на 30% перевершують провідні світові аналоги.

У 2000 році компанія ПРОМТ випустила сімейство систем МП на основі нового ядра перекладу. У новому ядрі реалізовано технології розширених мереж переходів та формалізму нейронних мереж, що вивело машинний переведення на якісно новий рівень, а також останні розробки в галузі алгоритмів семантичного аналізу та синтаксичного розбору.

Новим кроком у розвитку МП компанії ПРОМТ стало використання технології F2F, що забезпечує збереження всієї форматної інформації у процесі перекладу, що дозволило здійснювати переклад складноформатованих документів без втрати форматних ознак.

Крім розвитку власне технології машинного перекладу, були докладені спеціальні зусилля до того, щоб реалізувати в нових системах можливість лінгвістичного налаштування, що забезпечує значне покращення якості перекладу для спеціалізованих текстів.

Зокрема, поява підтримки тематик у новому ядрі дозволила кардинально змінити підхід до перекладу спеціалізованих текстів. Використання тематик вирішило проблему лінгвістичного налаштування системи на спеціалізовані тексти та забезпечило ефективність їх збереження.

Легкість та зручність лінгвістичного адміністрування систем МП було реалізовано на базі наступних технологій:

AutoDetect для реалізації автоматичного визначення
теми документа;

SmartFolders для попереднього завдання тематики
вода всім документам, що знаходяться у певній папці;

KeyWords - вибір тематики на основі попереднього
цього списку ключових слів;

SmartURL – можливість попереднього завдання тематики перекладу для конкретної URL-адреси.

Компанія ПРОМТ пропонує онлайнові сервіси перекладу тексту, web-сторінок та електронних листів для англійської, німецької, французької, іспанської, італійської та російської мов. Для перекладу текстів можна підключати тематичні словники.

Переклад тексту.Дозволяє перекладати будь-які тексти, набрані у вікні перекладу, або скопійовані з буфера обміну (Clipboard).

Переклад веб-сторінок.Дозволяє повністю перекладати веб-сторінки, включаючи гіперпосилання зі збереженням вихідного форматування.

Переклад електронної пошти.Дозволяє перекладати та надсилати електронні листи безпосередньо в онлайні.

WAP-перекладач.Новий переклад перекладу для користувачів мобільних телефонів.

  • I. Релігія має кілька історичних форм та пройшла тривалий шлях розвитку
  • I. Характеристика стану сфери створення та використання інформаційних та телекомунікаційних технологій у Російській Федерації, прогноз її розвитку та основні проблеми
  • I.) Історія виникнення та розвитку комп'ютерних вірусів
  • II Основні етапи та головні битви Великої Вітчизняної війни (2 години)

    • Новожилова Ганна Олексіївна

    Ключові слова

    ІНФОРМАЦІЙНІ ТЕХНОЛОГІЇ / ЕЛЕКТРОННІ СЛОВНИКИ / АВТОМАТИЗАЦІЯ ПЕРЕКЛАДУ / МАШИННИЙ ПЕРЕКЛАД / ЯКІСТЬ ПЕРЕКЛАДУ

    Анотація наукової статті з мовознавства, автор наукової роботи - Новожилова Ганна Олексіївна

    У статті докладно розглядаються дві системи машинного перекладу«ПРОМТ» та «Google Translate», які наразі є найбільш популярними серед користувачів інтернету. Робота цих систем організована за різними принципами: «ПРОМТ» працює за так званим принципом «перекладу за правилами» та копіює перекладацьку діяльність людини; Google Translate здійснює переклади за технологією, заснованою на принципі статистики. На прикладі фрагментів текстів різних жанрів пропонується лінгвістичний аналіз якості перекладівз англійської мови на російську, виконаних даними системами. У ході тестування виявляються типові помилки, які допускаються в машинному перекладі, та визначаються можливості та сфери використання кожної з перекладацьких систем. Встановлюється, що дані системи непридатні для роботи з текстами, що містять велику кількість складносурядних та складнопідрядних речень. Ці програми працюють в основному на рівні словосполучення, і їх можна успішно застосовувати для перекладу формалізованих текстів, наприклад, технічної документації, споживчих інструкцій, формальних описів тощо, для яких характерне використання простих поширених речень і в яких не містяться пропозиції зі складними синтаксичними конструкціями. Робиться висновок про те, що професійні перекладачі можуть вдаватися до допомоги цих систем у своїй практичній діяльності під час роботи з певними типами текстів, що допомагає економити час та оптимізувати процес перекладу. Однак обов'язковою умовою досягнення високого якості перекладів, виконаних за допомогою комп'ютерних програм, є їх постредагування.

    Схожі теми наукових праць з мовознавства, автор наукової роботи - Новожилова Ганна Олексіївна,

    • Постредагування машинного перекладу як актуальний напрям підготовки перекладачів у вузах

      2018 / Нечаєва Наталія Вікторівна, Світлова Світлана Юріївна
    • Мовна особа перекладача та машинний переклад

      2011 / Бабина Ольга Іванівна
    • 2009 / Коротких Г. І., Коротких Гал І.
    • Google-перекладач: практика та перспективи застосування в юридичному вузі

      2018 / Мартиненко Ірина Анатоліївна
    • Формування основ перекладацької компетенції при взаємодії студентів у комп'ютерному навчальному середовищі

      2016 / Абдуллахітов Рустам Шахранович, Дашкіна Олександра Ігорівна

    Матеріали розглядають дві системи трансформації систем, PROMT і Google Translate, які працюють на різних принципах. ПРОМТ робіт на про-званому "переведення до правил" principle. Google Translate використовує технологію, яка базується на статевих принципах. Матеріали зображені на лінгвістичній analysis of quality of translations of text fragments of different genres made from English in Russian by these systems. Більшість типових закладів зроблені з системами, що змінюються, можливості і сфери використання, які визначаються. Його автори, що системи не можуть бути використані для перетворення текстів, які є повною складовою і складними сенсаціями. Programs work mainly on the phrase level and can be fruitfully used for translating texts of formal style, for example, technical documents, manuals, etc., which contain simple extended sentences and no contain sentences with complex syntactic constructions. Автори вважають, що професійні translators можуть використовувати ці системи при роботі з певними текстовими типами; якраз, translations зроблені з системами повинні бути checked thoroughly and verified.

    Текст наукової роботи на тему «Машинні системи перекладу: якість та можливості використання»

    DOI: http://dx.doi.org/10.15688/jvolsu2.2014.3.8

    УДК 81"322.4 ББК 81.184

    МАШИННІ СИСТЕМИ ПЕРЕКЛАДУ: ЯКІСТЬ І МОЖЛИВОСТІ ВИКОРИСТАННЯ

    Новожилова Ганна Олексіївна

    Кандидат філологічних наук, доцент кафедри теорії та практики перекладу Волгоградського державного університету [email protected], [email protected]

    просп. Університетський, 100, 400062 р Волгоград, Російська Федерація

    Анотація. У статті докладно розглядаються дві системи машинного перекладу – «ПРОМТ» та «Google Translate», які наразі є найбільш популярними серед користувачів інтернету. Робота цих систем організована за різними принципами: «ПРОМТ» працює за так званим принципом «перекладу за правилами» та копіює перекладацьку діяльність людини; Google Translate здійснює переклади за технологією, заснованою на принципі статистики. На прикладі фрагментів текстів різних жанрів пропонується лінгвістичний аналіз якості перекладів з англійської на російську, виконаних даними системами. У ході тестування виявляються типові помилки, що допускаються в машинному перекладі, та визначаються можливості та сфери використання кожної з перекладацьких систем. Встановлюється, що дані системи непридатні для роботи з текстами, що містять велику кількість складносурядних та складнопідрядних речень. Ці програми працюють в основному на рівні словосполучення, і їх можна успішно застосовувати для перекладу формалізованих текстів, наприклад, технічної документації, споживчих інструкцій, формальних описів тощо, для яких характерне використання простих поширених речень і в яких не містяться пропозиції зі складними синтаксичними конструкціями. Робиться висновок про те, що професійні перекладачі можуть вдаватися до допомоги цих систем у своїй практичній діяльності під час роботи з певними типами текстів, що допомагає економити час та оптимізувати процес перекладу. Проте обов'язковою умовою досягнення високої якості перекладів, виконаних за допомогою комп'ютерних програм, є їхнє редагування.

    Ключові слова: інформаційні технології, електронні словники, автоматизація перекладу, машинний переклад, якість перекладу.

    ^ Науково-технічний прогрес тягне за собою зростання потоків інформації, якою обмінюються носії різних мов, що

    1 сприяє розширенню міжмовних меж і збільшення обсягу текстів, що вимагають щ перекладу. «В даний час переклад виконує головну функцію в процесі міжкультур-

    ної комунікації, дозволяючи людству долати труднощі в акумулюванні корисної та необхідної інформації». Сучасні перекладачі не можуть використовувати у своїй роботі лише словники. У перекладі все більше уваги приділяється аналізу електронних засобів, що дозволяють

    прискорити та оптимізувати процес перекладу. Вітчизняні та зарубіжні вчені-лінгвісти, практики та теоретики-перекладознавці, особливо фахівці у галузі перекладацького термінознавства та машинного перекладу, відзначаючи зростаючу значущість інформаційних технологій у лінгвістиці загалом та у перекладі зокрема, розробляють різні стратегії та методи їх найбільш ефективного застосування у професійній діяльності.

    Процеси глобалізації та загальнодоступність інтернету зумовили інтенсивний розвиток та вдосконалення систем інформаційного забезпечення комунікативної діяльності. На думку В.М. Шевчука, початок нового тисячоліття збігся з настанням ери інформаційної революції та у практичній діяльності професійних перекладачів та філологів за останні 20 років відбулися гігантські зміни. Багато вчених вважають, що поява комп'ютерів та інтернету стала серйозним кроком вперед у галузі практичного перекладу, дозволило значно підвищити якість перекладу, особливо при перекладі текстів з рідної мови на іноземну, а перекладачам працювати стало простіше та швидше. О.М. Усачова стверджує, що завдяки інтернету «перекладач придбав унікальну можливість виходу до світової інформаційної мережі, йому стали доступні дані звідусіль. Зміни, які це внесло у професію перекладача, настільки колосальні, що всі наслідки цього навряд чи можна оцінити» .

    Сьогодні у розпорядженні перекладача знаходяться різноманітні електронні інструменти, що прискорюють та полегшують перекладацький процес. Найбільш відомими з них є електронні перекладні словники (Lingvo, Мультитран, Мультілекс, Babylon, Polyglossum та ін), системи класу Translation Memory (TRADOS, Déjà vu, Wordfast) та ін), програми автоматичного редагування текстів, програми розпізнавання мовлення, електронні бібліотеки, термінологічні бази даних, а також сама глобальна мережа Інтернет як сховище інформаційних ресурсів. Всі ці інструменти є лише допоміжними в

    діяльності професійного перекладача, хоча вчені ще з середини минулого століття працюють над створенням систем, які б автоматично виконували бездоганні переклади з однієї мови на іншу. Перша система машинного перекладу – IBM Mark II, розроблена компанією IBM спільно з Джорджтаунським університетом, була представлена ​​у 1954 р. у Нью-Йорку. З того часу дослідження та розробки у сфері машинного перекладу не припиняються, а фахівці в галузі перекладу протягом багатьох років ведуть суперечки щодо доцільності застосування програм автоматичного перекладу. У середовищі професійних перекладачів висловлюється багато аргументів за їх використання і проти нього, але як противники, так і прихильники машинного перекладу залишаються одностайними в тому, що ці програми мають одну незаперечну перевагу - значну економію часу, що витрачається на переклад великих обсягів тексту. На сьогоднішній день існують різні системи машинного перекладу, деякі виконують переклад на досить високому рівні. Але для того, щоб виявити, які саме системи підходять для роботи з тими чи іншими мовами чи типами текстів, необхідно здійснювати тестування цих систем та аналізувати якість перекладу на основі великих фрагментів текстів. Це входить до завдань лінгвістів-перекладачів, а розробники автоматизованих програм перекладу намагаються виправляти помилки в системі, розвивати та вдосконалювати свої продукти, спираючись на результати та теоретичні обґрунтування фахівців у галузі перекладознавства.

    До основних факторів, що ускладнюють машинний переклад, дослідники відносять:

    Мовна неоднозначність, яка може бути як лексичного, так і граматичного характеру;

    Наявність складних синтаксичних структур, які можуть відрізнятися у мові оригіналу й у мові перекладу;

    Відмінності в порядку слів у реченні (прямий/зворотний, суворий/вільний);

    Наявність анафоричних зв'язків у тексті;

    Наявність ідіом, зміст яких неможливо передавати у вигляді послівного перекладу;

    наявність неологізмів;

    Існування культурних відмінностей у мовних угруповань і т. д. .

    Серед найбільш відомих автоматичних перекладачів можна виділити системи машинного перекладу "ПРОМТ" та "Google Translate". Автоматичний перекладач "ПРОМТ" працює за принципом "перекладу за правилами". Технологія цього перекладу полягає у застосуванні алгоритмів, відповідно до яких програма аналізує текст та на основі проведеного аналізу синтезує варіант перекладу. Вважається, що робота такого машинного перекладача схожа на процес мислення людини. Робота системи машинного перекладу Google Translate здійснюється за принципово іншою технологією, заснованої на статистичному обчисленні ймовірності збігів. Цією системою використовують безліч баз паралельних текстів, у яких попарно зберігаються словосполучення та його переклади. У процесі перекладу здійснюється статистичний аналіз: система підбирає еквівалент для перекладу, ґрунтуючись на частоті вжитків, і в результаті підставляє варіант, що має найвищий відсоток збігів. Слід зазначити, що Google Translate спочатку розроблявся для перекладу з англійської мови на неї, і досі англійська є мовою-посередником при роботі з іншими парами мов. Інакше кажучи, переклад здійснюється не безпосередньо: спочатку відбувається трансфер тексту з мови-оригіналу англійською, а вже потім - необхідною мовою перекладу, що багато в чому впливає на якість перекладу.

    Зіставимо приклади перекладів, виконані системами «ПРОМТ» та «Google Translate» з англійської на російську. При перекладі фрагмента тексту технічного характеру – інструкції з експлуатації електронного пристрою (ігрової приставки) – були отримані такі результати:

    Оригінал:

    Keep food and beverages away from product. Заборонено видалити liquid of any kind on this product as it mai render it inoperative. Clean with a slightly damp cloth (cold water). Не можна використовувати тверді речовини, хімічні речовини або інші хімічні речовини. Never submerge the unit in water.

    «ПРОМТ» (режим – загальна тематика, без підключення спеціалізованих словників):

    Тримайте окремо їжу та напої від продукту. Не проливайте рідину на цьому продукті, оскільки це може віддати його недіючий. Чистий із трохи вологою тканиною (холодна вода). Не використовуйте мило, миючий засіб або інші хімікати. Ніколи не занурюйте одиницю у воду.

    Google Translate (основний пропонований варіант):

    Тримайте їжу та напої від продукту. Не допускайте потрапляння рідини про цей продукт, як це може зробити його непрацездатним. Очистіть зі злегка вологою тканиною (холодна вода). Не використовуйте мило, миючі засоби та інші хімічні речовини. Ніколи не занурюйте прилад у воду.

    Слід зазначити, що обидві системи правильно розпізнали форми наказового способу, які у тексті оригіналу. Перекладач Google Translate чітко визначив часткову приналежність всіх мовних одиниць. Це становить його перевагу порівняно з «ПРОМТ», який вибрав для перекладу лексеми clean прикметник чистий, а не дієслово очистити. Ця проблема пов'язана з поширеним в англійській мовою явищем граматичної омонімії. «ПРОМТ», виконуючи переклад за граматичними правилами, неправильно дешифрував вихідну синтаксичну конструкцію і припустився помилки, оскільки в програмі не було враховано той факт, що англійська мова відноситься до аналітичного типу мов з досить суворим порядком слів і обов'язковою наявністю присудка: саме воно при перекладі було розпізнано. Google Translate визначив наявність дієслова в цьому реченні та його граматичну форму (імператив), але не розпізнав його видового значення, оскільки категорія виду в англійській мові не є облігаторною для кожної форми дієслова. У даному реченні професійний перекладач обов'язково використав би дієслово недосконалого виду, щоб підкреслити неодноразовість дії, що пропонується.

    Наведені переклади показують, що обидві системи не завжди добре справляються з вибором управління дієслів і часто-

    ють на рівні словосполучень, що стоять у безпосередній близькості один від одного (попадання будь-якої рідини про цей продукт; не проливайте рідину жодного виду на цьому продукті та ін.). При цьому здійснено і коректний вибір керування, наприклад: Ніколи не занурюйте одиницю у воду / Ніколи не занурюйте прилад у воду; Не використовуйте мило, миючий засіб або інші хімікати / Не використовуйте мило, миючі засоби та інші хімічні речовини.

    Відмінності виявляються при перекладі прислівників. Так, ПРОМТ переклав прислівник away за допомогою прислівника окремо, а Google Translate опустив це прислів'я, обмежившись перекладом прийменника from. Однак застосування функції перегляду та вибору доступних варіантів перекладу дозволяє побачити, що в Google Translate одиниці away і from розглядаються як пов'язана пара і пропонуються більш точні варіанти перекладу - далеко від, далеко від.

    У системі «ПРОМТ» є функція вибору спеціальної термінологічної галузі. При перекладі цього уривка з підключенням тематичної області «техніка: гад-жети» було отримано наступний текст:

    Тримайте окремо їжу та напої від продукту. Не проливайте рідину жодного виду на цьому продукті, оскільки це може уявити його недіючим. Чистий із трохи вологою тканиною (холодна вода). Не використовуйте мило, миючий засіб або інші хімікати. Ніколи не занурюйте модуль у воду.

    Підключення спеціалізованої тематичної області зумовило заміну лексеми одиниця лексеми модуль, що в даному контексті можна розглядати як більш вдалий варіант. При перекладі англійської дієслова render був використаний дієслово уявити, а не дієслово віддати. Однак обидва варіанти не можна вважати коректними, оскільки в даному випадку дієслово render слід перекласти за допомогою словосполучення приводити в стан (це може привести його в несправний стан).

    Якщо скористатися в системі Google Translate пропонованими для окремих словосполучень варіантами перекладу, то можна зібрати наступний текст:

    Зберігайте їжу та напої далеко від продукту. Уникайте потрапляння будь-яких рідин про цей продукт, як це може зробити його непрацездатним. Очистіть зі злегка вологою тканиною (холодна вода). Не використовуйте мило, миючі засоби та інші хімічні речовини. Ніколи не занурюйте прилад у воду.

    Наведений переклад свідчить про те, що користувачеві найчастіше пропонуються варіанти, які практично не відрізняються ні лексично, ні граматично. Однак якщо порівняти оригінал і переклад другої речення, то видно, що система зробила граматичну та лексичну трансформації, замінивши імператив дієслова spill у негативній конструкції (дослівно: не проливайте рідин будь-якого роду) на конструкцію «дієслово» + іменник» (не допускайте / уникайте влучення), але правильного керування для іменника (попадання куди-л.) розпізнати не змогла. При перекладі другої частини цієї пропозиції не було дано коректного варіанту і для багатозначного союзу as («бо оскільки»), що використовується для вираження причинно-наслідкових відносин.

    Результати аналізу представлені у наведеній нижче таблиці.

    Порівняння машинних перекладачів «ПРОМТ» та «Google Translate»

    Мовний параметр зіставлення Система машинного перекладу

    «ПРОМТ» «Google Translate»

    Нахилення + +

    Частина мови.

    Управління +/- +/-

    Лексика +/- +/-

    З таблиці видно, що обидві системи добре розпізнають спосіб; «ПРОМТ» допускає менше помилок з визначенням частково приналежності лексичних одиниць; обидві системи який завжди справляються з вибором правильного управління, підбором правильного лексичного еквівалента та нормами вживання дієслівного виду російською мовою. Проте, попри наявність помилок і неточностей, допущених програмами, можна дійти невтішного висновку у тому, що загальний зміст перекладеного фрагмента зрозумілий, і після

    внесення коректури до перекладів, виконаних кожною із систем, можна отримати текст, який цілком відповідатиме нормам російської мови.

    Наведемо як ще один приклад переклади тексту іншого жанру - енциклопедичної статті.

    Оригінал (фрагмент):

    Article 5 of North Atlantic Treaty, що потребують member states to come to aid of any member state subject to armed attack, був invoked for first and only time after the 11 September 2001 attacks, after which troops to NATO-led ISAF. Організація була задіяна в діапазоні додаткових робіт, які включають, включаючи прослуховування трейдерів до Iraq, вивчаючи в counter-piracy operations і в 2011 оforcing no-fly zone over Libya in acordcordance with U.N. Security Council Resolution 1973 року.

    Стаття 5 Північноатлантична угода, вимагаючи, щоб держави-члени прийшли на допомогу будь-якій державі-члену, яка зазнала збройного нападу, була покликана протягом першого і єдиного часу, після 11 вересня 2001 року нападає, після якого війська були розгорнуті до Афганістану під ВІДОМИМ НАТО. Організація керувала діапазоном додаткових ролей з тих пір, включаючи відправку тренерів до Іраку, допомогу в операціях протипіратства і в 2011 р. проводячи в життя безпольотну зону по Лівії відповідно до Резолюції 1973 року Ради безпеки ООН.

    "Google Translate":

    Стаття 5 Північноатлантичного договору, який вимагає держави-члени, прийшли на допомогу будь-якій країні-члені за умови збройного нападу, був викликаний вперше і єдиний раз після 11 вересня 2001 року, після чого війська були розгорнуті в Афганістані під керівництвом НАТО ISAF. Організація здійснює свою діяльність ряд додаткових ролей з тих пір, включаючи відправлення інструкторів до Іраку, допомогу у боротьбі з піратством та у 2011 році приведення безпольотної зони над Лівією відповідно до Резолюції 1973 року Ради Безпеки ООН.

    Вихідний фрагмент тексту складається з двох оповідальних речень, перша з яких є складнопідрядним і містить велику кількість конструкцій,

    побудованих на основі підрядних зв'язків між їхніми компонентами. Друге є простою поширеною пропозицією з однорідними членами, герундієм та складними синтаксичними конструкціями. Переклади дозволяють побачити, що обидві системи не розпізнають складних синтаксичних зв'язків, неправильно визначають присудок, об'єктні, атрибутивні та інші відносини у реченні. Виконані переклади є, швидше, довільним набором слів і словосполучень, не об'єднаних смисловими зв'язками. Їх, на відміну попереднього прикладу, неможливо відредагувати, не звертаючись до оригіналу.

    Представлений аналіз дозволяє зробити висновок про те, що машинні перекладачі Google Translate і ПРОМТ непридатні для перекладів текстів, що рясніють складносурядними і складнопідрядними пропозиціями, поширеними визначеннями, метафоричними порівняннями, складними синтаксичними конструкціями тощо. Переклад таких текстів може виконати лише людина, оскільки тільки він здатний до здійснення глибинних когнітивних мовних процесів. Однак машинні системи можна використовувати для перекладу з англійської на російську текстів, які досить формалізовані в мовному плані (технічна документація, споживчі інструкції, контракти тощо). Однак і в цьому випадку виконані машиною переклади вимагають обов'язкового редагування та доопрацювання вручну. Професійні перекладачі, від яких соціум, як правило, очікує на переклади високої якості, можуть вдаватися до допомоги «ПРОМТ» та «Google Translate» при перекладі текстів, обмежених у сфері функціонування, оскільки названі комп'ютерні системи часто пропонують цілком адекватні варіанти, що не потребують редагування. перекладів для окремих речень або невеликих фрагментів тексту або варіанти, що вимагають мінімальної коректури, яка займає незначний час у досвідченого перекладача. Таким чином, системи ПРОМТ і Google Translate при правильному використанні сприяють прискоренню процесу перекладу та оптимізації праці практикуючих перекладачів.

    СПИСОК ЛІТЕРАТУРИ

    1. Андрєєв, А. Машинний переклад: правила проти статистики/А. Андрєєв. - електрон. текстові дані. - Режим доступу: http://www.computerra.ru/ cio/old/offline/2007/63/329838/. - Загл. з екрану.

    2. Зубов, А. В. Інформаційні технології у лінгвістиці / А. В. Зубов, І. І. Зубова. - М.: Академія, 2004. - 208 с.

    3. Корольов, Е. І. Промислові системи машинного перекладу / Е. І. Корольов. - М.: Всесо-юз. центр перекладів, 1991. – 104 с.

    4. Марчук, Ю. Н. Комп'ютерна лінгвістика / Ю. Н. Марчук. - М.: АСТ: Схід-Захід, 2007. -320 с.

    5. Новожилова, А. А. Навчання студентів-перекладачів роботі з електронними ресурсами як основа їхньої майбутньої конкурентоспроможності та успішності / А. А. Новожилова, Є. А. Шовгеніна // Вісник Волгоградського державного університету. Серія 6, Університетська освіта. -2013. - №> 14. - С. 70-76.

    6. Соловйова, А. В. Професійний переклад за допомогою комп'ютера / А. В. Соловйова. -СПб. : Пітер, 2008. – 160 с.

    7. Тіссен, Ю. В. Інтернет у роботі перекладача / Ю. В. Тіссен // Світ перекладу. - 2000. -. № 2. -С. 45-62.

    8. Усачова, А. Н. Інноваційні технології у професійному перекладі / А. Н. Усачова // Комунікативні аспекти сучасної лінгвістики та лінгводидактики: матеріали Міжнар. наук. конф., м. Волгоград, 29 січ. 2008 р. – Волгоград: Волгогр. наук. вид-во, 2008. -С. 81-87.

    9. Усачова, А. Н. Переклад: від лінгвістичної теорії до когнітивної моделі / А. Н. Усачова // Вісник Волгоградського державного університету. Серія 2, Мовазнавство. – 2011. – J№ 1 (13). -С. 131-137.

    10. Шевчук, В. Н. Інформаційні технології у перекладі. Електронні ресурси перекладача – 2/ В. Н. Шевчук. - М.: Зебра Е, 2013. -384 с.

    11. Шевчук, В. Н. Електронні ресурси перекладача/В. Н. Шевчук. - М.: Лібрайт, 2010. -136 с.

    12. Austermühl, F. Electronic Tools for Translators / F. Austermühl. - Manchester: St. Jerome, 2001. - 192 p.

    13. Bowker, L. Computer-Aided Translation Technology: A Practical Introduction / L. Bowker. -Ottawa: Univ. of Ottawa Press, 2002. - 185 p.

    14. Комп'ютери та Translation: A Translator's Guide / H. Somers (ed.). - Amsterdam; Philadephia: John Benjamins Publ. Company, 2003. - 349 p.

    1. Andreev A. Mashinnye перевод: pravila protiv statistiki. Available at: http://www.computerra.ru/cio/ old/offline/2007/63/329838/.

    2. Зубов А.В., Зубова І.І. Інформаційні технології в лінгвістики. Moscow, Akademiya Publ., 2004. 208 p.

    3. Королев Е.І. Промислові системи машінного переводу. Москва, Всесоюзний центр переводов Publ., 1991. 104 p.

    4. Marchuk Yu.N. Компьютерная лінгвістика. Moscow, AST, Vostok-Zapad Publ., 2007. 320 p.

    5. Новозілова А.А., Шовгеніна Е.А. Обучення школярів-переводчиків працює з електронними ресурсами як основа їх майбутньої konkurentosposobnosti i успішності. Вестник Волгоградського государст-венного універсітета. Серія 6, Університетське obrazovanie, 2013, no. 14, pp. 70-76.

    6. Соловьева А.В. Професійний перевод з допомогу комп'ютера. Saint Petersburg, Piter Publ., 2008. 160 p.

    7. Tissen Yu.V. Інтернет в роботі переводчіка. Mir perevoda, 2000, no. 2, pp. 45-62.

    8. Осачева А.Н. Інноваційні технології в професійному перекладі. Коммунікативні аспекти современной лінгвістики і лінгводідактікі. Матеріали Междунородной наукової конференції. Volgograd, 29 Января 2008 . Волгоград, Волгоградське наукове izd-vo, 2008, pp. 81-87.

    9. Осачева А.Н. Перевод: від лінгвістичної теорії до когнітивної моделі.

    Вестник Волгоградського державного університету. Seriya 2, Yazykoznanie , 2011, no. 1 (13), pp. 131-137.

    10. Шевчук В.Н. Інформаційні технології в перекладі. Електронні ресурси переводчіка - 2 . Moscow, Zebra E Publ., 2013. 384 p.

    11. Шевчук В.Н. Електронні ресурси переводчіка. Moscow, Librayt Publ., 2010. 136 p.

    12. Austermühl F. Electronic Tools for Translators. Манчестер, St. Jerome, 2001. 192 p.

    13. Bowker L. Computer-Aided Translation Technology: A Practical Introduction. Ottawa, University of Ottawa Press, 2002. 185 p.

    14. Somers H., ed. Комп'ютери та Translation: A Translator's Guide. Amsterdam, Philadephia, John Benjamins Publishing Company, 2003. 349 p.

    MACHINE TRANSLATION SYSTEMS: QUALITY AND POSSIBLE WAYS OF USE

    Novozhilova Anna Alekseevna

    Candidate of Philological Sciences,

    Associate Professor, Department of Translation Theory and Practice, Volgograd State University [email protected], [email protected]

    Prosp. Університетський, 100, 400062 Волгоград, Російська Федерація

    Abstract. Матеріали розглядають дві системи трансформації систем, PROMT і Google Translate, які працюють на різних принципах. ПРОМТ робіт на про-званому "переведення до правил" principle. Google Translate використовує технологію, яка базується на статевих принципах. Матеріали зображені на лінгвістичній analysis of quality of translations of text fragments of different genres made from English in Russian by these systems. Більшість типових закладів зроблені з системами, що змінюються, можливості і сфери використання, які визначаються. Його автори, що системи не можуть бути використані для перетворення текстів, які є повною складовою і складними сенсаціями. Programs work mainly on the phrase level and can be fruitfully used for translating texts of formal style, for example, technical documents, manuals, etc., which contain simple extended sentences and no contain sentences with complex syntactic constructions. Автори вважають, що професійні translators можуть використовувати ці системи при роботі з певними текстовими типами; якраз, translations зроблені з системами повинні бути checked thoroughly and verified.

    Key words: information technologies, electronic dictionaries, computerized translation, machine translation, quality of translation.

    Перші експерименти з машинного перекладу, що підтвердили важливу можливість його реалізації, були проведені в 1954 році в Джорджтаунському університеті (Вашингтон, США). Незабаром після цього в промислово розвинених країнах світу було розпочато дослідження та розробки, спрямовані на створення систем машинного перекладу. І хоча з того часу минуло понад півстоліття, проблема машинного перекладу все ще не вирішена на належному рівні. Вона виявилася значно складнішою, ніж це уявляли собі піонери та ентузіасти машинного перекладу наприкінці п'ятдесятих – на початку шістдесятих років. Тому, оцінюючи сьогоднішню реальність, доводиться говорити як про досягнення, так і розчарування.

    Ми вже говорили про те, що для того, щоб навчити машину перекладу, на основі «семантики, що породжує» і чинної мовної моделі, «сенс ↔ текст» була створена семантична модель перекладу. Завдання полягало в тому, щоб забезпечити електронний мозок достатньою кількістю синонімів, конверсивів, синтаксичних дериватів і семантичних параметрів, якими він міг би маніпулювати в процесі перекладу. А переклад тоді розумівся лише як процес підстановки слів і словосполучень однієї мови замість слів і словосполучень іншої мови.

    Це був час, коли лінгвісти, які працювали в галузі машинного перекладу, намагалися описати природну мову за допомогою математичних символів. На відміну від Ретцкера і Федорова, які прагнули встановити існуючі закономірності з урахуванням практичних спостережень, ставили за мету створення дедуктивної теорії. Йшлося про розробку склепіння правил, застосування яких до певного набору мовних одиниць могло призвести до породження осмисленого тексту. Мовні одиниці виступали як математичних символів, які в результаті застосування до них названих правил, також виражених математично, можна було розташувати певним чином. Після декодування комбінація символів перетворювалася на текст.

    Вчені створили спеціальну мову, що складається з математичних символів, яка могла бути використана машиною як посередник при переході від вихідного тексту до тексту перекладу. Мова посередник це «метамова» перекладацької теорії. У лінгвістиці під метамовою зазвичай розуміється «мова другого порядку», тобто мова якою будуються міркування про природну мову або якісь інші явища. Так, говорячи про граматику, ми користуємося спеціальними словами, або термінами, і виразами, а при обговоренні галузі медицини, застосовуємо інший термінологічний апарат. Іншими словами, метамова, або «мова-посередник», перекладу є комплексом структурно-лінгвістичних характеристик, що дозволяють з достатньою повнотою описати процес перекладу.


    За задумом авторів теорії машинного перекладу в основі мови-посередника лежав концептуальний апарат «семантики, що породжує», і моделі «сенс ↔ текст». Було підготовлено набір правил перетворення поверхневих структур англійської в ядерні пропозиції. Вчені далі очікували, що за допомогою мови-посередника машина легко перетворює глибинні структури вихідної мови в глибинні структури перекладної мови, а потім і її поверхневі структури. Але отримані результати не були цілком задовільними. Якість машинного перекладу виявилося дуже низьким і подальші спроби покращити його до успіху на привели. У чому була причина?

    Як згадувалося раніше, вчені на той час, тобто на початку п'ятдесятих і середині шістдесятих років минулого століття, орієнтувалися на лінгвістичну теорію структуралізму, засновану на описі та інтерпретації мовних явищ строго в рамках внутрішньомовних відносин і не допускає виходу за межі мовної структури при аналізі цих явищ. Вони добре знали кожному перекладачеві-практику. А саме, важливість обліку конкретної обстановки, в якій протікає даний акт міжмовного спілкування, а також ситуації, що описується в повідомленні, що перекладається. Ця інформація з погляду якості перекладного тексту грає не меншу роль, ніж власне мовні явища.

    Для того, щоб примирити цю обставину з вимогою не виходити за межі внутрішньолінгвістичних відносин, перекладацьку діяльність пропонувалося розділити на два компоненти - власне переклад, який здійснюється за заданими правилами без звернення до позамовної дійсності, відображеної в досвіді чи сприйнятті перекладача, та інтерпретацію, що включає залучення позалінгвістичних даних.

    Але це явно йде в розріз з тим, що нам відомо про реальні процеси звичайного, тобто немашинного перекладу. Для перекладу, що здійснюється людиною характерна органічна та нерозривна єдність власне мовних та позамовних факторів. Справа в тому, що в будь-якому мовному творі далеко не все явно виражене, або, як кажуть лінгвісти, експліцитно. Багато чого зазвичай залишається невиразним, мається на увазі. Будь-яке висловлювання адресується певній особі чи певній аудиторії. Автор висловлювання при цьому виходить з того, що його слухачі чи читачі мають достатні знання для того, щоб однозначно інтерпретувати те чи інше повідомлення без уточнюючих подробиць.

    Таким чином, машинний переклад, заснований лише на аналізі формально-структурних закономірностей вихідного тексту, не дозволяє розкрити взаємодію лінгвістичних та позалінгвістичних факторів і тим самим залишає поза увагою найважливішу складову міжмовного спілкування. У цьому полягає основна причина його незадовільної якості.

    Багатьма дослідниками визнають, що і станом на даний час у машинному перекладі не відбулося жодних проривів у справі реалізації інших моделей, незважаючи на те, що можливості комп'ютерів у порівнянні з початком робіт з машинного перекладу багаторазово зросли, і виникли нові мови програмування, набагато зручніші реалізації програм зі створення машинного перекладу. Вся справа, мабуть, у тому, що інтерпретація мовних знаків щодо позамовної дійсності у багатьох відношеннях носить інтуїтивний характер і здійснюється несвідомо, або, як кажуть, «на підкірці», а те, що робиться несвідомо, не може бути формалізовано і передано машині у вигляді програмного забезпечення. Тому машинний переклад досі вимагає після себе людського редактора і є джерелом численних перекладацьких жартів.

    Так, одного разу машині було запропоновано перекласти на англійську мову, а потім відразу на російське прислів'я «З очей геть із серця геть». Остаточний варіант був таким: "Невидимий ідіот". Чому? Тому, що відповідне англійське прислів'я говорить: «Outofsight-outofmind». Машина знайшла її легко. Але при зворотному перекладі цього прислів'я російською мовою вона пішла неправильним шляхом. Справа в тому, що в російській мові є прямі відповідності обом компонентам англійської фрази: Out of sight - передається словом «невидимий», тоді як англійській outofmindвідповідає російські слова «божевільний, божевільний, ідіот». Машина цими відповідниками і користувалася. Вона просто не здогадалася, що обидві названі складові англійської фрази повинні передаватися не окремо, а як єдине ціле. Через відсутність у неї «людського фактора».

    У цілому нині рівень якості машинного перекладу суто інформативних текстів, контрактів, інструкцій, наукових доповідей тощо. значно вище, ніж текстів публіцистичного характеру. Наведемо кілька прикладів:

    Оплати за цей договір для обладнання включено в пакет 1 до контракту, що слід зробити ефективним як наступні.

    Платежі згідно з цим контрактом на обладнання, перераховане у додаванні 1 до контракту, повинні бути здійснені наступним чином.

    Yet plenty of traps await Mr. Bush if he tries to do it alone.

    Все ж таки безліч трапецієподібних м'язів чекає м. Буша, якщо він намагається йти це один.

    На ринках, Given more і sooner than they had any reason to expect, були розповсюджені всі права.

    Ринки, дані більше та швидше, ніж вони мали причину зачекати, здивований добре.

    Все сказане раніше дозволяє зробити висновок і про те, що піонери машинного перекладу та їхні найближчі послідовники досягли значних успіхів у цій галузі. Але багато найважливіших проблем їм все ж таки вирішити не вдалося. У зв'язку з цим цікавить висловлювання керівника японської державної програми з машинного перекладу професора Макото Нагао з університету Кіото. В одній зі своїх статей, опублікованих у 1982 році, він зробив таку заяву: «Будь-яка розробка систем машинного перекладу рано чи пізно зайде в глухий кут. Наша розробка також зайде в глухий кут, але ми постараємося, щоб це сталося якомога пізніше».

    Того ж року професор Наґао опублікував статтю, в якій запропонував нову концепцію машинного перекладу. Згідно з цією концепцією, тести повинні перекладатися за аналогією з іншими текстами, раніше перекладеними вручну, тобто не машиною, а перекладачем. Для цієї мети має бути сформований великий масив тематично подібних текстів та їх перекладів (білінгвів), які потім будуть введені у надпотужну багатопроцесорну ЕОМ. У процесі перекладу нових текстів із масиву білінгвів мають вибиратися аналоги фрагментів цих текстів, які можна використовуватиме формування кінцевого тексту. М.Нагао назвав свій підхід до машинного перекладу "Examplebasedtranslation" (переклад, заснований на прикладах), а традиційний підхід - "Rulebasedtranslation" (переклад за правилами).

    Концепція Макото Нагао перегукується з поширеною концепцією «TranslationMemory» (пам'ять перекладів), що називається іноді як «SentenceMemory» (накопичувач пропозицій). Сутність цієї концепції ось у чому. Під час підготовки іншомовних варіантів будь-яких документів (наприклад, експлуатаційної документації продукції машинобудівного заводу) спочатку їх переклад виконується вручну перекладачами вищої кваліфікації. Потім оригінали документів та його переклади іноземною мовою вводяться в ЕОМ, розчленовуються деякі пропозиції чи фрагменти пропозицій, і з цих елементів будується база даних, яка далі завантажується в пошукову систему. При перекладі нових текстів пошукова система шукає у яких пропозиції та частини речень, аналогічні тим, які вона є і вставляє в потрібні місця перекладуваного тексту. Таким чином в автоматичному режимі виходить якісний переклад фрагментів нового тексту, які є в базі даних.

    Не впізнані фрагменти тексту перекладаються іноземною мовою вручну. При цьому можна скористатися процедурою наближеного пошуку цих фрагментів у базі даних, а результати пошуку використовувати як підказку. Результати ручного перекладу нових фрагментів текстів знову вводяться до бази даних. У міру перекладу нових і нових документів, «пам'ять перекладів» поступово збагачується, і її ефективність зростає.

    Безперечною перевагою технології пам'ять перекладів є висока якість перекладів того класу текстів, для якого вона створювалася. Але база перекладних відповідностей, побудована для однорідних текстів одного підприємства, придатна лише для однорідних текстів близьких по профілю підприємств, оскільки пропозиції та великі фрагменти речень, які витягуються з текстів одних документів, як правило, не зустрічаються або дуже рідко зустрічаються в інших документах.

    На подолання цього обмеження «пам'яті перекладів» і, що особливо важливо, вихід із тупика, куди, судячи з усього, зайшла семантична теорія, спрямована нова концепція машинного перекладу, названа «фразеологічною теорією машинного перекладу». Головною особливістю цієї концепції є думка про те, що при перекладі як основні та найбільш стійкі одиниці сенсу слід розглядати не семантичні компоненти, які є невід'ємною частиною мови, а поняття, пов'язані з мовою через мовні значення, але при цьому виступають як самостійна форма осмислення. людиною навколишнього матеріального світу. Таким чином, робиться перший крок до того, щоб навчити машину оперувати не тільки мовними, а й позамовними аспектами перекладу.

    Нагадаю, що свідомість людини здатна відображати навколишній світ у формі двох сигнальних систем. Перша сигнальна система сприймає навколишній світ через органи почуттів. В результаті на один з органів чуття (зір, слух, дотик, нюх, смак) виникає відчуття. На основі сукупності відчуттів, пов'язаних із певним об'єктом, у людини виникає цілісне сприйняття цього об'єкта. Сприйнятий об'єкт може зберігатися у пам'яті у вигляді відповідного ставлення до нього без безпосереднього чуттєвого контакту.

    Друга сигнальна система дозволяє людині, абстрагуючись від конкретних об'єктів, формувати узагальнені поняття про навколишній світ. У понятті розрізняється його обсяг, тобто клас об'єктів, узагальнених у понятті, та зміст поняття – ознаки об'єктів, через які здійснено узагальнення. Поняттями люди оперують у спілкуванні. Для цього за кожним поняттям закріплюються певні ярлики – їх найменування у вигляді окремих слів або (що значно частіше) словосполучень. Причому в різних мовах для позначення одних і тих же понять можуть використовуватися різні ознаки (snowdrop-пролісок, eye-dog-соба-поводир, vacuumcleaner-пилосос).

    З урахуванням викладених принципів, система фразеологічного машинного перекладу загалом виглядає так. Як було зазначено, найбільш стійкими елементами тексту є найменування понять. У процесі перекладу проводиться заміна найменування понять вихідного тексту на найменування цих одиниць сенсу перекладною мовою та оформлення отриманого таким чином нового тексту у відповідність до граматичних норм перекладної мови. Як і в системах «Translationmemory», використовується принцип аналогії - слова, словосполучення та фрази, що відображають типові ситуації, перекладаються за аналогією з раніше виконаними перекладами цих одиниць. Відмінність з-поміж них у тому, що у системах типу «пам'ять перекладів» використовуються такі стійкі відрізки тексту, як поняття і типові ситуації, проте пропозиції, що у вихідному тексті.

    Зі сказаного випливає, що машинні словники є найважливішим компонентом систем фразеологічного машинного перекладу. Кількість різних слів у таких мовах, як російська та англійська, перевищує один мільйон, а кількість щодо стійких фразеологічних словосполучень обчислюється сотнями мільйонів. Фразеологічні словники такого обсягу швидко створити не вдасться. Так, обсяг словника однієї із сучасних систем «RetransVista» становить 3 млн. 300 тис. словникових статей.

    Упорядкування фразеологічних словників великих обсягів вимагатиме значних тимчасових витрат, у системах машинного перекладу постійним супутником фразеологічних словосполучень будуть окремі слова. Для їхнього перекладу, як говорилося, використовуються положення семантичної моделі, якість машинного перекладу викликає багато нарікань.

    Це, безумовно, так, але послівний переклад текстів значно кращий, ніж

    відсутність будь-якого перекладу.

    Звідси, як вважають багато фахівців у цій галузі, єдина розумна перспектива для систем машинного перекладу в XXI столітті – це поєднання фразеологічного та послівного семантичного перекладу. При цьому питома вага питома вага фразеологічного перекладу, мабуть, повинна постійно зростати, а питома вага семантичного перекладу постійно зменшуватися.

    Як показує досвід, системи машинного перекладу повинні бути орієнтовані насамперед на переклад ділових текстів у галузі науки, техніки, політики та економіки. Переклад художніх текстів – складніше завдання. Але й тут у майбутньому можна досягти певного успіху, якщо знайдуться ентузіасти на кшталт Володимира Даля, які з допомогою сучасних технічних засобів візьмуть він нелегкий працю зі складання потужних фразеологічних словників цього типу текстів.

    Додаткова література.

    1. Білоногов Г.Г. Про використання принципу аналогії під час автоматичної обробки текстової інформації. Зб. "Проблеми кібернетики", № 28, 1974.

    2. Убін І.І. Сучасні засоби автоматизації перекладу: надії, розчарування та реальність. Зб. «Переклад у світі», М., ВЦП, 2001, стор 60-69.

    На відміну від систем Автоматизованого перекладу, системи Машинного Перекладу роблять переклад текстів автоматично без участі людини.

    Форми організації взаємодії ЕОМ та людини при машинному перекладі

    * З постредагуванням: вихідний текст переробляється машиною, а людина-редактор виправляє результат.
    * З передредагуванням: людина пристосовує текст до обробки машиною (усуває можливі неоднозначні прочитання, спрощує та розмічує текст), після чого починається програмне оброблення.
    * З інтерредагування: людина втручається в роботу системи перекладу, дозволяючи важкі випадки.
    * Змішані системи (наприклад, одночасно з перед- та постредагуванням).
    * Частково автоматизований переклад: наприклад, використання перекладачем-людиною комп'ютерних словників.
    * Системи з поділом праці: комп'ютер навчений перекладати лише фрази жорстко заданої структури (але робить це так, щоб виправляти за ним не потрібно), а все, що не вклалося в схему, віддає людині.

    В англомовній термінології розрізняються терміни machine translation (MT, повністю автоматичний переклад) та machine-aided або machine-assisted translation (MAT, автоматизований переклад); якщо треба позначити і те, й інше, пишуть M(A)T.

    Історія машинного перекладу

    Ідея використовувати ЕОМ для перекладу було висловлено 1946 року, відразу після появи перших ЕОМ. Перша публічна демонстрація машинного перекладу (так званий Джорджтаунський експеримент) відбулася 1954 року. Незважаючи на примітивність тієї системи (словник у 150 слів, граматика з 6 правил, переклад кількох простих фраз), цей експеримент набув широкого резонансу: почалися дослідження в Англії, Болгарії, НДР, Італії, Китаї, Франції, ФРН, Японії та інших країнах; того ж 1954 року й у СРСР.

    До середини 1960-х США для практичного використання були надані дві системи російсько-англійського перекладу:

    * MARK (у Департаменті іноземної техніки ВПС США);
    * GAT (розробка Джорджтаунського університету, використовувалася в Національній лабораторії атомної енергії в Окріджі та в центрі Євратома у м. Іспра, Італія).

    Однак створена для оцінки подібних систем комісія ALPAC дійшла висновку, що через низьку якість машинно перекладених текстів ця діяльність в умовах США нерентабельна. Хоча комісія рекомендувала продовжувати та поглиблювати теоретичні розробки, загалом її висновки призвели до зростання песимізму, зниження фінансування, часто до повного припинення робіт із цієї тематики.

    Проте, у низці країн дослідження тривали, чому сприяв постійний прогрес обчислювальної техніки. Особливо суттєвим фактором стала поява міні- та персональних комп'ютерів, а з ними все більш складних словникових, пошукових і т. п. систем, орієнтованих на роботу з природномовними даними. Зростала і необхідність у перекладі як таке через зростання міжнародних зв'язків. Все це призвело до нового підйому цієї області, що настав приблизно з середини 1970-х. У 1980-х настав час широкого практичного використання перекладацьких систем, склався ринок комерційних розробок на цю тему.

    Втім, мрії, з якими рід людський узявся півстоліття тому за завдання машинного перекладу, значною мірою залишаються мріями: високоякісний переклад текстів широкої тематики, як і раніше, недосяжний. Однак, безперечним є прискорення роботи перекладача при використанні систем машинного перекладу: за оцінками кінця 1980-х, до п'яти разів.

    Нині існує безліч комерційних проектів машинного перекладу. Одним із піонерів у галузі машинного перекладу була компанія Systran. У Росії її великий внесок у розвиток машинного перекладу внесла група під керівництвом проф. Р. Г. Піотровського (Російський державний педагогічний університет ім. Герцена, Санкт-Петербург).

    Якість перекладу

    Якість перекладу залежить від тематики та стилю вихідного тексту. Машинний переклад художніх текстів практично завжди виявляється незадовільною якістю. Проте для технічних документів за наявності спеціалізованих машинних словників та деякого настроювання системи на особливості того чи іншого типу текстів можливе отримання перекладу прийнятної якості, який потребує лише невеликого редакторського коригування. Чим більш формалізований стиль вихідного документа, тим більшої якості перекладу очікується. Найкращих результатів при використанні машинного перекладу можна досягти для текстів, написаних у технічному (різні описи та посібники) та офіційно-діловому стилі.

    Застосування машинного перекладу без налаштування на тематику (або з навмисно неправильним налаштуванням) є предметом численних жартів. З докладних прикладів найбільш відомий текст «Гуртовики Миші» (переклад комп'ютерної документації програмою Poliglossum на основі медичного, комерційного та юридичного словників); з коротких - фраза "My cat has given birth to four kittens, 2 yellow, one white and one black", яку програма ПРОМТ перетворює на "Мій кіт народив чотирьох кошенят, два жовті кольори, одне біле й одного афроамериканця".

    Найчастіше подібні жарти пов'язані з тим, що програма не розпізнає контекст фрази та перекладає терміни дослівно, до того ж не відрізняючи власних імен від звичайних слів. Та ж програма ПРОМТ перетворює "bra-ket notation" на "примітку Кеті ліфчика", "Lie algebra" - на "алгебру Брехні", "eccentricity vector" - на "вектор оригінальності" тощо.

      Вид праці:

      Звіт з практики на тему: Машинний переклад.Система машинного перекладу PROMT

      21.03.2012 10:20:09

      Тип файлів:

      Перевірка на віруси:

      Антивірус Касперського

    • Повний текст:


      Введение…………………………………………………………………………..2

      Глава I. Машинний переклад

      Історія машинного перекладу………………………………………….…4

      Як здійснюється машинний переклад………………………………..10

      Системи машинного перекладу та їх класифікація…………...............13

      Якість машинного перевода…………………………………………..18

      Розділ II. Система машинного перекладу PROMT

      2.1 Можливості машинного перекладача сімейства PROMT…………...22

      2.2 Порівняльний аналіз перекладів художнього тексту зроблений системою машинного перекладу і людиною…………………………...…26

      Заключение………………………………………………………………….….30

      Бібліографія…………………………………………………………………..31

      Вступ


      Переклад (вид мовного посередництва, у якому зміст іноземного тексту оригіналу передається іншою мовою шляхом створення цією мовою комунікативно рівноцінного тексту.(№ 7)) має довгу історію, він сягає часів коли прамова почав розпадатися окремими мовами і виникла потреба у людях , здатних бути посередниками під час спілкування представників різних мовних громад.

      Комунікативна рівноцінність розуміється як здатність перекладеного тексту виступати як повноправну заміну вихідного тексту. (№ 7).

      Комунікативна еквівалентність нового тексту стосовно вихідного забезпечується таким:

      · передача змісту оригіналу у повному обсязі;

      · Відповідність тексту перекладу тексту оригіналу за нормами мови перекладу;

      · Текст перекладу повинен відповідати оригіналу з точки зору лаконічності та розгорнутості висловлювань для досягнення схожого стилістичного ефекту. Також переклад має бути приблизно порівнянний за обсягом.

      Актуальністьцієї проблеми зумовлена ​​тим, що історія розвитку та впровадження у повсякденне життя персональних комп'ютерів (здатних здійснювати автоматичний переклад) налічує не більше п'ятнадцяти – двадцяти років. Сьогодні програми перекладачі вміють будувати осмислені фрази та прості пропозиції, за останні кілька років якість перекладу покращилась.

      Об'єктом дослідженняє система машинного перекладу.

      Предметом дослідженняє переклад здійснений системою PROMT XT.

      Однак дані комп'ютерні програми ще недостатньо добре розуміються на граматиці, жаргонних виразах, стилістичних прийомах та багатьох інших здавалося б дрібницях, але саме з них складається гарний, зрозумілий переклад. У сучасному світі комп'ютери займають значне місце і в середовищі перекладачів, лінгвістів і фахівців, які потребують оперативного перекладу іншомовної інформації.

      Розвиток кібернетики уможливило машинний переклад, тобто. дія, що виконується на комп'ютері, з перетворення тексту однією природною мовою в еквівалентний за змістом текст іншою мовою а також результат такої дії. Нині основні сфери застосування машинного перекладу це переклад Інтернет – сторінок, посібників до техніки, електронних листів. У цьому досягається лише загальне розуміння тексту. Інше застосування цих систем – полегшення праці професійних перекладачів, зменшення витрат часу на підрядковий переклад, який згодом можна редагувати.

      Цільданої роботи – визначення наскільки можна використовувати сучасні програми для здійснення перекладу, а також яка їх ефективність.

      Відповідно до поставленої мети, завданнямидослідження є:

      · З'ясування послідовності формальних операцій, що забезпечує аналіз та синтез у системі машинного перекладу (переклад);

      · Аналіз роботи систем машинного перекладу на прикладі перекладу виробленого програмою PROMT XT;

      · Порівняння зразків перекладу з перекладом, зробленим людиною. Аналіз причин невідповідності.

      У роботі також буде окреслена історія розвитку машинного перекладу, як у нашій країні, так і за кордоном. Розглянуто алгоритм здійснення машинного перекладу, класифікацію систем машинного перекладу, проблему якості перекладу.


      Глава I. Машинний переклад.

      1.1 Історія машинного перекладу

      Вперше ідею використання механізмів для перекладу з однієї мови на іншу запропонували Лейбніц та Декарт. Вони спробували створити словник, заснований на числових кодах. Ще здавна існували ідеї про мову, зрозумілу всім, побудовану виключно на логіці, що використовує символи – піктограми. Найвідомішою розробкою у цій галузі стала «interlingua» Джона Вілкінса. Набагато пізніше було створено ще кілька штучних мов, найвідоміша з яких – есперанто Лева Знаменгофа. За свідченням біографів, знаменитий математик Чарльз Беббідж, намагаючись переконати британський уряд фінансувати його розробку «аналітичної машини», обіцяв, що в недалекому майбутньому його машина також зможе перекладати розмовну промову. Але машину так і не було збудовано.

      У 1933 році було видано два патенти на механічну систему перекладу – у Росії та у Франції. Французький вірмен Жорж Арсуні винайшов схему пристрою на паперовій стрічці для перекладу довільного слова іншою мовою і в 1937р. продемонстрував прототип системи У Росії її патент дістався Петру Смирнову – Троянському, який винайшов своєрідний лінгвістичний арифмометр. Він виділяв три стадії механічного перекладу: на першій стадії людина, яка знає вхідну мову, представляла слова та речення в «основній» формі та розставляла синтаксичні функції слів. На другій стадії машина перекладала ці форми та функції на вихідну мову, а потім, на третій стадії, отриманий текст редагував носій вихідної мови. Смирнов - Троянський вважав, що принаймні друга стадія може бути автоматизована. (№ 15)

      Історія машинного перекладу як науково-прикладного напряму розпочалася наприкінці 40-х років минулого століття. У березні 1947 р. Уоррен Уівер, директор відділення з природничих наук Рокфеллерівського фонду, у листуванні з Едрю Бутом і Норбертом Вінером вперше сформулював концепцію машинного перекладу, яку трохи пізніше (1949 р.) розвинув у своєму меморандумі, адресованому Фонду. У.Уівер писав: "Я маю текст в front of me which is written in Russian but I am going to pretend that it is really written in English and that it been coded in some strange symbols. All I need to do is strip off the code in order to retrieve the information contained in the text."" ("У мене перед очима текст, написаний російською, але я збираюся вдати, що насправді він написаний англійською і закодований за допомогою досить дивних знаків. Все що мені потрібно - це зламати код щоб отримати інформацію, укладену в тексті."). Аналогія між перекладом і дешифруванням була природною в контексті повоєнної епохи, якщо враховувати успіхи, яких досягла криптографія в роки Другої світової війни.

      · Дослідження суто зовнішніх характеристик повідомлення, таких як частота окремих елементів та поєднань елементів;

      · Вивчення дистрибуції елементів, що становлять текст;

      · Аналіз білінгів з метою виявлення збігаються елементів та використання деяких ключових елементів (власних імен та ін) з урахуванням статистичних та дистрибутивних характеристик;

      · Знаходження ключа та застосування його до всієї послідовності закодованих повідомлень. (№ 11)


      Приблизно водночас Клод Шеннон сформулював теорію інформації, а Норберт Вінер виклав концептуальні засади кібернетики. І незабаром на дослідження були виділені гроші, а машинний переказ став самостійним науковим напрямом, народженим на стику математики та програмування.

      Ідеї ​​Уівера лягли в основу підходу до МП, що ґрунтується на концепції interlingua: стадія передачі інформації розділена на два етапи; на першому етапі вихідна пропозиція перекладається на мову-посередник (створений на базі спрощеної англійської мови), а потім результат цього перекладу представляється засобами вихідної мови. Меморандум Уівера викликав найжвавіший інтерес до проблеми МП. У 1948 р. А. Бут і Річард Річенс зробили деякі попередні експерименти (так, Річенс розробив правила розбиття словоформ на основи та закінчення).

      У ті роки комп'ютери дуже відрізнялися від сучасних. Це були дуже великі та дорогі машини, які займали цілі кімнати та вимагали для свого обслуговування великий штат інженерів, операторів та програмістів. В основному ці комп'ютери використовувалися для здійснення математичних розрахунків потреб військових установ, і навіть математичних і фізичних факультетів університетів. Тому на ранніх етапах розробка систем МП активно підтримувалась військовими, при цьому в США основна увага приділялася російсько-англійському напрямку, а в СРСР – англо-російському. У 1952 відбулася перша конференція з машинного перекладу, організована логіком та математиком Й.Бар-Хіллелом. Крім очевидних практичних потреб важливу роль у становленні машинного перекладу відіграла та обставина, що запропонований у 1950 англійським математиком А. Т'юрінгом знаменитий тест на розумність («тест Тьюринга») фактично замінив питання про те, чи може машина мислити, на питання про те, чи може Чи машина спілкуватися з людиною природною мовою таким чином, що той не в змозі відрізнити її від співрозмовника-людини. Тим самим питання комп'ютерної обробки природно-мовних повідомлень на десятиліття опинилися в центрі досліджень з кібернетики (а згодом із штучного інтелекту), а між математиками, програмістами та інженерами-комп'ютерниками, з одного боку, і лінгвістами – з іншого встановилася продуктивна співпраця.

      Фактично історія машинного перекладу починається з "Джорджтаунського експерименту". фірма IBM спільно з Джорджтаунським університетом (США) успішно здійснили перший експеримент (що увійшов в історію під назвою Джорджтаунського), в ході якого система, що використовувала словник з 250 слів і граматику з 6 синтаксичних правил, здійснила переклад 49 заздалегідь відібраних речень. У тому ж 1954 перший експеримент з машинного перекладу був здійснений в СРСР І.К.Бельський (лінгвістична частина) та Д.Ю.Пановим (програмна частина) в Інституті точної механіки та обчислювальної техніки Академії наук СРСР, а перший промислово придатний алгоритм машинного перекладу та система машинного перекладу з англійської мови на російську на універсальній обчислювальній машині були розроблені колективом під керівництвом Ю.А.Моторина. Після цього роботи розпочалися у багатьох інформаційних інститутах, наукових та навчальних організаціях країни. Ідея машинного перекладу стимулювала розвиток досліджень у теоретичному та прикладному мовознавстві у всьому світі. З'явилися теорії формальних граматик, велика увага стала приділятися моделюванню мови та окремих її аспектів, мовної та розумової діяльності, питанням мовної форми та кількісних розподілів лінгвістичних явищ. Виникли нові напрями лінгвістичної науки – обчислювальна, математична, інженерна, статистична, алгоритмічна лінгвістика та низка інших галузей прикладного та теоретичного мовознавства. Протягом 1950-х років у навчальних центрах багатьох країн світу було відкрито відділення прикладної лінгвістики та машинного перекладу. Дослідження та розробки з машинного перекладу розгорнулися також у Франції, Англії, США, Канаді, Італії, Німеччині, Японії, Нідерландах, Болгарії, Угорщині та інших країнах, а також у міжнародних організаціях, де великий обсяг перекладів із різних мов.

      Перше покоління систем машинного перекладу базувалося на алгоритмах послідовного перекладу слово за словом, фраза за фразою. Можливості таких систем визначалися доступними розмірами словників, які прямо залежить від обсягу пам'яті комп'ютера. Переклад тексту здійснювався окремими реченнями, смислові зв'язки між ними не враховувалися. Такі системи називають системами прямого перекладу. На зміну їм згодом прийшли системи наступних поколінь, у яких переклад від мови до мови здійснювався лише на рівні синтаксичних структур. В алгоритмах перекладу використовувався набір операцій, що дозволяє шляхом аналізу пропозиції, що перекладається, побудувати його синтаксичну структуру за правилами граматики мови вхідної речення, а потім перетворити її в синтаксичну структуру вихідної речення і синтезувати вихідну речення, підставляючи потрібні слова зі словника. Такі системи називаються Т-системами (Т – від англійського слова "transfer – перетворення").

      Найбільш досконалим вважається підхід до побудови систем машинного перекладу на основі отримання деякого, незалежного від мов, смислового представлення вхідної речення шляхом його семантичного аналізу. Потім проводиться синтез вихідного речення за отриманим змістовим уявленням. Такі системи називають І-системами (І - від слова "інтерлінгва"). Вважається, що наступні покоління систем машинного перекладу будуть ставитись до класу І-систем.

      У 50-х роках ціла низка дослідницьких груп у США та в Європі працювали в галузі МП. У ці дослідження були вкладені значні кошти, проте результати незабаром розчарували інвесторів. Однією з головних причин невисокої якості МП в ті роки були обмежені можливості апаратних засобів: малий обсяг пам'яті при повільному доступі до інформації, що міститься в ній, неможливість повноцінного використання мов програмування високого рівня. Іншою причиною була відсутність теоретичної бази, необхідної для вирішення лінгвістичних проблем, у результаті перші системи МП зводилися до послівного (word-to-word) перекладу текстів без будь-якої синтаксичної (а тим більше смислової) цілісності.

      Виявилося, що традиційна лінгвістика не має в своєму розпорядженні ні фактичного матеріалу, ні ідей і уявлень, необхідних для побудови систем машинного перекладу, які використовували б зміст тексту, що перекладається.

      Традиційна лінгвістика не могла дати вихідні уявлення у частині семантики, а й у частини синтаксису. Для жодної мови на той час не існувало переліків синтаксичних конструкцій, не були вивчені умови їхньої сполучуваності та взаємозамінності, не були розроблені правила побудови великих одиниць синтаксичної структури з дрібніших. По суті, ні на одне питання, поставлене у зв'язку з побудовою систем машинного перекладу, традиційна лінгвістика в 50-х роках не могла дати відповіді.

      Потреба створення теоретичних основ машинного перекладу призвела до формування нового напрями у лінгвістиці, званого структурної, прикладної, математичної лінгвістикою.

      У 1959р. філософ, математик, логік Бар-Хіллел виступив із твердженням, що високоякісний повністю автоматичний МП (FAHQMT) не може бути досягнутий у принципі. Як приклад він навів проблему знаходження правильного перекладу слова pen у наступному контексті: John was looking for his toy box. Finally he found it. The box was in the pen. John був дуже happy. (Джон шукав свою іграшкову коробку. Нарешті він її знайшов. Коробка була в манежі. Джон був дуже щасливий.). Pen у разі має перекладатися не як "ручка" (інструмент для письма), бо як "дитячий манеж" (play-pen). Вибір того чи іншого перекладу в цьому випадку і в ряді інших обумовлений знанням позамовної дійсності, а це знання занадто широке і різноманітне, щоб вводити його в комп'ютер. Проте Бар-Хіллел не заперечував ідею МП як таку, вважаючи перспективним напрямом розробку машинних систем, орієнтованих використання їх людиною-перекладачем (своєї "людино-машинний симбіоз").

      Цей виступ найбільш несприятливо позначився на розвитку МП у США. У 1966 р. спеціально створена Національною Академією наук комісія ALPAC (Automatic Language Processing Advisory Committee), ґрунтуючись у тому числі й на висновках Бар-Хіллела, дійшла висновку, що машинний переклад нерентабельний: співвідношення вартості та якості МП було явно не на користь останнього. , а потреб перекладу технічних і наукових текстів було досить людських ресурсів. За доповіддю ALPAC послідувало скорочення фінансування досліджень у галузі МП з боку уряду США - і це незважаючи на те, що в той час як мінімум три різні системи МП регулярно використовувалися рядом військових та наукових організацій.

      Наступні десять років (60 – е) розробка систем МП здійснювалася у США університетом Brigham Young University у Прово, штат Юта (ранні комерційні системи WEIDNER та ALPS) та фінансувалася Мормонською церквою, зацікавленою у перекладі Біблії; у Канаді групами дослідників, серед яких TAUM у Монреалі з її системою METEO; у Європі - групами GENA (Гренобль) та SUSY (Саарбрюкен). На особливу згадку заслуговують робота в цій галузі вітчизняних лінгвістів, таких, як І.А.Мельчук та Ю.Д.Апресян (Москва), результатом якої став лінгвістичний процесор ЕТАП. У 1960 р. у складі Науково-дослідного інституту математики та механіки в Ленінграді була організована експериментальна лабораторія машинного перекладу, перетворена потім на лабораторію математичної лінгвістики Ленінградського державного університету.

      З розвитком обчислювальної техніки наприкінці 70-х (поява мікрокомп'ютерів, розвиток мереж, збільшення ресурсів пам'яті) машинний переклад увійшов у нову колію. При цьому дещо змістилися акценти: дослідники тепер ставили за мету розвиток "реалістичних" систем МП, які передбачали участь людини на різних стадіях процесу перекладу.

      Новий підйом досліджень у галузі МП розпочався у 1970-х роках і був пов'язаний із серйозними досягненнями у галузі комп'ютерного моделювання інтелектуальної діяльності. Відповідна галузь досліджень, що виникла трохи пізніше за МП, отримала назву штучного інтелекту, А створення систем машинного перекладу було осмислено в 1970-і роки як одне з приватних завдань цього нового дослідницького напряму.

      Можна виділити два основних стимули до розвитку робіт з машинного перекладу у світі. Перший – власне науковий; він визначається комплексністю та складністю комп'ютерного моделювання перекладу. Як вид мовної діяльності переклад торкається всіх рівнів мови – від розпізнавання графем (і фонем під час перекладу мовлення) до передачі сенсу висловлювання і тексту. Крім того, для перекладу характерна зворотний зв'язок та можливість відразу перевірити теоретичну гіпотезу про влаштування тих чи інших мовних рівнів та ефективність запропонованих алгоритмів. Ця характеристична риса перекладу загалом і машинного перекладу зокрема привертає увагу теоретиків, у результаті продовжують виникати нові теорії автоматизації перекладу і формалізації мовних даних, і процесів.

      Другий стимул - соціальний, і зумовлений він зростаючою роллю самої практики перекладу в сучасному світі як необхідної умови забезпечення міжмовної комунікації, обсяг якої зростає з кожним роком. Інші способи подолання мовних бар'єрів на шляху комунікації – розробка або прийняття єдиної мови, а також вивчення іноземних мов – не можуть зрівнятися з перекладом ефективності. З цієї точки зору можна стверджувати, що альтернативи перекладу немає, тож розробка якісних та високопродуктивних систем машинного перекладу сприяє вирішенню найважливіших соціально-комунікативних завдань.

      За період 1978-93 у США на дослідження в області МП витрачено 20 мільйонів доларів, у Європі – 70 мільйонів, у Японії – 200 мільйонів.

      Однією з нових розробок стала технологія TM (translation memory), що працює за принципом накопичення: у процесі перекладу зберігається вихідний сегмент (пропозиція) та його переклад, у результаті утворюється лінгвістична база даних; якщо ідентичний або подібний вихідний сегмент виявляється у тексті, що знову перекладається, він відображається разом з перекладом і зазначенням збігу у відсотках. Потім перекладач приймає рішення (редагувати, відхилити або прийняти переклад), результат якого зберігається системою. В даний час розробником відомої комерційної системи, заснованої на технології TM є система TRADOS (заснована в 1984 р.).

      В СРСР як головна організація з машинного перекладу був у 1974 визначений Всесоюзний центр перекладів науково-технічної літератури та документації (ВЦП), який взяв на себе координацію робіт у масштабі країни. Під його егідою було проведено низку великих міжнародних наукових конференцій з машинного перекладу та проблем науково-технічного перекладу. У ВЦП були створені промислові системи машинного перекладу з англійської мови на російську АМПАР (на основі досліджень та розробок колективу Ю.А.Моторина), з німецької мови на російську НЕРПА, з французької мови на російську ФРАП, автоматичні термінологічні словники на допомогу людині-перекладачеві . Система АМПАР тривалий час перебувала у промисловій експлуатації; згодом з її основі було створено ефективніші системи МП для персональних комп'ютерів сімейства СПРИНТ. У ВПЦ було також розроблено систему МП з російської мови на англійську АСПЕРУ. Великий внесок у розробку промислових систем МП було зроблено ленінградською загальносоюзною групою «Статистика промови» під керівництвом Р.Г.Піотровського, а також групами фахівців з комп'ютерної лінгвістики у Мінську (А.В.Зубов), Кишиневі (В.А.Чижаковський), Махачкале (А.І.Чапля), Чимкенте (К.Б.Бектаєв), Самарканде (Х.А.Арзикулов) та ін. На базі досліджень та науково-практичного підходу групи «Статистика мови» були згодом розроблені і зараз перебувають у комерційному використання таких систем машинного перекладу, як Stylus, Socrat та інші.

      Перші комерційні товари машинного перекладу, які знайшли практичне використання, з'явилися в середині 80-х років.

      В даний час в Російській Федерації продовжуються в незначних масштабах деякі роботи по системах МП, заснованим на підході «текст-сенс-текст», не завжди явно промовляється гаслом якого в момент обґрунтування цього підходу в 1960-х років був «машинний переклад без перекладу, без машин, без алгоритмів» (див. огляд робіт цього напряму, що належить Л.Н.Бєляєвої та М.І.Откупщикової). Ідея підходу полягала в тому, що від лінгвіста вимагається лише декларативний опис фактів мови (тобто лінгвістична теорія, що претендує, щоправда, на особливу точність та формалізованість), а алгоритми перекладу складуть програміст та математик. В рамках цих досліджень були отримані значні теоретико-лінгвістичні результати (зокрема, створена теорія так званих лексичних функцій, яка знайшла застосування в лексикографії), проте для створення практичних систем такого підходу виявився недостатньо ефективним. Можливості обчислювальної техніки, що незмірно виросли за останні десятиліття, і нові програмістські підходи ніяк не можуть допомогти реалізувати ідеї аналізу та синтезу, засновані на пріоритеті виявлення тільки синтаксичної структури з наступним переходом до змісту. Виявлення змісту тексту у межах человеко-машинного інтерфейсу може здійснюватися, як й у будь-якій прикладної задачі, лише з використанням як декларативних, і процедурних знань і за значної опорі на лексику. Ця точка зору обґрунтована, зокрема, у нещодавніх роботах вітчизняного фахівця з програмування та штучного інтелекту А.С.Наріньяні.

      1.2 Як здійснюється машинне переведення.


      Системи МП здійснюють автоматизований переклад тексту. Одиницями перекладу у своїй є слова чи словосполучення, причому останні розробки дозволяють враховувати морфологію перекладуваного слова. Розвинені системи МП здійснюють переклад за заданими розробником та/або коригованим користувачем алгоритмами перекладу. Для здійснення машинного перекладу до комп'ютера вводиться спеціальна програма, що реалізує алгоритм перекладу, під яким розуміється послідовність однозначно і суворо певних дій над текстом для знаходження перекладних відповідностей у цій парі мов А1 – А2 при заданому напрямку перекладу (з однієї конкретної мови іншою). Система машинного перекладу включає двомовні словники, забезпечені необхідною граматичною інформацією (морфологічною, синтаксичною та семантичною) для забезпечення передачі еквівалентних, варіантних і трансформаційних перекладних відповідностей, а також алгоритмічні засоби граматичного аналізу, що реалізують якусь із прийнятих для автоматичної переробки тексту формальних . Є також окремі системи машинного перекладу, розраховані переклад у межах трьох і більше мов, але вони нині є експериментальними. Найбільш поширеною є наступна послідовність формальних операцій, що забезпечують аналіз та синтез у системі машинного перекладу: 1. На першому етапі здійснюється введення тексту та пошук вхідних словоформ (слів у конкретній граматичній формі, наприклад знахідного відмінка множини) у вхідному словнику (словнику мови, з якого провадиться переклад) з супутнім морфологічним аналізом, у ході якого встановлюється належність даної словоформи до певної лексеми (слову як одиниці словника). У процесі аналізу з форми слова можна отримати також відомості, які стосуються іншим рівням організації мовної системи. 2. Наступний етап включає переклад ідіоматичних словосполучень, фразеологічних єдностей або штампів даної предметної області (наприклад, при англо-російському перекладі обороти типу that is why, in the form of отримують єдиний цифровий еквівалент і виключаються з подальшого граматичного аналізу); визначення основних граматичних (морфологічних, синтаксичних, семантичних та лексичних) характеристик елементів вхідного тексту (наприклад, числа іменників, часу дієслова, синтаксичних функцій словоформ у даному тексті), що виробляється в рамках вхідної мови; дозвіл омографії (конверсійної омонімії словоформ – скажімо, англ. why може бути іменником, вигуком, прислівником); лексичний аналіз та переклад лексем. Зазвичай на цьому етапі однозначні слова відокремлюються від багатозначних (мають більше одного перекладного еквівалента у вихідній мові), після чого однозначні слова перекладаються за списками еквівалентів, а для перекладу багатозначних слів використовуються так звані контекстологічні словники, словникові статті яких є алгоритмами запиту до контексту на наявність/відсутність контекстних визначників значення.

      3. Остаточний граматичний аналіз, у ході якого визначається необхідна граматична інформація з урахуванням даних вихідної мови (наприклад, при російських іменниках типу сани, ножиці дієслово має стояти у формі множини, незважаючи на те, що в оригіналі може бути і однина. Але в той же час "Російське" слово «порося» виявляється зворотним дієсловом зі значенням іменника. ся. Лінгвістична членність слова та членність слова, "зручна" для машини, не мають між собою нічого спільного. (№ 4))

      4. Синтез вихідних словоформ та речення в цілому вихідною мовою. Залежно від особливостей морфології, синтаксису і семантики конкретної мовної пари, і навіть напрями перекладу загальний алгоритм перекладу може й інші етапи, і навіть модифікації названих етапів чи порядку їхнього прямування, але варіації що така у сучасних системах, зазвичай, незначні. Аналіз та синтез можуть проводитися як пофразно, так для всього тексту, введеного в пам'ять комп'ютера; у разі алгоритм перекладу передбачає визначення про анафоричних зв'язків.

      Діючі системи машинного перекладу орієнтовані на конкретні пари мов (наприклад, французька та російська або японська та англійська) і використовують, як правило, перекладні відповідності або на поверхневому рівні, або на деякому проміжному рівні між вхідною та вихідною мовою. Якість машинного перекладу залежить від обсягу словника, обсягу інформації, що приписується лексичним одиницям, від ретельності складання та перевірки роботи алгоритмів аналізу та синтезу, ефективності програмного забезпечення. Будь-який досить хороший словник фіксує як слова, а й поєднання слів, що часто зустрічаються, тобто. мікроконтекст відповідних одиниць Наприклад, при слові "справжній" може бути дано поєднання "в даний час" - gegenwartig, actuellement, при слові "досвід" - поєднання: "проводити досвід" - Experiment, durchfiihren і поєднання "досвід по" - Experiment mit (experiences sur, essais de).

      Одночасно в хорошому словнику вказуються поєднання "поштовий переказ", "грошовий переказ" - ньому. Post"s anweisung, фр. mandat poste, і оскільки це поєднання нам не зустрілося, то відповідні переклади будуть виключені. (№ 18)

      Сучасні апаратні та програмні засоби допускають використання словників великого обсягу, що містять докладну граматичну інформацію. Інформація може бути подана як у декларативній (описовій), так і в процедурній (що враховує потреби алгоритму) формі.

      Сучасний машинний переклад слід відрізняти від використання комп'ютерів на допомогу людині-перекладачі. В останньому випадку мається на увазі автоматичний словник, який допомагає людині швидше підбирати потрібний перекладний еквівалент. Хоча і в тому, і в іншому випадку комп'ютер працює разом із людиною (перекладачем або редактором). У зміст терміна «машинний переклад» входить уявлення про те, що головну, велику частину роботи з перекладу та віднайдення перекладних еквівалентів та перекладних відповідностей машина бере на себе, залишаючи людині лише контроль та виправлення помилок, тоді як комп'ютерний словник на допомогу людині – це суто допоміжний засіб для швидкого знаходження переказних відповідностей; при цьому, однак, у подібних словниках в обмеженій мірі можуть бути реалізовані і деякі функції, притаманні системам машинного перекладу.

      У практиці перекладацької діяльності та в інформаційній технології розрізняються два основні підходи до машинного перекладу. З одного боку, результати машинного перекладу можуть бути використані для поверхового ознайомлення зі змістом документа незнайомою мовою. У цьому випадку він може використовуватися як сигнальна інформація і не вимагає ретельного редагування. Інший підхід передбачає використання машинного перекладу замість звичайного людського. Це передбачає ретельне редагування та налаштування системи перекладу певну предметну область. Тут відіграють роль повнота словника, орієнтованість його на зміст і набір мовних засобів текстів, що перекладаються, ефективність способів вирішення лексичної багатозначності, результативність роботи алгоритмів вилучення граматичної інформації, знаходження перекладних відповідностей та алгоритмів синтезу. На практиці переклад такого типу стає економічно вигідним, якщо обсяг текстів, що перекладаються, досить великий (не менше кількох десятків тисяч сторінок на рік), якщо тексти досить однорідні, словники системи повні і допускають подальше розширення, а програмне забезпечення зручне для постредагування. Такі системи машинного перекладу використовують у організаціях, потреби яких у оперативних і якісних перекладах досить великі.

      1.3 Системи машинного перекладу та його класифікація.

      У 1990 році Ларі Чайлдс, фахівець з машинного перекладу, запропонував наступну класифікацію систем МП за принципом незалежності машини від дій людини, яка зараз є загальноприйнятою:

      · FAMT (Fully - automated machine translation) - повністю автоматизований машинний переклад;

      · HAMT (Human – assisted machine translation) – машинний переклад за участю людини;

      · MAHT (Machine – assisted human translation) – переклад, здійснюваний людиною з допомогою комп'ютера.

      Програми машинного перекладу першою з названих категорій є справою далекого майбутнього, оскільки навіть у загальному вигляді не вирішено проблем автоматичного розуміння, перекладу та синтезу текстів. Основною проблемою є складність мови як такої. Візьмемо, наприклад, значення слова англійської " can " . Крім основного значення модального допоміжного дієслова, слово "can" має кілька офіційних і жаргонних значень як іменника: "банка", "бідон", "припинити", "перестати", "ковпак димової труби", "в'язниця". Крім цього, існує архаїчне значення цього слова - "знати чи розуміти". Якщо припустити, що у вихідної мови для кожного з цих значень є окреме слово, яким чином комп'ютер може їх розрізнити?

      Як виявилося, певних успіхів було досягнуто у сфері розробки програм перекладу, що розрізняють сенс на основі контексту. Пізніші дослідження при аналізі текстів спираються більше на теорії ймовірності. Проте сьогодні всі «коробкові» продукти – перекладачі, і онлайнові служби побудовані лише за схемою FAMT. (№ 8,15)
      Програми другої категорії розробники називають МТ-програми (від Machine translation – машинний переклад). Реально автоматизований (з участю людини) машинний переклад можливий лише в умовах штучно обмеженої, як за словниковим запасом, так і граматикою, мови. Говорячи про машинний переклад за участю людини, зазвичай мають на увазі редагування текстів як до, так і після обробки комп'ютером. Люди-перекладачі змінюють тексти так, щоб вони були зрозумілі машинам. Після того, як комп'ютер зробив переклад, люди знову редагують грубий машинний переклад, роблячи текст вихідною мовою правильним. Крім такого порядку роботи, існують системи МП, які під час перекладу потребують постійної присутності людини-перекладача, що допомагає комп'ютеру робити переклад особливо складних чи неоднозначних конструкцій. Машинний переклад за допомогою людини застосовується переважно до текстів з обмеженим вокабуляром вузько-обмеженої тематики. Економічність використання машинного перекладу за допомогою людини – питання все ще спірне. Самі програми зазвичай досить дорогі, а для роботи деяких із них потрібне спеціальне обладнання. Попередньому та подальшому редагуванню необхідно вчитися. Створення та підтримання в робочому стані баз даних слів – процес трудомісткий і найчастіше вимагає спеціальних навичок.

      Як реальний успішний проект МТ-програми завжди називають німецьку систему Meteo, яка виконує переклад метеопрогнозів з французької мови на англійську і назад.

      До МТ-програм відносяться і продукти машинного перекладу фірми ПРОМТ.

      Програми третьої категорії розробники називають ТМ-програми (від translation memory – пам'ять перекладу). Переклад, який здійснюється людиною з використанням комп'ютера. У цьому підході людина-перекладач ставиться у центр процесу перекладу, тоді як програма комп'ютера розцінюється як інструмент, який робить процес перекладу ефективнішим, а переклад - точним. Ось список найбільш відомих систем ТМ: - Transit швейцарської фірми Star, - Trados (США), - Translation Manager від IBM, - Eurolang Optimizer французької фірми LANT, - DejaVu від ATRIL (США), - WordFisher (Угорщина). Системи ТМ дозволяють виключити повторне переведення ідентичних фрагментів тексту. Переклад сегмента здійснюється перекладачем лише один раз, а потім кожен наступний сегмент перевіряється на збіг (повне або нечітке) з базою даних, і якщо знайдений ідентичний або схожий сегмент, то він пропонується як варіант перекладу. Незважаючи на широкий асортимент систем TM, вони мають кілька спільних функцій: - функція зіставлення (Alignment). Однією з переваг систем ТМ є можливість використання вже перекладених матеріалів з даної тематики. База даних ТМ може бути отримана шляхом посегментного зіставлення файлів оригіналу та перекладу. - Наявність фільтрів імпорту – експорту. Ця властивість забезпечує сумісність систем ТМ з багатьма текстовими процесорами та видавничими системами і дає перекладачу відносну незалежність від замовника. - механізм пошуку нечітких або повних збігів. Саме цей механізм і є основною гідністю систем ТМ. Якщо при перекладі тексту система зустрічає сегмент, ідентичний або близький до переведеного раніше, то перекладений сегмент пропонується перекладачеві як варіант перекладу поточного сегмента, який може бути підкоригований. Ступінь нечіткого збігу задається користувачем. - підтримка тематичних словників. Ця функція допомагає перекладачеві дотримуватися глосарію. Як правило, якщо в перекладеному сегменті зустрічається слово або словосполучення з тематичного словника, воно виділяється кольором і пропонується його переклад, який можна вставити в текст, що перекладається автоматично. - засоби пошуку фрагментів тексту. Цей інструмент дуже зручний при редагуванні перекладу. Якщо в процесі роботи було знайдено більш вдалий варіант перекладу будь-якого фрагмента тексту, цей фрагмент може бути знайдений у всіх сегментах ТМ, після чого в сегменти ТМ послідовно вносяться необхідні зміни. Звичайно, як і будь-який програмний продукт, системи ТМ мають свої переваги та недоліки, і свою сферу застосування. Однак щодо систем TM, основним недоліком є ​​їхня дорожнеча. Особливо зручно використовувати системи ТМ при перекладі таких документів, як посібники користувача, інструкції з експлуатації, конструкторська та ділова документація, каталоги продукції та іншої однотипної документації з великою кількістю збігів.

      Часто ТМ-програми використовують у поєднанні із МТ-програмами. Найбільш популярним у світі ТМ-інструментарієм є Translation"s Workbench фірми Trados (для стислості часто також званий Trados).

      Є, проте, враження, що ресурси розвитку у цьому напрямі вже практично вичерпані і без переходу до нових технологій, радикального покращення якості перекладу досягти не вдасться. До таких нових: технологій відноситься залучення користувача в процес перекладу, а також:

      · Автоматичне визначення контексту вживання слова для того, щоб вибирати для перекладу адекватні словникові значення;

      · Використання баз знань, в яких зібрана інформація про предметну область;

      · Самонавчання системи в ході взаємодії з користувачем.

      Ще недавно про подібні можливості на персональному комп'ютері не могло бути й мови. Зараз потужності та обсягу пам'яті вже цілком достатньо, немає тільки систем, які б забезпечували хорошу якість перекладу. (№ 15)

      Сучасні комерційні продукти машинного перекладу пропонують вітчизняні фірми:

      · "Віста Текнолоджиз" та "Адвентіс", утворені в 1991 р. колективом розробників, що виділилися з ВІНІТІ;

      · ПРОМТ, утворена у 1991 р.;

      · "Медіа Лінгва".

      Найбільш відомою з числа систем машинного перекладу, що експлуатуються за кордоном, є система SYSTRAN, розроблена і підтримувана компанією SYSTRAN Software Inc. та використовувана службою машинного перекладу при комісії Європейського Союзу. Дана служба, обсяг перекладів у якій складає близько 2,5 млн. сторінок на рік, використовує систему SYSTRAN для перекладу з англійської на німецьку, французьку, іспанську, грецьку та італійську мови, а також з французької на англійську, іспанську та італійську. Переваги системи:

      · отримуваний текст може піддаватися редагуванню легко та швидко;

      · Є можливість перекладати великий обсяг науково-технічних матеріалів;

      · Система «багатомовна»;

      · Інженерні рішення досить прості (стандартні ЕОМ).

      Одна з головних переваг полягає в тому, що при МП забезпечується дотримання послідовної, несуперечливої ​​термінології, тоді як у людському перекладі термінологічної лексики часто виникає різнобій. Ця перевага є дуже суттєвою для науково-технічного перекладу. Швидкість перекладу становить 1 млн. слів за годину за час (роботи центрального процесора.

      Система забезпечує правильний переклад діаграм, графіків та інших нетекстових включень. ЕОМ можуть вводитися зміни, наприклад, при змінах стандарту на термінологію. Поправки редакторів також поступово накопичуються та вводяться у словник.

      Лінгвістичний аналізатор СІСТРАНу складається з наступних чотирьох основних етапів. Перший етап дозволяє омографію. Другий досліджує пропозицію справа наліво, запам'ятовуючи при переході від слова до слова, які типи синтаксичних відносин потенційно можливі всередині кожної самостійної пропозиції, якщо врахувати типи слів, що зустрілися. Використовуючи набір регістрів, які містять дані про можливі типи синтаксичних відносин, цей етап потім встановлює основні структури всередині пропозиції (дієслово плюс об'єкт, прийменник плюс об'єкт тощо. буд.). Третій етап, рухаючись зліва направо, уточнює ці відносини, упізнаючи типи об'єктів, означальні структури та ін. цих пропозицій, визначаючи підлягає і присудок у кожному з цих пропозицій.

      Слід зазначити, що в деяких випадках інформація може передаватися від однієї пропозиції до іншої. У пам'яті ЕОМ відведено спеціальне місце для такої інформації. Вона особливо потрібна для перекладу займенників, антецеденти яких можуть бути в іншій пропозиції. Основні завдання, які виконуються універсальним програмним забезпеченням СІСТРАНу, такі:

      · Зчитування тексту;

      · Розбивка тексту на слова;

      · Пошук слів у різних словниках;

      · Приписування словникових кодів словам або словосполученням тексту;

      · Розподіл пам'яті під аналізовані пропозиції;

      · Контроль за виконанням програм перекладу;

      · Підготовка перекладу до друку, видачі на мікрофіші та ін.

      Програмне забезпечення системи дозволяє забезпечити швидкість перекладу 200 000 -300 000 слів на годину. (№ 11)


      90-ті роки принесли з собою бурхливий розвиток ринку ПК (від настільних до кишенькових) та інформаційних технологій, широке використання мережі Інтернет (яка стає все більш міжнародною та багатомовною). Усе це уможливило, а головне затребуваним, подальший розвиток систем МП. З'являються нові технології, що ґрунтуються на використанні нейронних мереж, концепції коннекціонізму, статистичних методах.

      Ефективність роботи сучасної системи МП у вирішальній мірі залежить від її вдалого налаштування на конкретну підмову (або мікропідмову) природної мови, на певну лексику та обмежений набір граматичних засобів, характерних для текстів даної предметної галузі, а також на певні типи документів. Вчення про підмови з погляду машинного перекладу було вперше сформульовано Н.Д.Андрєєвим (Ленінградський університет) в 1967, хоча уявлення про мовні регістри, стилі, жанри письмового тексту і т.п. були добре відомі і у традиційній лінгвістиці. Підмова, з точки зору МП, визначається в першу чергу деяким вихідним набором текстів, в рамках якого визначається вхідний та вихідний словники, ступінь поширення та характер лексичної неоднозначності лексем, характер та поширеність синтаксичних конструкцій, способи їх перекладу в даній мовній парі та ін. роль відіграють паралельні тексти та словники-конкорданси, за допомогою яких можна досить ефективно вивчити та використовувати у складанні алгоритмів лексичну сполучність та дистрибуцію (розподіл) мовних елементів у мовленні (дискурсі, тексті). Статистичні характеристики під'язиків допомагають упорядкувати структуру відповідних алгоритмів аналізу та синтезу. Вихідний словник, орієнтований потреби синтезу і передачі основних видів відповідностей у конкретній мовній парі, забезпечує прийнятний вихідний текст. У будь-якому із сучасних видів машинного перекладу необхідна участь людини-редактора, зручність роботи якого забезпечується якістю та надійністю відповідного програмного забезпечення.

      Перспективи розвитку машинного перекладу пов'язані з подальшою розробкою та поглибленням теорії та практики перекладу як машинного, так і «людського». Для розвитку теорії важливі результати порівняльного мовознавства, загальної теорії перекладу, теорії закономірних відповідностей, способів представлення знань, оптимізації та вдосконалення лінгвістичних алгоритмів. Нові та ефективніші словники з необхідною словниковою інформацією, суворі теорії термінологізації лексики, теорія та практика роботи з підмовами допоможуть підвищити якість перекладу лексичних одиниць. Формальні граматики, орієнтовані переклад, дадуть можливість оптимізувати алгоритми знаходження перекладних відповідностей у цій комунікативної ситуації, яка можна описати у межах відповідних прикладних теорій представлення знань. Нарешті, нові можливості програмування та обчислювальної техніки також будуть робити свій внесок у вдосконалення та подальший розвиток теорії та практики машинного перекладу «Машинний переклад все ще далекий від досконалості, але будь-хто з його допомоги. Чи зможе принаймні зрозуміти основний зміст документа.» (Луї Моньє, технологічний директор AltaVista.)

      1.4 Якість машинного перекладу

      "Теорія машинного перекладу дає можливість не лише критично переглянути всі найважливіші традиційні поняття граматики (слова, частини мови, члени речення тощо), а й призупинити наукові суперечки, які велися навколо цих понять. З позиції, що диктується машинним перекладом," слово - це те, що обмежено інтервалами між літерами", а "пропозиція - це те, що обмежено певними розділовими знаками".(№ 12)Для машинного перекладу з однієї мови на іншу дійсно необхідне теоретичне вивчення суто формальної структури мови. перекладає з однієї мови на іншу, певною мірою байдуже, що означають ті формальні категорії, які вона транспонує з однієї мови на іншу.(№ 4)

      Так, багато, наприклад, емоційно забарвлені слова або певні висловлювання можуть неоднаково сприйматися різними людьми, (не кажучи вже про машину) а ці люди являють собою різні мовні та етнічні колективи (№ 1). В даний час якість машинного перекладу бажає багато кращого , І саме наявність таких систем поки що правильніше сприймати як предмет наукових досліджень про. У більшості випадків під час роботи над проектом застосування систем МП не виправдане, оскільки: - Системи МП не дають прийнятної якості вихідного тексту. Більш високої якості можна досягти за допомогою попереднього налаштування системи, що абсолютно неприйнятно при невеликих обсягах тексту, що перекладається, та/або шляхом подальшого редагування, а це тільки уповільнює роботу, якщо перекладач використовує сліпий метод друку. - Системи МП не гарантують дотримання єдності термінології, особливо під час роботи колективу перекладачів над великим проектом. Вірніше, можуть гарантувати за умови дуже уважного поводження з словниками користувача, а на це не завжди варто розраховувати. Однак у деяких випадках використання систем МП все ж таки допомагає скоротити тимчасові витрати. Це відбувається, якщо текст досить об'ємний і містить однакову термінологію, що дозволяє порівняно швидко налаштувати систему МП. Тоді редагування тексту не займе надто багато часу. Однак у цьому випадку слід особливо уважно поставитися до стилю перекладу. Машинний переклад є формальним, тому висока ймовірність калькування синтаксичних структур мови оригіналу, яке характерне для перекладу взагалі, а тому цілком може бути пропущено при редагуванні. Взагалі кажучи, системи МП можуть застосовуватися там, де використовується максимально стандартизована мова з простою граматикою і порівняно невеликим запасом слів. Досить успішним проектом системи МП вважається німецька програма Meteo, яка виконує переклад метеопрогнозів з французької мови англійською та назад. Для полегшення роботи перекладачів та технічних письменників компанією Boeing свого часу було розроблено стандарт мови для написання технічної документації, яка відома як Boeing English.

      З філологічної точки зору переклад є авторською операцією, яку людина-перекладач робить над текстом. Усвідомивши характер завдання, діючи з певною мірою обізнаності, напругою уваги та волі перекладач досягає комунікативного ефекту, передбачуваного автором оригіналу. Перекладач формує новий текст, який в ідеалі має всі особливості оригіналу. Попереднє читання перекладачем оригіналу забезпечує можливість застосування певного «стильового зусилля», оскільки щоразу текст, складений людиною, містить певні помилки проти прийнятого нормативу. Ці помилки можуть бути наслідком різноманітних причин, але головним чином вони є наслідком свободи волі мовця, якою він користується для досягнення нового ефекту, також докладаючи стильового зусилля. Через порушення нормативу будь-яка формальна граматика не буде повною і не даватиме повного покриття текстів. Для читача тексту перекладу, так само, як і для читача тексту оригіналу, важливе психолінгвістичне усвідомлення тексту.

      Машинний переклад є перекладом без авторства перекладача. У тій мірі, як і створення і подальше поповнення алгоритмів і словників є робота колективу, МП є знеособлений колективний переклад. МП базується на суто перекладних, мовних відповідності, ніякого попереднього читання тексту система МП робити не може, тому МП виключає текстологічний аналіз. Передача сенсу МП досягається особливим знаковим перетворенням, оскільки МП: є певна операція над мовою за умови ідентичності змісту знака. Він здійснює механічні синонімічні заміщення на основі регулярних міжмовних кореспонденцій співвіднесення. Ці регулярні кореспонденції не виймаються автоматично зі сховищ або пристроїв, подібних до словників. Неможливо моделювати комунікативну функцію природної мови, якщо розглядати її лише як кодову систему; перекладні відповідності є елемент динаміки користування мовою, і система, що задовільно моделює переклад, не може не розглядати перекладні відповідності як всеосяжні, багаторівневі, але щоразу нові освіти. Повинні бути формалізовані не самі перекладні відповідності як такі, але закономірності, за якими вони виникають у текстах і за допомогою яких можуть бути виявлені в деталях, важливих і необхідних перекладу. Така формалізація вдається за допомогою моделювання дій перекладача, при якому особлива увага приділяється семантико-синтаксичному аналізу в термінах, близьких до традиційно зрозумілих для всіх користувачів мовою. (№ 11)

      Жодних стильових зусиль машина-перекладач не робить. Завдання докладання цих зусиль доручається читача машинного перекладу чи редактора. Механічні операції, які проводить ЕОМ над текстом, мають складний характер: система здійснює максимально повні рекомбінації знаків та комплексну переробку масової інформації у мові. Проводиться упізнання, розрізнення та переклад між різними категоріями двох мов, розведення синонімів та омонімів, процесне розгортання членів речення, внаслідок чого забезпечується інваріантність суттєвих семантичних ознак значення у передачі його іншою мовою.

      З концепції системної організації, особливу увагу МП приділяється словнику. Оскільки словник для МП є одночасно машинний словник, який має аналоги в інших системах автоматичної обробки інформації природною мовою, виникає можливість зробити узагальнення та говорити про загальні властивості машинних словників. Ці загальні властивості розглядаються у протиставленні властивостям звичайних словників, але з абстрактному сенсі (у якому такі протиріччя можуть стиратися подібно до того, як стирається різницю між людиною і мислячої машиною), а представленнях інженерної лінгвістики - прикладної лінгвістики, спрямованої рішення технічних завдань.

      Для подолання основних труднощів проблеми машинного перекладу повинні бути вирішені завдання автоматизованого представлення контексту, змістового перекладного тексту, знань про поняття предметної області, до якої відноситься текст, що перекладається. У перших системах реалізувався так званий "прямий" підхід до перекладу, в рамках якого, як уже зазначалося, всі операції, що здійснюються при перекладі, трактувалися як операції міжмовного переходу - перетворення тексту оригіналу в текст перекладу. У машинному перекладі у відповідному сенсі цей підхід призводить до так званих "тотальних стратегій" (№ 10). Загальною характеристикою тотальних стратегій є прагнення отримати автоматизований високоякісний машинний переклад максимальним використанням семантичного рівня мови. Цей підхід зробив значний внесок, як у теорію, так і в практику машинного перекладу.
      Другий підхід хронологічно виник раніше за перший. Цей підхід полягає у уявленні про проміжну мову та близько пов'язаний з ідеєю перекладних відповідностей на чисто мовному рівні. Методична суть даного підходу полягає у вивченні поведінки мовних одиниць, особливо у мовному контексті; у моделюванні людського володіння мовою, особливо у процесі міжмовного перекладу; у переході від простого до складнішого. Багато дослідників, наприклад, такі як Марчук Ю.М., Нелюбін Л.Л., Ревзін І.І. вважають, що програмне забезпечення для роботи з граматикою ґрунтувалося на теоріях структури мови в поєднанні з придуманими нашвидкуруч правилами.
      Розроблені програми видавали настільки поганий переклад, що його було неможливо зрозуміти. Проблема полягає в тому, що зміст тексту природною мовою залежить не тільки від самої пропозиції, але також і від контексту.
      Швидше за все, ці перші проекти справді не дали жодних реальних результатів. Однак було виявлено багато основних проблем перекладу текстів природною мовою: багатозначність слів та синтаксичних конструкцій, практична неможливість глобального опису семантичної структури світу навіть в обмеженій предметній галузі, відсутність ефективних формальних методів опису лінгвістичних закономірностей та ін. (№ 8).

      Сучасний стан МП характеризується деяким злиттям результатів двох підходів, але не механічним з'єднанням результатів, а злиттям їх на базі нових моделей, створених за переважної уваги до власне перекладацького аспекту володіння природною мовою. Центром дослідження в сучасному МП стає моделювання дій людини-перекладача, особливо в частині використання нею двох- та багатозначних перекладних відповідностей при перекладі з однієї мови на іншу. МП, що виник поза лінгвістики, увійшов до неї головним чином завдяки важливому аспекту моделювання. Якість перекладу забезпечується технологією, багаторозмірною архітектурою словників (два рівні перекладу для кожного слова: активні та пасивні), механізмом асоціативної пам'яті, створенням та редагуванням словників користувача, а також підключенням спеціалізованих та загальних словників великих обсягів. (№ 14)

      Повільне підвищення точності машинного перекладу частково пояснюється тим, що така програма потребує дуже великої бази даних з текстами дні порівняння схожих фраз і їх осмислення (№ 19).


      Ще 1956 р. американські психологи Міллер і Біб-Сентер запропонували такі методи оцінки якості перекладу:

      · Проставлення оцінки якості перекладу випробуваними за стабільною шкалою;

      · Підрахунок відсотка слів, що збігаються в невідредагованому та відредагованому перекладі;

      · Вивчення відповідей людини, яка читала тільки переклад, на питання, поставлені за текстом оригіналу.

      Психолог Ш. Пфаффлін використовує для оцінки якості перекладу наступні два критерії:

      Оцінка розуміння перекладу шляхом постановки питань за текстом;

      Оцінка ясності сенсу перекладу за шкалою «ясно», «неясно», «безглуздо» Жоден із цих методів не дає чіткої відповіді питання, які критерії якості машинного перекладу і який допустимий рівень якості. (№ 11)

      ГлаваII. Система машинного перекладуPROMT

      2.1 Можливості машинного перекладача сімейства PROMT.

      З початку 1990-х років. ринку систем ПК виходять вітчизняні розробники. У липні 1990 року на виставці PC Forum в Москві була представлена ​​перша в Росії комерційна система машинного перекладу під назвою PROMT (PROgrammer's Machine Translation). виграла конкурс NASA на постачання систем МП (ПРОМТ була єдиною неамериканською фірмою на цьому конкурсі) У 1992 р. "ПРОМТ" випускає цілу родину систем під новою назвою STYLUS для перекладу з англійської, німецької, французької, італійської та іспанської мов російською та з російської на англійську, а 1993 р. з урахуванням STYLUS створюється перша у світі система МП для Windows. 3.0 для Windows 95/NT, одночасно з цим успішно завершено розробку абсолютно нових, перших у світі російсько-німецької та російсько-французької систем МП.

      У 1997 р. підписано угоду з французькою фірмою Softissimo про створення систем перекладу з французької мови на німецьку та англійську та назад, а в грудні цього року була випущена перша у світі система німецько-французького перекладу. У цьому ж році компанія "ПРОМТ" випустила систему, реалізовану за технологією Гігант - для підтримки кількох мовних напрямків в одній оболонці, а також спеціальний перекладач для роботи в Інтернеті WebTranSite.

      У 1998 р. випускається ціле сузір'я програм під новою назвою PROMT 98. Через рік компанія ПРОМТ випустила два нових продукти: унікальний пакет програм для роботи в Інтернеті – PROMT Internet, та перекладач для корпоративних поштових систем – PROMT Mail Translator. Для корпоративних клієнтів розроблено також спеціальні серверні рішення – корпоративний сервер перекладів PROMT Translation Server (PTS) та Інтернет-рішення PROMT Internet Translation Server (PITS). У 2000 р. "ПРОМТ" оновила всю систему, випустивши МП системи нового покоління: PROMT Translation Office 2000, PROMT Internet 2000 і Magic Gooddy 2000.

      В основі всіх продуктів ПРОМТ лежить єдине перекладацьке ядро ​​– система аналізу вхідного тексту та синтез зв'язкового перекладу на виході; у них також реалізовані загальні принципи автоматизації перекладу. Лінгвістичний редактор ПРОМТ дозволяє перекладати документи, проводити налаштування на тематику документа та дозволяє редагувати текст. Програма забезпечує швидкий переклад, підтримуючи майже всі текстові редактори. Розмір тексту, що перекладається обмежений тільки ресурсами самого комп'ютера.

      Перекладач можна застосовувати у двох режимах: без налаштувань для оперативного чорнового перекладу (включається лише базовий словник) та з додатковим налаштуванням (підключення додаткових тематичних словників) для забезпечення більш якісного перекладу. Програма включає більше 100 спеціалізованих словників, що дає можливість зробити переклад більш точним, проте навіть велика кількість спеціалізованих словників не може замінити словника користувача.

      Унікальною технологією реалізованої в останніх версіях ПРОМТ є механізм асоціативної пам'яті (АП). Справа в тому, що багато документів містять однакові звороти, що часто зустрічаються, і навіть фрагменти тексту, які логічно перекладати один раз і згодом застосовувати готовий переклад. В базі перекладів АП зберігаються сегменти оригінального та перекладеного текстів, які використовуються при необхідності перекласти аналогічний фрагмент тексту. Це забезпечує можливість навчання системи та збереження результатів праці користувача для подальшого застосування.

      Корисна особливість програм останнього покоління – здатність виключати з процесу перекладу власні імена з можливістю їх транслітерації. Ще один спосіб налаштування полягає у виборі лінгвістичних алгоритмів. Для кожного напряму перекладу існує список алгоритмів, які може налаштувати користувач. (№ 8,5)

      Система PROMT XT здійснює переклад за такими напрямками: англо-іспанська, англо-німецька, англо-російська, англо-французька, іспансько-англійська, іспансько-російська, іспансько-французька, італійсько-російська, німецько-англійська, німецько-російська, німецька -французька, російсько-англійська, російсько-німецька, російсько-французька, французько-англійська, французько-іспанська, французько-німецька, французько-російська. Мова інтерфейсу системи: англійська, російська, французька, німецька.

      Системою надаються такі додаткові можливості:

      o редагування словникових статей у словниках користувача (крім деяких спеціальних слів: прийменників, спілок, займенників, деяких омонімічних форм);

      o визначення ієрархії підключених словників (за наявності кількох варіантів перекладу система вибирає переклад із словника, пріоритет якого визначено користувачем як найвищий);

      o пошук перекладів в електронних словниках (тільки для англо-російського та російсько-англійського напрямів);

      o автоматичне визначення тематики тексту (за ключовими словами) та підключення спеціальних словників;

      o встановлення алгоритмів перекладу деяких конструкцій (наприклад, переклад англ. you як "ти", "ви" чи "Ви";

      o підключення препроцесорів (які дозволяють не перекладати деякі спеціальні елементи, такі, як імена файлів, адреси електронної пошти та веб-сторінок);

      o визначення зарезервованих слів (наприклад, термінів, власних імен), які не будуть перекладатися програмою

      o використання баз перекладів Асоціативної пам'яті (спрощений варіант технології Translation Memory).

      Остання розробка компанії ПРОМТ, електронний перекладач PROMT XT Office- перший продукт, що реалізує нову концепцію автоматичного перекладу, що базується на технології Асоційованої Пам'яті. Новий рівень лінгвістичних алгоритмів забезпечує поліпшення якості перекладу для щонайменше 55% пропозицій.

      PROMT XT Office вирішує такі завдання:

      · Переклад документів наступних форматів: DOC, RTF, TXT, HTML. Вперше реалізовано можливість перекладу документів у форматі Adobe Acrobat.

      · Комфортна робота з іншомовними документами у програмах Microsoft Word, Excel, PowerPoint забезпечується завдяки інтеграції програми до програм MS Office 2000/XP та Microsoft Office System 2003.

      · Переклад електронної пошти.

      · Онлайн-переклад Web-сайтів із збереженням форматування. (№ 9)

      Напрями перекладу: англійська<->російська, німецька<->російська, французька<->російська, іспанська<->російська, італійська -> російська, Гігант (англ.<->русявий, нім.<->русявий, фран.<->рус.)

      Основні можливості системи перекладу:

      · Переклад документів основних форматів: DOC, RTF, HTML, TXT.

      · Збереження форматування під час перекладу.

      · Збереження результату перекладу у файлах формату: RTF та TXT.

      · Переклад PDF-документів безпосередньо в Adobe Acrobat 4.х/5.х та Adobe Acrobat Reader 4.х/5.х.

      · Вбудовування функцій перекладу у всі основні програми Microsoft Office 2000/XP (Word, Excel, PowerPoint, FrontPage) та Microsoft Office System 2003*.

      · Переклад електронної пошти. Автоматичний переклад електронної пошти у Microsoft Outlook. Маршрутизація листів папками.

      o Все для роботи в ІнтернетіОнлайн-переклад Web-сайтів із збереженням форматування.

      o Переказ запитів для пошукових систем та надсилання на вказаний сервер.

      o Налаштування перекладу на базі технології SmartURL – програма сама запам'ятовує параметри перекладу сторінок. При повторному відвідуванні сторінки параметри перекладу відновлюються.

      o Створення сайтів іноземною мовою у FrontPage за допомогою вбудованих перекладацьких модулів.

      · Переклад вмісту буфера Windows Clipboard.

      · Інтелектуальні алгоритми самонавчання системи при використанні Асоційованої Пам'яті. Асоційована Пам'ять (АП) – працює за принципом накопичення: у процесі перекладу зберігається вихідний сегмент (пропозиція або його частина) та його переклад. При підключенні бази АП система порівнює кожну пропозицію зі збереженими в базі сегментами. Якщо сегмент ідентичний вихідному знайдено, він може бути використаний для перекладу.

      · Потужний лінгвістичний редактор PROMT, що забезпечує можливість інтерактивного керування перекладом.

      o Зручні засоби редагування перекладу - синхронна "прокручування" оригіналу та його перекладу. Колірне підсвічування пов'язаних фрагментів в оригіналі та перекладі.

      o Миттєвий переклад будь-якого слова при підведенні курсору мишки. Перегляд усіх перекладів та словоформ виділеного слова.

      o Інтелектуальні алгоритми автоматичного визначення мови та тематики тексту.

      o Збереження параметрів перекладу у шаблонах тематики.

      · Підвищення якості перекладу за рахунок персональних налаштувань:

      o Можливість підключення спеціалізованих словників, що випускаються компанією ПРОМТ для різних предметних областей;

      o Створення та поповнення власних словників користувача.

      o Створення списку зарезервованих слів. Резервування слів із зазначеним форматом, наприклад, виділених курсивом. Резервування виділених фрагментів тексту.

      o Завдання ознак транслітерації незнайомих слів.

      o Вибір алгоритмів перекладу (режими перекладу деяких мовних конструкцій, якими неможливо керувати, модифікуючи словникові дані).

      o Підключення макросів для обробки вихідного тексту та перекладу.

      o Використання баз Асоційованої Пам'яті (АП).

      · Ефективний засіб налаштування словників - Dictionary Editor:

      o Можливість перегляду, редагування, копіювання, видалення та відновлення словникових статей з словників користувача.

      o Різні режими доступу до вмісту словникових статей - "Початківець" та "Спеціаліст".

      o Інтелектуальні алгоритми поповнення словників.

      o Одночасне поповнення пов'язаних словників у двох напрямках.

      o Можливість введення в словник з текстового файлу та експорту словникових статей до текстового файлу або документа RTF.

      · Великий електронний словник для перекладу окремих слів (реалізований для англо-російського, російсько-англійського, французько-російського, російсько-французького, німецько-російського та російсько-німецького напрямів перекладу).

      · Підтримка зовнішніх програм сканування, перевірки орфографії та електронних словників.

      · Озвучування тексту за наявності встановлених на комп'ютері засобів синтезу мови, сумісних із стандартом Text-To-Speech (TTS). (№ 22,23)

      Програмні продукти компанії "ПРОМТ" удостоєні цілої низки вітчизняних та зарубіжних нагород, об'єктивно є найкращими програмами, що здійснюють машинний переклад у нашій країні.

      2.2 Порівняльний аналіз перекладів художньо та політичного тексту зроблений системою машинного перекладу та людиною.

      Щоб краще зрозуміти принципи дії систем МП, методи використання словників, аналізу граматики та синтезу структур вихідною мовою, необхідно на практиці провести кілька дослідів та перекласти тексти (бажано різні за стилями та тематикою), використовуючи одну із систем машинного перекладу.

      Для порівняння перекладу художнього тексту буде використано систему машинного перекладу PROMT XT. Також буде виконано переклад цього тексту, та зроблено порівняльний аналіз результатів.

      Візьмемо для початку уривок із казки «Маленький Принц» англійською мовою:

      «The little prince went away, to look again at the roses.

      "Ви не маєте на все, як ми роси," he said. "As yet you are nothing. No one has tamedyou, and you have tamed no one. And roses були дуже рясні embarrassed.

      "You are beautiful, але you are empty," he went on. "One could not die for you. To beНапевно, звичайний passerby would think that my rose looked just like you - the rose that belongs to me. Але в ньому самотньо, що є більш важливою, ніж усі випадки з інших росіян. And he went back to meet the fox. "Goodbye," said the fox. "Ад тепер ми є моєму secret, а дуже простий secret: Це є тільки з srdce, що один може вірно вірити; який є вірним є invisible to the eye."

      "What is essential is invisible to the eye," the little prince repeated, so that he wouldbe sure to remember.

      "It is the time you have wasted for your rose that makes your rose so important."

      "It is the time I have wasted for my rose..." said the little prince, so that he would besure to remember.

      "Men have forgotten this truth," said the fox. "But you must not forget it. You becomeresponsible, forever, for what you have tamed. Ви є відповідальним для вашої росі..."

      "I am responsible for moji rose," the prince repeated, so that he would be sure toremember.»(№ 16)


      Ось переклад цього уривку зроблений перекладачем:

      Маленький принц пішов поглянути на троянди.

      Ви зовсім не схожі на мою троянду, – сказав він їм. – Ви ще ніщо. Ніхто вас не приручив і ви нікого не приручили. І троянди дуже зніяковіли.

      Ви гарні, але порожні, - вів далі Маленький принц. - Ніхто не захоче вмерти заради вас. Звичайно, випадковий перехожий, подивившись на мою троянду, скаже, що вона точно така сама, як ви. Але мені вона одна дорожча за вас

      І Маленький принц повернувся до Лисиці.

      Прощай... - сказав він.

      Прощай, - сказав Лис. - Ось мій секрет, він дуже простий: пильно одне лише серце. Найголовнішого очима не побачиш.

      - Самогоголовного очима не побачиш, - повторив маленький принц, щоб краще запам'ятати.

      Твоя троянда така дорога тобі тому, що ти віддавав їй усі свої дні.

      Тому що я віддавав їй усі свої дні... - повторив Маленький принц, щоб краще запам'ятати.

      Люди забули цю істину, - сказав Лис, - але ти не забувай: ти назавжди відповідає за всіх, кого приручив. Ти відповідаєш за твою троянду.

      Я відповідаю за мою троянду... - повторив Маленький принц, щоб краще запам'ятати.

      У деяких реченнях нам довелося змінити порядок слів. Декілька слів були «викинуті» з перекладу, оскільки їх відсутність або присутність не впливає на зміст і стилістику перекладу. Але в той же час може «різати слух», бо «російською» так не говорять. А ось як зроблено переклад того ж уривку системою PROMT XT.


      «Маленький принц пішов знову дивитися на троянди.

      "Ви нітрохи не схожі, мій підвищився," він сказав. "Поки що Ви не ніщо. Ніхто не приручив Вас, і Ви не приручили нікого..."

      І троянди були дуже стурбовані. "Ви красиві, але Ви порожні," він продовжував. "Не можна було померти для Вас. Безумовно, звичайний перехожий думав би, що мій підвищився, дивився так само як Ви, підвищився, який належить мені. Але в собі один вона важливіша за всі сотні з Вас інші троянди....

      І він повернувся, щоб зустріти (виконати) лисицю.

      "До побачення," сказав лисиця. "І тепер ось - моя таємниця, дуже проста таємниця: тільки з серцем можна бачити справедливо; що є суттєвим, невидимий для ока."

      "Що є суттєвим, невидимий для ока," маленький принц повторився, щоб він переконався, що пам'ятав

      "Це - час, який Ви витратили марно для вашого, підвищився, який робить ваш, підвищився настільки важливим."

      "Це - час, який я витратив даремно для мого, підвищився ..." сказав маленький принц, щоб він переконався, що пам'ятав.

      "Чоловіки забули цю правду," сказала лисиця. Але ви не повинні забути це. Ви стаєте відповідальними, назавжди, для того, що ви приручили.

      Ви відповідальні за ваш, підвищився..."

      " Я відповідальний мій, підвищився, " маленький принц повторився, те щоб він переконався, що пам'ятав.

      Як бачимо, переклад тексту зроблено пословно. Програма не може змінювати місцями слова в реченнях, тобто у вихідній мові порядок слів майже завжди такий самий, як і у вхідній. Також дуже впадає у вічі переклад слова «rose» - «підвищився», я згодна, слово «rose» дуже багатозначно. Але навіть словник видає першим значення при перекладі саме слово «троянда», система ж, навіть не пропонує його як варіант. Але в той же час слово "троянда", у множині "roses", система перекладає правильно (не враховуючи при цьому що "roses" - n, pl, AmE, sl "He uses roses - Він ударяє по аптеці"). Очевидно, що в даному контексті слово повинно перекладатися як «троянда», проте система не може проаналізувати контекст і, отже, не може правильно вибрати еквівалент. Бентежить слова "Вас" написане з великої літери, очевидно в налаштуваннях для цього користувача слово "you" має перекладатися як "Ви" саме з великої літери. А не як «ти» чи «ви». Але в цій версії програми це легко можна виправити, достатньо змінити налаштування для поточного користувача. Слово "look" перекладено як "дивитися", не враховуючи те, що можна також перекласти як "виглядати", що переважно в даному випадку. Вираз "in herself alone" перекладений як "в собі один". Звичайно всім відомо, що англійські іменники втратили граматичну категорію роду. Отже всі вони узгоджуються з займенником 3 особі од. числа «it» - середнього роду. У російській мові категорія роду у іменників присутня. Недоліком системи є неможливість узгодження в роді вихідною мовою. Слова «троянда» у російській мові жіночого роду. Слова дані в дужках – це варіанти перекладу слів (другі значення), які система залишає на вибір редактора перекладача. Слово «rightly» перекладено у першому значенні, без додаткових варіантів. Так само і зі словом "essential". Слово «wasted» задане над початковій формі перекладено електронним словником ABBY Lingvo як: «wasted» дод.- виснажений; схудлий, худий; хирлявий; блідий; у цьому тексті його слід перекласти як «провів», «віддавав».

      На даному етапі роботи, доцільно порівняти зроблені переклади з англійської з перекладами з французької (мова оригіналу), для того щоб наочно виявити, чи існують ті ж проблеми в граматиці та словнику при перекладі з французької.

      Le petit prince s'en fut revoir les roses:

      «Vous n'êtes pas du tout semblantи à ma rose, vous n'êtes rien encore, leur dit-il. Personne ne vous a apprivoisées et vous n"avez apprivoisé personne.»

      Et les roses étaient bien gênées.

      «Vous êtes belles, mais vous êtes vides, leur dit-il encore. On ne peut pas mourir pour vous. Bien sûr, ma rose à moi, un passant ordinaire croirait qu'elle vous ressemble.

      Et il revint vers le renard:

      «Adieu, dit-il...

      Adieu, dit le renard. Voici mon secret. Il est très simple: on ne voit been qu'avec le cœur. L'essentiel est invisible pour les yeux.

      L'essentiel est invisible pour les yeux, répéta le petit prince, afin de se suvenir.

      C'est le temps que tu as perdu pour ta rose qui fait ta rosé si important.

      C'est le temps que j'ai perdu pour ma rose..., fit le petit prince, afin de se suvenir.

      Les hommes on oublié cette vérité, dit le renard. Mais tu ne dois pas l'oublier.

      Je suis responsable de ma rose...», répéta le petit prince, afin de se suvenir. (№ 5)


      Переклад зроблений перекладачем:

      «Маленький принц пішов подивитись на троянди.

      Ви зовсім не схожі на мою троянду, – сказав він їм. – Ви ще ніщо. Ніхто вас не приручив і ви нікого не приручили.

      І троянди дуже зніяковіли.

      Ви гарні, але порожні, – сказав він нарешті. - Ніхто не захоче померти заради вас. Звичайно, випадковий перехожий, подивившись на мою троянду, скаже, що вона така сама, як ви. Але мені вона одна дорожча і важливіша за всіх вас

      І Маленький принц повернувся до Лисиці.

      Прощай... - сказав він.

      Прощай, - сказав Лис. - Ось мій секрет, він дуже простий: бачити можна лише серцем. Найголовніше невидимо для очей.

      Найголовніше невидиме для очей, - повторив Маленький принц, щоб краще запам'ятати.

      Те, що ти віддавав своїй троянді так багато часу, робить її особливою.

      Тому що я віддавав їй так багато часу... - повторив маленький принц, щоб краще запам'ятати.

      Люди забули цю істину, - сказав Лис, - але ти не забувай: ти назавжди відповідальний за всіх, кого приручив. Ти відповідаєш за твою троянду.

      Я у відповіді за мою троянду... - повторив Маленький принц, щоб краще запам'ятати.


      Переклад зроблений системою PROMT з французької на російську:


      Маленький принц знову побачив троянди:

      Ви не подібні до моєї троянди, ви не є нічим ще, він їм каже. Ніхто вас не приручив і ви не приручили нікого.

      І троянди були дуже сором'язливі.

      Ви гарні, але ви порожні, він їм каже ще. Не можемо померти для вас. Звичайно, моя троянда, звичайний перехожий вважала б, що вона на вас буде схожа.

      І він повернувся до лисиці:

      " До побачення, він каже

      До побачення, каже лисиця. Ось моя таємниця. Він дуже простий: бачимо добре тільки з c і *339; ur. Істотна частина невидима для очей.

      Значна частина невидима для очей, повторив маленький принц, щоб згадувати.

      Саме час ти втратив для твоєї троянди, яка робить твоя троянда така важлива.

      Саме час я втратив для моєї троянди, зробив маленького принца, щоб згадувати.

      Люди забули цю правду, каже лисиця. Але ти не мусиш його забувати. Ти стаєш відповідальним назавжди того, що ти приручив.

      Ти – відповідальний за твою троянду – Я – відповідальний за мою троянду”, повторив маленький принц, для того, щоб згадувати.


      У цілому нині, переклад цілком коректний, зрозумілий загальний зміст уривка. Переклад так само зроблено послівно, що підтверджує нам, що система не може змінювати порядок слів у вихідній мові. Система виявилася не в змозі перекласти 2 слова, одне з них вона транслітувала, а одне замінила цифровим кодом через те, що вираз "que avec le сoeur" написано як "qu`avec le сoeur". Голосна «е» завжди випадає у разі, але в листі усікається. Так само як і при перекладі з англійської виявляються невідповідності роду вихідною (російською) мовою. Хоча система писалася російськомовними фахівцями. Переклад деяких пропозицій змушує думати, що це перекладала людина, яка слабо розмовляє російською. Проблема полягає не в синтезі граматичної структури вихідної мови, а в нерозумінні структури вхідної мови, тобто, по суті, у граматичному аналізі. У принципі прості пропозиції система перекладає відносно правильно, складні, складно - складені чи складно-підлеглі пропозиції також перекладаються відносно легко. Але якщо зустрічаються вступні або пояснювальна конструкція і розривається основна пропозиція, то програма починає переклад, без урахування синтаксису, намагаючись просто зв'язати слова. Таким чином варіант на виході виходить дуже складним та заплутаним. Але навіть якщо прописати алгоритми для всіх цих правил, без розуміння вхідного тексту переклад так і залишатиметься інколи повністю безладним.

      Висновок.

      Можна зробити висновок, що повністю автоматичний машинний переклад, це дуже складне завдання, яке належить вирішити не лише лінгвістам, а й програмістам, фахівцям з кібернетики та багатьом іншим представникам наук, які торкаються цієї проблеми. Дуже складно змоделювати процес перекладу за допомогою комп'ютерної програми. Якщо людина, здійснюючи переклад, мислить образами і виходить з того, яку думку до кінцевого результату треба донести до слухача, то навчити цій програмі неможливо (на даному етапі розвитку комп'ютерних технологій).

      Сучасні програми машинного перекладу дуже далекі від ідеалу якого прагнуть їх розробки. Але вони вже без сумніву можуть бути гарною підмогою перекладачеві в його рутинній роботі. Хоча б тим, що без проблем можуть за кілька секунд зробити підрядковий переклад будь-якого за складністю та обсягом тексту. Якщо при цьому правильно налаштований розподіл пріоритетних словників для даної тематики та напряму перекладу, то на виході редакторська правка потрібна мінімальна (порівняно з перекладом при підключеному словнику загальної лексики). Звичайно повністю віддати текст в руки машини не можна. Системи нового покоління можуть «запам'ятовувати» вже перекладені конструкції одного разу і згодом вже не вимагати повторного їх перекладу. Системи ефективні за допомогою користувачів ще й тому що є можливість створювати «користувальницький» словник, що суттєво полегшує переклад на певну тематику.

      Але все ж таки недоліків у систем машинного перекладу, на мою думку, більше ніж переваг. Головний недолік це, звичайно ж, словник. Програма не враховує елементарних значень слів і не пропонує їх як варіант при перекладі. Тим самим це змушує користувача шукати ці словоформи у словнику, що б'є по одному з основних переваг системи, на думку виробників, – швидкості. Недоліки лише на рівні граматики. Ці недоліки простежуються як із аналізі не вхідному мові, і при синтезі на вихідному. Не враховано граматичні особливості вхідних та вихідних мов, такі як наприклад, рід іменників у російській мові та її відсутність в англійській. Система зазвичай проводить ще й синтаксичний аналіз на вході, але якщо пропозиція не вписується в алгоритм, заданий програмою, система починає послівний переклад не звертаючи увагу на синтаксичні зв'язки.

      Розглянувши цю проблему, я дійшла висновку, що машинний переклад у принципі можливий, але його варто розглядати лише як «чорновий» варіант перекладу, який підлягає обов'язковому редагуванню.

      Бібліографія

      Джерела літератури російською мовою


      1. Арапов М.В. Шрейдер Ю.А. Семантика та машинний переклад.М., 1965. № 1

      2. Бархударов Л.С. Мова та переклад. - М: Між. відносини, 1975.

      3. Білоногов Г.Г. Зеленков Ю.Г. Інтерактивна система російсько-англійського та англо-російського машинного перекладу, ВІНІТІ, 1993

      4. Вісник Московського університету. Сер.19 Лінгвістика та міжкультурна комунікація. 2004. № 4, с.51.

      5. Домашній комп'ютер - 2004., № 12

      6. Канічєв М. Стаття. // Світ ПК. – 1998, № 8.

      7. Комісарів В.М. «Сучасне перекладознавство», ЕТС,М. 2004.с.411.

      8. Комп'ютер Прес. - 2004. № 7

      9. Комп'ютер Прес. - 2004. -№11

      10. Людсканов А. Селективна стратегія при машинному перекладі. - У кн.: Міжнародний семінар з машинного перекладу. М., ВЦП, 1975

      11. Марчук Ю. Н. Проблеми машинного перекладу. М: Наука, 1983

      12. Матеріали з машинного перекладу. Вип. 1. Л.,1958. с.5.

      13. Машинний переклад. Збірник статей, переклад з англійської, М., 1957

      14. Світ ПК. - 2004. - № 9

      15. Світ Internet. - 2001. № 2, с. 16-26.

      16. Міньяр - Бєлоручєв А.П., Англійська мова. Підручник усного перекладу. М., «Іспит», 2004р.

      17. Панов Д.Ю., Автоматичний переклад, М., 1958

      18. Ревзін. І., В.Ю. Розенцвейг. Основи загального та машинного перекладу., 1964.

      19. Техніка – молоді. - 2005. № 2.

      20. Шаляпіна З.М. «Автоматичний переклад: еволюція та сучасні тенденції» питання мовознавства, 1996 № 2


      Джерела літератури іноземними мовами


      2. Dezso L., Papp F. Механізація лексикографічних робіт та зворотні словники. - In: "Сomputational linguistics, III", р.212 - 215

      3. Antoine de Saint – Exupery. Le petit prince.,M.,Jupiter-inter, 2003

      4. Visson L., From Russian into English, Ardis, 1991


      Електронні джерела


      5. Електронний словник ABBY LINGVO 9.0


    Якщо Вас цікавить допомога НАПИСАННЯ САМЕ ВАШОЇ РОБОТИ, за індивідуальними вимогами - можна замовити допомогу в розробці на тему - Машинний переклад.Система машинного перекладу PROMT ... або схожою. На наші послуги вже поширюватимуться безкоштовні доопрацювання та супровід до захисту у ВНЗ. І само собою зрозуміло, ваша робота в обов'язковому порядку перевіриться на плагіат і гарантовано раніше не публікуватися. Для замовлення або оцінки вартості індивідуальної роботи пройдіть по


    Останні матеріали розділу:

    Список відомих масонів Закордонні знамениті масони
    Список відомих масонів Закордонні знамениті масони

    Присвячується пам'яті митрополита Санкт-Петербурзького та Ладозького Іоанна (Сничова), який благословив мою працю з вивчення підривної антиросійської...

    Що таке технікум - визначення, особливості вступу, види та відгуки Чим відрізняється інститут від університету
    Що таке технікум - визначення, особливості вступу, види та відгуки Чим відрізняється інститут від університету

    25 Московських коледжів увійшли до рейтингу "Топ-100" найкращих освітніх організацій Росії. Дослідження проводилося міжнародною організацією...

    Чому чоловіки не стримують своїх обіцянок Невміння говорити «ні»
    Чому чоловіки не стримують своїх обіцянок Невміння говорити «ні»

    Вже довгий час серед чоловіків ходить закон: якщо назвати його таким можна, цього не може знати ніхто, чому ж вони не стримують свої обіцянки. По...