Репетиторские услуги и помощь студентам!
Помощь в написании студенческих учебных работ любого уровня сложности

Тема: Машинный перевод.Система машинного перевода PROMT

  • Вид работы:
    Отчет по практике по теме: Машинный перевод.Система машинного перевода PROMT
  • Предмет:
    Другое
  • Когда добавили:
    21.03.2012 10:20:09
  • Тип файлов:
    MS WORD
  • Проверка на вирусы:
    Проверено - Антивирус Касперского

Другие экслюзивные материалы по теме

  • Полный текст:

    ОГЛАВЛЕНИЕ:


    Введение…………………………………………………………………………..2

    Глава I. Машинный перевод

      История машинного перевода………………………………………….…4

      Как осуществляется машинный перевод………………………………..10

      Системы машинного перевода и их классификация…………...............13

      Качество машинного перевода…………………………………………..18

    Глава II. Система машинного перевода PROMT

    2.1     Возможности машинного переводчика семейства PROMT…………...22

    2.2    Сравнительный анализ переводов художественного текста сделанный         системой машинного перевода и человеком…………………………...…26

    Заключение………………………………………………………………….….30

    Библиография…………………………………………………………………..31

     

     

     

     

     

     

     

     

     

     

     

     

    Введение


    Перевод (вид языкового посредничества, при котором содержание иностранного текста оригинала передается на другой язык путем создания на этом языке коммуникативно равноценного текста.(№ 7)) имеет долгую историю, он восходит к временам когда праязык начал распадаться на отдельные языки и возникла необходимость в людях, способных быть посредниками при общении представителей разных языковых общин.

    Коммуникативная равноценность понимается как способность переведенного текста выступать в качестве полноправной замены исходного текста.(№ 7).

    Коммуникативная эквивалентность нового текста по отношению к исходному обеспечивается следующим:

    ·   передача содержания оригинала в полном объёме;

    ·   соответствие текста перевода тексту оригинала по нормам языка перевода;

    ·   текст перевода должен соответствовать оригиналу с точки зрения лаконичности и развернутости высказываний для достижения схожего стилистического эффекта. Также перевод должен быть примерно сопоставим по объёму.

    Актуальность данной проблемы обусловлена тем, что история развития и внедрения в повседневную жизнь персональных компьютеров (способных осуществлять автоматический перевод) насчитывает не более пятнадцати – двадцати лет. Сегодня программы переводчики умеют строить осмысленные фразы и простые предложения, за последние несколько лет качество перевода улучшилось.

    Объектом исследования является система машинного перевода.

    Предметом исследования является перевод осуществлённый системой PROMT XT.

    Однако данные компьютерные программы еще недостаточно хорошо разбираются в грамматике, жаргонных выражениях, стилистических приемах и многих других казалось бы мелочах, но именно из них, складывается красивый, понятный перевод. В современном мире компьютеры занимают значительное место и в среде переводчиков, лингвистов и специалистов нуждающихся в оперативном переводе иноязычной информации.

    Развитие кибернетики сделало возможным машинный перевод, т.е. выполняемое на компьютере действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст на другом языке а также результат такого действия. В настоящее время главные области применения машинного перевода это перевод Интернет – страничек, руководств к технике, электронных писем. При этом достигается лишь общее понимание текста. Другое применение этих систем – облегчение труда профессиональных переводчиков, уменьшение затрат времени на подстрочный перевод, который можно впоследствии редактировать.

    Цель данной работы – определение того насколько можно использовать современные программы для осуществления перевода, а также какова их эффективность.

    В соответствии с поставленной целью, задачами исследования являются:

    · Уяснение последовательности формальных операций, обеспечивающий анализ и синтез в системе машинного перевода (перевод);

    · Анализ работы систем машинного перевода на примере перевода произведенного программой PROMT XT;

    · Сравнение образцов перевода с переводом, сделанным человеком. Анализ причин несоответствия.

    В работе также будет обозначена история развития машинного перевода, как в нашей стране так и за рубежом. Рассмотрена  алгоритм осуществления машинного перевода, классификация систем машинного перевода, проблема качества перевода.


    Глава I. Машинный перевод.

    1.1 История машинного перевода

     

    Впервые идею использования механизмов для перевода с одного языка на другой предложили Лейбниц и Декарт. Они предприняли попытку создать словарь, основанный на числовых кодах. Еще издавна существовали идеи о языке, понятном всем, построенном исключительно на логике, использующем символы – пиктограммы. Самой известной разработкой в этой области стала «interlingua» Джона Вилкинса. Гораздо позже были созданы еще несколько искусственных языков, наиболее известный из которых – эсперанто Льва Знаменгофа. По свидетельству биографов, знаменитый математик Чарльз Бэббидж, пытаясь убедить британское правительство финансировать его разработку «аналитической машины», обещал, что в недалеком будущем его машина кроме всего прочего сможет переводить разговорную речь. Но машина так и не была построена.

    В 1933 году было выдано два патента на механическую систему перевода – в России и во Франции. Французский армянин Жорж Арсуни изобрел схему устройства на бумажной ленте для перевода произвольного слова на другой язык и в 1937г. продемонстрировал прототип системы. В России патент достался Петру Смирнову – Троянскому, который изобрел своеобразный лингвистический арифмометр. Он выделял три стадии механического перевода: на первой стадии человек, знающий входной язык, представлял слова и предложения в «основной» форме и расставлял синтаксические функции слов. На второй стадии машина переводила эти формы и функции на выходной язык, а затем, на третьей стадии, полученный текст редактировал носитель выходного языка. Смирнов – Троянский считал, что по  крайней мере вторая стадия может быть автоматизирована.(№ 15)

    История машинного перевода как научно-прикладного направления началась в конце 40-х годов прошлого века. В марте 1947 г. Уоррен Уивер, директор отделения естественных наук Рокфеллеровского фонда, в переписке с Эдрю Бутом и Норбертом Винером впервые сформулировал концепцию машинного перевода, которую несколько позже (в 1949 г.) развил в своем меморандуме, адресованном Фонду.  У.Уивер писал: "I have a text in front of me which is written in Russian but I am going to pretend that it is really written in English and that it has been coded in some strange symbols. All I need to do is strip off the code in order to retrieve the information contained in the text.'' ("У меня перед глазами текст, написанный по-русски, но я собираюсь сделать вид, что на самом деле он написан по-английски и закодирован при помощи довольно странных знаков. Все что мне нужно — это взломать код чтобы извлечь информацию, заключенную в тексте."). Аналогия между переводом и дешифрованием была естественной в контексте послевоенной эпохи, если учитывать успехи, которых достигла криптография в годы Второй мировой войны.

    Можно считать, что на становление и развитие МП повлияли следующие этапы криптоанализа, касающиеся различных уров­ней языкового описания:

    · исследование чисто внешних характеристик сообщения, та­ких как частота отдельных элементов и сочетаний элементов;

    · исследование дистрибуции элементов, составляющих текст;

    · анализ билингв с целью выявления совпадающих элемен­тов и использования некоторых ключевых элементов (собствен­ных имен и пр.) с учетом статистических и дистрибутивных характеристик;

    · нахождение ключа и применение его ко всей  последова­тельности закодированных сообщений.(№ 11)


    Примерно в то же время Клод Шеннон сформулировал теорию информации, а Норберт Винер изложил концептуальные основы кибернетики. И вскоре на исследования были выделены деньги, а машинный перевод стал самостоятельным научным направлением, рожденным на стыке математики и программирования.

    Идеи Уивера легли в основу подхода к МП, основанного на концепции interlingua: стадия передачи информации разделена на два этапа; на первом этапе исходное предложение переводится на язык-посредник (созданный на базе упрощенного английского языка), а затем результат этого перевода представляется средствами выходного языка.  Меморандум Уивера вызвал самый живой интерес к проблеме МП. В 1948 г. А. Бут и Ричард Риченс произвели некоторые предварительные эксперименты (так, Риченс разработал правила разбиения словоформ на основы и окончания). 

    В те годы компьютеры довольно сильно отличались от современных. Это были очень большие и дорогие машины, которые занимали целые комнаты и требовали для своего обслуживания большой штат инженеров, операторов и программистов. В основном эти компьютеры использовались для осуществления математических расчетов для нужд военных учреждений, а также математических и физических факультетов университетов. Поэтому на ранних этапах разработка систем МП активно поддерживалась военными, при этом в США основное внимание уделялось русско-английскому направлению, а в СССР — англо-русскому. В 1952 состоялась первая конференция по машинному переводу, организованная логиком и математиком Й.Бар-Хиллелом. Помимо очевидных практических нужд важную роль в становлении машинного перевода сыграло то обстоятельство, что предложенный в 1950 английским математиком А.Тьюрингом знаменитый тест на разумность («тест Тьюринга») фактически заменил вопрос о том, может ли машина мыслить, на вопрос о том, может ли машина общаться с человеком на естественном языке таким образом, что тот не в состоянии будет отличить ее от собеседника-человека. Тем самым вопросы компьютерной обработки естественно-языковых сообщений на десятилетия оказались в центре исследований по кибернетике (а впоследствии по искусственному интеллекту), а между математиками, программистами и инженерами-компьютерщиками, с одной стороны, и лингвистами – с другой установилось продуктивное сотрудничество.

     Фактически история машинного перевода начинается с "Джорджтаунского эксперимента". фирма IBM совместно с Джорджтаунским университетом (США) успешно осуществили первый эксперимент (вошедший в историю под названием Джорджтаунского), в ходе которого система, использовавшая словарь из 250 слов и грамматику из 6 синтаксических правил, осуществила перевод 49 заранее отобранных предложений. В том же 1954 первый эксперимент по машинному переводу был осуществлен в СССР И.К.Бельской (лингвистическая часть) и Д.Ю.Пановым (программная часть) в Институте точной механики и вычислительной техники Академии наук СССР, а первый промышленно пригодный алгоритм машинного перевода и система машинного перевода с английского языка на русский на универсальной вычислительной машине были разработаны коллективом под руководством Ю.А.Моторина. После этого работы начались во многих информационных институтах, научных и учебных организациях страны. Идея машинного перевода стимулировала развитие исследований в теоретическом и прикладном языкознании во всем мире. Появились теории формальных грамматик, большое внимание стало уделяться моделированию языка и отдельных его аспектов, языковой и мыслительной деятельности, вопросам языковой формы и количественных распределений лингвистических явлений. Возникли новые направления лингвистической науки – вычислительная, математическая, инженерная, статистическая, алгоритмическая лингвистика и ряд других отраслей прикладного и теоретического языкознания. В течение 1950-х годов в учебных центрах многих стран мира были открыты отделения прикладной лингвистики и машинного перевода. Исследования и разработки по машинному переводу развернулись также во Франции, Англии, США, Канаде, Италии, Германии, Японии, Нидерландах, Болгарии, Венгрии и других странах, а также в международных организациях, где велик объем переводов с различных языков.

    Первое поколение систем машинного перевода базировалось на алгоритмах последовательного перевода "слово за словом", "фраза за фразой". Возможности таких систем определялись доступными размерами словарей, прямо зависящими от объема памяти компьютера. Перевод текста осуществлялся отдельными предложениями, смысловые связи между ними никак не учитывались. Такие системы называют системами прямого перевода. На смену им со временем пришли системы последующих поколений, в которых перевод от языка к языку осуществлялся на уровне синтаксических структур. В алгоритмах перевода использовался набор операций, позволяющий путем анализа переводимого предложения построить его синтаксическую структуру по правилам грамматики языка входного предложения, а затем преобразовать ее в синтаксическую структуру выходного предложения и синтезировать выходное предложение, подставляя нужные слова из словаря. Такие системы называются Т-системами (Т - от английского слова "transfer - преобразование").

    Наиболее совершенным считается подход к построению систем машинного перевода на основе получения некоторого, независимого от языков, смыслового представления входного предложения путем его семантического анализа. Затем производится синтез выходного предложения по полученному смысловому представлению. Такие системы называют И-системами (И - от слова "интерлингва"). Считается, что следующие поколения систем машинного перевода будут относиться к классу И-систем.

    В 50-х годах целый ряд исследовательских групп в США и в Европе работали в области МП. В эти исследования были вложены значительные средства, однако результаты очень скоро разочаровали инвесторов. Одной из главных причин невысокого качества МП в те годы были ограниченные возможности аппаратных средств: малый объем памяти при медленном доступе к содержащейся в ней информации, невозможность полноценного использования языков программирования высокого уровня. Другой причиной было отсутствие теоретической базы, необходимой для решения лингвистических проблем, в результате чего первые системы МП сводились к пословному (word-to-word) переводу текстов без какой-либо синтаксической (а тем более смысловой) целостности.

    Оказалось, что традиционная лингвистика не располагает ни фактическим материалом, ни идеями и представлениями, нужными для построения систем машинного перевода, которые использовали бы смысл переводимого текста.

    Традиционная лингвистика не могла дать исходные представления не только в части семантики, но и в части синтаксиса. Ни для одного языка в то время не существовало перечней синтаксических конструкций, не были изучены условия их сочетаемости и взаимозаменяемости, не были разработаны правила построения крупных единиц синтаксической структуры из более мелких. В сущности ни на один вопрос, поставленный в связи с построением систем машинного перевода, традиционная лингвистика в 50-х годах не могла дать ответа.

    Потребность в создании теоретических основ машинного перевода привела к формированию нового направления в лингвистике, называемого структурной, прикладной, математической лингвистикой.

    В 1959г. философ, математик, логик  Бар-Хиллел выступил с утверждением, что высококачественный полностью автоматический МП (FAHQMT) не может быть достигнут в принципе. В качестве примера он привел проблему нахождения правильного перевода для слова pen в следующем контексте: John was looking for his toy box. Finally he found it. The box was in the pen. John was very happy. (Джон искал свою игрушечную коробку. Наконец он ее нашел. Коробка была в манеже. Джон был очень счастлив.). Pen в данном случае должно переводиться не как "ручка" (инструмент для письма), а как "детский манеж" (play-pen). Выбор того или иного перевода в этом случае и в ряде других обусловлен знанием внеязыковой действительности, а это знание слишком обширно и разнообразно, чтобы вводить его в компьютер. Однако Бар-Хиллел не отрицал идею МП как таковую, считая перспективным направлением разработку машинных систем, ориентированных на использование их человеком-переводчиком (своего рода "человеко-машинный симбиоз"). 

    Это выступление самым неблагоприятным образом отразилось на развитии МП в США. В 1966 г. специально создананная Национальной Академией наук комиссия ALPAC (Automatic Language Processing Advisory Committee), основываясь в том числе и на выводах Бар-Хиллела, пришла к заключению, что машинный перевод нерентабелен: соотношение стоимости и качества МП было явно не в пользу последнего, а для нужд перевода технических и научных текстов было достаточно человеческих ресурсов. За докладом ALPAC последовало сокращение финансирования исследований в области МП со стороны правительства США — и это несмотря на то, что в то время как минимум три различные системы МП регулярно использовались рядом военных и научных организаций.

    Следующие десять лет (60 – е) разработка систем МП осуществлялась в США университетом Brigham Young University в Прово, штат Юта (ранние коммерческие системы WEIDNER и ALPS) и финансировалась Мормонской церковью, заинтересованной в переводе Библии; в Канаде группами исследователей, в числе которых TAUM в Монреале с ее системой METEO;  в Европе — группами GENA (Гренобль) и SUSY (Саарбрюкен).  Особого упоминания заслуживают работа в этой области отечественных лингвистов, таких, как И.А.Мельчук и Ю.Д.Апресян (Москва), результатом которой стал лингвистический процессор ЭТАП. В 1960 г. в составе Научно-исследовательского института математики и механики в Ленинграде была организована экспериментальная лаборатория машинного перевода, преобразованная затем в лабораторию математической лингвистики Ленинградского государственного университета.

    С развитием вычислительной техники в конце 70-х годов (появление микрокомпьютеров, развитие сетей, увеличение ресурсов памяти) машинный перевод вошел в новую колею.  При этом несколько сместились акценты: исследователи теперь ставили целью развитие "реалистических" систем МП, предполагавших участие человека на различных стадиях процесса перевода. 

    Новый подъем исследований в области МП начался в 1970-х годах и был связан с серьезными достижениями в области компьютерного моделирования интеллектуальной деятельности. Соответствующая область исследований, возникшая несколько позже МП, получила название искусственного интеллекта, а создание систем машинного перевода было осмыслено в 1970-е годы как одна из частных задач этого нового исследовательского направления.

    Можно выделить два основных стимула к развитию работ по машинному переводу в современном мире. Первый – собственно научный; он определяется комплексностью и сложностью компьютерного моделирования перевода. Как вид языковой деятельности перевод затрагивает все уровни языка – от распознавания графем (и фонем при переводе устной речи) до передачи смысла высказывания и текста. Кроме того, для перевода характерна обратная связь и возможность сразу проверить теоретическую гипотезу об устройстве тех или иных языковых уровней и эффективности предлагаемых алгоритмов. Эта характеристическая черта перевода вообще и машинного перевода в частности привлекает внимание теоретиков, в результате чего продолжают возникать все новые теории автоматизации перевода и формализации языковых данных и процессов.

    Второй стимул – социальный, и обусловлен он возрастающей ролью самой практики перевода в современном мире как необходимого условия обеспечения межъязыковой коммуникации, объем которой возрастает с каждым годом. Другие способы преодоления языковых барьеров на пути коммуникации – разработка или принятие единого языка, а также изучение иностранных языков – не могут сравниться с переводом по эффективности. С этой точки зрения можно утверждать, что альтернативы переводу нет, так что разработка качественных и высокопроизводительных систем машинного перевода способствует разрешению важнейших социально-коммуникативных задач.

     За период 1978-93 в США на исследования в области МП истрачено 20 миллионов долларов, в Европе — 70 миллионов, в Японии — 200 миллионов.

    Одной из новых разработок стала технология TM (translation memory), работающая по принципу накопления: в процессе перевода сохраняется исходный сегмент (предложение) и его перевод, в результате чего образуется лингвистическая база данных; если идентичный или подобный исходному сегмент обнаруживается во вновь переводимом тексте, он отображается вместе с переводом и указанием совпадения в процентах. Затем переводчик принимает решение (редактировать, отклонить или принять перевод), результат которого сохраняется системой. В настоящее время разработчиком известной коммерческой системы, основанной на технологии TM, является система TRADOS (основана в 1984 г.).

    В СССР в качестве головной организации по машинному переводу был в 1974 определен Всесоюзный центр переводов научно-технической литературы и документации (ВЦП), взявший на себя координацию работ в масштабе страны. Под его эгидой был проведен ряд крупных международных научных конференций по машинному переводу и проблемам научно-технического перевода. В ВЦП были созданы промышленные системы машинного перевода с английского языка на русский АМПАР (на основе исследований и разработок коллектива Ю.А.Моторина), с немецкого языка на русский НЕРПА, с французского языка на русский ФРАП, автоматические терминологические словари в помощь человеку-переводчику. Система АМПАР длительное время находилась в промышленной эксплуатации; впоследствии на ее базе были созданы более эффективные системы МП для персональных компьютеров семейства СПРИНТ. В ВПЦ была также разработана система МП с русского языка на английский АСПЕРА. Большой вклад в разработку промышленных систем МП был сделан ленинградской общесоюзной группой «Статистика речи» под руководством Р.Г.Пиотровского, а также группами специалистов по компьютерной лингвистике в Минске (А.В.Зубов), Кишиневе (В.А.Чижаковский), Махачкале (А.И.Чапля), Чимкенте (К.Б.Бектаев), Самарканде (Х.А.Арзикулов) и др. На базе исследований и научно-практического подхода группы «Статистика речи» были впоследствии разработаны и сейчас находятся в коммерческом использовании такие системы машинного перевода, как Stylus, Socrat и другие.

    Первые коммерческие продукты машинного перевода, нашедшие практическое использование, появились в середине 80-х годов.

    В настоящее время в Российской Федерации продолжаются в незначительных масштабах некоторые работы по системам МП, основанным на подходе «текст-смысл-текст», не всегда явно проговариваемым лозунгом которого в момент обоснования этого подхода в 1960-х годов был «машинный перевод без перевода, без машин, без алгоритмов» (см. обзор работ этого направления, принадлежащий Л.Н.Беляевой и М.И.Откупщиковой). Идея подхода заключалась в том, что от лингвиста требуется только декларативное описание фактов языка (т.е. лингвистическая теория, претендующая, правда, на особую точность и формализованность), а алгоритмы перевода составят программист и математик. В рамках этих исследований были получены значительные теоретико-лингвистические результаты (в частности, создана теория так называемых лексических функций, нашедшая применение в лексикографии), однако для создания практических систем подобного рода подход оказался недостаточно эффективным. Неизмеримо выросшие за последние десятилетия возможности вычислительной техники и новые программистские подходы никак не могут помочь реализовать идеи анализа и синтеза, основанные на приоритете выявления только синтаксической структуры с последующим переходом к смыслу. Выявление содержания текста в рамках человеко-машинного интерфейса может производиться, как и во всякой прикладной задаче, только с использованием как декларативных, так и процедурных знаний и при значительной опоре на лексику. Эта точка зрения обоснована, в частности, в недавних работах отечественного специалиста по программированию и искусственному интеллекту А.С.Нариньяни.

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

    1.2 Как осуществляется машинный перевод.


    Системы МП осуществляют  автоматизированный  перевод  текста.  Единицами перевода  при  этом  служат  слова  или словосочетания,  причем   последние разработки  позволяют  учитывать  морфологию  переводимого  слова.  Развитые системы  МП   осуществляют   перевод   по   заданным   разработчиком   и/или корректируемым пользователем алгоритмам перевода. Для осуществления машинного перевода в  компьютер  вводится  специальная программа,   реализующая   алгоритм перевода,   под   которым   понимается последовательность однозначно и строго  определенных  действий  над  текстом для нахождения переводных соответствий в данной паре  языков  А1  –  А2  при заданном направлении перевода (с  одного  конкретного  языка  на другой). Система машинного перевода включает в себя  двуязычные  словари,  снабженные необходимой грамматической информацией (морфологической,  синтаксической  и семантической)  для  обеспечения  передачи   эквивалентных,   вариантных   и трансформационных переводных соответствий, а также алгоритмические  средства грамматического   анализа,  реализующие   какую-либо   из   принятых    для автоматической  переработки  текста  формальных  грамматик.  Имеются   также отдельные системы машинного перевода, рассчитанные на перевод в рамках  трех и более языков, но они в настоящее время являются экспериментальными.     Наиболее   распространенной   является   следующая   последовательность формальных операций, обеспечивающих анализ  и  синтез  в  системе машинного перевода:     1. На первом этапе осуществляется ввод текста и поиск входных  словоформ (слов  в  конкретной  грамматической  форме,  например   винительного   падежа множественного  числа)  во входном  словаре  (словаре  языка,  с   которого производится перевод)  с  сопутствующим  морфологическим  анализом,  в  ходе которого устанавливается принадлежность  данной  словоформы  к  определенной лексеме (слову как единице словаря).  В  процессе  анализа  из  формы  слова могут  быть  получены  также  сведения,   относящиеся   к   другим   уровням организации языковой системы.     2. Следующий этап включает в себя перевод идиоматических словосочетаний, фразеологических единств или штампов данной  предметной  области  (например, при англо-русском переводе обороты типа  that is why,  in the form of  получают  единый  цифровой   эквивалент   и   исключаются   из   дальнейшего грамматического    анализа);     определение    основных     грамматических (морфологических,    синтаксических,    семантических     и     лексических) характеристик элементов входного текста  (например,  числа  существительных, времени глагола, синтаксических функций словоформ в данном  тексте), производимое в рамках входного языка;  разрешение омографии  (конверсионной омонимии  словоформ  –  скажем,  англ.  why  может  быть  существительным, междометием, наречием); лексический  анализ  и перевод лексем.  Обычно  на  этом  этапе  однозначные  слова  отделяются  от многозначных  (имеющих  более  одного  переводного  эквивалента  в  выходном языке), после чего однозначные слова переводятся по спискам эквивалентов,  а для    перевода    многозначных    слов    используются    так    называемые контекстологические словари, словарные  статьи  которых  представляют  собой алгоритмы   запроса   к   контексту   на   наличие/отсутствие    контекстных определителей значения.

        3. Окончательный грамматический анализ, в ходе  которого  доопределяется необходимая  грамматическая  информация  с  учетом  данных  выходного  языка (например, при русских существительных  типа  сани,  ножницы  глагол  должен стоять в форме множественного числа, несмотря на то, что в  оригинале  может быть и единственное число. Но в то же время "Русское" слово «порося» оказывается возвратным глаголом со значением су­ществительного". Как бы ни анализировать русское слово «порося», с лингвистической точки зрения оно абсолютно не сопоставимо с возвратными глаголами на -ся. Лингвистическая членимость сло­ва и членимость слова, "удобная" для машины,  не имеют между собой ничего общего. (№ 4))

        4. Синтез выходных словоформ и предложения в целом на выходном языке.     В  зависимости  от  особенностей  морфологии,  синтаксиса  и   семантики конкретной языковой  пары,  а  также  направления  перевода  общий  алгоритм перевода может включать  и  другие  этапы,  а  также  модификации  названных этапов или порядка их следования, но  вариации  такого  рода  в  современных системах, как правило, незначительны. Анализ и  синтез  могут  производиться как пофразно, так и  для  всего  текста,  введенного  в  память  компьютера; в последнем  случае  алгоритм  перевода  предусматривает   определение   так называемых анафорических  связей.

    Действующие системы машинного перевода ориентированы на конкретные пары языков (например, французский и русский или японский и английский) и используют, как правило, переводные соответствия либо на поверхностном уровне, либо на некотором промежуточном уровне между входным и выходным языком. Качество машинного перевода зависит от объема словаря, объема информации, приписываемой лексическим единицам, от тщательности составления и проверки работы алгоритмов анализа и синтеза, от эффективности программного обеспечения. Любой достаточно хороший словарь фиксирует не только слова, но и часто встречающиеся сочетания слов, т.е. микро­контекст соответствующих единиц. Например, при слове «настоящий» может быть дано сочетание «в настоящее время» — gegenwartig, actuellement, при слове «опыт» — сочета­ние: «проводить опыт» - Experiment, durchfiihren и сочетание «опыт по» - Experiment mit (experiences sur, essais de).

    Одновременно в хорошем словаре указываются сочетания «почтовый перевод», «денежный перевод» — нем. Post­'s anweisung, фр. mandat poste, и поскольку это сочетание нам не встретилось, то соответствующие переводы будут исключены. (№ 18)

    Современные аппаратные и программные средства допускают использование словарей большого объема, содержащих подробную грамматическую информацию. Информация может быть представлена как в декларативной (описательной), так и в процедурной (учитывающей потребности алгоритма) форме.

    Современный машинный перевод следует отличать от использования компьютеров в помощь человеку-переводчику. В последнем случае имеется в виду автоматический словарь, помогающий человеку быстрее подбирать нужный переводной эквивалент. Хотя и в том, и в другом случае компьютер работает вместе с человеком (переводчиком или редактором). В содержание термина «машинный перевод» входит представление о том, что главную, большую часть работы по переводу и отысканию переводных эквивалентов и переводных соответствий машина берет на себя, оставляя человеку лишь контроль и исправление ошибок, в то время как компьютерный словарь в помощь человеку – это чисто вспомогательное средство для быстрого нахождения переводных соответствий; при этом, однако, в такого рода словарях в ограниченной степени могут быть реализованы и некоторые функции, присущие системам машинного перевода.

    В практике переводческой деятельности и в информационной технологии различаются два основных подхода к машинному переводу. С одной стороны, результаты машинного перевода могут быть использованы для поверхностного ознакомления с содержанием документа на незнакомом языке. В этом случае он может использоваться как сигнальная информация и не требует тщательного редактирования. Другой подход предполагает использование машинного перевода вместо обычного «человеческого». Это предполагает тщательное редактирование и настройку системы перевода на определенную предметную область. Здесь играют роль полнота словаря, ориентированность его на содержание и набор языковых средств переводимых текстов, эффективность способов разрешения лексической многозначности, результативность работы алгоритмов извлечения грамматической информации, нахождения переводных соответствий и алгоритмов синтеза. На практике перевод такого типа становится экономически выгодным, если объем переводимых текстов достаточно велик (не менее нескольких десятков тысяч страниц в год), если тексты достаточно однородны, словари системы полны и допускают дальнейшее расширение, а программное обеспечение удобно для постредактирования. Такого рода системы машинного перевода используются в организациях, потребности которых в оперативных и качественных переводах достаточно велики.























    1.3 Системы машинного перевода и их классификация.

     

    В 1990 году Лари Чайлдс, специалист по машинному переводу, предложил следующую классификацию систем МП по принципу независимости машины от действий человека, ставшую сейчас общепринятой:

    · FAMT (Fully – automated machine translation) – полностью автоматизированный машинный перевод;

    · HAMT (Human – assisted  machine translation) – машинный перевод при участии человека;

    · MAHT (Machine – assisted human translation) – перевод, осуществляемый человеком с использованием компьютера.

    Программы машинного перевода первой из названных категорий являются делом далекого будущего, поскольку даже в общем виде не решены проблемы автоматического понимания, перевода и синтеза текстов. Основной проблемой является сложность языка  как  такового.  Возьмем,  к примеру, значения  слова  английского "can".  Помимо  основного   значения   модального вспомогательного глагола, у слова  "can"  имеется  несколько  официальных  и жаргонных значений в качестве существительного:  "банка", “бидон”, “прекратить”, “перестать”,“колпак дымовой трубы”, "тюрьма". Кроме этого, существует архаичное значение этого  слова  -  "знать или понимать". Если предположить, что у выходного языка для каждого из  этих значений  имеется  отдельное  слово,  каким  образом  может   компьютер   их различить?

     Как оказалось, определенные успехи были достигнуты  в  сфере  разработки программ  перевода,  различающих  смысл  основываясь  на  контексте.   Более поздние исследования  при  анализе  текстов  опираются  больше  на   теории вероятности. Но тем не менее сегодня все «коробочные» продукты – переводчики, и онлайновые службы построены только по схеме FAMT.(№ 8,15)
    Программы второй категории разработчики называют МТ-программы (от Machine translation - машинный перевод). Реально автоматизированный (с участием человека) машинный перевод возможен только в условиях искусственно ограниченного, как по словарному запасу, так и по грамматике, языка. Говоря о машинном переводе при участии человека, обычно подразумевают редактирование текстов как до, так  и после их обработки компьютером. Люди-переводчики изменяют тексты так,  чтобы они были понятны машинам. После того, как  компьютер  сделал перевод,  люди опять-таки редактируют грубый  машинный перевод, делая  текст  на  выходном языке правильным. Помимо такого порядка работы, существуют  системы  МП,  во время  перевода  требующие  постоянного  присутствия   человека-переводчика, помогающего компьютеру делать перевод  особенно  сложных  или  неоднозначных конструкций. Машинный перевод с помощью человека применим в большей степени к текстам с ограниченным вокабуляром узко-ограниченной тематики. Экономичность использования  машинного перевода с  помощью  человека  - вопрос все еще спорный. Сами программы  обычно  достаточно  дорогостоящи,  а для  работы   некоторых   из   них   требуется   специальное   оборудование. Предварительному и последующему редактированию необходимо  обучаться. Создание и поддержание в  рабочем  состоянии  баз данных слов - процесс трудоемкий и  зачастую  требует  специальных  навыков.

    В качестве реального успешного проекта МТ-программы всегда называют немецкую систему Meteo, выполняющую перевод метеопрогнозов с французского языка на английский и обратно.

    К МТ-программам относятся и продукты машинного перевода фирмы ПРОМТ.

       Программы третьей категории разработчики называют ТМ-программы (от translation memory - память перевода). Перевод, осуществляемый человеком с использованием компьютера. При  этом подходе человек-переводчик ставится в центр процесса перевода,  в  то  время как программа компьютера расценивается  в  качестве  инструмента,  делающего процесс  перевода  более  эффективным,  а  перевод  -  точным.          Вот список наиболее известных систем ТМ:     - Transit швейцарской фирмы Star,     - Trados (США),     - Translation Manager от IBM,     - Eurolang Optimizer французской фирмы LANT,     - DejaVu от ATRIL (США),     - WordFisher (Венгрия).     Системы ТМ позволяют исключить повторный перевод  идентичных  фрагментов текста. Перевод сегмента осуществляется  переводчиком  только  один  раз,  а затем  каждый  следующий  сегмент  проверяется  на  совпадение  (полное  или нечеткое) с базой данных, и, если найден идентичный или похожий сегмент,  то он предлагается в качестве варианта перевода.     Несмотря на широкий ассортимент систем TM,  они  имеют  несколько  общих функций:     - Функция сопоставления (Alignment). Одно из преимуществ систем ТМ – это возможность использования уже переведенных материалов  по  данной  тематике. База данных ТМ может быть получена путем посегментного сопоставления  файлов оригинала и перевода.     -  Наличие  фильтров  импорта  –  экспорта.  Это  свойство  обеспечивает совместимость систем ТМ с множеством текстовых  процессоров  и  издательских систем и дает переводчику относительную независимость от заказчика.     - Механизм поиска нечетких или полных совпадений. Именно этот механизм и представляет собой основное достоинство систем ТМ. Если при переводе  текста система встречает сегмент, идентичный или близкий к переведенному ранее,  то уже переведенный  сегмент  предлагается  переводчику  как  вариант  перевода текущего сегмента, который может быть  подкорректирован.  Степень  нечеткого совпадения задается пользователем.     - Поддержка тематических  словарей.  Эта  функция  помогает  переводчику придерживаться  глоссария.  Как  правило,  если   в   переводимом   сегменте встречается слово  или  словосочетание  из  тематического  словаря,  то  оно выделяется цветом  и предлагается его  перевод,  который  можно  вставить  в переводимый текст автоматически.     - Средства поиска фрагментов текста. Этот инструмент  очень  удобен  при редактировании перевода. Если в процессе работы  был  найден  более  удачный вариант перевода какого-либо фрагмента текста, то этот фрагмент  может  быть найден во всех сегментах  ТМ,  после  чего  в  сегменты  ТМ  последовательно вносятся необходимые изменения.     Конечно,  как  и  любой  программный  продукт,  системы  ТМ  имеют  свои достоинства и недостатки, и свою  область  применения.  Однако  в  отношении систем TM, основным недостатком является их дороговизна.     Особенно удобно использовать системы ТМ при переводе  таких  документов, как руководства пользователя, инструкции по эксплуатации, конструкторская  и деловая документация, каталоги продукции и другой однотипной документации  с большим количеством совпадений.

    Часто ТМ-программы используют в сочетании с МТ-программами. Наиболее популярным в мире ТМ-инструментарием является Translation's Workbench фирмы Trados (для краткости часто также называемый Trados).

    Есть, однако, впечатление, что ресурсы развития в этом направлении уже практически  исчерпаны и без перехода к новым технологиям, радикального улучшения качества пе­ревода достигнуть не удастся. К числу таких новых: техноло­гий относится вовлечение пользователя в процесс перевода, а также:

    ·   автоматическое определение контекста употребления слова с тем, чтобы выбирать для перевода адекватные словарные значения;

    ·   использование баз знаний, в которых собрана информация о предметной области;        

    ·   самообучение системы в ходе взаимодействия с пользователем.       

    Еще недавно о подобных возможностях на персональном компьютере не могло быть и речи. Сейчас мощности и объема памяти уже вполне достаточно, нет только систем, которые обеспечивали бы хорошее качество перевода.(№ 15)

    Современные коммерческие продукты машинного перевода предлагают отечественные фирмы:

    ·   "Виста Текнолоджиз" и "Адвентис", образованные в 1991 г. коллективом разработчиков, выделившихся из ВИНИТИ;

    ·   ПРОМТ, образованная в 1991 г.;

    ·   "Медиа Лингва".

    Наиболее известной из числа эксплуатируемых за рубежом систем машинного перевода является система SYSTRAN, разработанная и поддерживаемая компанией SYSTRAN Software Inc. и используемая службой машинного перевода при комиссии Европейского союза. Данная служба, объем переводов в которой составляет около 2,5 млн. страниц в год, использует систему SYSTRAN для перевода с английского на немецкий, французский, испанский, греческий и итальянский языки, а также с французского на английский, испанский и итальянский. Достоинства системы:

    ·   получаемый текст может подвергаться    редактированию легко и быстро;

    ·   имеется возможность переводить большой объем научно-технических материалов;

    ·   система «многоязычна»;

    ·   инженерные решения достаточно простые    (стандартные ЭВМ).

    Одно из главных   достоинств   заключается, в том, что при МП обеспечивается соблюдение   последовательной,   непротиво­речивой терминологии, в то время как в человеческом переводе терминологической лексики часто возникает разнобой. Это достоинство является весьма существенным для научно-технического перевода. Скорость перевода составляет 1 млн. слов в час за время (работы центрального процессора.

    Система обеспечивает правильный перевод диаграмм, гра­фиков и прочих нетекстовых включений. В ЭВМ могут вводить­ся изменения, например, при изменениях стандарта на терми­нологию. Поправки редакторов также постепенно накаплива­ются и вводятся в словарь.

    Лингвистический анализатор СИСТРАНа состоит из следую­щих четырех основных этапов. Первый этап разрешает омографию. Второй исследует предложение справа налево, запоминая при переходе от слова к слову, какие типы синтаксических отно­шений потенциально возможны внутри каждого самостоятель­ного предложения, если учесть типы встретившихся слов. Ис­пользуя набор регистров, в которых содержатся данные о возможных типах синтаксических отношений, этот этап затем устанавливает основные структуры внутри предложения (глагол плюс объект, предлог плюс объект и т. д.). Третий этап, двига­ясь слева направо, уточняет эти отношения, опознавая типы объектов, определительные структуры и пр. Четвертый этап, используя данные, полученные в результа­те работы предшествующих этапов, включая информацию о «границах предложений, типах главных и зависимых предложений, осуществляет анализ в границах этих предложений, определяя подлежащее и сказуемое в каждом из этих предложений.

    Следует отметить, что в некоторых случаях информация мо­жет передаваться от одного предложения к другому. В памяти ЭВМ отведено специальное место для такой информации. Она особенно необходима для перевода местоимений, антецеденты которых могут находиться в другом предложении. Основные задачи, ко­торые выполняются универсальным программным обеспечением СИСТРАНа, следующие:

    ·   считывание текста;

    ·   разбивка текста на слова;

    ·   поиск слов в различных словарях;

    ·   приписывание словарных кодов словам или словосочета­ниям текста;

    ·   распределение памяти под анализируемые предложения;

    ·   контроль за выполнением программ перевода;

    ·   подготовка  перевода   к  печати,  выдаче  на   микрофиши и   пр.

    Программное обеспечение системы позволяет обеспечить скорость перевода в 200 000 —300 000 слов в час. (№ 11)


    90-е годы принесли с собой бурное развитие рынка ПК (от настольных до карманных) и информационных технологий, широкое использование сети Интернет (которая становится все более интернациональной и многоязыкой). Все это сделало возможным, а главное востребованным, дальнейшее развитие систем МП. Появляются новые технологии, основанные на использовании нейронных сетей, концепции коннекционизма, статистических методах.

    Эффективность работы современной системы МП в решающей степени зависит от ее удачной настройки на конкретный подъязык (или микроподъязык) естественного языка, на определенную лексику и ограниченный набор грамматических средств, характерных для текстов данной предметной области, а также на определенные типы документов. Учение о подъязыках с точки зрения машинного перевода было впервые сформулировано Н.Д.Андреевым (Ленинградский университет) в 1967, хотя представления о языковых регистрах, стилях, жанрах письменного текста и т.п. были хорошо известны и в традиционной лингвистике. Подъязык, с точки зрения МП, определяется в первую очередь некоторым исходным набором текстов, в рамках которого определяется входной и выходной словари, степень распространения и характер лексической неоднозначности лексем, характер и распространенность синтаксических конструкций, способы их перевода в данной языковой паре и пр. Большую роль играют параллельные тексты и словари-конкордансы, с помощью которых можно достаточно эффективно изучить и использовать в составлении алгоритмов лексическую сочетаемость и дистрибуцию (распределение) языковых элементов в речи (дискурсе, тексте). Статистические характеристики подъязыков помогают упорядочить структуру соответствующих алгоритмов анализа и синтеза. Выходной словарь, ориентированный на потребности синтеза и передачи основных видов соответствий в конкретной языковой паре, обеспечивает приемлемый выходной текст. В любом из современных видов машинного перевода необходимо участие человека-редактора, удобство работы которого обеспечивается качеством и надежностью соответствующего программного обеспечения.  

    Перспективы развития машинного перевода связаны с дальнейшей разработкой и углублением теории и практики перевода, как машинного, так и «человеческого». Для развития теории важны результаты сопоставительного языкознания, общей теории перевода, теории закономерных соответствий, способов представления знаний, оптимизации и совершенствования лингвистических алгоритмов. Новые и более эффективные словари с необходимой словарной информацией, строгие теории терминологизации лексики, теория и практика работы с подъязыками помогут повысить качество перевода лексических единиц. Формальные грамматики, ориентированные на перевод, дадут возможность оптимизировать алгоритмы нахождения переводных соответствий в данной коммуникативной ситуации, которая может быть описана в рамках соответствующих прикладных теорий представления знаний. Наконец, новые возможности программирования и вычислительной техники также будут вносить свой вклад в совершенствование и дальнейшее развитие теории и практики машинного перевода «Машинный перевод все ещё далек от совершенства, но любой желающий с его помощь. Сможет по крайней мере понять основной смысл документа.» (Луи Монье, технологический директор AltaVista.)

                                                   1.4 Качество машинного перевода  

    "Теория машинного перевода дает возможность не только кри­тически пересмотреть все важнейшие традиционные понятия грамматики (слова, части речи, члены предложения и т.д.), но и приостановить научные споры, которые велись вокруг этих поня­тий. С позиции, диктуемой машинным переводом, "слово — это то, что ограничено интервалами между буквами", а "предложение - это то, что ограничено определенными знаками препинания".(№ 12)Для машинного перевода с одного языка на другой действительно необходимо теоретическое изучение чисто фор­мальной структуры языка. Машине, которая переводит с одного языка на другой, в известной мере безразлично, что означают те формальные категории, которые она транспонирует с одного языка на другой. (№ 4)

    Так, многие, например, эмоционально окрашенные слова или определенные выражения могут неодинаково восприниматься разными людьми, (не говоря уже о машине) а эти люди представляют собой разные языковые и этнические коллективы (№ 1).В настоящее время качество машинного перевода оставляет  желать  много лучшего, и само  наличие  таких  систем  пока  правильнее  воспринимать  как предмет научных исследований. В большинстве случаев при работе над  проектом применение систем МП не оправдано, поскольку:     - Системы МП  не  дают  приемлемого  качества  выходного  текста.  Более высокого  качества  можно  добиться  с  помощью  предварительной   настройки системы, что совершенно неприемлемо  при  небольших  объемах переводимого текста, и/или путем последующего редактирования, а  это  только замедляет работу, если переводчик использует слепой метод печати.     - Системы МП не гарантируют соблюдения единства  терминологии,  особенно при работе коллектива  переводчиков  над  большим  проектом.  Вернее,  могут гарантировать при условии очень внимательного обращения с  пользовательскими словарями, а на это не всегда стоит рассчитывать.     Однако в некоторых случаях  использование  систем  МП  все  же  помогает сократить временные затраты. Это происходит, если текст достаточно  объемный и содержит однообразную  терминологию,  что  позволяет  сравнительно  быстро настроить под  него  систему  МП.  Тогда  редактирование  текста  не  займет слишком много времени. Однако в этом  случае  следует  особенно  внимательно отнестись к  стилю  текста  перевода. Машинный перевод формален,  поэтому высока вероятность калькирования синтаксических  структур  языка  оригинала, которое  характерно  для перевода вообще,  а  потому  вполне  может   быть пропущено при редактировании.     Вообще  говоря,  системы   МП  вполне   могут   применяться   там,   где используется максимально стандартизованный  язык  с  простой  грамматикой  и сравнительно небольшим запасом слов. Довольно успешным проектом  системы  МП считается немецкая программа Meteo,  выполняющая  перевод  метеопрогнозов  с французского  языка  на  английский  и  обратно.   Для   облегчения   работы переводчиков и технических писателей  компанией  Boeing  в  свое  время  был разработан стандарт языка для написания  технической  документации,  который известен как Boeing English.

    С филологической точки зрения перевод есть авторская опе­рация, которую человек-переводчик производит над текстом. Осознав характер задачи, действуя с определенной мерой осве­домленности, напряжением внимания и воли переводчик дости­гает коммуникативного эффекта, предполагаемого автором ори­гинала. Переводчик формирует новый текст, который в идеале обладает всеми особенностями оригинала. Предварительное чте­ние переводчиком оригинала обеспечивает возможность прило­жения определенного «стилевого усилия», поскольку всякий раз текст, составленный человеком, содержит определенные ошиб­ки против принятого норматива. Эти ошибки могут быть следствием разнообразных причин, но главным образом они суть следствие свободы воли говорящего, которой он пользуется для достижения нового эффекта, также прилагая стилевое усилие. Из-за нарушений норматива любая формальная грамматика не будет полна и не будет давать полного покрытия текстов. Для читателя текста перевода, в такой же степени, как и для читателя текста оригинала, важно психолингвистическое осознание текста.

    Машинный перевод есть перевод без авторства переводчика. В той мере, в какой создание и последующее пополнение алгоритмов и словарей есть работа коллектива, МП есть обезличен­ный коллективный перевод. МП базируется на чисто перевод­ных, языковых соответствиях, никакого предварительного чте­ния текста система МП производить не может, поэтому МП исключает текстологический анализ. Передача смысла в МП достигается особым знаковым преобразованием, так как МП: есть определенная операция над языком при условии идентич­ности содержания знака. Он осуществляет механические сино­нимические замещения на основе регулярных межъязыковых корреспонденции соотнесения. Эти регулярные корреспонденции не извлекаются автоматически из хранилищ или устройств, по­добных словарям. Невозможно моделировать коммуникативную функцию естественного языка, если рассматривать его только как кодовую систему; переводные соответствия есть элемент ди­намики пользования языком, и удовлетворительно моделирую­щая перевод система не может не рассматривать переводные соответствия как всеобъемлющие, многоуровневые, но каждый раз новые образования. Должны быть формализованы не сами переводные соответствия как таковые, но закономерности, по которым они возникают в текстах и с помощью которых они мо­гут быть обнаружены в деталях, важных и нужных для пере­вода. Такая формализация удается с помощью моделирования действий переводчика, при котором особое внимание уделяется семантико-синтаксическому анализу в терминах, близких к тра­диционно понятным всем пользователям языком.(№ 11)

    Никаких стилевых усилий машина-переводчик не произво­дит. Задача приложения этих усилий возлагается на читателя машинного перевода или редактора. Механические операции, ко­торые производит ЭВМ над текстом, носят сложный характер: система осуществляет максимально полные рекомбинации зна­ков и комплексную переработку массовой информации в языке. Производится опознание, различение и перевод между разными категориями двух языков, разведение синонимов и омонимов, процессное развертывание членов предложения, в результате чего обеспечивается инвариантность существенных семантиче­ских признаков значения в передаче его на другой язык.

    Исходя из концепции системной организации, особое внима­ние в МП уделяется словарю. Поскольку словарь для МП есть одновременно машинный словарь, который имеет аналоги в дру­гих системах автоматической обработки информации на естест­венном языке, возникает возможность сделать обобщения и го­ворить об общих свойствах машинных словарей. Эти общие свой­ства рассматриваются в противопоставлении свойствам обычных словарей, но не в абстрактном смысле (при котором такие про­тиворечия могут стираться подобно тому, как стирается различие между человеком и мыслящей машиной), а в представлениях инженерной лингвистики — прикладной лингвистики, направленной на решение технических задач.

      Для преодоления основных трудностей проблемы машинного перевода должны быть решены задачи автоматизированного представления контекста, смыслового содержания переводимого текста, знаний о понятиях предметной области, к которой относится переводимый текст. В первых системах реализовался так называемый "прямой" подход к переводу, в рамках которого, как уже отмечалось, все осуществляемые при переводе операции трактовались как операции межъязыкового перехода - преобразования текста оригинала в текст перевода. В машинном переводе в соответственном смысле этот подход приводит к так называемым "тотальным стратегиям" (№ 10). Общей характеристикой тотальных стратегий является стремление получить полностью автоматизированный высококачественный машинный перевод максимальным использованием семантического уровня языка. Этот подход внес значительный вклад, как в теорию, так и в практику машинного перевода.
    Второй подход хронологически возник раньше первого. Этот подход заключается в представлении о промежуточном языке и близко связан с идеей переводных соответствий на чисто языковом уровне. Методическая суть данного подхода заключается: в изучении поведения языковых единиц, особенно в языковом контексте; в моделировании человеческого владения языком, особенно в процессе межъязыкового перевода; в переходе от простого к более сложному.   Многие исследователи, например, такие как Марчук Ю.Н., Нелюбин Л.Л., Ревзин И.И. считают, что программное обеспечение для работы с грамматикой основывалось на имевшихся теориях структуры языка в сочетании с придуманными на скорую руку правилами.
    Разработанные программы выдавали настолько плохой перевод, что его невозможно было понять. Проблема состоит в том, что смысл текста на естественном языке зависит не только от самого предложения, но также и от контекста.
    Скорее всего, эти первые проекты действительно не дали никаких реальных результатов. Однако были выявлены многие основные проблемы перевода текстов на естественном языке: многозначность слов и синтаксических конструкций, практическая невозможность глобального описания семантической структуры мира даже в ограниченной предметной области, отсутствие эффективных формальных методов описания лингвистических закономерностей и др. (№ 8).

    Современное состояние МП характеризуется некоторым слиянием результатов двух подходов, но не механическим соединением результатов, а слиянием их на базе новых моделей, созданных при основном внимании к собственно переводческому аспекту владения естественным языком. Центром исследования в современном МП становится моделирование действий человека-переводчика, особенно в части использования им двух- и многозначных переводных соответствий при переводе с одного языка на другой. МП, возникший вне лингвистики, вошел в нее главным образом благодаря важному аспекту моделирования.Качество перевода обеспечивается технологией, многоразмерной архитектурой словарей (два уровня перевода для каждого слова: активные и пассивные), механизмом ассоциа­тивной памяти, созданием и редактированием пользовательских словарей, а также подключе­нием специализированных и общих словарей больших объемов. (№ 14)

    Медленное повышение точности машинного перевода объясняется от­части тем, что такая программа нуждается в очень большой базе данных с текстами дни сравнения похожих фраз и их осмысления  ( № 19).


    Еще в 1956 г. американские психологи Миллер и Биб-Сентер предложили следующие методы оценки качества перевода:

    ·   проставление оценки качества перевода испытуемыми по стабильной шкале;

    ·   подсчет процента слов, совпадающих в неотредактированном и отредактированном переводе;

    ·   изучение ответов человека, читавшего только перевод, на вопросы, поставленные по тексту оригинала.

    Психолог Ш. Пфаффлин использует для оценки качества пе­ревода следующие два критерия:

    — оценка понимания перевода путем постановки вопросов по тексту;

    — оценка ясности смысла перевода по шкале «ясно», «неяс­но», «бессмысленно» Ни один из этих методов не дает четкого ответа на вопрос о том, каковы критерии качества машинного перевода и каков до­пустимый уровень качества. (№ 11)




    Глава II. Система машинного перевода PROMT

    2.1  Возможности машинного переводчика семейства PROMT.

    С начала 1990-х гг. на рынок систем ПК выходят отечественные разработчики.  В июле 1990 года на выставке PC Forum в Москве была представлена первая в России коммерческая система машинного перевода под названием PROMT (PROgrammer's Machine Translation). В 1991 г. было создано ЗАО "ПРОект МТ", и уже в 1992 г. компания "ПРОМТ" выиграла конкурс NASA на поставку систем МП (ПРОМТ была единственной неамериканской фирмой на этом конкурсе). В 1992 г. "ПРОМТ" выпускает  целое семейство систем под новым названием STYLUS для перевода с английского, немецкого, французского, итальянского и испанского языков на русский и с русского на английский, а в 1993 г. на базе STYLUS создается первая в мире система МП для Windows. В 1994 г. вышла версия STYLUS 2.0 для, а в 1995-1996 гг. представлено третье поколение систем машинного перевода, полностью 32-разрядных STYLUS 3.0 для Windows 95/NT, одновременно с этим успешно завершена разработка совершенно новых, первых в мире русско-немецкой и русско-французской систем МП.

    В 1997 г. подписано соглашение с французской фирмой Softissimo о создании систем перевода с французского языка на немецкий и английский и обратно, а в декабре этого года была выпущена первая в мире система немецко-французского перевода. В этом же году компания "ПРОМТ" компания выпустила систему, реализованную по технологии Гигант — для поддержки нескольких языковых направлений в одной оболочке, а также специальный переводчик для работы в Интернете WebTranSite.

    В 1998 г. выпускается целое созвездие программ под новым названием PROMT 98. Через год компания ПРОМТ выпустила два новых продукта: уникальный пакет программ для работы в Интернете - PROMT Internet,  и переводчик для корпоративных почтовых систем — PROMT Mail Translator. Для корпоративных клиентов разработаны также специальные серверные решения – корпоративный сервер переводов PROMT Translation Server (PTS) и Интернет-решение PROMT Internet Translation Server (PITS). В 2000 г. "ПРОМТ" обновила всю линию своих программных продуктов, выпустив МП системы нового поколения: PROMT Translation Office 2000, PROMT Internet 2000 и Magic Gooddy 2000. 

    В основе всех продуктов ПРОМТ лежит единое переводческое ядро – система анализа входного текста и синтез связного перевода на выходе; в них тоже реализованы общие принципы автоматизации перевода. Лингвистический редактор ПРОМТ позволяет переводить документы, проводить настройку на тематику документа и позволяет редактировать текст. Программа обеспечивает быстрый перевод, поддерживая практически все текстовые редакторы. Размер переводимого текста ограничен только ресурсами самого компьютера.

    Переводчик можно применять в двух режимах: без настроек для оперативного чернового перевода (включается только базовый словаря) и с дополнительной настройкой (подключение дополнительных тематических словарей) для обеспечения более качественного перевода. Программа включает более 100 специализированных словарей, что даёт возможность сделать перевод более точным, однако даже большое количество специализированных словарей не может заменить пользовательского словаря. 

    Уникальной технологией реализованной в последних версиях компании ПРОМТ является механизм ассоциативной памяти (АП). Дело в том, что многие документы содержат часто встречающиеся одинаковые обороты и даже фрагменты текста, которые логично переводить единожды и впоследствии применять готовый перевод. В базе переводов АП сохраняются сегменты оригинального и переведенного текстов, которые используются при необходимости перевести аналогичный фрагмент текста. Это обеспечивает возможность обучения системы и сохранения результатов труда пользователя для последующего применения.

    Полезная особенность программ последнего поколения – способность исключать из процесса перевода имена собственные с возможностью их транслитерации. Еще одн способ настройки заключается в выборе лингвистических алгоритмов. Для каждого направления перевода существует свой список алгоритмов, которые может настроить пользователь. ( № 8,5)

    Система PROMT XT осуществляет перевод по следующим направлениям: англо-испанский, англо-немецкий, англо-русский, англо-французский,  испанско-английский, испанско-русский, испанско-французский, итальянско-русский, немецко-английский, немецко-русский, немецко-французский, русско-английский, русско-немецкий, русско-французский, французско-английский, французско-испанский, французско-немецкий, французско-русский. Язык интерфейса системы: английский, русский, французский, немецкий.

    Системой предоставляются следующие дополнительные возможности:

    o   редактирование словарных статей в пользовательских словарях (кроме некоторых специальных слов: предлогов, союзов, местоимений, некоторых омонимичных форм);

    o   определение иерархии подключенных словарей (при наличии нескольких вариантов перевода система выбирает перевод из словаря, приоритет которого определен пользователем как самый высокий);

    o   поиск переводов в электронных словарях (только для англо-русского и русско-английского направлений);

    o   автоматическое определение тематики текста (по ключевым словам) и подключение специальных словарей;

    o   установка алгоритмов перевода некоторых конструкций (например, перевод англ. you как "ты", "вы" или "Вы";

    o   подключение препроцессоров (позволяющих не переводить некоторые специальные элементы, такие, как имена файлов, адреса электронной почты и веб-страниц);

    o   определение зарезервированных слов (например, терминов, собственных имен), которые не будут переводиться программой

    o   использование баз переводов Ассоциативной памяти (упрощенный вариант технологии Translation Memory). 

    Последняя разработка компании ПРОМТ, электронный переводчик PROMT XT Office - первый продукт, реализующий новую концепцию автоматического перевода, основанную на технологии Ассоциированной Памяти. Новый уровень лингвистических алгоритмов обеспечивает улучшение качества перевода для не менее, чем 55% предложений.

    PROMT XT Office решает следующие задачи:

    · Перевод документов следующих форматов: DOC, RTF, TXT, HTML. Впервые реализована возможность перевода документов в формате Adobe Acrobat.

    · Комфортная работа с иноязычными документами в приложениях Microsoft Word, Excel, PowerPoint обеспечивается благодаря интеграции программы в приложения MS Office 2000/XP и Microsoft Office System 2003.

    · Перевод электронной почты.

    · Онлайн-перевод Web-сайтов с сохранением форматирования. (№ 9)

    Направления перевода: английский <-> русский, немецкий <-> русский, французский <-> русский, испанский <-> русский, итальянский -> русский, Гигант (англ.<->рус., нем.<->рус., фран.<->рус.)

    Основные возможности системы перевода:

    ·   Перевод документов основных форматов: DOC, RTF, HTML, TXT.

    ·   Сохранение форматирования при переводе.

    ·   Сохранение результата перевода в файлах формата: RTF и TXT.

    ·   Перевод PDF-документов непосредственно в Adobe Acrobat 4.х/5.х и Adobe Acrobat Reader 4.х/5.х.

    ·   Встраивание функций перевода во все основные приложения Microsoft Office 2000/XP (Word, Excel, PowerPoint, FrontPage) и Microsoft Office System 2003*.

    ·   Перевод электронной почты. Автоматический перевод электронной почты в Microsoft Outlook. Маршрутизация писем по папкам.

    o   Все для работы в ИнтернетеОнлайн-перевод Web-сайтов с сохранением форматирования.

    o   Перевод запросов для поисковых систем и отправка на указанный сервер.

    o   Настройка перевода на базе технологии SmartURL - программа сама запоминает параметры перевода страниц. При повторном посещении страницы параметры перевода восстанавливаются.

    o   Создание сайтов на иностранном языке во FrontPage при помощи интегрированных переводческих модулей.

    ·   Перевод содержимого буфера Windows Clipboard.

    ·   Интеллектуальные алгоритмы самообучения системы при использовании Ассоциированной Памяти. Ассоциированная Память (АП) - работает по принципу накопления: в процессе перевода сохраняется исходный сегмент (предложение или его часть) и его перевод. При подключении базы АП, система сравнивает каждое предложение с сохраненными в базе сегментами. Если сегмент идентичный исходному найден, он может быть использован для перевода.

    ·   Мощный лингвистический редактор PROMT, обеспечивающий возможность интерактивного управления переводом.

    o   Удобные средства редактирования перевода - синхронная "прокрутка" оригинала и его перевода. Цветовая подсветка связанных фрагментов в оригинале и переводе.

    o   Мгновенный перевод любого слова при подведении курсора мышки. Просмотр всех переводов и словоформ выделенного слова.

    o   Интеллектуальные алгоритмы автоматического определения языка и тематики текста.

    o   Сохранение параметров перевода в шаблонах тематики.

    ·   Повышение качества перевода за счет персональных настроек:

    o   Возможность подключения специализированных словарей, выпускаемых компанией ПРОМТ для различных предметных областей;

    o   Создание и пополнение собственных пользовательских словарей.

    o   Создание списка зарезервированных слов. Резервирование слов с указанным форматом, например, выделенных курсивом. Резервирование выделенных фрагментов текста.

    o   Задание признаков транслитерации незнакомых слов.

    o   Выбор алгоритмов перевода (режимы перевода некоторых языковых конструкций, которыми невозможно управлять, модифицируя словарные данные).

    o   Подключение макросов для обработки исходного текста и текста перевода.

    o   Использование баз Ассоциированной Памяти (АП).

    ·   Эффективное средство настройки словарей - Dictionary Editor:

    o   Возможность просмотра, редактирования, копирования, удаления и восстановления словарных статей из пользовательских словарей.

    o   Различные режимы доступа к содержимому словарных статей - "Начинающий" и "Специалист".

    o   Интеллектуальные алгоритмы пополнения словарей.

    o   Одновременное пополнение связанных словарей в двух направлениях.

    o   Возможность ввода в словарь из текстового файла и экспорта словарных статей в текстовый файл или документ RTF.

    ·   Большой электронный словарь для перевода отдельных слов (реализован для англо-русского, русско-английского, французско-русского, русско-французского, немецко-русского и русско-немецкого направлений перевода).

    ·   Поддержка внешних программ сканирования, проверки орфографии и электронных словарей.

    ·   Озвучивание текста при наличии установленных на компьютере средств синтеза речи, совместимых со стандартом Text-To-Speech (TTS). (№ 22,23)

    Программные продукты компании "ПРОМТ" удостоены целого ряда отечественных и зарубежных наград, объективно являются лучшими программами осуществляющими машинный перевод в нашей стране.

     

     

     









    2.2  Сравнительный анализ переводов художественно и политического текста сделанный системой машинного перевода и человеком.

    Чтобы лучше понять принципы действия систем МП, методы использования словарей, анализа грамматики и синтеза структур на выходном языке, необходимо на практике провести несколько опытов и перевести тексты (желательно разные по стилям и тематике), используя одну из систем машинного перевода.

    Для сравнения перевода художественного текста будет использована система машинного перевода PROMT XT. Также будет выполнен перевод этого текста, и произведен сравнительный анализ результатов.

    Возьмём для начала отрывок из сказки «Маленький Принц» на английском языке:

    «The little prince went away, to look again at the roses.

    "You are not at all like my rose," he said. "As yet you are nothing. No one has tamed you, and you have tamed no one.      And the roses were very much embarrassed.

    "You are beautiful, but you are empty," he went on. "One could not die for you. To be sure, an ordinary passerby would think that my rose looked just like you - the rose that belongs to me. But in herself alone she is more important than all the hundreds of you other roses. And he went back to meet the fox. "Goodbye," said the fox. "And now here is my secret, a very simple secret: It is only with the heart that one can see rightly; what is essential is invisible to the eye."

    "What is essential is invisible to the eye," the little prince repeated, so that he would be sure to remember.

    "It is the time you have wasted for your rose that makes your rose so important."

    "It is the time I have wasted for my rose..." said the little prince, so that he would be sure to remember.

    "Men have forgotten this truth," said the fox. "But you must not forget it. You become responsible, forever, for what you have tamed. You are responsible for your rose..."

    "I am responsible for my rose," the little prince repeated, so that he would be sure to remember.» (№ 16)


    Вот перевод этого отрывка сделанный переводчиком:

    Маленький принц пошел взглянуть на розы.

    —Вы совсем не похожи на мою розу, — сказал он им. — Вы еще ничто. Никто вас не при­ручил, и вы никого не приручили. И розы очень смутились.

    —Вы красивые, но пустые, — продолжал Маленький принц. — Никто не захочетумереть ради вас. Конечно, случайный прохожий, поглядев на мою розу, скажет, что онаточно такая же, как вы. Но мне она одна дороже всех вас

    И Маленький принц возвратился к Лису.

    — Прощай... — сказал он.

    — Прощай, — сказал Лис. — Вот мой секрет, он очень прост: зорко одно лишь сердце. Самого главного глазами не увидишь.

    Самого главного глазами не увидишь, — повторил Маленький принц, чтобы лучше запомнить.

    — Твоя роза так дорога тебе потому, что ты отдавал ей все свои дни.

    — Потому что я отдавал ей все свои дни... — повторил Маленький принц, чтобы лучшезапомнить.

    — Люди забыли эту истину, — сказал Лис, — но ты не забывай: ты навсегда в ответе за всех, кого приручил. Ты в ответе за твою розу.

    — Я в ответе за мою розу... — повторил Маленький принц, чтобы лучше запомнить.

    В некоторых предложениях нам пришлось поменять порядок слов. Несколько слов были «выброшены» из перевода так как их отсутствие или присутствие не влияет на смысл и стилистику перевода. Но в то же время может «резать слух» потому что «по русски» так не говорят. А вот как сделан перевод того же отрывка системой PROMT XT.


    «Маленький принц ушел, снова смотреть на розы.

    "Вы нисколько не походите, мой повысился," он сказал. "Пока еще Вы не ничто. Никто не приручил Вас, и Вы не приручили никого..."

    И розы были очень обеспокоены. "Вы красивы, но Вы пусты," он продолжал. "Нельзя было умереть для Вас. Безусловно, обычный прохожий думал бы, что мой повысился, смотрел точно так же как Вы, повысился, который принадлежит мне. Но в себе один она более важна чем все сотни из Вас другие розы....

    "И он возвратился, чтобы встретить{выполнить} лису.

    "До свидания, " сказал лиса. "И теперь вот - моя тайна, очень простая тайна: только с сердцем можно видеть справедливо; что является существенным, невидим для глаза."

    "Что является существенным, невидим для глаза, " маленький принц повторился, так, чтобы он убедился, что помнил

    "Это - время, которое Вы потратили впустую для вашего, повысился, который делает ваш, повысился настолько важным."

    "Это - время, которое я потратил впустую для моего, повысился ... "сказал маленький принц, так, чтобы он убедился, что помнил.

    "Мужчины забыли эту правду, "сказала лиса. "Но Вы не должны забыть это. Вы становитесь ответственными, навсегда, для того, что Вы приручили.

    Вы ответственны за ваш, повысился ..."

    "Я ответственен за мой, повысился, " маленький принц повторился, так, чтобы он убедился, что помнил.

    Как мы видим, перевод текста сделан пословно. Программа не может менять местами слова в предложениях то есть в выходном языке порядок слов почти всегда такой же как, как и во входном. Также очень бросается в глаза перевод слова «rose» - «повысился», я согласна, слово «rose» очень многозначно. Но даже словарь выдает первым значение при переводе именно слово «роза», система же, даже не предлагает его в качестве варианта. Но в тоже время слово «роза», во множественном числе «roses», система переводит правильно (не учитывая при этом что «roses» - n, pl, AmE, sl «He uses roses — Он ударяет по аптеке»). Очевидно что в данном контексте слово должно переводиться как «роза», однако система не может проанализировать контекст и следовательно не может правильно выбрать эквивалент. Смущает слова «Вас» написанное с большой буквы, очевидно в настройках для этого пользователя слово «you» должно переводиться как «Вы» именно с большой буквы. А не как «ты» или «вы». Но в этой версии программы это легко поправимо, достаточно изменить настройки для текущего пользователя. Слово «look» переведено как «смотреть», не учитывая то, что можно также перевести как «выглядеть», что  предпочтительно в данном случае. Выражение «in herself alone» переведенное как «в себе один». Естественно всем известно, что английские существительные утратили грамматическую категорию рода. Следовательно все они согласуются с местоимением 3 лице ед.числа «it» - среднего рода. В русском же языке категория рода у существительных присутствует. Упущением системы является невозможность согласования в роде на выходном языке. Слова «роза» в русском языке женского рода. Слова данные в скобках это варианты перевода слов (вторые значения), которые система оставляет на выбор редактора переводчика. Слово «rightly» переведено в первом значении, без дополнительных вариантов. Так же и со словом «essential». Слово «wasted» заданное не в начальной форме переведено электронным словарем ABBY Lingvo как: «wasted» прил.- истощенный; исхудавший, худой; чахлый; бледный; в данном же тексте его следует перевести как «провел», «отдавал».

    На данном этапе работы, целесообразно сравнить сделанные переводы с английского с переводами с французского (язык оригинала), для того чтобы наглядно выявить существуют  ли те же проблемы в грамматике и словаре при переводе с французского.

    Le petit prince s'en fut revoir les roses:

    «Vous n'êtes pas du tout semblables à ma rose, vous n'êtes rien encore, leur dit-il. Personne ne vous a apprivoisées et vous n'avez apprivoisé personne.»

    Et les roses étaient bien gênées.

    «Vous êtes belles, mais vous êtes vides, leur dit-il encore. On ne peut pas mourir pour vous. Bien sûr, ma rose à moi, un passant ordinaire croirait qu'elle vous ressemble. Mais à elle seule elle est plus impor­tante que vous toutes

    Et il revint vers le renard:

    «Adieu, dit-il...

    - Adieu, dit le renard. Voici mon secret. Il est très simple: on ne voit bien qu'avec le cœur. L'es­sentiel est invisible pour les yeux.

    - L'essentiel est invisible pour les yeux, répéta le petit prince, afin de se souvenir.

    - C'est le temps que tu as perdu pour ta rose qui fait ta rosé si importante.

    - C'est le temps que j'ai perdu pour ma rose..., fit le petit prince, afin de se souvenir.

    - Les hommes ont oublié cette vérité, dit le renard. Mais tu ne dois pas l'oublier. Tu deviens responsable pour toujours de ce que tu as apprivoisé. Tu es responsable de ta rose...

    —         Je suis responsable de ma rose...», répéta le petit prince, afin de se souvenir. (№ 5)


    Перевод сделанный переводчиком:

    «Маленький принц пошел взглянуть на розы.

    — Вы совсем не похожи на мою розу, — ска­зал он им. — Вы еще ничто. Никто вас не при­ручил, и вы никого не приручили.

    И розы очень смутились.

    — Вы красивые, но пустые, — сказал он наконец. — Никто не захочет умереть ради вас. Конечно, случайный прохожий, по­глядев на мою розу, скажет, что она точно та­кая же, как вы. Но мне она одна дороже и важнее всех вас

    И Маленький принц возвратился к Лису.

    — Прощай... — сказал он.

    — Прощай, — сказал Лис. — Вот мой сек­рет, он очень прост: видеть можно только сердцем. Самое главное невидимо для глаз.

    — Самое главное невидимо для глаз, — повторил Маленький принц, чтобы лучше за­помнить.

    — То что ты отдавал своей розе так много времени, делает её особенной.

    — Потому что я отдавал ей так много времени... — повторил Маленький принц, чтобы лучше за­помнить.

    — Люди забыли эту истину, — сказал Лис, — но ты не забывай: ты навсегда ответственен за всех, кого приручил. Ты в ответе за твою розу.

    — Я в ответе за  мою розу... — повторил Ма­ленький принц, чтобы лучше запомнить.»


    Перевод сделанный системой PROMT с французского на русский:


    Маленький принц был снова увидеть розы:

    " Вы не подобны моей розе, вы не являетесь ничем еще, он им говорит. Никто вас не приручил и вы не приручили никого.

    " И розы были очень стеснительны.

    " Вы красивы, но вы пустые, он им говорит еще. Не можем умереть для вас. Конечно, моя роза, обычный прохожий полагала бы, что она на вас будет походить. Но ей только она больше imporкtante, что Вы все

    И он возвратился к лисе:

    " До свидания, он говорит

     - До свидания, говорит лиса. Вот моя тайна. Он очень прост: видим хорошо только с c и * 339; ur. Существенная часть невидим для глаз.

    - существенная часть невидима для глаз, повторил маленький принц, для того, чтобы вспоминать.

    - именно время ты потерял для твоей розы, которая делает твоя роза столь важная.

    - именно время я потерял для моей розы, сделал маленького принца, для того, чтобы вспоминать.

    - люди забыли эту правду, говорит лиса. Но ты не должен его забывать. Ты становишься ответственным навсегда того, что ты приручил.

    Ты - ответственный за твою розу - Я - ответственный за мою розу ", повторил маленький принц, для того, чтобы вспоминать.


    В целом, перевод  вполне корректен, ясен общий смысл отрывка. Перевод так же сделан пословно, что подтверждает нам, что система не может менять порядок слов в выходном языке. Система оказалась не в состоянии перевести 2 слова, одно из них она транслитирировала, а одно заменила цифровым кодом из за того что выражение «que avec le сoeur» написано как «qu`avec le сoeur». Гласная «е» всегда выпадает в таких случаях, а на письме усекается. Так же как и при переводе с английского обнаруживаются несоответствия рода на выходном  (русском) языке. Хотя система писалась русскоязычными специалистами. Перевод некоторых предложений заставляет думать, что это переводил человек слабо говорящий по-русски. Проблема заключается не в синтезе грамматической структуры выходного языка, а в непонимании структуры входного языка, то есть, по сути дела в грамматическом анализе. В принципе простые предложения система переводит относительно правильно, сложные, сложно - сочинённые или сложно -подчиненные предложения тоже переводятся относительно легко. Но если встречаются вводные или пояснительная конструкция и разрывается основное предложение, то программа начинает пословный перевод, без учета синтаксиса, пытаясь просто связать слова. Таки образом вариант на выходе получается очень сложным и запутанным. Но даже если прописать алгоритмы для всех этих правил, без понимания входного текста перевод так и будет оставаться иногда полностью бессвязным.

    Заключение.

    Можно сделать вывод, что полностью автоматический машинный перевод, это очень сложная задача, которую предстоит решить не только лингвистам, но и программистам, специалистам по кибернетике и многим другим представителям наук которые затрагивает эта проблема. Очень сложно смоделировать сам процесс перевода с помощью компьютерной программы. Если человек осуществляя перевод мыслит образами и исходит из того какую мысль к конечном итоге надо донести до слушателя, то научить этому программу невозможно (на данном этапе развития компьютерных технологий.

    Современные программы машинного перевода очень далеки от того идеала к которому стремятся их разработки. Но они уже без сомнений могут служить хорошим подспорьем переводчику в его рутинной работе. Хотя бы тем, что без проблем могут за несколько секунд сделать подстрочный перевод любого по сложности и объёму текста. Если при этом верно настроено распределение приоритетных словарей для данной тематики и направления перевода, то на выходе редакторская правка требуется минимальная (в сравнении с переводом при подключённом словаре общей лексики).  Естественно полностью отдать текст в руки машины нельзя. Системы нового поколения могут «запоминать» уже переведенные однажды конструкции и впоследствии уже не требовать повторного их перевода. Системы эффективны в помощи пользователям еще и потому что есть возможность создавать «пользовательский» словарь, что существенно облегчает перевод по определенной тематике.

    Но  все же недостатков у систем машинного перевода, по моему мнению, больше чем достоинств. Главный недостаток это конечно же словарь. Программа не учитывает элементарных значений слов и не предлагает их в качестве варианта при переводе. Тем самым это заставляет пользователя искать эти словоформы в словаре, что бьет по одному из основных достоинств системы, по мнению производителей, - скорости. Недостатки на уровне грамматики. Эти недостатки прослеживаются как при анализе не входном языке, так и при синтезе на выходном. Не учтены грамматические особенности входных и выходных языков, такие как например,  род существительных в русском языке и его отсутствие в английском. Система как правило проводит еще и синтаксический анализ на входе, но если предложение не вписывается в алгоритм заданный программой, система начинает пословный перевод не обращая внимание на синтаксические связи.

    Рассмотрев данную проблему, я пришла к выводу, что машинный перевод в принципе возможен, но его стоит рассматривать только как «черновой» вариант перевода, который подлежит обязательному редактированию.

     

     

     

     

     

     

     

    Библиография

     

    Источники литературы на русском языке


    1. Арапов М.В. Шрейдер Ю.А. Семантика и машинный перевод.М., 1965.№ 1

    2. Бархударов Л.С. Язык и перевод. - М.: Межд. отношения, 1975.

    3. Белоногов Г.Г. Зеленков Ю.Г. Интерактивная система русско-английского и англо-русского машинного перевода, ВИНИТИ, 1993

    4. Вестник Московского Университета. Сер.19 Лингвистика и  межкультурная коммуникация. 2004. № 4, с.51.

    5. Домашний компьютер – 2004., № 12

    6. Каничев М. Статья. // Мир ПК. - 1998, № 8.

    7. Комиссаров В.Н.  «Современное переводоведение», ЭТС,М. 2004.с.411.

    8. Компьютер Пресс. – 2004. № 7

    9. Компьютер Пресс. – 2004. -№11

    10. Людсканов А. Селективная стратегия при машинном переводе. - В кн.:  Международный семинар по машинному переводу. М., ВЦП, 1975

    11. Марчук Ю. Н. Проблемы машинного перевода. М.: Наука, 1983

    12. Материалы по машинному переводу. Вып. 1. Л.,1958. с.5.

    13. Машинный перевод. Сборник статей, перевод с английского, М., 1957

    14. Мир ПК. – 2004. - № 9

    15. Мир Internet. – 2001. № 2, с. 16-26.

    16. Миньяр – Белоручев А.П., Английский язык. Учебник устного перевода. М.,   «Экзамен» , 2004г.

    17. Панов Д.Ю., Автоматический перевод, М., 1958

    18. Ревзин. И., В.Ю. Розенцвейг. Основы общего и машинного перевода., 1964.

    19. Техника – молодежи. – 2005. № 2.

    20. Шаляпина З.М. «Автоматический перевод: эволюция и современные тенденции» вопросы языкознания, 1996, № 2


    Источники литературы на иностранных языках


    1. Saint - Exupery A.,The Little Prince and Letter to a Hostage, Penguin Books, 2001

    2. Dezso L., Papp F. Механизация лексикографических работ и обратные словари. – In: «Сomputational linguistics, III», р.212 - 215

    3. Antoine de Saint – Exupery. Le petit prince.,M.,Jupiter-inter, 2003

    4. Visson L., From Russian into English, Ardis, 1991


    Электронные источники


    5. Электронный словарь ABBY LINGVO 9.0

    6. #"#">#"#">#"#">www.krugosvet.ru

    10. www.promt.ru

    11. www.translate.ru


Если Вас интересует помощь в НАПИСАНИИ ИМЕННО ВАШЕЙ РАБОТЫ, по индивидуальным требованиям - возможно заказать помощь в разработке по представленной теме - Машинный перевод.Система машинного перевода PROMT ... либо схожей. На наши услуги уже будут распространяться бесплатные доработки и сопровождение до защиты в ВУЗе. И само собой разумеется, ваша работа в обязательном порядке будет проверятся на плагиат и гарантированно раннее не публиковаться. Для заказа или оценки стоимости индивидуальной работы пройдите по ссылке и оформите бланк заказа.