реферат бесплатно, курсовые работы
 
Главная | Карта сайта
реферат бесплатно, курсовые работы
РАЗДЕЛЫ

реферат бесплатно, курсовые работы
ПАРТНЕРЫ

реферат бесплатно, курсовые работы
АЛФАВИТ
... А Б В Г Д Е Ж З И К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Э Ю Я

реферат бесплатно, курсовые работы
ПОИСК
Введите фамилию автора:


Электронные словари и их применимость для традиционного машинного перевода

Электронные словари и их применимость для традиционного машинного перевода

Нижегородский государственный

лингвистический университет

им. Н.А. Добролюбова

дипломная работа

на тему

Электронные словари

и их применимость

для традиционного

машинного перевода

Выполнил:

студент гр. 503А Тараскин А.А.

Научный руководитель:

к.ф.н. доц. Яржемский А.Н.

Нижний Новгород, 2003 г.

Содержание:

Введение 3

Глава I. Место лексикографии среди

лингвистических дисциплин. 5

a. Лексикография как одна из наук о языке. 6

b. Типы словарей. 8

c. Составление словарей. 22

Глава II. Электронные словари. 24

a. Электронные словари "МультиЛекс". 24

b. Электронные словари "Lingvo". 25

c. Преимущества электронных словарей. 26

d. Новые мехи требуют нового вина. 29

e. Читатели и писатели. 30

f. Проблема актуальности. 31

g. Соответствие уровню достижений

лингвистической науки. 31

Глава III. Машинный перевод. 33

a. Немного истории. 33

b. Классификация систем машинного перевода

по Лари Чайлду. 34

i. Полностью автоматизированный МП. 34

ii. Автоматизированный МП

при участии человека. 35

iii. Перевод, осуществляемый человеком

с помощью компьютера. 35

c. Системы машинного перевода. 37

iv. Система МП Retrans Vista. 40

v. Система МП PROMT XT. 43

Глава IV. Практическая часть. 49

Заключение 54

Библиография 56

Введение.

В настоящее время компьютеры занимают все более значительное место не

только среди программистов и инженеров, но и в среде самых разнообразных

пользователей, включая лингвистов, переводчиков и специалистов, нуждающихся

в оперативном переводе иноязычной информации. В этой связи компьютерные

словари являются очень удобным подручным средством в целях экономии времени

и оптимизации процесса понимания иноязычной информации. Кроме того, сейчас

имеются программы-переводчики, которые могут производить более или менее

адекватный перевод иноязычных текстов и могут являться подспорьем в работе

специалистов различных профилей. Данная работа посвящается изучению

указанных проблем, а также анализу некоторых лингвистических программных

продуктов, направленных на автоматизацию процесса перевода.

Настоящую тему исследования можно считать вполне современной, поскольку

история развития и внедрения в повседневную жизнь персональных компьютеров

(а тем более таких, каким было бы 'под силу' осуществлять более или менее

современные программы машинного перевода) насчитывает едва ли более

пятнадцати лет. Особую актуальность эта тема приобретает, если учесть тот

факт, что именно в настоящее время Россия все более интегрируется в

международное сообщество и что, наряду с экономическими и политическими

барьерами, препятствуют этому во многом барьеры языковые. Вместе с тем,

профессиональных переводчиков, способных и желающих осуществлять подобный

процесс коммуникации сообществ во всех сферах науки и культуры, не так

много, следствием чего является тот факт, что услуги их недешевы. Поэтому

именно сейчас особенно актуален поиск путей максимально автоматизировать

процесс перевода, осуществляемого человеком, чтобы, с одной стороны,

максимально облегчить нелегкий труд человека-переводчика, а с другой -

сделать этот труд максимально эффективным. Осуществить подобное можно, лишь

максимально интегрировав усилия специалистов в областях кибернетики,

программирования, психологии, а главное - лингвистики.

Цель данной работы - определение того, насколько можно использовать

современные программные продукты для осуществления перевода, а также

выявление наиболее перспективных, на наш взгляд, направлений исследований в

области его автоматизации.

В соответствии с поставленной целью, задачами исследования являются:

- уяснение местоположения компьютерной лексикографии среди

лингвистических наук;

- уяснение различий между электронными и традиционными бумажными

словарями;

- определение максимально эффективного способа организации электронных

словарей;

- уяснение различий между разнообразными системами МП и классификации

последних;

- анализ работы систем машинного перевода на примере перевода,

произведенного программой PROMT XT, и сравнение образцов перевода с

переводом, сделанным человеком. Анализ причин несоответствия.

Глава I. МЕСТО ЛЕКСИКОГРАФИИ СРЕДИ

ЛИНГВИСТИЧЕСКИХ ДИСЦИПЛИН

Слово «лексикография» греческого происхождения, lexikos — относящийся к

слову, словарный и grapho — пишу. Следовательно, лексикография означает:

«пишу слова» или «пишу словари». В современном значении лексикография — это

теория и практика составления словарей, главным образом языковых,

лингвистических, в отличие от неязыковых, энциклопедических.

Лексикография как научный термин появилась в широком обиходе

сравнительно недавно. Например, в энциклопедическом словаре Брокгауза и

Ефрона (1896 г.) нет статьи на слово «лексикография», однако есть статья на

слово «лексикология». Справедливости ради следует отметить, что в статье

«словарь» этого же справочника имеется слово «лексикография», где оно

является синонимом словосочетания «словарная техника».

В энциклопедическом словаре братьев А. и И. Гранат (1916 г.) уже есть

статья на слово «лексикография», которая определяется как «научные способы

обработки словесного материала языка для составления лексикона». Отметим в

этом определении акцент на «научные способы обработки».

В первом издании «Большой советской энциклопедии» (1938 г.) в статье на

слово «лексикография» дано: «Лексикография (греч.), работа по составлению

словарей». И только во втором (1953 г.) и третьем (1973 г.) изданиях этот

термин толкуется достаточно современно: «Лексикография — раздел

языкознания, занимающийся практикой и теорией составления словарей». (БСЭ,

3-е изд. 1973, т. 14).

С другой стороны, статьи на слово «лексикография» нет ни в энциклопедии

«Британика», ни в энциклопедии «Американа», хотя в обеих есть статьи на

слово «словарь». Отсутствие термина «лексикография» в таких солидных

современных справочниках, как британская и американская энциклопедии,

отнюдь не случайно. Это объясняется, во-первых, молодостью лексикографии

как науки и, во-вторых, тем, что даже среди самих языковедов до сих пор еще

идет спор, является ли лексикография наукой, точнее, частью науки о языке,

или же она просто техника составления словарей, в лучшем случае, искусство

их составления.

Видный испанский лексикограф X. Касарес в своей широко известной книге

«Введение в современную лексикографию» (которая переведена на русский язык)

утверждает, что лексикография — это техника и искусство составления

словарей. (Вспомним определение «лексикографии» в первом издании БСЭ:

«работа по составлению словарей».)

Известный английский лексикограф, автор знаменитых справочников по

английскому и американскому сленгу Эрик Патридж, посвятивший всю свою жизнь

составлению словарей, не случайно назвал свою последнюю книгу, плод

многолетних разысканий в области словарного дела, так: «Благородное

искусство лексикографии как объект занятий и опыт страстного его

приверженца».

Даже Ф. Гоув, главный редактор третьего издания словари Уэбстера (1461

г.), крупнейшего лексикографического предприятия нашего времени, пишет в

программной статье «Успехи лингвистики и лексикография»: «Лексикография еще

не наука. По-видимому, они никогда не будет наукой. Однако это сложное,

топкое и порой всепоглощающее искусство, требующее субъективного анализа,

произвольных решений и интуитивных доказательств".

Лексикография как одна из наук о языке

Существует, однако, другая точка зрения на лексикографию. Ее сторонники

считают, что лексикография — это не просто техника, не просто практическая

деятельность по составлению словарей и даже не искусство, а самостоятельная

научная дисциплина, имеющая свой предмет изучения (словари различных

типов), свои научные и методологические принципы, свою собственную

теоретическую проблематику, свое место в ряду других наук о языке.

Впервые эту точку зрения на лексикографию со всей определенностью

высказал известный советский языковед академик Л. В. Щерба. В предисловии к

русско-французскому словарю (1936 г.) он писал: «Я считаю крайне

неправильным то пренебрежительное отношение наших квалифицированных

лингвистов к словарной работе, благодаря которому почти никто из них

никогда ею не занимался (в старые времена это за гроши делали случайные

любители, не имевшие решительно никакой специальной подготовки) и благодаря

которому она получила такое нелепое название «составление» словарей. И

действительно, наши лингвисты, а тем более наши «составители» словарей

просмотрели, что работа эта должна иметь научный характер и никак не

состоять в механическом сопоставлении каких-то готовых элементов».

Развивая выдвинутые в 1936 г. положения, Л.В. Щерба публикует в 1940 г.

статью (ставшую потом широко известной и за рубежом), в которой на большом

фактическом материале начинает разрабатывать основные теоретические вопросы

лексикографии. Л.В. Щерба мыслил написать несколько статей (этюдов, как он

их называл) по общей теории лексикографии, в которых намеревался обсудить

такие важные проблемы, как основные типы словарей, природа слова, значение

и употребление слова, построение словарной статьи в связи с семантическим,

грамматическим и стилистическим анализом слова и др. Однако преждевременная

смерть помешала осуществлению этого замысла. Л.В. Щербой был написан лишь

первый этюд «Основные типы словарей», который начинался следующим хорошо

известным сейчас положением: «Одним из первых вопросов лексикографии

является, конечно, вопрос о различных типах словарей. В основе его лежит

ряд теоретических противоположений, которые и необходимо вскрыть». С тех

пор тезис о том, что лексикография — это не только практика составления

словарей, но и теоретическая научная дисциплина, прочно вошел в ряд

отправных положений советской лексикографической школы.

Здесь, однако, можно задать вопрос: такое ли большое точение имеет

антиномия «наука или искусство» для лексикографии? Ведь ясно, что в том и

другом случае составлением словарей следует заниматься, ибо они нужны;

нужно много хороших и разных словарей. На это со всей определенностью

следует ответить, что данный вопрос имеет принципиальное значение, и вот

почему.

Что такое наука вообще? Каковы ее важнейшие черты? Основными и

важнейшими чертами науки, любой научной дисциплины являются следующие:

наличие системы знаний и необходимость их объективного исследования. Эти

две существенные черты взаимосвязаны, тесно переплетены, ибо только тогда

можно строить адекватную действительности систему знаний, когда эта

действительность будет объективно изучена. В применении к лексикографии это

выглядит следующим образом.

Если принять тезис о том, что лексикография есть искусство, то тогда

открываются двери субъективному пониманию задач и предмета лексикографии,

приемов и методов ее исследования, субъективному решению ее проблем. Вряд

ли такой подход будет плодотворен и уж никак не научно объективен. Если же

принять тезис о том, что лексикография есть просто техника составления

словарей, некий вид сугубо практической деятельности, то тогда придется

передать другим наукам (лексикологии, семантике, стилистике, этимологии и

т. п.) решение всех теоретических вопросов, и лексикография должна будет

использовать лишь готовые решения этих наук. Вряд ли это будет плодотворно,

ибо другие науки о языке недостаточно хорошо знакомы с положением дел в

лексикографии. Они, следовательно, будут решать вопросы лексикографии со

своих позиций, со своих точек зрения, а потому ущербно для лексикографии.

Таким образом, тезис о том, что лексикография есть наука, является

единственно правильным и наиболее плодотворным. Из этого следует, что

лексикография как наука имеет свой собственный предмет исследования, свои

специальные методы исследования, свою структуру, свое место в ряду других

лингвистических дисциплин.

Как и всякая наука, лексикография имеет две стороны: научно-

теоретическую и практически-прикладную. Первая (теоретическая

лексикография) ставит общие теоретические проблемы и работает над их

решением. Вторая (практическая лексикография) занимается непосредственно

составлением словарей различных типов на базе теоретических решений

основных проблем. Конечно, деление лексикографии на две части в высшей

степени условно. Эти две стороны лексикографии идут всегда вместе, они

взаимосвязаны: лексикограф-теоретик не может заниматься голым

теоретизированием без работы над конкретным материалом, без участия в какой-

то практической лексикографической работе; и, наоборот, никакой лексикограф-

практик не может окунуться только в свою чисто эмпирическую работу, не зная

новейшей проблематики лексикографии как науки. Тем не менее, принципиальное

разграничение двух сторон лексикографии чрезвычайно важно.

Из изложенного выше можно заключить, что термин «лексикография» имеет в

настоящее время три значения: 1) наука, точнее, особая область языкознания,

изучающая принципы составления словарей разных типов; 2) сама практика

словарного дела, т.е. составление словарей; 3) совокупность словарей

данного языка.

Являясь частью науки о языке, лексикография тесным образом связана с

такими лингвистическими дисциплинами, как лексикология, семантика,

стилистика, этимология, фонология и т. п. С этими дисциплинами

лексикография имеет общую проблематику. Порой она использует результаты их

исследований, а часто и опережает их в решении некоторых проблем.

Таким образом, постепенно, шаг за шагом, лексикография оформляется и

самостоятельную лингвистическую дисциплину, становясь равноправной среди

других языковедческих наук.

Типы словарей.

Существующие типы словарей разнообразны. Это разнообразие объясняется,

прежде всего, сложностью и многоаспектностью самого объекта

лексикографического описания, т. е. языка. Кроме того, многочисленные

потребности общества в получении самой различной информации о языке также

усложняют и расширяют репертуар словарей. Практически нет никакой

возможности дать в одном словаре всю в той или иной мере исчерпывающую

информацию о языке, которая удовлетворила бы в равной степени все общество

в целом и отдельные его слои и частности. Именно поэтому в любой

национальной лексикографии мы находим десятки, а то и сотни словарей самых

разных типов.

Деление словарей на типы происходит, как говорят классификаторы, по

различным основаниям: в зависимости от цели словаря, его объема, порядка

расположения в нем слов, объекта описания и т. д. Многие из указанных

моментов налагаются друг на друга, объединяясь в словаре одного и того же

типа, другие стоят особняком, служа основанием для словарей совершенно

отличного типа. Существуют переводные, толковые, диалектные и региональные

словари, словари сленга, исторические, неологизмов, этимологические,

крылатых выражений и много других. Необходимо отметить, что в науке о языке

пока еще нет сколько-нибудь общепринятой типологии словарей, хотя попытки

создать таковую предпринимались многими лингвистами, в частности Л. В.

Щербой, П. Н. Денисовым, Б. Кемадой, Я. Малкилом, Л. Згустой и др.

Прежде всего, приходится различать словари лингвистические и

нелингвистические. Первые собирают и описывают под тем или иным углом

зрения лексические единицы языка (слова и фразеологизмы). Особый подтип

лингвистических словарей составляют так называемые идеографические словари,

идущие от понятия (идеи) к выражению этого понятия в слове или

словосочетании. В нелингвистических словарях лексические единицы (в

частности — термины, однословные и составные, и собственные имена) служат

лишь отправной точкой для сообщения тех или иных сведений о предметах и

явлениях внеязыковой действительности. Встречаются и промежуточные

разновидности словарей. Кроме того, всякий словарь может быть отнесен либо

к «общим», либо к «специальным».

Примерами общих лингвистических словарей могут служить обычные толковые

и переводные словари, охватывающие с той или иной степенью полноты всю

лексику, бытующую в общенародном употреблении. Специальный лингвистический

словарь разрабатывает какую-то одну область лексики, иногда достаточно

широкую (например, фразеологический словарь, словарь иностранных слов),

иногда же довольно узкую (например, словарь личных имен, даваемых

новорожденным). Общий нелингвистический словарь — это общая энциклопедия

(например, БСЭ—Большая Советская Энциклопедия). Специальный

нелингвистический словарь — это специальная (отраслевая) энциклопедия

(медицинская, юридическая и т. д.) или же краткий словарь той или иной

(обычно — более узкой) области знания, или биографический словарь деятелей

той или иной отрасли (писателей, художников и т.д.), или же той или иной

страны (словарь-справочник типа «Who is who»).

Толковые словари. Толковым словарем называют такой словарь, главной

задачей которого является толкование значений слов (и фразеологизмов)

какого-либо языка средствами самого этого языка. Толкование дается с

помощью логического определения концептуального значения (например,

накалиться — нагреться до очень высокой температуры; рекордсмен —

спортсмен, установивший рекорд), посредством подбора синонимов (назойливый

— надоедливый, навязчивый) или в форме указания на грамматическое отношение

к другому слову (прикрывание—действие по значению глаголов прикрывать и

прикрываться). В некоторых толковых словарях значения слов раскрываются в

нужных случаях с помощью рисунков. Эмоциональные, экспрессивные и

стилистические коннотации указываются посредством специальных помет

(«неодобр.», «презр.», «шутл.», «ирон.», «книжн.», «разг.» и т. п.).

Отдельные значения по мере надобности и возможности (в зависимости от

объема словаря) иллюстрируются примерами — типичными сочетаниями, в которых

участвует данное слово (например, утюг накалился, атмосфера накалилась —

где глагол выступает уже в переносном значении: “стала напряженной”), или

же (особенно в словарях большего объема) цитатами авторитетных писателей.

Как правило, толковые словари дают также грамматическую характеристику

слова, указывая с помощью специальных помет на часть речи, грамматический

род имени существительного, вид глагола и т. д. и приводя в нужных случаях

кроме «представительной», или «словарной», и некоторые другие

грамматические формы данного слова. В той или иной мере указывается и

произношение слова (например, в русских толковых словарях — ударение),

иногда сообщаются и разные другие, добавочные сведения.

Обычно толковые словари являются словарями современного литературного

языка. Некоторые из них носят строго нормативный характер, т. е. отбирают

только факты, полностью соответствующие литературной норме, рекомендуют эти

факты как единственно «правильные» и отсекают все, что хотя бы немного

отклоняется в сторону просторечья. Типичным примером может служить

академический словарь французского языка (Dictionnaire de I'Academie

Franзaise). Для многих других толковых словарей характерно более широкое

понимание литературного языка и, соответственно, включение в словарь

разговорной и даже просторечной лексики (кроме лишь узко-областных,

диалектных, узкопрофессиональных и сугубо арготических элементов). К этому

типу относятся академические словари русского языка — 17-томный «Словарь

современного русского литературного языка» Академии наук СССР (1950—1965) и

4-томный «Словарь русского языка» (1957—1961), а также однотомный «Словарь

русского языка» С. И. Ожегова (9-е испр. и доп. издание под ред. Н. Ю.

Шведовой 1972 г.), который очень полезен для практических целей, и более

ранний «Толковый словарь русского языка» коллектива авторов под ред. Д. Н.

Ушакова (4 тома, 1935—1940). Особое значение для русской лексикографии

имеет, конечно, 17-томный академический «Словарь современного русского

литературного языка». Он включает более 120 тыс. слов. В 1970 г. он отмечен

Ленинской премией.

Иной характер носит знаменитый, не раз переиздававшийся «Толковый

словарь живого великорусского языка» В. И. Даля (4 тома, первое изд.

1863—1866 гг.), в изобилии включающий областную и диалектную лексику

середины 19 века и в отношении полноты охвата этой лексики и обилия

народных выражений до сих пор непревзойденный. Он включает около 200 тыс.

слов литературного языка и диалектов. С 1965 г. начал выходить «Словарь

русских народных говоров» под редакцией Ф. П. Филина, в котором

представлены диалектная лексика и фразеология всех русских говоров 19-20

веков.

Главная задача толкового словаря – истолковать значение слов и их

Страницы: 1, 2, 3, 4, 5, 6


реферат бесплатно, курсовые работы
НОВОСТИ реферат бесплатно, курсовые работы
реферат бесплатно, курсовые работы
ВХОД реферат бесплатно, курсовые работы
Логин:
Пароль:
регистрация
забыли пароль?

реферат бесплатно, курсовые работы    
реферат бесплатно, курсовые работы
ТЕГИ реферат бесплатно, курсовые работы

Рефераты бесплатно, реферат бесплатно, курсовые работы, реферат, доклады, рефераты, рефераты скачать, рефераты на тему, сочинения, курсовые, дипломы, научные работы и многое другое.


Copyright © 2012 г.
При использовании материалов - ссылка на сайт обязательна.