Клингонский язык что это

Клингонский язык

Описание

Клингонский язык – искусственный язык, придуманный Марком Окрандом для расы Клингонов из вселенной «Звездный путь». Он обладает сложной и тщательно разработанной грамматикой, синтаксисом, обширным словарем (более 2500 слов), проработанным алфавитом и фонетикой.

Уникальность языка также в том, что он развивается вне кинематографической вселенной – в Америке существует специальная организация (Институт клингонского языка), которая занимается переводом различных произведений литературы на клингонский язык. Существует несколько учебников от вышеупомянутого института и даже несколько страниц Википедии на этом языке, а также страницы Гугл и Мозилы. Помимо этого, фанаты «Звездного пути» нередко хотят научиться говорить как Клингоны, тем самым и они не позволяют клингонскому языку перестать развиваться.

Алфавит клингонского языка

Лингвисты, придумавшие этот язык, за основу взяли тибетскую письменность. Получились острые буквы, скорее напоминающие фигуры и очень похожие друг на друга. В современных реалиях, те, кто изучают клингонский язык, используют обычный английский алфавит для удобства. Помимо букв в языке важную роль играют апострофы.

Клингонский язык что это. Смотреть фото Клингонский язык что это. Смотреть картинку Клингонский язык что это. Картинка про Клингонский язык что это. Фото Клингонский язык что это

Апостроф в этом языке считается за отдельную букву. Он выполняет и функцию мягкого звука «а». Для удобства произнесения, можно представить, будто бы вы негромко вздыхаете.

Прежде чем выучить клингонский язык, нужно понять несколько особенностей и нюансов:

С первого взгляда кажется, что письменность клингонов – простой набор символов без какого-либо смысла, но это не так. Просто этот искусственный язык обладает своей особой спецификой, к которой привыкаешь в процессе изучения.

Произношение

Так как язык придумывался по принципу «чем необычнее для человеческого уха – тем лучше», дальнейшее развитие языка не планировалось. Но фанатам «Стартрека» настолько понравился клингонский, что он из обычного искусственного языка вырос в полноценный и вполне настоящий, изучением которого занимается множество людей в разных точках мира. Фонетика очень непривычна для большинства языков, поэтому именно произношение чаще всего вызывает вопросы.

Всего в этом языке 21 согласный звук и 5 гласных. Многие звуки произносятся точно так же как такие же звуки английского или русского языка, а некоторые наоборот очень сложны для произношения.

Стоит обратить свое внимание на то, что в клингонском языке некоторые буквы пишутся несколькими символами, но считаются за одну. Многие новички путаются и читают их как два или три разных звука. Поэтому очень важно много практиковаться в чтении и произношении.

Как выучить клингонский язык?

Поскольку во всем мире возможно насчитать лишь несколько десятков, которые свободно владеют этим языком, то единственным доступным и наиболее удобным способом изучения является Интернет, в частности этот сайт.

В настоящее время можно найти множество групп в различных социальных сетях, посвященных изучению этого языка. Там более опытные пользователи помогают новичкам, некоторые даже общаются по видеосвязи и помогают друг другу в произношении.

Существуют и видеоуроки, но большая их часть на английском языке. К счастью, некоторые пользователи уже сделали к ним русские субтитры, поэтому можно смело использовать их для своего обучения.

Грамматика клингонского языка необычна, но не очень сложна. Первое время придется постараться, чтобы разобраться в том, что именно написано, но всегда можно обратиться к переводчику или словарю.

Для практики можно порекомендовать больше читать. Многие книги уже переведены на клингонский язык, поэтому можно выбрать уже знакомое произведение и прочитать его на языке Клингонов. Таким образом, запомнить многие слова будет легче, ведь подсознательно вы уже знаете, что читаете.

Например, буквально одна буква может изменить смысл слова, чаще всего к одному слову добавляют ‘a’, которая «увеличивает» значение:

Также большим помощником в изучении клингонского станет учебник, выпущенный самими создателями этого искусственного языка. В нем подробно расписана вся грамматика, синтаксис и произношение каждой буквы с примерами. Помимо этого в книге содержится словарь. К сожалению, учебник полностью на английском языке, но некоторые пользователи переводят некоторые части книги, что существенно облегчает процесс обучения.

Разговорные фразы на клингонском

Изначально язык создавался для фильма «Стартрек» поэтому для него было записано несколько базовых фраз. Потом они постепенно дополнялись другими, было придумано даже несколько ругательств и оскорблений.

Приветствие на языке инопланетной расы звучит как «nuqneH». При этом значение его можно трактовать и как обычное «привет», так и «что ты хочешь?». Не забываем, что это нечеловеческий язык, поэтому логика языка может быть не всегда нам понятна.

Чтобы понять, говорит ли ваш собеседник на клингонском языке, используют такую фразу как «tlhIngan Hol Dajatlh’a ‘». Он же ответит вам «да» или «нет».

Для обозначения согласия у Клингонов есть целых два слова: «Hija» и «HISlaH», если же вы не согласны с собеседником, используйте такое слово как «ghobe».

Как сказать собеседнику, что вы его понимаете? Достаточно будет всего одного слова: «jIyaj». Добавляем к концу «be» и получаем уже «не понимаю» или «jIyajbe».

Раса Клингонов имеет морщинистый лоб, поэтому такая фраза как «Hab SoSlI’ Quch!» является ужасным оскорблением и означает «У твоей мамы гладкий лоб!». Осторожнее с этим предложением, Клингоны могут обидеться, а это может кончится плохо, ведь эта раса изначально агрессивна и враждебно настроена к другим обитателям Вселенной.

Есть одно слово, также использующееся для оскорбления кого-то, и выглядит оно так: «petaQ». Его значение не такое обидное как у вышеупомянутой фразы, слово можно перевести как «трус» или тот, у кого недостаточно силы духа.

Таким образом, можно сказать, что клингонский язык не отличается легкостью, особенно это касается фонетического аспекта, однако если вам действительно нравятся Клингоны и Вселенная «Звездного пути» в целом, то нет ничего невозможного. В Интернете можно найти много разного материала, чтобы выучить язык самостоятельно, главное заниматься клингонским регулярно и результат не заставит долго себя ждать.

Источник

Клингонский язык

Искусственные языки
Клингонский язык
Клингонский язык что это. Смотреть фото Клингонский язык что это. Смотреть картинку Клингонский язык что это. Картинка про Клингонский язык что это. Фото Клингонский язык что это
Самоназвание:tlhIngan Hol /ˈt͡ɬɪŋɑn xol/
Создан:Окранд, Марк
Регулирующая организация:Институт клингонского языка [1]
Общее число носителей:12 свободно владеющих (1996) [2]
Тип письма:латиница (английский), клингонские письменности
Языковые коды
ISO 639-1:нет
ISO 639-2:tlh
ISO/DIS 639-3:tlh
Звёздный путь
(Star Trek)
Телесериалы
Оригинальный сериал — 80 эпизодов
Анимационный сериал — 22 эпизода
Следующее поколение — 178 эпизодов
Глубокий космос 9 — 176 эпизодов
Вояджер — 172 эпизода
Энтерпрайз — 98 эпизодов
Фильмы
Звёздный путь: Фильм
Звёздный путь 2: Гнев Хана
Звёздный путь 3: В поисках Спока
Звёздный путь 4: Путешествие домой
Звёздный путь 5: Последняя граница
Звёздный путь 6: Неоткрытая страна
Звёздный путь: Поколения
Звёздный путь: Первый контакт
Звёздный путь: Восстание
Звёздный путь: Возмездие
Звёздный путь (XI)
Основные цивилизации
Объединённая федерация планет
Клингоны — Ромуланцы — Борги
Баджорцы — Кардассианцы — Ференги
Кезоны — Толианцы — Триллы
Доминион — Брины — Хирогены
Зинди — Вулканцы — Кью
Информация
Персонажи — Расы — Клингонский язык
Хронология — Телепатия — Физика
Звездолёты — Классы звездолётов
Сопутствующая продукция
Рассказы и книги
Игры
Star Trek Online
Список компьютерных игр по Star Trek
Карточная игра (CCG) — RPG
Вклад
Вклад в культуру — Треккеры

Клингонский язык — искусственный язык, разработанный лингвистом Марком Окрандом по заказу Paramount Studios для одной из инопланетных рас в вымышленной вселенной сериала «Звёздный путь». На клингонском языке говорят несколько сотен человек, проживающие в 37 странах мира. [источник не указан 1316 дней] В отличие от многих языков, созданных для кинематографа, клингонский язык имеет детально разработанную грамматику, синтаксис и словарь, а также регулирующую организацию — Институт клингонского языка, публикующий переводы классических литературных произведений на клингонский язык и научный журнал, развивающий язык.

Содержание

Источники

Традиционно, Марк Окранд отрицал какие-либо источники для создания языка, говоря о свободном творчестве.

По одной из версий, первые слова и звуки клингонского языка ввёл в сериал Джеймс Духан в первом фильме Звёздный путь (1979). Привлечённый к работе над фильмом позже Марк Окранд сохранил эти слова и звуки, изобретая язык.

При создании языка Марк Окранд свободно объединил элементы знакомых ему по университету языков индейцев Северной Америки и санскрита. Найдено значительное количество соответствий ему в языке американских индейцев мутсун (язык утийской группы), последний носитель которого умер в 1930. [3] Фонетика языка использует ряд затрудняющих носителя индоевропейских языков звуков, в том числе гортанной смычки и других, экспортированных из разных языков индейцев для создания подчёркнуто «чуждого» звучания.

Письменность

Буквы пикада (pIqaD)Кириллический эквивалентМФА
aА, аɑ
bБ, бb
chЧ, чt͡ʃ
DД, дɖ
eЭ, эɛ
ghГ, гɣ
HХ, хx
IЫ, ы
(И, и)
ɪ
jДж, джd͡ʒ
lЛ, лl
mМ, мm
nН, нn
ngНг, нгŋ
oО, оo
pП, п
qК, к
QКх, кхq͡χ
rР, рr
( ɹ )
SШ, шʂ
tТ, т
tlhТл, тлt͡ɬ
uУ, уu
vВ, вv
wУ, у
(В, в)
w
yЙ, йj
ʔ

Бытование

Потомки

На основе клингонского языка был разработан эзотерический язык программирования Var’aq.

Интересные факты

Ссылки

См. также

Примечания

Полезное

Смотреть что такое «Клингонский язык» в других словарях:

Язык синтетический — Искусственные языки специальные языки, которые, в отличие от естественных, сконструированы целенаправленно. Таких языков существует уже более тысячи, и постоянно создаются всё новые и новые. Классификация Различают следующие виды искусственных… … Википедия

Искусственный язык — Искусственные языки специальные языки, которые, в отличие от естественных, сконструированы целенаправленно. Таких языков существует уже более тысячи, и постоянно создаются всё новые и новые. Классификация Различают следующие виды искусственных… … Википедия

Вспомогательный язык — Искусственные языки специальные языки, которые, в отличие от естественных, сконструированы целенаправленно. Таких языков существует уже более тысячи, и постоянно создаются всё новые и новые. Классификация Различают следующие виды искусственных… … Википедия

Баджорский язык — Пример письменности … Википедия

Клингон — Клингонский язык Самоназвание: tlhIngan Hol /ˈt͡ɬɪŋɑn xol/ Создан: Окранд, Марк Регулирующая организация: Klingon Lan … Википедия

Клингоны — Клингонская Империя Дата основания: 900 год н. э. Император: Кахлес II (2369) Канцлер … Википедия

Клингонская Империя — Дата основания: 900 год н. э. Император: Кахлес II (2369) Канцлер: Марток (2375) Столица: Ко’ноС (англ. Qo noS) … Википедия

Языки мира — У этого термина существуют и другие значения, см. Языки мира (значения). Ниже представлен полный список статей по языкам и их группам, которые уже есть в Википедии или обязательно должны быть. Включены только человеческие языки (включая… … Википедия

Окранд — Окранд, Марк Марк Окранд Marc Okrand Дата рождения: 1948 год( … Википедия

Окранд, Марк — Марк Окранд Marc Okrand Дата рождени … Википедия

Источник

Самоучитель клингонского

Пару лет назад мы рассказали о том, как в системе Антиплагиат устроен поиск русского перевода английских статей. Естественно, без машинного переводчика в алгоритме не обойтись. В основе машинного переводчика, конечно, лежит машинное обучение, которое, в свою очередь, требует весьма значительного количества «параллельных предложений», т.е. одинаковых по смыслу предложений, написанных на двух языках. Значительное количество — это миллионы предложений, и чем больше, тем лучше. Понятно, что для русско-английской пары найти такую базу (в том числе и в открытом доступе) реально. А что делать с теми языковыми парами, для которых параллельных предложений принципиально не может быть слишком много?

Казалось бы, не имея в распоряжении большого объема обучающих примеров, обучить систему машинного перевода невозможно. Но на помощь приходит идеология Unsupervised Learning, или «обучение без учителя». Ну а чтобы задача была действительно интересной (особенно порадует она фанатов вселенной Стартрека), мы будем обучать наш машинный переводчик для пары языков «английский – клингонский».

Клингонский язык что это. Смотреть фото Клингонский язык что это. Смотреть картинку Клингонский язык что это. Картинка про Клингонский язык что это. Фото Клингонский язык что этоИсточник картинки: Собственное творчество от команды Антиплагиата

А самым подходящим девизом к дальнейшему рассказу о применении Unsupervised Learning будет знаменитая выдержка из Инструкции клингонского почетного караула «Если не можешь контролировать себя, тебе не дано командовать другими».

Для тех, кто еще не стал фанатом Стартрека, клингонский язык – это искусственно созданный язык, на котором говорят клингоны в популярной американской киновселенной «Звездный путь». Для этого языка существует несколько систем письма, мы возьмем наиболее простую для нашей задачи систему на основе латиницы. Вообще, создавать свои языки для вымышленных миров – это довольно популярная тема. Вспомнить хотя бы Толкиена, который создал синдарин – язык эльфов в фантастическом мире «Властелин колец». Более свежие примеры – это дотракийский из «Игры престолов» или на’ви из «Аватара». Впрочем, для нашей задачи конкретный выбор языка не так уж важен, главное, чтобы в какой-нибудь библиотеке не лежало пару тысяч томов текста на этом языке – иначе станет неинтересно.

Концепция «Unsupervised Learning» подразумевает обучение моделей (математических, поручик, математических 🙂 ) без использования размеченных данных. В нашем случае это обучение системы машинного перевода без корпуса параллельных предложений (или с очень маленьким объемом). Применять обучение без учителя для задачи перевода стали не так давно. Здесь и здесь есть статьи, в которых впервые был описан одними один из самых популярных на сегодня методов решения нашей задачи. Этот метод мы и постараемся сегодня применить.

Сразу оговорим тот факт, что для построения переводчика мы все же будем использовать параллельный корпус, но только для побочных задач: построения словаря и дообучения модели. Дообучение модели опционально, его можно и не делать, а вместо построения словаря из параллельных предложений можно воспользоваться готовым (разумеется, если он есть). В любом случае, при подходе, описанном ниже, нам понадобится намного меньший корпус параллельных предложений, чем при обучении переводчика «в лоб», это будет видно в конце статьи.

Основной алгоритм построения модели переводчика без параллельных предложений можно описать следующим образом:

Далее поговорим о каждом пункте.

Векторизация слов

Элементарная смысловая составляющая языка – это слово. Если человек начинает учить незнакомый язык, то, как правило, он старается запомнить самые частые слова. Подобный принцип лежит в основе модели машинного перевода: на самом нижнем уровне оперируем словами (хотя это не всегда правда, но про BPE сегодня говорить не будем). С точки зрения компьютера слово – это только последовательность кодов символов. Никакого дополнительного смысла эта последовательность не несет. Поэтому слова надо каким-то образом «оцифровывать». Проще говоря, надо переводить слово в некоторый уникальный вектор или эмбеддинг. Построение такого преобразования само по себе очень большая и интересная задача, которая до сих пор актуальна. Причем решается эта задача чаще всего как раз с помощью Unsupervised Learning. Почитать о примерах реализации можно, например, здесь. Нам же важно, что такие модели существуют и обладают одним очень важным свойством: они подчиняются дистрибутивной гипотезе. Это значит, что слова, которые часто встречаются в одном контексте, в этом векторном пространстве будут располагаться ближе друг к другу. А слова, которые редко или вообще не встречаются в одном контексте, будут в этом векторном пространстве разнесены далеко. Таким образом, векторы слов образуют некоторую структуру в этом построенном пространстве.

Выравнивание векторных пространств

Можно предположить, что в идеальном случае такие структуры будут очень похожи для разных языков. На этом предположении и строится идея выравнивания эмбеддингов для разных языков. Имея два векторных пространства слов для разных языков, мы пытаемся максимально совместить их, чтобы сопоставить слова из разных языков друг с другом. Можно посмотреть наглядную иллюстрацию из статьи.

Самое логичное в данной задаче – использовать словари, которые, по сути, являются естественным отображением слов одного языка в слова другого языка. Если же словаря под рукой нет, можно получить его из небольшого набора параллельных предложений. В нашем эксперименте мы воспользуемся утилитой fast_align. Здесь надо сказать, что методы выравнивания векторных пространств на основе словарей работают неплохо, но порой с ними возникают проблемы. Во-первых, одному слову в словаре всегда соответствует несколько значений из другого языка – не всегда понятно, как работать с такой избыточной информацией. Во-вторых, пытаясь совместить векторные пространства по словарям, мы можем потерпеть неудачу, потому что словари составлены по совершенно другой структуре. Ну и наконец, бывают экзотические случаи, когда языковая пара, для которой мы хотим построить перевод настолько редка, что нет ни словаря, ни параллельного корпуса. Для таких случаев существуют методы выравнивания векторных пространства слов без использования информации из словарей. Про оба метода, как со словарем, так и без словаря, можно почитать, например, здесь.

Обучение переводчика

Итак, мы умеем переводить слово в вектор, а по вектору восстанавливать наиболее похожее слово из целевого языка. И уже теперь мы можем построить простейший переводчик. А именно: мы можем переводить предложения по отдельным словам. Конечно, это очень слабая модель перевода, но для начальной инициализации подойдет и такая. Теперь, имея простейшую модель перевода, мы можем сами порождать параллельные предложения. Конечно же, полученные параллельные предложения окажутся очень плохого качества – в них никак не будет учитываться грамматика языка. Самое время вспомнить о принципе обучения автокодировщиков для текстов.

Совсем недавно мы рассказывали, как модели автокодировщиков учатся восстанавливать зашумленный вход, чтобы настраивать свои параметры. В данном случае, полученный нами «плохой» параллельный корпус можно рассматривать как «зашумленную» версию перевода. И, пользуясь тем же способом, что и автокодировщики, мы можем учить модель восстанавливать истинный перевод. Для нашей пары «английский-клингонский» алгоритм выглядит следующим образом:

Стоит подчеркнуть, при данном подходе довольно логично обучать сразу две модели машинного перевода: с исходного языка на целевой и наоборот. Действительно, после некоторого числа итераций машинный переводчик достигнет качества пословного перевода (в теории) и больше не сможет улучшаться, так как корпус параллельных предложений так и остался «зашумленным». Поэтому в процессе обучения сгенерированный параллельный корпус надо периодически обновлять, переводя предложения более качественным обученным переводчиком. Казалось бы, пошагово улучшая переводчик на каждом шаге, мы в итоге должны получить идеальную модель. Если бы все было так просто! Мы не можем внести в модель больше информации, чем содержится в самом корпусе предложений изначально. К тому же, методы обучения машинного перевода, которые мы здесь рассматриваем, базируются на довольно сильных предположениях, которые на практике не совсем верны.

Модели перевода

То, какую модель перевода выбрать – отдельный вопрос. Глобально все модели можно разделить на два семейства: нейросетевые и статистические. Большим прорывом в области нейросетевого перевода стала архитектура трансформера, про который можно почитать в этой статье. У таких моделей есть большой недостаток: они требуют большого объема обучающей выборки. Причем данные в этой выборке должны быть достаточно хорошего качества. Статистические модели более просты и требуют гораздо меньшего объема данных для настройки параметров. Конечно, качество перевода у них, соответственно, будет ниже, но, как мы говорили в предыдущих статьях, нам не обязателен идеальный «читаемый» перевод. Достаточно, чтобы качества перевода хватало для дальнейших этапов работы.

Эксперименты

Продемонстрируем все теоретические выкладки на примере. Сразу оговоримся, что эксперименты несут чисто демонстративный характер и всего лишь иллюстрируют примерный ход экспериментов при построении модели.

Самое важное при построении новой модели машинного перевода – сбор данных. В случае с редкими языками вопрос сбора данных стоит особо остро, так как данных для таких языков не так много. Для клингонского языка мы подобрали несколько ресурсов, на которых можно было найти как параллельные данные (клингонский-английский), так и моноязыковые данные (предложения только на клингонском). В первую очередь, это сайт с открытыми параллельными корпусами, а также аналог Википедии на клингонском. С моноязыковыми данными для английского языка проблем, разумеется, нет, но мы ограничили размер выборки, чтобы сохранить баланс обучающих данных.

Что ж, у нас есть изложенный выше план, будем его придерживаться. Сначала надо обучить две модели векторизации слов для каждого языка по отдельности. Процедура эта довольно стандартная, и интересного в ней нет ничего.

Имея в распоряжении два векторных пространства слов, попробуем их выровнять друг относительно друга. Для этого будем использовать метод MUSE.

Клингонский язык что это. Смотреть фото Клингонский язык что это. Смотреть картинку Клингонский язык что это. Картинка про Клингонский язык что это. Фото Клингонский язык что это Клингонский язык что это. Смотреть фото Клингонский язык что это. Смотреть картинку Клингонский язык что это. Картинка про Клингонский язык что это. Фото Клингонский язык что это Искусственные языки ( список )
Естественный язык • Искусственный язык • Плановый язык • Социализованный язык • Международный вспомогательный язык • Априорный язык • Апостериорный язык • Гипосхематические языки • Гиперсхематические языки • Универсальный язык • Схематизм
Интерлингвистика
Апостериорные языки и лингвопроекты
Плановыеfolkspraak • lingua catolica • адьюванто • балейбелен • бейсик-инглиш • будинос • глоса • интерглосса • интерлингва • космос • латино-сине-флексионе • лингва франка нова • окциденталь • романид • словио • словянски • универсалглот • универсаль • унитарио • уропи
Вымышленныеbrithenig • speedtalk • вавилон 17 • венедык • ларимин • надсат • новояз • Старшая Речь
Априорные языки и лингвопроекты
Философские
и логические
aui • ифкуиль • линкос • логлан • ложбан • токипона • сона
Плановыеро • сольресоль • эльюнди
Вымышленныеаварин • адунайский • валарин • вестрон • квенья • клингон • кхуздул • на’ви • рамерийские • роханский • синдарин • талиска • тэлерин • чёрное наречие
Иероглифическиеблисс • 3ленго • локос
Смешанные языки и лингвопроекты
ПлановыеLingua Ignota • волапюк • идо • нэо • неутраль • новиаль • ОМО • эсперантидо • (прото-)эсперанто
Вымышленныечатлано-пацакский
Создатели и пропагандисты языков
Персоны
warkill
noHHoH
HoHlu’be’pIHoHbe’
HoHlu’muHoH
HoHlu’pu’muHoHbe’
ghoHlu’pIHoH

Носителей клингонского среди нас нет, поэтому оценить адекватность полученного перевода сложновато. Понадеемся на способности искусственного интеллекта и для проверки воспользуемся переводчиком Bing (разработчики которого, судя по плашке на странице переводчика, разработали перевод вместе с Институтом клингонского языка):

Клингонский язык что это. Смотреть фото Клингонский язык что это. Смотреть картинку Клингонский язык что это. Картинка про Клингонский язык что это. Фото Клингонский язык что это

Клингонский язык что это. Смотреть фото Клингонский язык что это. Смотреть картинку Клингонский язык что это. Картинка про Клингонский язык что это. Фото Клингонский язык что это

Видно, что хотя в топ-5 соседей к исходному слову «war» попал мусор (The unseen good old man), в целом нам удалось построить выравнивание.

А дальше следует непосредственно процесс обучения самой модели переводчика. Как мы говорили выше, для начальной инициализации создадим параллельный корпус, состоящий из пословного перевода предложений. На каждой следующей итерации будем обновлять этот корпус переводами нашей модели (которая, в теории, должна становиться лучше и лучше с каждой итерацией).

Посмотрим, как же работает наша модель после нескольких итераций обучения. Для оценки качества необходим истинный параллельный корпус. В качестве такого воспользуемся отрывком из Гамлета, который был переведен специалистами клингонского языка. Хотя клингонский канцлер Горкон уверен, что изначально перевод был сделан в другую сторону: «Вы никогда не поймете Шекспира, пока не прочитаете его в оригинале, на клингонском».

Клингонский язык что это. Смотреть фото Клингонский язык что это. Смотреть картинку Клингонский язык что это. Картинка про Клингонский язык что это. Фото Клингонский язык что это
Обложка издания «Hamlet Prince of Denmark: The Restored Klingon Version», The Klingon Language Institute printed version, USA, 1996

continuous or not.
now reference question.
like, noted since nice primarily, severely respectively condition?
or, crisis regulation battle bore condition,
and, fought, sudden?
died; sleeping

Qapla’! У нас даже есть одинаковые слова! Учитывая все допущения, которые мы сделали (чересчур маленький объем выборки, простая модель перевода и прочее), наличие хотя бы совпадающих слов уже является успехом.

При переводе текста модель статистического перевода учитывает несколько факторов (языковая модель, условные вероятности и пр.) с различными весами. Эти веса мы можем подкорректировать, дообучив модель на параллельном корпусе. В итоге перевод слегка улучшился:

be or not.
now example question.
like, noted since nice primarily, severely respectively condition?
or, crisis regulation battle bore condition,
and, fought, sudden?
died; sleeping

Для сравнения, посмотрим, как бы выглядел перевод, если бы мы воспользовались обычным машинным переводчиком, обучающимся на нашем параллельном корпусе:

Может и норм, но для меня качество последнего перевода сопоставимо с дерьмом тарга.

Клингонский язык что это. Смотреть фото Клингонский язык что это. Смотреть картинку Клингонский язык что это. Картинка про Клингонский язык что это. Фото Клингонский язык что это
Источник изображения: Кадр со съемочной площадки, снят во время производства 5 эпизода «Там, где никто не бывал», «Звездный путь: следующее поколение», 1987

Кроме того, в случае поиска переводных заимствований, как мы уже говорили, использование перевода по прямому назначению не предполагается. Полученный перевод далее используется модулем поиска заимствований, который не так требователен к качеству перевода. Однако это не отменяет того, что эту технику можно использовать и для построения модели, которая будет генерировать «читаемый» перевод. Об этом мы напишем в других статьях.

Большое спасибо Наталье Поповой за полезные консультации по вселенной Стартрека и моим коллегам за помощь в подготовке статьи.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *