Что такое синтетический язык
синтетические языки
Смотреть что такое «синтетические языки» в других словарях:
Синтетические языки — СИНТЕТИЧЕСКИЕ ЯЗЫКИ. См. Аналитические языки. Литературная энциклопедия: Словарь литературных терминов: В 2 х т. / Под редакцией Н. Бродского, А. Лаврецкого, Э. Лунина, В. Львова Рогачевского, М. Розанова, В. Чешихина Ветринского. М.; Л.: Изд во… … Литературная энциклопедия
СИНТЕТИЧЕСКИЕ ЯЗЫКИ — класс языков, в которых грамматические значения выражаются в пределах слова с помощью аффиксов или внутренней флексии, напр. русский, немецкий, литовский и др. индоевропейские языки … Большой Энциклопедический словарь
Синтетические языки — СИНТЕТИЧЕСКИЕ ЯЗЫКИ. См. Аналитические языки … Словарь литературных терминов
синтетические языки — класс языков, в которых грамматические значения выражаются в пределах слова с помощью аффиксов или внутренней флексии, например русский, немецкий, литовский и другие индоевропейские языки. * * * СИНТЕТИЧЕСКИЕ ЯЗЫКИ СИНТЕТИЧЕСКИЕ ЯЗЫКИ, класс… … Энциклопедический словарь
Синтетические языки — типологический класс языков, в которых преобладают Синтетические формы выражения грамматических значений. С. я. противопоставляются аналитическим языкам (См. Аналитические языки), в которых грамматические значения выражаются при помощи… … Большая советская энциклопедия
синтетические языки — См. аналитические языки … Грамматический словарь: Грамматические и лингвистические термины
Синтетические языки — Синтетические языки см. Типологическая классификация языков … Лингвистический энциклопедический словарь
Синтетические языки — … Википедия
синтетические языки — См. lingue sintètiche … Пятиязычный словарь лингвистических терминов
языки синтетические — см. синтетические языки … Словарь лингвистических терминов
Что такое синтетический язык
В морфологической типологии (а это хронологически первая и наиболее разработанная область типологических исследований) принимаются во внимание, во-первых, способы выражения грамматических значений и, во-вторых, характер соединения в слове его значимых частей (морфем). В зависимости от способов выражения грамматических значений различают синтетические и аналитические языки. В зависимости от характера соединения морфем различают агглютинативные и фузнойные языки (§ 141—142).
В языках мира существуют две основные группы способов выражения грамматических значений: 1) синтетические способы и 2) аналитические. Для синтетических способов характерно соединение грамматического показателя с самим словом (в этом мотивированность термина синтетический1);таким показателем, вносящим грамматическое значение «внутрь слова», может быть окончание, суффикс, приставка, внутренняя флексия (т. е. чередование звуков в корне, например, теку — течет— поток), изменение ударения (ноги — ноги), супплетивизм (я — меня, хожу — иду, хороший —лучше), повтор морфемы2. Подробно о грамматических способах в разных языках см. Реформатский 1967: 263—313.
Общей чертой аналитических способов является выражение грамматического значения за пределами слова, отдельно от него — например, с помощью предлогов, союзов, артиклей, вспомогательных глаголов и других служебных слов, а также с помощью порядка слов и общей интонации высказывания3.
Синтетический (от греч. synthesis — сочетание, составление, объединение) — основанный на синтезе, объединенный.
Таково, в частности, происхождение праславянского показателя имперфекта: длительность действия передавалась изобразительно — путем удвоения суффиксального гласного или добавления другого, похожего, гласного, ср. ст.-слав. ГЛАГОЛААХЪ, НЕСЬАХЪ.
3 Аналитический (от греч. analysis — разъединение, разложение, расчленение — разъединяющий, разлагающий на составные части; связанный с анализом. болгарского), санскрит, древнегреческий, латынь, литовский, якутский, арабский, суахили и др.
К языкам аналитического строя относятся все романские языки, болгарский, английский, немецкий, датский, новогреческий, новоперсидский и др. Аналитические способы в этих языках преобладают, однако в той или иной мере используются и синтетические грамматические средства.
Языки, в которых почти отсутствуют возможности синтетического выражения ряда грамматических значений (как в китайском, вьетнамском, кхмерском, лаосском, тайском и др.), в начале XIX в. называлиаморфными (‘бесформенными’), т. е. как бы лишенными формы, но уже Гумбольдт назвал ихизолирующими. Было увидено, что эти языки отнюдь не лишены грамматической формы, просто ряд грамматических значений (именно синтаксические, реляционные значения) выражаются здесь отдельно, как бы «изолированно», от лексического значения слова (подробно см. Солнцева 1985).
Есть языки, в которых корень слова, напротив, оказывается настолько «переобремененным» разными служебными и зависимыми корневыми морфемами, что такое слово превращается по смыслу в предложение, но при этом остается оформленным как слово. Такое устройство «слова-предложения» называют инкорпорацией (лат. incorporatio — включение в свой состав, от лат. m — в и corpus — тело, единое целое), а соответствующие языки — инкорпорирующими или полисинтетическими(некоторые индейские языки, чукотский, корякский и др.).
СИНТЕТИЧЕСКИЙ И АНАЛИТИЧЕСКИЙ СТРОЙ ЯЗЫКОВ
Аналити́ческие языки́ —языки, в которых грамматические отношения имеют тенденцию к передаче в основном через синтаксис, то есть через отдельные служебные слова (предлоги, модальные глаголы и т. п.) через фиксированный порядок слов, контекст и/или интонационные вариации, а не через словоизменение с помощью зависимых морфем (окончаний, суффиксов, приставок и т. д.). К языкам с хорошо выраженной тенденцией к аналитизму традиционно относятся африкаанс, английский, голландский, новоперсидский, македонский и болгарский языки. При этом предки всех этих языков носили хорошо задокументированный флективный характер. Ярко выраженная тенденция к аналитизму проявляется во всех романских языках, включая французский, который представляет её наиболее полно, демонстрируя наибольший контраст по сравнению с флективной латынью.
Синтетический строй языков.
В синтетических языках грамматические значения выражаются в пределах самого слова (аффиксация, внутренняя флексия, ударение, супплетивизм), то есть формами самих слов. Для выражения отношений между словами в предложении могут быть использованы также элементы аналитического строя (служебные слова, порядок знаменательных слов, интонация).
Поскольку язык в принципе не бывает типологически однородным, термин «синтетические языки» применяется на практике к языкам с достаточно высокой степенью синтеза, например немецкому, русскому, тюркским, финно-угорским, большинству семито-хамитских, индоевропейским (древним), монгольским, тунгусо-маньчжурским, некоторым африканским (банту), кавказским, палеоазиатским, языкам американских индейцев.
Генеалогическая классификация языков.
Классификация языков по степени их родства называется генеалогической. Изучение и группировка языков мира на основании определения родственных связей между ними (отнесения их к одной семье, группе), т. е. на основе общего происхождения из предполагаемого праязыка.
Лингвисты выявили более ста основных языковых семей (языковых семей, которые не считаются связанными друг с другом). Некоторые из них состоят всего из нескольких языков, другие же состоят более чем из тысячи. Вот основные языковые семьи мира.
Аналитические и синтетические языки. Машинный перевод между ними
Введение. Типы языков. Различия между ними
В языках мира существуют две основных группы способов выражения грамматических значений – синтетические и аналитические.
Аналитические языки — те, в которых грамматические отношения имеют тенденцию к передаче в основном через синтаксис, то есть через отдельные служебные слова (предлоги, модальные глаголы и т. п.) через фиксированный порядок слов, контекст и/или интонационные вариации, а не через словоизменение с помощью зависимых морфем (окончаний, суффиксов, приставок и т. д.).
В синтетических языках грамматические значения выражаются в пределах самого слова (аффиксация, внутренняя флексия, ударение, супплетивизм), то есть формами самих слов.
Помимо двух основных типов существуют два экстремальных подтипа – полисинтетические и изолирующие.
Полисинтетические языки — те, в которых все члены предложения (полная инкорпорация) или некоторые компоненты словосочетания (частичная инкорпорация) соединяются в единое целое без формальных показателей у каждого из них. Другими словами, целое предложение может оказываться внутри одного массивного слова, несущего как основную информацию, так и дополнительные оттенки эмоциональные и смысловые.
Изолирующие языки́ (иначе аморфные, односложные, корневые) — языки с низким соотношением морфем к слову. Слова в максимально изолирующем языке будут состоять только из одной морфемы — корня, не образуя ни составных слов, ни сочетаний с суффиксами, префиксами и т. д.
Классический пример синтетического и аналитического строя:
В английском языке, считающемся аналитическим, фраза I love you может быть правильно воспринята только при такой последовательности слов. При изменении последовательности страдает смысл и, зачастую, грамматика. Так, нельзя сказать Love you I или I you love.
В то же время в русском языке, считающемся синтетическим, фраза «Я тебя люблю» может достаточно легко трансформироваться в «Тебя люблю я», «Тебя я люблю» и так далее. Это происходит за счёт того, что грамматические конструкции находятся внутри самих слов, что позволяет легко идентифицировать их значение вне зависимости от положения в предложении.
Другой характерный пример различия этих языков – однословное предложение «Смеркалось». В то время, как в русском языке смысл передан одним словом, которое указывает одновременно и на действие, и на время, не требуя при этом подлежащего, в английском языке аналог будет растянут на длинное предложение: It was getting dark.
В большинстве языков есть и аналитические, и синтетические средства выражения грамматических значений, однако их удельный вес бывает разным. В зависимости от того, какие способы преобладают, различают языки аналитического и синтетического строя. К синтетическим языкам принадлежат все славянские языки (кроме болгарского), санскрит, древнегреческий, латынь, немецкий, якутский, суахили и др. Важно отметить, что чистых аналитических или синтетических не существует, есть примеры (окончания числовых?). Так. В аналитическом английском число в существительных отображается с помощью окончания s.
К языкам аналитического типа относятся все романские языки, английский, болгарский, новоперсидский, датский и др.
Языки, в которых почти отсутствуют возможности синтетического выражения грамматических значений (китайский, вьетнамский и др.), называют изолирующими (ранее их называли аморфными), как бы лишенными формы.
Есть языки, в которых слово оформляется большим количеством разных служебных морфем, оно превращается по смыслу в слово-предложение, но при этом остается оформленным как слово. Такое устройство «слова-предложения» называют инкорпорацией, а соответствующие языки – инкопрорирующими или полисинтетическими (индейские языки, чукотский, корякский и др).
Критерии выбора языков для исследования. Методика анализа
В качестве материала для исследования была взято руководство пользователя iPhone для программного обеспечения iOS-8 на исследуемых языках. Выбор был продиктован тем, что данная тематика представляет наименьшие трудности для алгоритмов NMT, предложения в таких материалах, как инструкции, наиболее просты грамматически и не отличаются сложной лексикой. Объём текста для каждой языковой пары оказался около 40 страниц.
Перед исследованием не ставился вопрос о том, как быстро можно постредактировать переводы внутри и между типами языков. Главный вопрос – насколько изначально читаемым и схожим будет материал на выходе.
В качестве системы МТ был выбран один из основных российских разработчиков МТ, среди движков которого оказалось подавляющее большинство необходимых для исследования языковых пар. Таким образом, несмотря на неизбежные отличия в качестве корпусов, сводилась к нулю вероятность различия результатов в силу разных алгоритмов разных систем МТ.
Для анализа было решено выбрать несколько языков: по два каждого типа. Основными критериями выбора стали: отсутствие близких связей между выбранными языками, их популярность и возможность выполнения нейромашинного перевода для всех выбранных языков на единой платформе во избежание влияния алгоритмов разных систем МТ на конечный результат перевода.
В качестве синтетических языков были взяты:
В качестве аналитических выбраны:
Выбор был продиктован следующим соображениями:
Русский язык – представитель славянских языков и наиболее используемый из них в международной практике и, следовательно, в переводческой отрасли.
Турецкий язык – наиболее популярный язык тюркской группы.
Английский язык – самый используемый в мире язык, представитель германской ветви индоевропейских языков.
Китайский – язык с наибольшим числом носителей в мире из сино-тибетской семьи, являющийся изолирующим по грамматическому строю.
Выбор языков был также обусловлен количеством носителей, принадлежностью к разным языковым семьям, разным группам с точки зрения типологической классификации и влиянием в экономическом плане.
В качестве методики выбрана схема оценки переводов общей тематики с и на языки внутри своей группы, а также перевод с и на языки противоположной группы.
Под коэффициентом качества понимается отношение количества ошибок выше средней степени тяжести к количеству слов в переводе. Так, учитывались только средние и тяжёлые ошибки (явные лексические ошибки, пропуски, искажение смысла, грамматика), поскольку они в конечном счёте больше всего влияют на восприятие перевода (как и на время постредактирования). В практическом смысле коэффициенты способны показать, какие пары больше подходят для их использования без редактирования, а какие – меньше или не подходят совсем.
Формула для подсчёта коэффициента качества:
Q – коэффициент качества
Em – количество ошибок средней тяжести
Eh – количество тяжёлых ошибок
Nw – количество слов в переведённом тексте
Для наглядности приведём примеры ошибок, считающихся в рамках нашего исследования лёгкими, средними и тяжёлыми.
For information about changing sound and vibration settings, see Sounds and silence on page 36.
Дополнительные сведения об изменении параметров звука и вибрации см. В разделе звуки и тишина на стр. 36.
В сегменте 490 капитализация затронула не то слово, которое следовало. Здесь потребуется лёгкая корректура, однако на понимание текста в общем она практически не влияет.
When the corresponding circles appear on the screen, swipe or drag in the direction required by the gesture.
Когда на экране появятся соответствующие круги, проведите пальцем или перетащите их в направлении, требуемом жестом.
В сегменте 5387 ошибка исключительно стилистическая и, опять же, не создающая сколь бы то ни было больших препятствий пониманию содержания.
Данный телефон прошел проверку и некоторые используемые в нем беспроводные технологии классифицированы для использования со слуховыми аппаратами.
This phone has been tested and some of the wireless technologies used in it are classified for use with hearing AIDS.
В сегменте 5884 в конце предложения словосочетание выбрано правильно, но некорректная капитализация добавляет неожиданные смыслы.
Если имеется ненастроенная базовая станция AirPort, которая включена и находится в диапазоне действия сети, можно использовать iPhone для ее настраивания.
If you have an unbuilt AirPort base station that is enabled and within network range, you can use your iPhone to configure it.
Здесь мы видим некорректное использование лексики. В данном случае корректный перевод – unconfigured. В то время как смысл может быть правильно понят, ошибка однозначно препятствует быстрому пониманию текста.
Locking iPhone puts the display to sleep, saves the battery, and prevents anything from happening if you touch the screen.
Блокировка iPhone переводит дисплей в спящий режим, экономит заряд батареи и предотвращает все, что происходит, если вы касаетесь экрана.
Искажение смысла. В русской версии эта фраза переведена как prevents everything that is happening.
Erase iPhone: Protect your privacy by erasing all the information and media on your iPhone and restoring it to its original factory settings.
Стирание iPhone: защитите свою частную жизнь, удалив всю информацию и носители на вашем iPhone и восстановив его первоначальные заводские настройки.
Лексическая ошибка. В русской версии перевод ближе к delete iPhone, чем к очистке данных.
If you have an unconfigured AirPort base station turned on and within range, you can use iPhone to set it up.
Если у вас есть неконфигурированная базовая станция аэропорта, включенная и находящаяся в пределах досягаемости, вы можете использовать iPhone для ее настройки.
Смысл полностью ускользает. Название AirPort переведено как аэропорт (воздушный хаб).
If the interior temperature of iPhone exceeds normal operating temperatures (for example, in a hot car or in direct sunlight for extended periods of time), you may experience the following as it attempts to regulate its temperature:
Если внутренняя температура iPhone превышает нормальные рабочие температуры (например, в жарком автомобиле или под прямыми солнечными лучами в течение длительного периода времени), вы можете испытать следующее, когда он пытается регулировать свою температуру:
Искажение смысла. В русской версии перевод больше схож с you may get a following experience.
To help Apple improve products and services, iPhone sends diagnostic and usage data.
Чтобы помочь компании Apple улучшить продукцию и услуги, iPhone отправляет данные о диагностике.
Язык синтетический
Иску́сственные языки́ — специальные языки, которые, в отличие от естественных, сконструированы целенаправленно. Таких языков существует уже более тысячи, и постоянно создаются всё новые и новые.
Классификация
Различают следующие виды искусственных языков:
Идея создания нового языка международного общения зародилась в XVII—XVIII веках в результате постепенного уменьшения международной роли латыни. Первоначально это были преимущественно проекты рационального языка, освобождённого от логических ошибок живых языков и основанного на логической классификации понятий. Позднее появляются проекты по образцу и материалам живых языков. Первым таким проектом был универсалглот, опубликованный в 1868 году в Париже Жаном Пирро. Проект Пирро, предвосхитивший многие детали позднейших проектов, остался незамеченным общественностью.
Следующим проектом международного языка стал волапюк, созданный в 1880 немецким языковедом И. Шлейером. Он вызвал весьма большой резонанс в обществе.
Наиболее известным искусственным языком стал эсперанто (Л. Заменгоф, 1887) — единственный искусственный язык, получивший широкое распространение и объединивший вокруг себя довольно многих сторонников международного языка.
Из искусственных языков наиболее известны:
Также есть языки, которые специально были разработаны для общения с внеземным разумом. Например — линкос.
По цели создания искусственные языки можно разделить на следующие группы:
По своей структуре проекты искусственного языка могут быть разделены на следующие группы:
Число носителей искусственных языков можно назвать лишь приблизительно, ввиду того что систематического учета носителей не ведётся.
По степени практического употребления искусственные языки делят на проекты, получившие широкое распространение: идо, интерлингва, эсперанто. Такие языки, как и национальные языки, называют «социализованными», среди искусственных их объединяют под термином плановые языки. Промежуточное положение занимают такие проекты искусственного языка, которые имеют некоторое количество сторонников, например, логлан (и его потомок ложбан), словио и другие. Большинство искусственных языков имеет единственного носителя — автора языка (по этой причине их более корректно называть «лингвопроектами», а не языками).