Наносинтаксис - Nanosyntax

Наносинтаксис - это подход к синтаксису, при котором конечные узлы синтаксических деревьев синтаксического анализа могут быть уменьшены до единиц, меньших, чем морфема . Каждая единица может выступать в качестве несводимого элемента, и от нее не требуется формировать дополнительное «поддерево». Из-за его сокращения до наименьшего возможного терминала, терминалы меньше морфем. Следовательно, морфемы и слова не могут быть разделены на один терминал, а вместо этого состоят из нескольких терминалов. В результате Nanosyntax может служить решением явлений, которые неадекватно объясняются другими теориями синтаксиса.

Некоторые недавние работы в области теоретической лингвистики предполагают, что «атомы» синтаксиса намного меньше слов или морфем. Из этого следует, что ответственность за синтаксис не ограничивается упорядочиванием «заранее сконструированных» слов. Вместо этого в рамках Nanosyntax слова являются производными сущностями, встроенными в синтаксис, а не примитивными элементами, предоставляемыми лексиконом.

История

Теоретический контекст

Наносинтаксис возник в контексте других синтаксических теорий, в первую очередь картографии и распределенной морфологии . Теории картографического синтаксиса оказали большое влияние на мысль, лежащую в основе наносинтаксиса, и эти теории имеют много общего. Картография стремится предоставить синтаксическую теорию, которая вписывается в универсальную грамматику, путем построения диаграмм строительных блоков и структур синтаксиса, присутствующих во всех языках. Поскольку картография основана на эмпирических данных, для размещения новых лингвистических данных разрабатывались более мелкие и подробные синтаксические единицы и структуры. Картография также синтаксизирует различные области грамматики, особенно семантику, в разной степени в разных фреймворках. Например, элементы семантики, которые служат грамматическим функциям, такие как функции, передающие число, время или падеж, рассматриваются как часть семантики. Эта тенденция к включению других грамматических областей в синтаксис также отражена в Nanosyntax. Другие элементы картографии, присутствующие в Nanosyntax, включают универсальные синтаксические категории порядка слияния и исключительно правые ветвящиеся деревья / движение влево. Однако картографический синтаксис концептуализирует лексику как предсинтаксическое хранилище, что контрастирует с наносинтаксическим представлением о лексиконе / синтаксисе.

Архитектура грамматики в теории наносинтаксиса.

Распределенная морфология предоставляет альтернативу лексикалистским подходам к взаимодействию лексики и синтаксиса, то есть со словами, независимо созданными в лексиконе, а затем организованными с использованием синтаксиса. В распределенной морфологии лексика не функционирует независимо, а вместо этого распределена по многим языковым процессам. И распределенная морфология, и наносинтаксис являются моделями поздней вставки, что означает, что синтаксис рассматривается как долексический / фонологический процесс, а синтаксические категории - как абстрактные понятия. Кроме того, обе теории рассматривают синтаксис как ответственный за структуру на уровне предложений и слов. Несмотря на многие сходства, наносинтаксис и распределенная морфология по-прежнему различаются в нескольких ключевых областях, особенно в том, что касается архитектуры того, как они теоретизируют взаимодействие грамматических доменов. Распределенная морфология использует пресинтаксический список абстрактных корней, функциональных морфем и словарных вставок, которые следуют синтаксическим процессам. Напротив, Nanosyntax имеет синтаксис, морфологию и семантику, работающие одновременно как часть одного домена, который взаимодействует на протяжении всего синтаксического процесса для применения лексических элементов (лексика - это единый домен в Nanosyntax, тогда как он распределен по нескольким доменам в распределенной морфологии). См. Раздел Инструменты Nanosyntax ниже для получения дополнительной информации.

Наносинтаксическая теория находится в прямом конфликте с теориями, которые принимают взгляды на лексику как на независимую область, которая генерирует лексические статьи отдельно от любой другой грамматической области. Примером такой теории является гипотеза лексической целостности , которая утверждает, что синтаксис не имеет доступа к внутренней структуре лексических элементов.

Рассуждение

Поддерево для идиомы «связать себя узами брака», что означает «жениться».

Приняв теоретическую архитектуру грамматики, которая не разделяет синтаксические, морфологические и семантические процессы, и позволяя терминалам представлять суб-морфемическую информацию, Nanosyntax способен устранять различные недостатки и области неопределенности в предыдущих теориях. Одним из примеров, поддерживающих эти инструменты Nanosyntax, являются идиомы , в которых один лексический элемент представлен несколькими словами, значение которых не может быть определено совокупно. Поскольку терминалы в Nanosyntax представляют суб-морфемную информацию, одна морфема может охватывать несколько терминалов, создавая таким образом поддерево. Это приспосабливает структуру идиом, которые лучше всего представлены как поддерево, представляющее одну морфему.

Дополнительные доказательства необходимости наносинтаксического анализа включают анализ неправильных форм множественного числа существительных и неправильного перегиба глаголов (более подробно описано в разделе « Наносинтаксические операции ») и анализ морфем, содержащих несколько грамматических функций (более подробно описанных в разделе « Инструменты »).

Наносинтаксические операции

Наносинтаксис - это теория, которая пытается заполнить дыры, оставленные другими теориями, когда они стремятся объяснить явления на языке. Наиболее заметным явлением, с которым справляется Nanosyntax, является нерегулярное конъюгация. Например, слово « гусь » неправильное в том смысле, что его форма множественного числа не «гуси», а, скорее, «гуси». Это создает проблему для простого синтаксиса, поскольку без дополнительных правил и разрешений «гуси» должны оказаться неоптимальным кандидатом для множественного числа «гусь» по сравнению с «гуси».

Возможные решения

Синтаксики могут попытаться решить эту проблему тремя способами. Первый - это словесное лечение. В приведенных выше примерах «утка», «утки», «гусь» и «гуси» считаются отдельными головами в категории существительных . В этом случае в лексической статье отмечается, обозначает ли слово единственное или множественное число, и не существует заголовка числа, с помощью которого можно было бы включать аффиксы для изменения корневого слова. Эта теория требует от говорящего значительной работы, чтобы подобрать правильное слово. Это также считается недостаточным перед лицом морфологических концепций, таких как тест Wug, в котором дети могут правильно спрягать ранее неслыханное бессмысленное существительное из единственного числа во множественное число.

Распределенная морфология пытается решить этот вопрос через процесс слияния. Слияние - это процесс, при котором голова существительного и его числовая голова могут сливаться вместе при определенных параметрах, чтобы получить неправильное множественное число. В приведенном выше примере множественное число от «утка» просто выберет его алломорф во множественном числе «утки», а множественное число от «гусь» выберет его алломорф во множественном числе «гуси», созданный посредством слияния «гусь» и «-s». . Таким образом, распределенная морфология основана на головах. Однако эта теория до сих пор не объясняет, почему «гуси» предпочтительнее и более оптимальный кандидат для множества гусей, чем «гуси».

Nanosyntax решает эту дилемму, предполагая, что вместо того, чтобы каждое слово было заголовком, это вместо этого фраза и поэтому может быть преобразована в поддерево. Внутри дерева можно назначить заголовки для переопределения других заголовков в определенных контекстах. Например, если к существительному добавляется голова с надписью «-s», чтобы превратить его из единственного числа во множественное, но голова отменяет это в случае неправильного спряжения существительного множественного числа, такого как «гусь» , он будет выбран для работы замещающей головки. Поскольку он использует формулу, а не запоминание лексических элементов наизусть, он обходит проблемы, возникающие при использовании словесной обработки, а благодаря расположению заголовков и их приоритету также обеспечивает решение проблем оптимальности распределенной морфологии.

Наносинтаксис функционирует на основе двух принципов: фразовой лексикализации и принципа в другом месте.

Здесь происходит фразовая лексикализация, когда что-то может лексизировать другое, если оно соответствует его конкретным параметрам. В этом примере «гуси» могут лексически обозначить «NP goose + NumP во множественном числе».

Фразовая лексикализация

Фразовая лексикализация - это концепция, которая предполагает, что только лексические элементы могут составлять конечные узлы. Когда применяется этот принцип, мы можем сказать, что в обычных существительных множественного числа нет специальной лексикализации (обозначенной в приведенном ниже примере с помощью X), которая должна применяться, и поэтому применяются стандартные правила множественного числа. Ниже приведен пример использования слова «утка», где из-за отсутствия дополнительной лексикализации существительного множественного числа добавлено -s для образования множественного числа существительного:

Неправильные глаголы могут быть параллельны фонологическим идиомам (например, «гуси»), а также использовать фразовую лексикализацию.

X ↔ [ _PlP [ _NP DUCK] Pl, утка ↔ [ _NP DUCK] (8) s ↔ Pl

Этот принцип также позволяет такому слову, как «гуси», лексизировать [гусь [Pl ⁰ ]. Когда присутствует дополнительная лексикализация, вместо того, чтобы следовать стандартному добавлению -s для образования множественного числа существительного, вместо этого правило лексикализации вступает во владение следующим образом:

гуси ↔ [ _ПлП [ _НП_ГУСЕ ] Пл.

Принцип в другом месте

Принцип «в другом месте» пытается найти решение вопроса о том, какая лексикация применима к рассматриваемому существительному. Проще говоря, более конкретная лексикализация всегда будет иметь приоритет над более общей лексикализацией.

Как показано, синтаксическая структура S стремится либо к лексикализации из A ↔ [ _XP X [ _YP Y [ _ZP Z]]], либо из B ↔ [ _YP Y [ _ZP Z]], B победит над A, потому что B лексикализует в более конкретной ситуации. тогда как A лексикализирует в более общем плане. Это решает проблему, с которой сталкивается распределенная морфология при определении оптимального множественного числа для неправильных существительных.

Наблюдаемые последствия

Каха предположил, что существует иерархия падежей от самого широкого до самого узкого: дательный, родительный, винительный, именительный. Каха также предположил, что каждый из этих случаев можно разбить на самые основные структуры, каждая из которых является синтаксическим окончанием, следующим образом:

Дательный падеж = [ _WP W [ _XP X [ _YP Y [ _ZP Z]]]] Родительный падеж = [ _XP X [ _YP Y [ _ZP Z]]] Винительный падеж = [ _YP Y [ _ZP Z]] Именительный падеж = [ _ZP Z]

Это более подробно описано в разделе « Морфологическое сдерживание / вложение» этой статьи в Википедии.

Поскольку каждое из них состоит из наборов внутри, возможно, что части времени будут лексикализованы с помощью отдельного существительного. Следовательно, есть несколько возможностей в паттернах синкретизма, а именно AAAA, AAAB, AABB, ABBB, AABC, ABBC и ABCC. Некоторые договоренности не кажутся возможными из-за ограничений, налагаемых принципом «где-то еще». Примечательно, что после того, как произошел переход к отдельной лексикализации, лексикализация из предшествующей не может вернуться. Другими словами, не бывает случаев, когда после того, как A превращается в B или B в C, снова появляется A или B соответственно. Принцип «в другом месте» гласит, что более узкая лексикализация побеждает более широкую лексикализацию, и после того, как была выбрана более узкая лексикализация, более широкая лексикализация больше не появится.

Инструменты

Nanosyntax использует несколько инструментов для детального отображения элементов анализируемого языка. Помимо принципов правописания, есть три основных инструмента для этой системы, основанных на трудах Бауназа, Хегемана, Де Клерка и Ландера в Exploring Nanosyntax .

Семантика

Универсальная структура композиционности используется для семантического отображения структуры внутри предложений. Это имеет дело с отображением, из которого состоят слова, например, на каких структурах семантически «построено» данное слово. Семантические соображения влияют на параметры структурного охвата предложения, основанные на семантических категориях таких вещей, как глаголы. Это важная направляющая функция, определяющая, какие элементы синтаксиса необходимо согласовать с семантическими маркерами.

Синкретизм

Синкретизм сыграл центральную роль в развитии Nanosyntax. Эта система объединяет две различные морфосинтаксические структуры на поверхности предложения: например, две грамматические функции, содержащиеся в одной лексической форме. Примером этого может быть что-то вроде французского «à», которое может использоваться для обозначения местоположения или цели; следовательно, это синкретизм местоположения и цели. Это наблюдение синкретизма происходит из работы по изучению закономерностей чтения слов, таких как цель «к», «маршрут через» и местоположение «в», кросс-лингвистической выполненной лингвистикой, как это было предложено Свенониусом.

На основании теоремы ABA было определено, что синкретизм случаев возможен только со смежными случаями. Таким образом, это может быть использовано для нацеливания на соседние элементы в упорядочении падежей, например, в именительном и винительном падежах в таких языках, как английский. Используя синкретизм в Nanosyntax, можно идентифицировать универсальный порядок падежей, определяя, какие случаи находятся рядом друг с другом. Это открытие позволяет лингвистам понять, какие признаки присутствуют, а также их порядок.

Морфологическое сдерживание

{\ Displaystyle {\ mathsf {\ underbrace {\ qquad K_ {6} \ qquad> \ underbrace {\ qquad K_ {5} \ qquad> \ underbrace {\ qquad K_ {4} \ qquad> \ underbrace {\ qquad K_ { 3} \ qquad> \ underbrace {\ qquad K_ {2} \ qquad> \ underbrace {\ qquad K_ {1} \ qquad} _ {NOM}} _ {ACC}} _ ​​{GEN}} _ {DAT}} _ {INS}} _ {COM}}}}

Вложенность случаев, предполагаемая в Nanosyntax.

Морфологическое содержание относится к иерархии линейного порядка в синтаксических структурах. Синкретизм может выявить линейный порядок, но не может определить, в каком направлении происходит линейный порядок. Вот где требуется морфологическое сдерживание. Он используется в этом контексте для установления иерархии дел. Синкретизм может определять линейный порядок падежей: COM> INS> DAT> GEN> ACC> NOM или NOM> ACC> GEN> DAT> INS> COM, но морфологическое включение решает, является ли он именительным или комитативным начальным. Эти особенности кейса можно понимать как наборы друг друга, где функции строятся друг над другом, причем первая функция является одиночной, а следующая функция - первая и вторая, вложенные внутри себя, и так далее. Эти наборы можно назвать вышеупомянутыми функциями. В качестве альтернативы, чтобы упростить вложение функций, можно пометить их как K _{1 / и т. Д.,} Как было предложено Павлом Каха. Аргументы в пользу того, что именительный падеж является самым простым и первым падежом, можно связать с его простотой в структуре и особенностях. Примеры можно найти в естественном языке, которые предлагают порядок, начинающийся с NOM и заканчивающийся на COM, например, в западно-тохарском языке, где окончание множественного числа ACC -m вложено в окончание GEN / DAT -mts. Это поверхностное представление упорядочивания Case посредством использования вложенности в Nanosyntax.

Languages

In other projects