Поясняю свой ответ здесь, так как в форме не хватало места.
Под бессмысленностью я имел ввиду кажущуюся мне невозможность использования результатов исследований в этой области для сколько-нибудь конструктивного предсказания, что же будет в следующем языке, о котором мы не знали во время попытки построения такой универсальной грамматики.
Представим себе грамматику для "любого языка": определяем, что у нас есть множество "лексем", но не даем никаких характеристик этого множества (здесь и далее - в терминах машинных грамматик. Вероятно, у филологов все иначе - как-никак, предметная область совсем другая), потом даем "универсальное вырожденное грамматическое правило": [текст] := [лексема] | [лексема]+. Очевидно, что получившийся идиотизм абсолютно истенен и полон, но он одновременно настолько же абсолютно бесполезен. Хотя, я бы поспорил и насчет полноты, так как теоретически, если хорошо поколотиться головой о близстоящую стену, можно себе представить язык, в котором элементы вовсе не нанизаны цепочкой друг на друга. О - вот и пример: кодовое разделение каналов в стандарте CDMA. А что, тоже ведь язык :) Только вот все "элементы", элементарные сообщения, идут параллельно друг другу во времени.
Итак, если мы будем строить некоторую всеобъемлющую грамматику, то рассматривая все более разные языки и внося их под крыло этой грамматики, мы будем все больше и больше приближать эту грамматику к вышеупомянутому "универсальному вырожденному грамматическому правилу".
Можно, конечно, пойти со стороны "элементарных операций" в мозгу, которые позволяют кодировать и декодировать любой существующий язык, но, кажется, тут мы тоже уперлись бы в ту же стену: потенциально возможно очень и очень многое, мозг многое может обработать, и поэтому, встретив какой-то новый для нас язык, мы будем вынуждены опять расширять грамматику в сторону приближения к "универсальному правилу". С той же (бес)полезностью результата для укладывания в ложе этой грамматики еще одного неизвестного нам ранее языка.
[Да, я уже знаю, что я зануда :) И даже догадываюсь, что полный профан/дилетант :)]
Я тут чуть-чуть на эту тему почитал, и теперь смотрю на это чуть иначе. Раньше я думал так же, как, видимо, и Вы: UG - это такой формальный язык, который можно определить при помощи BNF, дальше я смотрел на первую же грамматическую конструкцию, которая не может быть описываема при помощи BNF (например, порядок слов в предложении: SOV vs. SVO) - и превед, товарищ Хомски. Оказывается все несколько сложней. В частности, UG определяет не только (и не столько) конкретные грамматические конструкции, а скорее комплексы грамматических фичеров, у которых определенные значения одного фичера ВСЕГДА сочетаются с определенными значениями другого фичера. Что все еще не означает, что эта теория полезна для чего-нибудь, но по крайней мере объясняет, почему это может работать.
Кроме того, существует теория, по которой в мозгу есть "фирмвейр", служащий конкретно для обработки языка (иными словами - некие районы мозга, в которых "вшита" некая обобщенная логика для обработки человеческих языков), и даже существуют весьма интересные опыты, позволяющие определить некоторые довольно продвинутые параметры этого фирмвейра, и тут, видимо, UG начинает быть полезной.
Я вполне допускаю, что в языках есть конструкции, которые не описываются BNF. Собственно, приведенный пример модуляции с кодовым разделением каналов, хоть и не является человеческим языком, но языком имхо назвать можно, и в то же время он очевидно не описывается BNF.
В частности, UG определяет не только (и не столько) конкретные грамматические конструкции, а скорее комплексы грамматических фичеров, у которых определенные значения одного фичера ВСЕГДА сочетаются с определенными значениями другого фичера. То есть, получается некая "метаграмматика", язык для генерации грамматик (в широком смысле - не записи, похожей на BNF, описывающей одномерную последовательность элементарных лексем, а некоторых более абстрактных "правил сочетаемости").
Что все еще не означает, что эта теория полезна для чего-нибудь, но по крайней мере объясняет, почему это может работать. Ну, работать-то что угодно можно заставить :) Полагаю, что можно формально доказать, что любой язык можно описать в виде некоторой грамматики (в очень широком смысле - явно в более широком, чем "машинные грамматики" и вообще правила вывода). Понятно, что можно описать также и общие законы всех языков. Мой пойнт как раз в том, что чем более широкий класс языков охватывается создаваемой нами грамматикой (или, при очень вольном допущении, любой грамматикой, входящей во множество могущих быть порожденными создаваемым нами языком генерации грамматик), тем более "бессмысленным" и бесполезным является это описание.
Кроме того, существует теория, по которой в мозгу есть "фирмвейр", служащий конкретно для обработки языка (иными словами - некие районы мозга, в которых "вшита" некая обобщенная логика для обработки человеческих языков) Да, согласен. У меня отголосок такой мысли как раз возник - под "элементарными операциями в мозгу" я имел ввиду что-то из этой степи. и даже существуют весьма интересные опыты, позволяющие определить некоторые довольно продвинутые параметры этого фирмвейра, и тут, видимо, UG начинает быть полезной. А вот тут мы уходим от рассмотрения всего в виде грамматик и начинаем чуть-чуть двигаться в сторону семантики. Аналогия (сорри за залезание в дебри; я все же надеюсь, что аналогии будут понятны всем присутствующим - все тут немного технари или по крайней мере, у всех есть рядом готовый пофилософствовать технарь :)): базис логических элементов в цифровой схемотехнике: берем базис 2И-НЕ, можем на нем построить некоторый класс машин (в данном случае - все, что мы в обыденности считаем цифровыми схемами). Но: в этом базисе, как оказывается, можно построить такую комбинационную схему, которая не является комбинационной схемой, а является асинхронным конечным автоматом. А умея строить асинхронные конечные автоматы, мы можем построить синхронный автомат, и только через эти два перехода мы приходим к "обычной" цифровой электронике. Смысл иллюстрации: бесполезно описывать поведение цифровой схемы в терминах поведения базисных элементов. Понятно, что из базисных элементов можно построить что угодно, тем не менее, выстраиваются почему-то именно такие конструкции, что можно объяснить только какими-то принципами селекции "закрепляемого" среди "возможного", то есть, уже чем-то более близким к семантике.
Собственно, приведенный пример модуляции с кодовым разделением каналов, хоть и не является человеческим языком, но языком имхо назвать можно, и в то же время он очевидно не описывается BNF.
Если честно, для меня неочевидна ни валидность сравнения CDMA с натуральным языком, ни невозможность выражения алгоритма, на котором основан CDMA при помощи BNF. Это будет очень сложный BNF, не имеющий практического применения, но тем не менее.
То есть, получается некая "метаграмматика", язык для генерации грамматик (в широком смысле - не записи, похожей на BNF, описывающей одномерную последовательность элементарных лексем, а некоторых более абстрактных "правил сочетаемости").
Если я правильно понимаю, скорее не метаграмматика, а шаблон с некоторым количеством свободных переменных (как то, порядок слов в предложении), binding которых происходит, в частности, в процессе изучения ребенком конкретного (родительского) языка.
Мой пойнт как раз в том, что чем более широкий класс языков охватывается создаваемой нами грамматикой (или, при очень вольном допущении, любой грамматикой, входящей во множество могущих быть порожденными создаваемым нами языком генерации грамматик), тем более "бессмысленным" и бесполезным является это описание.
Только если предположить, что широкий класс языков означает отсутствие инварианты. Но именно это и пытаются опровергнуть апологеты UG. В общем-то, тут есть некая круговая аргументация, согласен, но с другой стороны, таким же образом можно атаковать любую другую таксономию (в чем практическая польза отнесения пингвина, страуса и зяблика к одной категории?)
Что касается аналогии с цифровыми схемами - мне кажется, более верной будет аналогия с reverse engineering-ом какого-нибудь черного ящика. Мы, скажем, зачитываем подопытному определенного вида предложения, и замеряем, скажем, скорость, с которой он выполняет какие-то другие действия, потом меняем виды предложения, и снова замеряем скорость, тем самым пытаясь сделать какие-то предположения о том, как именно мозг, скажем так, парсит речь. В общем, это я все под впечатлением только что прочитанной книги, которую и рекомендую тепло, хотя некоторые и утверждают, что читать ее надо с применением немалой доли скептицизма (что, впрочем, верно в отношении любой книги). Называется "The Language Instinct", автор - Stven Pinker. Как говорится, хайли рекомменд.
Если я правильно понимаю, скорее не метаграмматика, а шаблон с некоторым количеством свободных переменных Почему-то кажется, что этот шаблон имеет все шансы быть очень, очень сложным шаблоном. Многоуровневым в смысле того, что свободные переменные являются сильно и нетривиально зависимыми друг от друга, и вся сложность - как раз там.
Но именно это и пытаются опровергнуть апологеты UG Да, если опровергнут и инвариант найдется - будет весьма интересно. Только, боюсь, инвариант будет очень сложной штукой, которую саму по себе можно будет изучать и изучать на протяжении поколений...
Что касается аналогии с цифровыми схемами - мне кажется, более верной будет аналогия с reverse engineering-ом какого-нибудь черного ящика. Да, можно с этой стороны смотреть. Я как-то проглядел этот "ракурс взгляда". Но вообще, для меня это уже становится как-то черезчур сложным, бакграунд-то далеко от этих понятий...
В общем, это я все под впечатлением только что прочитанной книги, которую и рекомендую тепло Эх, еще одна книга в длиннющий перечень того, что я мог бы с пользой прочесть, но вряд ли прочитаю до пенсии... Anyway, спасибо! Тем более, может, здесь найдется кто-то другой, кому наводка будет полезной :)
Про "фичеры" придумалось: есть некоторые общие характеристики понятий, как то: теплый-мягкий-большой/холодный-твердый-маленький, etc etc. Но мне кажется, что тут легко обмануться - трудно забраться на столь большую "высоту полета", чтобы отличить друг от друга "культурные наслоения" разных степеней приближенности к "фундаменту". Где-то я слышал, что у каких-то племен (случайно не у бушменов?) язык основан на разных щелчках, а не на привычных нам звуках. Как знать, может, у них и группировка этих понятий совершенно другая? :)
Щелчки затрагивают только фонетику, этажом ниже - все как у всех. Ну, то есть, у них своя, уникальная комбинация фичеров, надо полагать (комбинаторно так получается), но не нарушающая, вроде бы, общих законов.
no subject
Date: 2006-07-09 06:13 pm (UTC)no subject
Date: 2006-07-09 06:16 pm (UTC)no subject
Date: 2006-07-09 06:18 pm (UTC)no subject
Date: 2006-07-09 07:06 pm (UTC)Под бессмысленностью я имел ввиду кажущуюся мне невозможность использования результатов исследований в этой области для сколько-нибудь конструктивного предсказания, что же будет в следующем языке, о котором мы не знали во время попытки построения такой универсальной грамматики.
Представим себе грамматику для "любого языка": определяем, что у нас есть множество "лексем", но не даем никаких характеристик этого множества (здесь и далее - в терминах машинных грамматик. Вероятно, у филологов все иначе - как-никак, предметная область совсем другая), потом даем "универсальное вырожденное грамматическое правило": [текст] := [лексема] | [лексема]+. Очевидно, что получившийся идиотизм абсолютно истенен и полон, но он одновременно настолько же абсолютно бесполезен.
Хотя, я бы поспорил и насчет полноты, так как теоретически, если хорошо поколотиться головой о близстоящую стену, можно себе представить язык, в котором элементы вовсе не нанизаны цепочкой друг на друга. О - вот и пример: кодовое разделение каналов в стандарте CDMA. А что, тоже ведь язык :) Только вот все "элементы", элементарные сообщения, идут параллельно друг другу во времени.
Итак, если мы будем строить некоторую всеобъемлющую грамматику, то рассматривая все более разные языки и внося их под крыло этой грамматики, мы будем все больше и больше приближать эту грамматику к вышеупомянутому "универсальному вырожденному грамматическому правилу".
Можно, конечно, пойти со стороны "элементарных операций" в мозгу, которые позволяют кодировать и декодировать любой существующий язык, но, кажется, тут мы тоже уперлись бы в ту же стену: потенциально возможно очень и очень многое, мозг многое может обработать, и поэтому, встретив какой-то новый для нас язык, мы будем вынуждены опять расширять грамматику в сторону приближения к "универсальному правилу". С той же (бес)полезностью результата для укладывания в ложе этой грамматики еще одного неизвестного нам ранее языка.
[Да, я уже знаю, что я зануда :) И даже догадываюсь, что полный профан/дилетант :)]
no subject
Date: 2006-07-09 07:51 pm (UTC)Кроме того, существует теория, по которой в мозгу есть "фирмвейр", служащий конкретно для обработки языка (иными словами - некие районы мозга, в которых "вшита" некая обобщенная логика для обработки человеческих языков), и даже существуют весьма интересные опыты, позволяющие определить некоторые довольно продвинутые параметры этого фирмвейра, и тут, видимо, UG начинает быть полезной.
no subject
Date: 2006-07-09 08:36 pm (UTC)В частности, UG определяет не только (и не столько) конкретные грамматические конструкции, а скорее комплексы грамматических фичеров, у которых определенные значения одного фичера ВСЕГДА сочетаются с определенными значениями другого фичера.
То есть, получается некая "метаграмматика", язык для генерации грамматик (в широком смысле - не записи, похожей на BNF, описывающей одномерную последовательность элементарных лексем, а некоторых более абстрактных "правил сочетаемости").
Что все еще не означает, что эта теория полезна для чего-нибудь, но по крайней мере объясняет, почему это может работать.
Ну, работать-то что угодно можно заставить :) Полагаю, что можно формально доказать, что любой язык можно описать в виде некоторой грамматики (в очень широком смысле - явно в более широком, чем "машинные грамматики" и вообще правила вывода). Понятно, что можно описать также и общие законы всех языков. Мой пойнт как раз в том, что чем более широкий класс языков охватывается создаваемой нами грамматикой (или, при очень вольном допущении, любой грамматикой, входящей во множество могущих быть порожденными создаваемым нами языком генерации грамматик), тем более "бессмысленным" и бесполезным является это описание.
Кроме того, существует теория, по которой в мозгу есть "фирмвейр", служащий конкретно для обработки языка (иными словами - некие районы мозга, в которых "вшита" некая обобщенная логика для обработки человеческих языков)
Да, согласен. У меня отголосок такой мысли как раз возник - под "элементарными операциями в мозгу" я имел ввиду что-то из этой степи.
и даже существуют весьма интересные опыты, позволяющие определить некоторые довольно продвинутые параметры этого фирмвейра, и тут, видимо, UG начинает быть полезной.
А вот тут мы уходим от рассмотрения всего в виде грамматик и начинаем чуть-чуть двигаться в сторону семантики.
Аналогия (сорри за залезание в дебри; я все же надеюсь, что аналогии будут понятны всем присутствующим - все тут немного технари или по крайней мере, у всех есть рядом готовый пофилософствовать технарь :)): базис логических элементов в цифровой схемотехнике: берем базис 2И-НЕ, можем на нем построить некоторый класс машин (в данном случае - все, что мы в обыденности считаем цифровыми схемами). Но: в этом базисе, как оказывается, можно построить такую комбинационную схему, которая не является комбинационной схемой, а является асинхронным конечным автоматом. А умея строить асинхронные конечные автоматы, мы можем построить синхронный автомат, и только через эти два перехода мы приходим к "обычной" цифровой электронике. Смысл иллюстрации: бесполезно описывать поведение цифровой схемы в терминах поведения базисных элементов. Понятно, что из базисных элементов можно построить что угодно, тем не менее, выстраиваются почему-то именно такие конструкции, что можно объяснить только какими-то принципами селекции "закрепляемого" среди "возможного", то есть, уже чем-то более близким к семантике.
no subject
Date: 2006-07-09 08:53 pm (UTC)Если честно, для меня неочевидна ни валидность сравнения CDMA с натуральным языком, ни невозможность выражения алгоритма, на котором основан CDMA при помощи BNF. Это будет очень сложный BNF, не имеющий практического применения, но тем не менее.
Если я правильно понимаю, скорее не метаграмматика, а шаблон с некоторым количеством свободных переменных (как то, порядок слов в предложении), binding которых происходит, в частности, в процессе изучения ребенком конкретного (родительского) языка.
Только если предположить, что широкий класс языков означает отсутствие инварианты. Но именно это и пытаются опровергнуть апологеты UG. В общем-то, тут есть некая круговая аргументация, согласен, но с другой стороны, таким же образом можно атаковать любую другую таксономию (в чем практическая польза отнесения пингвина, страуса и зяблика к одной категории?)
Что касается аналогии с цифровыми схемами - мне кажется, более верной будет аналогия с reverse engineering-ом какого-нибудь черного ящика. Мы, скажем, зачитываем подопытному определенного вида предложения, и замеряем, скажем, скорость, с которой он выполняет какие-то другие действия, потом меняем виды предложения, и снова замеряем скорость, тем самым пытаясь сделать какие-то предположения о том, как именно мозг, скажем так, парсит речь. В общем, это я все под впечатлением только что прочитанной книги, которую и рекомендую тепло, хотя некоторые и утверждают, что читать ее надо с применением немалой доли скептицизма (что, впрочем, верно в отношении любой книги). Называется "The Language Instinct", автор - Stven Pinker. Как говорится, хайли рекомменд.
no subject
Date: 2006-07-09 09:19 pm (UTC)Почему-то кажется, что этот шаблон имеет все шансы быть очень, очень сложным шаблоном. Многоуровневым в смысле того, что свободные переменные являются сильно и нетривиально зависимыми друг от друга, и вся сложность - как раз там.
Но именно это и пытаются опровергнуть апологеты UG
Да, если опровергнут и инвариант найдется - будет весьма интересно. Только, боюсь, инвариант будет очень сложной штукой, которую саму по себе можно будет изучать и изучать на протяжении поколений...
Что касается аналогии с цифровыми схемами - мне кажется, более верной будет аналогия с reverse engineering-ом какого-нибудь черного ящика.
Да, можно с этой стороны смотреть. Я как-то проглядел этот "ракурс взгляда". Но вообще, для меня это уже становится как-то черезчур сложным, бакграунд-то далеко от этих понятий...
В общем, это я все под впечатлением только что прочитанной книги, которую и рекомендую тепло
Эх, еще одна книга в длиннющий перечень того, что я мог бы с пользой прочесть, но вряд ли прочитаю до пенсии... Anyway, спасибо! Тем более, может, здесь найдется кто-то другой, кому наводка будет полезной :)
no subject
Date: 2006-07-09 08:44 pm (UTC)no subject
Date: 2006-07-09 08:55 pm (UTC)