Cybernetics: Or the Control and Communication in the Animal and the Machine. Paris, 1948
Норберт Винер
Кибернетика
VI. Гештальт и универсалии
(гештальт (нем. Gestalt) - форма, образ, структура. Целостный образ, целостная структура, формирующиеся в сознании человека при восприятии объектов, при представлении о них.
 Универсалии – общие понятия, общие представления)

В предыдущей главе, в числе прочего, мы обсуждали, можно ли связать какой-либо нервный механизм с локковской теорией ассоциации идей.
 
Согласно Локку, ассоциация идей основана на трех принципах:

- принципе смежности,
- принципе сходства и
- принципе причины и следствия
 
Третий принцип Локк и ещё решительнее Юм сводят просто к постоянному сосуществованию, и, таким образом, он подпадает под первый принцип – смежности. Второй принцип – принцип сходства – заслуживает более детального рассмотрения.
 
Как мы узнаем индивидуальные черты человеческого лица
в разных его положениях: в профиль, в три четверти или в анфас?
 
Как мы узнаем в круге круг, большой ли он или маленький, далекий или близкий, расположен ли он перпендикулярно лучу зрения к своему центру и кажется нам действительно кругом или ориентирован иначе, выглядя эллипсом? Как мы видим лица животных и географические карты в облаках или в кляксах тестов Роршаха? Все эти примеры относятся к зрению, но аналогичные вопросы можно поставить и для других чувств; некоторые из них касаются связей между различными чувствами. Как мы перекладываем в слова крик птицы или стрекотание насекомого? Как узнаем осязанием, что монета круглая?
-----------------------------
* Тест Роршаха – предложенный швейцарским психиатром Германом Роршахом психологический тест-испытание, состоящий из 10 стандартных черных или цветных чернильных пятен. По тому, какие фигуры видит в них испытуемый, судят о его умственных наклонностях и личности.
Ограничимся пока чувством зрения. Существенным фактором при сравнении форм различных предметов является, конечно, взаимодействие глаза и мышц: мышц, находящихся внутри глазного яблока; мышц, двигающих глазное яблоко; мышц, двигающих голову; мышц, двигающих все тело в целом. И эта система зрительно-мышечной Обратной связи существует в какой-то форме уже на такой низкой ступени животного царства, как плоские черви. У плоских червей отрицательный фототропизм – стремление избегать свет – регулируется, как полагают, балансом импульсов от двух глазных пятен. Соотношение этих импульсов действует на мышцы туловища, поворачивающие тело прочь от света, и в сочетании с общим импульсом поступательного движения приводит животное в наиболее темную область, ему доступную. Любопытно отметить, что пара фотоэлементов с соответствующими усилителями, мостик Уитстона для сравнения их выходных напряжений и ещё одна пара усилителей, управляющих питанием двух электродвигателей двухвинтового механизма, обеспечивают нам весьма приличное отрицательное фототропическое управление для небольшой лодки. Было бы трудно или даже невозможно вместить этот механизм в такие габариты, чтобы его мог нести плоский червь; но здесь мы встречаем ещё один пример истины, уже известной читателю: живые механизмы, как правило, имеют значительно меньшие размеры, чем механизмы, наиболее удобные для изготовления человеком, хотя, с другой стороны, применение электричества дает искусственному механизму громадное преимущество перед живым организмом в отношении скорости.
 
Пропуская все промежуточные стадии, переходим сразу к обратным связям между зрением и мышцами у человека. Некоторые из этих обратных связей имеют чисто гомеостатическую природу; так, зрачок расширяется в темноте и сокращается на свету, стремясь держать проникающий в глаз световой поток в более узких границах, чем было бы возможно без этого. Другие обусловлены тем, что человеческий глаз экономично ограничил свою способность наилучшего различения формы и цвета сравнительно небольшим желтым пятном сетчатки. Когда периферическим зрением уловлен какой-нибудь предмет, заметный своей яркостью, или световым контрастом, или цветом, или – и прежде всего – движением, рефлекторная обратная связь переводит его на желтое пятно. Эта обратная связь сопровождается сложной системой взаимозависимых подчиненных обратных связей, которые стремятся свести направления обоих глаз в одну точку, чтобы предмет, привлекший внимание, находился в одной и той же части поля зрения того и другого глаза, и фокусировать хрусталики, чтобы очертания предмета были возможно более четкими. Эти действия дополняются движениями тела и головы, при помощи которых мы переводим предмет в центр поля зрения, если этого трудно достичь движениями одних глаз, или переводим в поле зрения предмет, лежащий вне его и воспринятый другим чувством. Если перед нами предметы, которые мы привыкли наблюдать в определенной угловой ориентации, – письмо, человеческие лица, пейзажи и т.п., – то посредством особого механизма мы стремимся также привести их в надлежащую ориентацию.

Все эти процессы можно резюмировать одной фразой: мы стремимся привести привлекший наше внимание предмет в нормальное положение и в нормальную ориентацию, чтобы создаваемый нами зрительный образ предмета менялся в возможно меньшем диапазоне. Это не исчерпывает процессов, связанных с восприятием формы и значения предмета, но, бесспорно, облегчает все дальнейшие процессы, служащие названной цели. Эти последние развертываются в глазу и в зрительной области коры головного мозга. Имеется немало данных, свидетельствующих о том, что на многих стадиях число нейронных каналов, участвующих в передаче зрительной информации, падает с каждым шагом процесса, а информация становится на один шаг ближе к той форме, в которой она используется и хранится в памяти.
 
Первый шаг в концентрации зрительной информации совершается при переходе от сетчатки к зрительному нерву. Заметим, что в желтом пятне сетчатки существует почти взаимно однозначное соответствие между палочками и колбочками, с одной стороны, и волокнами зрительного нерва, с другой, тогда как на периферии одно волокно зрительного нерва соответствует десяти и более концевым органам. Это вполне понятно, поскольку основное назначение периферических волокон состоит не столько в самом зрительном восприятии, сколько в уловлении предмета для центрирующего, фокусирующего и направляющего механизма глаза.
 
Одним из самых замечательных явлений в зрении следует считать нашу способность узнавать контурный рисунок. Несомненно, контур человеческого лица имеет очень малое сходство с самим лицом в отношении цвета и распределения светотени, и тем не менее в нем очень легко узнать портрет данного человека. Наиболее правдоподобно объясняется это тем, что где-то в зрительном процессе подчеркиваются контуры, а значение других сторон образа уменьшается. Указанные процессы начинаются в самом глазу. Подобно всем органам чувств, сетчатка подвержена аккомодации; иначе говоря, действие постоянного раздражения уменьшает её способность воспринимать и передавать раздражение.
 
Аккомодация заметнее всего для рецепторов, воспринимающих внутреннюю часть большого скопления образов постоянного цвета и постоянной освещенности, так как даже неизбежные небольшие флюктуации фокуса и точки фиксации не меняют характера воспринимаемого изображения. Совершенно иначе обстоит дело на границе двух контрастирующих областей. В этом случае флюктуации вызывают смену одного раздражения другим, и эта смена, как мы видим в явлении остаточных образов, не только не приводит к истощению зрительного механизма из-за аккомодации, но вызывает повышение его чувствительности. Сказанное относится к контрасту между двумя соседними областями как по освещенности, так и по цвету. В объяснение этих фактов заметим, что три четверти волокон зрительного нерва реагируют только на “вспышку” освещения. Мы видим, таким образом, что глаз воспринимает наиболее сильные впечатления на границах и что всякий зрительный образ в некоторой мере является контурным. 
 
Вероятно, этот эффект обусловлен не только периферическим восприятием. Известно, что в фотографии некоторые способы обработки пластинки увеличивают её контрастность, и, конечно, такие явления, по существу нелинейные, могут иметь место и в нервной системе. Они сходны с процессами в телеграфном повторителе, о которых мы уже говорили. Как и там, впечатление – если оно не слишком размыто, вызывает новое впечатление стандартной четкости. Во всяком случае, эти явления уменьшают общее количество неиспользуемой информации, переносимой образом, и, вероятно, объясняют собой частично то уменьшение количества передающих волокон, которое наблюдается на различных участках зрительной области коры.
 
Мы наметили, таким образом, ряд действительных или возможных этапов схематизации наших зрительных впечатлений. Мы центрируем изображения относительно фокуса внимания и сводим их более или менее к контурам. Затем их надо сравнить между собой или, во всяком случае, со стандартным изображением, хранимым в памяти, например с “кругом” или с “квадратом”. Это может быть сделано различными способами. Выше мы дали грубый набросок возможного механизма для локковского принципа ассоциации по смежности. Заметим, что принцип смежности в значительной степени покрывает также локковский принцип сходства. Мы часто наблюдаем различные стороны одного и того же предмета, когда приводим его к фокусу внимания, а также при других движениях, позволяющих нам видеть его то на одном, то на другом расстоянии, то под одним, то под другим углом.
 
Это общий принцип, применимый не только к какому-то одному чувству и, несомненно, играющий важную роль при сравнении наших более сложных переживаний. Но, вероятно, ассоциация по смежности – не единственный процесс, формирующий наши специфически зрительные общие представления, или, как их называет Локк, “сложные идеи”. Зрительная область коры имеет настолько высоко организованное и специфическое строение, что трудно предположить, чтобы она действовала как подобный, крайне обобщенный механизм. Создается впечатление, что мы имеем здесь дело со специальным механизмом, представляющим собой не кратковременное соединение универсальных элементов, где части допускают взаимную замену, а постоянный субблок, подобный суммирующим и множительным устройствам вычислительной машины. Целесообразно поэтому рассмотреть, как может работать такой субблок и как нужно подойти к его проектированию.
 
Возможные перспективные преобразования предмета составляют группу в том смысле, как она определена в гл.II. Эта группа включает несколько подгрупп преобразований: аффинную группу, состоящую только из таких преобразований, которые не затрагивают бесконечно удаленной области; однородные растяжения относительно данной точки, в которых сохраняется одна точка, направления осей и равенство масштабов во всех направлениях; преобразования, сохраняющие длину; вращения в двух или трех измерениях вокруг заданной точки; множество всех сдвигов и т.д. Упомянутые группы являются непрерывными группами, т.е. относящиеся к ним операции определяются значениями нескольких непрерывно изменяющихся параметров в соответствующем пространстве. Они образуют, таким образом, многомерные конфигурации в n-мерном пространстве и содержат подмножества преобразований, составляющие области в этом пространстве.
 
И как область на обычной двумерной плоскости покрывается в телевидении процессом развертки, позволяющим представить целое множество выборочных точек, распределенных более или менее равномерно по области, точно так же и любую область в групповом пространстве, включая само пространство, можно представить с помощью процесса групповой развертки. При таком процессе (он, конечно, применим к пространству не только трех измерений) сетка точек в пространстве обегается в одномерной последовательности, а точки этой сетки распределены так, что в некотором, соответственно определенном, смысле они подходят к каждой точке области. Таким образом, сетка будет содержать точки, сколь угодно близкие к любой выбранной точке. Если эти “точки” (или системы параметров) действительно используются для выбора соответствующих преобразований, то нетрудно видеть, что в результате применения этих преобразований к данной фигуре мы сколь угодно приблизимся к любому преобразованию этой фигуры, осуществимому в данной групповой области. Если наша развертка достаточно мелка и преобразуемая область имеет максимальное протяжение среди всех областей, преобразуемых группой, то обегаемые при развертке преобразования дадут в результате область, покрывающую сколь угодно большую часть площади любого преобразования исходной области.*
-------------------------------
* В этой главе автор все время переходит от областей в групповом абстрактном пространстве к областям в физическом, зрительном пространстве и обратно.
Пусть теперь мы сравниваем некоторую область с другой фиксированной областью, взятой за эталон. Если на каком-либо этапе развертки группы образ сравниваемой области, полученный с помощью одного из развертываемых преобразований, совпадает с фиксированным эталоном в пределах допустимого расхождения, то это совпадение регистрируется, и обе области считаются подобными. Если такого совпадения не происходит ни на каком этапе развертки, области считаются неподобными. Этот процесс легко поддастся механизации и может быть использован для распознания формы фигуры, независимо от её размеров и ориентации и от тех преобразований, которые могут быть в развертываемой групповой области.
 
Если эта область не составляет всей группы, то может оказаться, что область А будет подобна области В, область В будет подобна области С, но область А не будет подобна области С. Так бывает и в действительности. Фигура может не иметь сходства с такой же фигурой, но перевернутой, по крайней мере, не иметь его при первом впечатлении, в котором не участвуют процессы более высокого порядка. Однако на каждом этапе переворачивания может найтись достаточно соседних положений, представляющихся подобными. Образованные таким путем общие “представления” не являются совершенно различными, но незаметно переходят друг в друга.
 
Существуют и более тонкие способы использования групповой развертки при абстрагировании универсалий из группы преобразований. Рассматриваемые нами группы имеют “групповую меру” – плотность вероятности, которая зависит от самой группы и не меняется с умножением всех преобразований группы справа или слева на любое данное преобразование группы. Можно развертывать группу так, что для достаточно обширного класса групповых областей плотность развертки области (т.е. время, в течение которого переменный развертывающий элемент находится внутри области при полном развертывании группы) будет почти пропорциональна её групповой мере. Пусть теперь, при такой равномерной развертке, мы встречаемся с величиной, зависящей от некоторого множества элементов S, преобразуемого группой, и пусть это множество S преобразуется всеми преобразованиями группы. Обозначим через Q(S) величину, зависящую от S, и обозначим через TS образ множества S при преобразовании Т из нашей группы. Тогда при замене S на TS величина Q(S) примет значение Q(TS). Усредняя или интегрируя эту величину относительно групповой меры для группы преобразований Т, получим величину примерно такого вида:

   (6.01)

где интегрирование производится по групповой мере. Величина (6.01) будет тождественна для всех множеств S, переходящих друг в друга при преобразованиях группы, т.е. для всех множеств S, имеющих в некотором смысле одну и ту же форму, один гештальт. Можно сравнивать формы приближенно, если интеграл в формуле (6.01) брать не по всей группе и если подынтегральная функция Q(TS) мала в отбрасываемой области. На этом мы простимся с групповой мерой.
 
В последние годы обратили внимание на проблему протезирования одного потерянного чувства с помощью другого. Наибольшей решительностью отличалась попытка создать читающие аппараты для слепых, снабженные фотоэлементами. Мы будем предполагать, что эти усилия ограничиваются печатным текстом, и даже одним шрифтом или немногими шрифтами. Будем также считать, что выравнивание страниц, центрирование строк, переход от одной строки к другой уже обеспечиваются вручную или, что вполне возможно, как-либо автоматически.
 
Эти процессы, очевидно, соответствуют стадиям распознания зрительного образа, основанным на мышечных обратных связях и использовании нашего нормального центрирующего, ориентирующего, фокусирующего и конвергирующего аппарата. Далее встает проблема определения форм отдельных букв, над которыми последовательно проходит развертывающее устройство. Здесь предлагалось использовать фотоэлементы, расположенные в ряд по вертикали и соединенные каждый со звучащим прибором особого тона. Черный цвет букв может отмечаться либо отсутствием звука, либо звуком. Предположим, что выбрано второе, и вообразим себе три фотоэлектрических рецептора, один над другим. Пусть они изображают буквы в виде трех нот гаммы, причем самая высокая нота соответствует верхнему фотоэлементу, а самая низкая – нижнему.
 
Тогда, например, заглавная буква F будет передана звуком:
 
 
Заглавная буква Z будет передана звуком:
 
 
Заглавная буква О – звуком:
 
 
и т.д. С обычной нашей способностью к интерпретации читать такой слуховой код нетрудно – не труднее, чем, скажем, читать шрифт Брайля. Но все зависит от одного условия – от надлежащего соотношения фотоэлементов с высотой букв. Даже при стандартном шрифте неизбежны значительные колебания в размерах букв. Поэтому желательно найти возможность растягивать или сжимать вертикальный масштаб развертки, чтобы привести образ данной буквы к стандарту. Мы должны иметь в своем распоряжении, в ручной или в автоматической форме, хотя бы некоторые преобразования из группы вертикальных растяжений.
 
Это можно сделать несколькими способами
 
Можно предусмотреть механическую вертикальную регулировку фотоэлементов. С другой стороны, можно взять достаточно большой вертикальный ряд фотоэлементов и менять распределение нот соответственно размеру шрифта, оставляя фотоэлементы, расположенные выше и ниже шрифта, немыми. Для этого можно, например, воспользоваться схемой с двумя комплектами соединительных линий. В этой схеме входные линии отходят от фотоэлементов и ведут к цепочке переключателей, все более и более расходясь в стороны, а выходами служат вертикальные линия, как на рис. 8.
 
Здесь одиночные линии – провода от фотоэлементов, двойные линии – провода к генераторам звука, кружки на пунктирных линиях – точки соединения входных и выходных, проводов, а сами пунктирные линии – провода, управляющие включением того или иного генератора. Это и есть упомянутое во введении устройство, которое спроектировал Мак-Каллох для регулировки своего аппарата по высоте шрифта. В первом варианте выбор пунктирных линий производился вручную.
 
Именно эта схема, показанная д-ру фон Бонину, заставила его подумать о четвертом слое зрительной коры. Соединительные кружки напоминают собой тела нейронов этого слоя, расположенные подслоями с равномерно меняющейся горизонтальной плотностью и с протяженностью, меняющейся в противоположном направлении к плотности. Горизонтальные проводники возбуждаются, вероятно, в каком-то циклическом порядке. Весь механизм кажется вполне приспособленным для групповой развертки. Конечно, должен существовать какой-то процесс перераспределения во времени верхних выходов.
 
Итак, Мак-Каллох навел нас на мысль, что подобное устройство действительно используется в мозгу для обнаружения зрительных образов. В сущности, оно годится для групповой развертки любого рода. Нечто подобное происходит и в других органах чувств. Для уха переложение музыки с одного основного тона на другой есть не что иное, как сдвиг логарифма частоты, и, следовательно, может быть осуществлено посредством устройства групповой развертки.
 
Устройство групповой развертки имеет, таким образом, вполне определенную, адекватную анатомическую структуру. Необходимое переключение может осуществляться через независимые горизонтальные проводники, по которым подаются импульсы, смещающие пороги каждого уровня как раз настолько, чтобы соответствующие клетки возбуждались при раздражении их входов. Хотя мы не знаем всех подробностей действия этого хозяйства, нетрудно вообразить возможный механизм, соответствующий такому анатомическому строению. Короче говоря, устройство групповой развертки вполне способно образовать своего рода постоянный субблок мозга, соответствующий суммирующим или множительным устройствам цифровой вычислительной машины.
 
Наконец, развертывающее устройство должно иметь собственный рабочий период, выделимый в общей работе мозга. Длительность этого периода должна соответствовать минимальному времени, необходимому для прямого сравнения форм у предметов разных размеров. Такое прямое сравнение возможно только между двумя предметами, не слишком отличающимися друг от друга по величине; в других случаях сравнение – продолжительный процесс, что свидетельствует о действии неспециализированного соединения универсальных элементов. Там, где прямое сравнение кажется возможным, оно как будто занимает время порядка одной десятой секунды.
 
Таков же, видимо, порядок времени, необходимого для возбуждения всех слоев поперечных проводников в циклической последовательности. Хотя этот циклический процесс может иметь местное происхождение, некоторые данные свидетельствуют о том, что существует значительный синхронизм между разными участками коры головного мозга, а это показывает, что процесс обусловлен каким-то синхронизирующим центром. Порядок частоты процесса соответствует ритму альфа-колебаний мозга, как видно из электроэнцефалограмм. Можно подозревать, что этот альфа-ритм связан с восприятием формы и носит характер ритма развертки, подобно ритму телевизионной аппаратуры.
 
Он исчезает при глубоком сне; с другой стороны, он, как и следовало бы ожидать, маскируется и перекрывается другими ритмами, когда мы смотрим на какой-либо предмет и наш ритм развертки действует подобно несущему колебанию для других ритмов и процессов. альфа-ритм делается наиболее заметен, если бодрствовать с закрытыми глазами или же, не обращая взгляда ни на что в отдельности, пристально смотреть перед собой в пространство, как йог в состоянии отрешенности от внешнего мира*, когда альфа-ритм обнаруживает почти совершенную периодичность.
-------------------------------
* Личное сообщение д-pa Уолтера из Бристоля (Англия)
 
Мы видели, что задача протезирования органов чувств – задача замены информации, нормально поступающей от потерянного органа чувств, информацией от уцелевших органов чувств – имеет важное значение и не является заведомо неразрешимой. Особенно обнадеживающим является то обстоятельство, что память и ассоциативные зоны, нормально возбуждаемые одним внешним чувством, не являются замками с единственным ключом, но могут хранить впечатления, поступающие и от других чувств. Ослепший человек, в отличие от слепорожденного, не только сохраняет зрительные воспоминания, предшествующие потере зрения, но способен даже запасать осязательные и слуховые впечатления в виде зрительных образов. Ощупывая свой путь при движении по комнате, он может представлять себе, как она должна выглядеть.
 
Следовательно, часть его нормального зрительного механизма продолжает ему служить. С другой стороны, он потерял не только свои глаза, он потерял также возможность пользоваться той частью зрительной области коры, которую можно рассматривать как фиксированный блок, организующий зрительные впечатления. Его нужно снабдить не только искусственными зрительными рецепторами, но и искусственной зрительной корой, которая будет переводить световые впечатления, поступающие в его новые рецепторы, в форму, настолько близкую к нормальным выходным сигналам его зрительной коры, что предметы, обычно выглядящие одинаково, будут иметь теперь одинаковое звучание.
 
Отсюда ясно, что критерием возможности такой замены зрения слухом служит, по крайней мере частично, отношение между числом различимых зрительных образов и числом различимых слуховых образов на уровне коры. Это – отношение количеств информации. Ввиду довольно сходной организации различных участков сенсорной коры оно не будет, вероятно, сильно отличаться от отношения площадей зрительной и слуховой областей коры, которое составляет 100:1. Если всю слуховую область коры использовать для зрения, то можно надеяться, что количество получаемой информации будет равно примерно одному проценту информации, поступающей через зрительные органы. С другой стороны, зрение обычно оценивается по относительному расстоянию, при котором получают определенную степень разрешения образов, и по такой оценке 10/100 зрения означает поток информации, равный примерно одному проценту нормального потока. Это очень плохое зрение, но, конечно, не слепота; люди с таким зрением могут не считать себя слепыми.
В другом направлении картина гораздо благоприятнее. Глаз может распознавать все звуковые оттенки, используя лишь один процент своих способностей, и сохранность зрения при этом будет составлять около 95/100, т.е. по существу оно будет совершенным. Итак, протезирование внешних чувств представляет собой весьма перспективную область работы.

Оглавление

 
www.pseudology.org