Шелия Губерман - Shelia Guberman

Шелия Губерман
Губерман Шелия.jpg
Родившийся ( 1930-02-25 ) 25 февраля 1930 г. (91 год)
Гражданство СССР , США
Научная карьера
Поля Ядерная физика , информатика , геология , геофизика , , Искусственный интеллект , психология от восприятия

Шелия Губерман (родилась 25 февраля 1930 года, Украина , СССР) - ученый в области информатики , ядерной физики , геологии , геофизики , медицины , искусственного интеллекта и восприятия . Он предложил теорию сейсмичности Земли с помощью D-волн , алгоритмы гештальт-восприятия (1980) и сегментации изображений , а также программы для технологии разведки нефтяных и газовых месторождений (1985).

Жизнь и карьера

Сын Айзика Губермана (писатель, поэт) и его жены Эты (учительница). С 1947 по 1952 год Губерман учился в Институте электросвязи Одессы, СССР по специальности радиотехника. С 1952 по 1958 год работал полевым геофизиком в советской нефтяной промышленности. С 1958 по 1961 год учился в аспирантуре Института нефти и газа в Москве. В 1962 году получил докторскую степень. в ядерной физике , а затем докторскую степень. в прикладной математике в 1971 году. В 1971 году он был назначен профессором информатики . После создания первой прикладной программы распознавания образов в 1962 году Губерман специализировался на искусственном интеллекте, внедряя принципы гештальт-восприятия в компьютерные программы для анализа геологических данных. В 1966 году он был приглашен выдающимся математиком ХХ века профессором И. Гельфандом возглавить группу по искусственному интеллекту в Институте прикладной математики им. М.В. Келдыша РАН. Он применил технологию распознавания образов для прогнозирования землетрясений , разведки месторождений нефти и газа , распознавания почерка , сжатия речи и медицинской визуализации . С 1989 по 1992 год Губерман занимал должность профессора Московского открытого университета (географический факультет). С 1992 года проживает в США. Губерман - изобретатель технологии распознавания рукописного ввода, реализованной в коммерческом продукте компании «Параграф Интернэшнл», основанной С. Пачиковым, и применяемой сегодня Microsoft в Windows CE. Он является автором основных технологий для пяти американских компаний и владеет патентом на сжатие речи.

Достижения

Распознавание почерка

Распространенным подходом к компьютерному распознаванию почерка было компьютерное обучение на наборе примеров (символов или слов), представленных в виде визуальных объектов. Губерман предположил, что для психофизиологии человеческого восприятия более адекватно представить сценарий как кинематический объект, жест, т. Е. Синергию движений стилуса, создающего сценарий.

Примитивы
Преобразование букв

Почерк состоит из 7 примитивов. Вариации, которым подвергаются символы при написании, ограничиваются правилом: каждый элемент может быть преобразован только в своего соседа в упорядоченной последовательности примитивов. В ходе эволюции латинского письма приобрело сопротивление естественным вариациям в форме знаков: когда один из примитивов заменяется его соседом, интерпретация иероглифа не меняется.

На основе этого подхода две американские компании Paragraph и Parascript разработали первые коммерческие продукты для бесплатного распознавания рукописного ввода в режиме онлайн и в автономном режиме , которые были лицензированы Apple, Microsoft, Boeing, Siemens и другими. «Большинство имеющихся в продаже программ для естественного рукописного ввода основано на технологии ParaGraph или Parascript».

Гипотеза о том, что люди воспринимают почерк, а также другие линейные рисунки (в целом - сигналы коммуникации) не в визуальной, а в моторной модальности, позже была подтверждена открытием зеркальных нейронов . Разница в том, что в классических явлениях зеркального отражения двигательная реакция возникает параллельно с наблюдаемым движением («восприятие немедленного действия»), а во время распознавания почерка статический стимул трансформируется во временной процесс, отслеживая путь пера на бумаге. бумага. В обоих случаях наблюдатель пытается понять намерение корреспондента: «понимание того, что делает человек и почему он это делает, достигается с помощью механизма, который напрямую преобразует визуальную информацию в моторный формат».

Речевое параллельное кодирование

Речи традиционно представлены как временная последовательность фонем - гласных и согласных звуков . Каждая гласная в основном определяется соотношением между размерами громкости передней и задней части речевого тракта. Это соотношение определяется 1) горизонтальным положением языка (назад-вперед), 2) положением губ (назад-вперед) и 3) размером глотки, который может расширять полость речевого тракта далеко назад. Большинство согласных можно описать с помощью 3 параметров: 1) место артикуляции (губы, зубы и т. Д.), 2) временной паттерн взаимодействия с речевым трактом (взрывной или негромкий) и 3) звонкий или глухой звук. Из-за инертности артикуляционных органов (языка, губ, челюсти) любая фонема мешает соседям и меняет свое звучание (сочленение). В результате каждая фонема звучит по-разному в разном контексте. Губерман представляет параллельную модель речевого производства. В нем говорится, что гласные и согласные генерируются не последовательно, а параллельно . Два канала управляют двумя разными мышцами, которые вместе определяют геометрию речевого тракта и, соответственно, голосового сигнала. Разделение возможно, потому что при образовании гласных и согласных участвуют разные мускулы . Для гласных [o], [u] губами управляют мышцы Mentalis и Orbicularis Oris для выпячивания и округления, а для [i], [e] - Buccinator и Risorius для втягивания губ. Язык участвует в образовании гласных, иннервируя верхние продольные и вертикальные звуки для подъема и движения всего языка вперед и назад, а также Genioglossus для всех согласных, артикулируемых в передней части рта (когда челюсть зафиксирована). Для согласных губ [p], [b], [v], [f] губами управляют мышцы Labii Inferioris и Orbicularis Oris для перемещения губ и челюсти вверх и вниз, а Zygomaticus Minor - для перемещения нижней губы назад. для [v], [f].
Из гипотезы параллельного фонетического кодирования следует:
1. Поскольку гласные определяются как определенное соотношение объемов передней и задней частей речевого тракта, гласные присутствуют в любой момент речи (даже во время тишины - нейтральная гласная [ə] когда никакая мышца голосового тракта не иннервируется).

2. Любая согласная в речи появляется на фоне гласной. Последняя согласная в слове произносится на фоне нейтральной гласной [ə]. В кластерах согласные произносятся параллельно с [ə], кроме последнего. Раньше в русском письме после согласного в конце слова должен был стоять специальный символ, обозначающий нейтральную гласную - Ъ (правило было отменено в 1918 году).

(N) Запись слов соды и слова в параллельном коде

3. Правильный письменный код для слов soda и word показан в (N), где количество гласных в слоге отражает относительную продолжительность гласного. Такая кодировка используется в иврите: в слове יצֵירֵ (мир) две точки под буквами обозначают гласную [е]). В арабском языке два канала несут разные функции: поток согласных сохраняет значение (корень), а поток гласных либо изменяет значение корня, либо выражает грамматическую категорию: китаб означает «книга»; катиб «писатель»; иа-ктуб-у «он пишет»; ма-ктаб «школа».

Разведка гигантских нефтегазовых месторождений

Прогностическая карта Анд в Южной Америке опубликована в 1986 году. Красные и зеленые кружки - участки, предсказанные как будущие открытия гигантских месторождений нефти / газа. Красные круги - там, где действительно были обнаружены гиганты. Зеленые еще недостаточно развиты.

В 70-х и 80-х годах Губерман разработал программное обеспечение искусственного интеллекта и соответствующую технологию для геологических приложений и использовал их для прогнозирования мест гигантских залежей нефти / газа.

В 1986 году команда опубликовала прогностическую карту открытия гигантских нефтяных и газовых месторождений в Андах в Южной Америке, основанную на теории абиогенного происхождения нефти. Модель, предложенная профессором Юрием Пиковским ( МГУ ), предполагает, что нефть движется из камина на поверхность по проницаемым каналам, созданным на пересечении глубоких разломов. Технология использует 1) карты морфоструктурного зонирования (метод, предложенный и разработанный профессором Э. Ранцман), на котором очерчиваются морфоструктурные узлы (пересечения разломов), и 2) программу распознавания образов, которая идентифицирует узлы, содержащие гигантские месторождения нефти / газа. Прогнозировалось, что одиннадцать узлов, которые в то время еще не разрабатывались, содержат гигантские месторождения нефти или газа. Эти 11 участков покрывали только 8% общей площади всех бассейнов Анд. Спустя 30 лет (в 2018 году) был опубликован результат сравнения прогноза и реальности. С момента публикации прогнозной карты в 1986 году в регионе Анд было открыто только шесть гигантских нефтегазовых месторождений: Кано-Лимон, Кусиана, Капиагуа и Вулканера (бассейн Льянос, Колумбия), Камисеа (бассейн Укали, Перу) и Инкауаси. (Бассейн Чако, Боливия). Все открытия были сделаны в местах, обозначенных на прогностической карте 1986 года как перспективные.

Результат убедительно положительный, и это весомый вклад в поддержку абиогенной теории происхождения нефти.

Теория D-волн

В середине ХХ века внимание сейсмологов привлекло явление цепочек землетрясений, последовательно возникающих по крупным разломам. Позже это было интерпретировано как волны тектонической деформации. В 1975 году Губерман предложил теорию D-волн, которая разделяет локальные процессы накопления напряжений и возникновения землетрясений. Основными постулатами этой теории являются: а) сильное землетрясение изменяет распределение массы в ядре Земли и, соответственно, скорость ее вращения ω; б) в моменты, когда ω достигает локального минимума, возмущения возникают на обоих полюсах, которые распространяются по меридианам с постоянной скоростью 0,15 ° / год (волны D); c) Сильное землетрясение происходит в месте накопления тектонических напряжений и в момент, когда в этой точке встретились две D-волны (от полюсов N и S). (Рисунок ).

Эта гипотеза и ее последствия были подтверждены сейсмологическими данными.

D-волны Аляски

1. Постулат c) представлен на графике () где φ - широта сильного землетрясения, а T - время его возникновения. Каждая линия представляет собой D-волну, движущуюся по Земле с постоянной скоростью 0,15 ° / год, вызывая по пути сильные землетрясения. Точками обозначено сильное землетрясение на Алеутских островах и на Аляске (магнитуда M ≥ 7.0). Аналогичные результаты были продемонстрированы для Калифорнии, Юго-Восточной Европы, Малой Азии, Южного Чили, Южных Сандвичевых островов, Новой Зеландии, Франции и Италии. Вероятность того, что это может произойти случайно, составляет <0,025 в каждом случае.

2. Источником неравномерности вращения Земли могло быть сильное землетрясение, которое сместило огромные массы горных пород, и

Китай: цепочка сильных землетрясений, вызванных волнами D (180–1902 гг. Н.э.)

для поддержания постоянного момента вращения Земли необходимо изменить угловую скорость вращения ω. Из-за низкой скорости D-волн (0,15 ° / год) требуется более 200 лет после возникновения, чтобы достичь областей, где происходят землетрясения. с магнитудой M> 8. Для проверки постулата б) необходим очень большой временной интервал сейсмологических записей. В Китае сейсмическая история документирована в течение очень длительного периода времени (с 180 г. н.э.). На графике представлены пространственно-временные отношения между 6 сильнейшими задокументированными землетрясениями в Китае. Землетрясение №1 создало на полюсах две D-волны. Один движется с Северного полюса и через 332 года спровоцировал землетрясение №2; вторая волна движется от Южного полюса и через 858 лет достигла местоположения землетрясения №4 и так далее (см. график). В сумме среднее отклонение положения D-волны в момент события и местоположения спровоцированного землетрясения составляет 0,4 °, что меньше ошибки определения положения эпицентра исторических землетрясений. 3. Из гипотезы D-волн следует, что эпицентры сильнейших землетрясений могут преимущественно возникать на дискретных D-широтах (90 / 2n) · i (i = 0, 1, 2,…), с n ≤ 5. Чтобы проверить это утверждение, области с высокой сейсмичностью на Земле были разделены на полосы, параллельные D-широте порядка <= 4 каждая шириной 5,625 ° (см. Карту).

Положение сильных землетрясений относительно D-широт

В 43 регионах произошли землетрясения с M ≥ 8.0, в каждом из которых было выбрано самое сильное землетрясение, а в 31 регионе эпицентр сильнейшего землетрясения расположен близко к D-широте, т.е. расположен в полосе вокруг D-широты 1 °. широкий. Полоса шириной 1 ° занимает 0,36 части площади каждой области, что составляет 5,625 °. Если эпицентры случайным образом разбросаны по каждому из 43 регионов, ожидаемое количество эпицентров, которые появятся близко к D-широте, будет 43 x 0,36 = 15, а вероятность того, что 31 эпицентр будет расположен внутри полосы, будет меньше. чем 0,005.

Землетрясения - неотъемлемая часть тектонических движений на Земле. Показано, что сильные землетрясения возникают на пересечении разломов - морфоструктурных узлов. Это означает, что вблизи D-широт находятся не только землетрясения, но и крупные морфоструктурные узлы. В сочетании с гипотезой профессора Пиковского о том, что морфоструктурные узлы представляют собой трубы, доставляющие нефть из мантии в земную кору, следует, что крупные месторождения нефти / газа также преимущественно расположены на дискретных D-широтах. Это было доказано, и соответствующий параметр (расстояние до D-широты) был использован при поиске гигантских нефтегазовых месторождений (см. Выше). Тот факт, что сильные землетрясения происходят на дискретных D-широтах, влияет на тектоническую конфигурацию сети тектонических разломов. Также было обнаружено, что именно в морфоструктурных узлах чаще всего случаются аварии на нефте-, газо- и водопроводах, а также на железнодорожных рельсах.

Компьютерная медицинская диагностика

Для пациентов с геморрагическим инсультом существует два типа лечения: пассивное (медикаментозное) и активное (хирургическое). Э. Кандел (один из пионеров хирургического лечения геморрагических инсультов) обратился к выдающемуся математику профессору И. Гельфанду за помощью в сравнении эффективности этих двух методов лечения. Губерман был выбран главным архитектором проекта. Во-первых, было решено изменить цель: вместо выбора лучшего лечения в целом найти лучшее лечение для конкретного пациента - консервативное или оперативное («лечить пациента, а не болезнь»). Для этого было решено использовать технологию распознавания образов, разработанную в прошлом для геологии (см. Выше). Необходимо разработать два правила принятия решения: 1) для прогнозирования исхода (жизнь или смерть) консервативного лечения конкретного пациента, 2) для прогнозирования исхода (жизни или смерти) хирургического вмешательства того же пациента. Решения основываются на неврологических и общих симптомах, собранных в первые 12 часов после поступления пациента в больницу. Полученные правила принятия решений предварительно тестировались в течение двух лет: собранные данные отправлялись в компьютер, а два прогноза (прогнозируемые исходы операции и консервативное лечение) помещались в файл пациента. Через месяц компьютерные прогнозы сравнили с результатами. Общий результат - 90% верных прогнозов. Затем последовала клиническая реализация: компьютерные решения немедленно отправлялись дежурному хирургу, который принимает окончательное решение. За пять лет компьютерные прогнозы получили 90 пациентов. В 16 случаях компьютер настоятельно рекомендовал операцию. 11 из них были прооперированы и выжили. У 5 пациентов компьютерное предупреждение было проигнорировано (по разным причинам), и все 5 умерли . В 5 случаях настоятельно рекомендовалось отказаться от операции. Трое из них получили соответствующее лечение и выжили, двое из них были прооперированы вопреки рекомендациям компьютера и умерли.

Должности

Публикации

Более 180 статей опубликовано в научных журналах России, США, Франции, Германии, Италии и Австрии.

Избранные недавние статьи по информатике и психологии :

Избранный доклад по тектонофизике :

  • 1972: Губерман Ш. (1972), "Критерии высокой сейсмичности определяется распознавания образов.", Тектонофизика , 13 (1-4): 415-422 v.13, Bibcode : 1972Tectp..13..415G , DOI : 10.1016 / 0040-1951 ( 72) 90031-5

Книги:

  • 1987: «Неформальный анализ данных в геологии и геофизике», Недра, Москва.
  • 1962: «Теория подобия и интерпретация данных ГИС», Недра, Москва.
  • 2007: с Джанфранко Минати «Диалог о системах», Polimetrica, Италия. ISBN   978-8876990618
  • 2009: «Необычная геология и геофизика. Нефть, руды и землетрясения», Polimetrica, Италия. ISBN   978-8876991356

Источники о его творчестве

  • Зуева Е. (2009), «История компьютерного зрения в Институте прикладной математики им. М.В. Келдыша РАН», Математические машины и системы (4) http://www.immsp.kiev.ua/publications/articles/2009/2009_4/04_2009_Zueva.pdf
  • Е.М. Кудрявцев, Е.Ф. Макляев, С.Д. Зотов и А.А. Лебедев (2009), «Сравнение гипотетических D-волн планетарного масштаба, вызывающих землетрясения в модели Ш.А. Губермана, с медленными уединенными упругими волнами, обнаруженными экспериментально», Вестник Физического института им. , 36 (9): 277-281, Bibcode : 2009BLPI ... 36..277K , DOI : 10,3103 / S106833560909005X , S2CID   121955600 CS1 maint: несколько имен: список авторов ( ссылка )
  • Джоэл Н. Шуркин (1994), "Тщательно электронный русский", журнал San Jose Mercury News West , стр. 8–12

Рекомендации