Шелия Губерман - Shelia Guberman
Шелия Губерман | |
---|---|
Родившийся |
|
25 февраля 1930 г.
Гражданство | СССР , США |
Научная карьера | |
Поля | Ядерная физика , информатика , геология , геофизика , , Искусственный интеллект , психология от восприятия |
Шелия Губерман (родилась 25 февраля 1930 года, Украина , СССР) - ученый в области информатики , ядерной физики , геологии , геофизики , медицины , искусственного интеллекта и восприятия . Он предложил теорию сейсмичности Земли с помощью D-волн , алгоритмы гештальт-восприятия (1980) и сегментации изображений , а также программы для технологии разведки нефтяных и газовых месторождений (1985).
Жизнь и карьера
Сын Айзика Губермана (писатель, поэт) и его жены Эты (учительница). С 1947 по 1952 год Губерман учился в Институте электросвязи Одессы, СССР по специальности радиотехника. С 1952 по 1958 год работал полевым геофизиком в советской нефтяной промышленности. С 1958 по 1961 год учился в аспирантуре Института нефти и газа в Москве. В 1962 году получил докторскую степень. в ядерной физике , а затем докторскую степень. в прикладной математике в 1971 году. В 1971 году он был назначен профессором информатики . После создания первой прикладной программы распознавания образов в 1962 году Губерман специализировался на искусственном интеллекте, внедряя принципы гештальт-восприятия в компьютерные программы для анализа геологических данных. В 1966 году он был приглашен выдающимся математиком ХХ века профессором И. Гельфандом возглавить группу по искусственному интеллекту в Институте прикладной математики им. М.В. Келдыша РАН. Он применил технологию распознавания образов для прогнозирования землетрясений , разведки месторождений нефти и газа , распознавания почерка , сжатия речи и медицинской визуализации . С 1989 по 1992 год Губерман занимал должность профессора Московского открытого университета (географический факультет). С 1992 года проживает в США. Губерман - изобретатель технологии распознавания рукописного ввода, реализованной в коммерческом продукте компании «Параграф Интернэшнл», основанной С. Пачиковым, и применяемой сегодня Microsoft в Windows CE. Он является автором основных технологий для пяти американских компаний и владеет патентом на сжатие речи.
Достижения
Распознавание почерка
Распространенным подходом к компьютерному распознаванию почерка было компьютерное обучение на наборе примеров (символов или слов), представленных в виде визуальных объектов. Губерман предположил, что для психофизиологии человеческого восприятия более адекватно представить сценарий как кинематический объект, жест, т. Е. Синергию движений стилуса, создающего сценарий.
Почерк состоит из 7 примитивов. Вариации, которым подвергаются символы при написании, ограничиваются правилом: каждый элемент может быть преобразован только в своего соседа в упорядоченной последовательности примитивов. В ходе эволюции латинского письма приобрело сопротивление естественным вариациям в форме знаков: когда один из примитивов заменяется его соседом, интерпретация иероглифа не меняется.
На основе этого подхода две американские компании Paragraph и Parascript разработали первые коммерческие продукты для бесплатного распознавания рукописного ввода в режиме онлайн и в автономном режиме , которые были лицензированы Apple, Microsoft, Boeing, Siemens и другими. «Большинство имеющихся в продаже программ для естественного рукописного ввода основано на технологии ParaGraph или Parascript».
Гипотеза о том, что люди воспринимают почерк, а также другие линейные рисунки (в целом - сигналы коммуникации) не в визуальной, а в моторной модальности, позже была подтверждена открытием зеркальных нейронов . Разница в том, что в классических явлениях зеркального отражения двигательная реакция возникает параллельно с наблюдаемым движением («восприятие немедленного действия»), а во время распознавания почерка статический стимул трансформируется во временной процесс, отслеживая путь пера на бумаге. бумага. В обоих случаях наблюдатель пытается понять намерение корреспондента: «понимание того, что делает человек и почему он это делает, достигается с помощью механизма, который напрямую преобразует визуальную информацию в моторный формат».
Речевое параллельное кодирование
Речи традиционно представлены как временная последовательность фонем - гласных и согласных звуков . Каждая гласная в основном определяется соотношением между размерами громкости передней и задней части речевого тракта. Это соотношение определяется 1) горизонтальным положением языка (назад-вперед), 2) положением губ (назад-вперед) и 3) размером глотки, который может расширять полость речевого тракта далеко назад. Большинство согласных можно описать с помощью 3 параметров: 1) место артикуляции (губы, зубы и т. Д.), 2) временной паттерн взаимодействия с речевым трактом (взрывной или негромкий) и 3) звонкий или глухой звук. Из-за инертности артикуляционных органов (языка, губ, челюсти) любая фонема мешает соседям и меняет свое звучание (сочленение). В результате каждая фонема звучит по-разному в разном контексте. Губерман представляет параллельную модель речевого производства. В нем говорится, что гласные и согласные генерируются не последовательно, а параллельно . Два канала управляют двумя разными мышцами, которые вместе определяют геометрию речевого тракта и, соответственно, голосового сигнала. Разделение возможно, потому что при образовании гласных и согласных участвуют разные мускулы . Для гласных [o], [u] губами управляют мышцы Mentalis и Orbicularis Oris для выпячивания и округления, а для [i], [e] - Buccinator и Risorius для втягивания губ. Язык участвует в образовании гласных, иннервируя верхние продольные и вертикальные звуки для подъема и движения всего языка вперед и назад, а также Genioglossus для всех согласных, артикулируемых в передней части рта (когда челюсть зафиксирована). Для согласных губ [p], [b], [v], [f] губами управляют мышцы Labii Inferioris и Orbicularis Oris для перемещения губ и челюсти вверх и вниз, а Zygomaticus Minor - для перемещения нижней губы назад. для [v], [f].
Из гипотезы параллельного фонетического кодирования следует:
1. Поскольку гласные определяются как определенное соотношение объемов передней и задней частей речевого тракта, гласные присутствуют в любой момент речи (даже во время тишины - нейтральная гласная [ə] когда никакая мышца голосового тракта не иннервируется).
2. Любая согласная в речи появляется на фоне гласной. Последняя согласная в слове произносится на фоне нейтральной гласной [ə]. В кластерах согласные произносятся параллельно с [ə], кроме последнего. Раньше в русском письме после согласного в конце слова должен был стоять специальный символ, обозначающий нейтральную гласную - Ъ (правило было отменено в 1918 году).
3. Правильный письменный код для слов soda и word показан в (N), где количество гласных в слоге отражает относительную продолжительность гласного. Такая кодировка используется в иврите: в слове יצֵירֵ (мир) две точки под буквами обозначают гласную [е]). В арабском языке два канала несут разные функции: поток согласных сохраняет значение (корень), а поток гласных либо изменяет значение корня, либо выражает грамматическую категорию: китаб означает «книга»; катиб «писатель»; иа-ктуб-у «он пишет»; ма-ктаб «школа».
Разведка гигантских нефтегазовых месторождений
В 70-х и 80-х годах Губерман разработал программное обеспечение искусственного интеллекта и соответствующую технологию для геологических приложений и использовал их для прогнозирования мест гигантских залежей нефти / газа.
В 1986 году команда опубликовала прогностическую карту открытия гигантских нефтяных и газовых месторождений в Андах в Южной Америке, основанную на теории абиогенного происхождения нефти. Модель, предложенная профессором Юрием Пиковским ( МГУ ), предполагает, что нефть движется из камина на поверхность по проницаемым каналам, созданным на пересечении глубоких разломов. Технология использует 1) карты морфоструктурного зонирования (метод, предложенный и разработанный профессором Э. Ранцман), на котором очерчиваются морфоструктурные узлы (пересечения разломов), и 2) программу распознавания образов, которая идентифицирует узлы, содержащие гигантские месторождения нефти / газа. Прогнозировалось, что одиннадцать узлов, которые в то время еще не разрабатывались, содержат гигантские месторождения нефти или газа. Эти 11 участков покрывали только 8% общей площади всех бассейнов Анд. Спустя 30 лет (в 2018 году) был опубликован результат сравнения прогноза и реальности. С момента публикации прогнозной карты в 1986 году в регионе Анд было открыто только шесть гигантских нефтегазовых месторождений: Кано-Лимон, Кусиана, Капиагуа и Вулканера (бассейн Льянос, Колумбия), Камисеа (бассейн Укали, Перу) и Инкауаси. (Бассейн Чако, Боливия). Все открытия были сделаны в местах, обозначенных на прогностической карте 1986 года как перспективные.
Результат убедительно положительный, и это весомый вклад в поддержку абиогенной теории происхождения нефти.
Теория D-волн
В середине ХХ века внимание сейсмологов привлекло явление цепочек землетрясений, последовательно возникающих по крупным разломам. Позже это было интерпретировано как волны тектонической деформации. В 1975 году Губерман предложил теорию D-волн, которая разделяет локальные процессы накопления напряжений и возникновения землетрясений. Основными постулатами этой теории являются: а) сильное землетрясение изменяет распределение массы в ядре Земли и, соответственно, скорость ее вращения ω; б) в моменты, когда ω достигает локального минимума, возмущения возникают на обоих полюсах, которые распространяются по меридианам с постоянной скоростью 0,15 ° / год (волны D); c) Сильное землетрясение происходит в месте накопления тектонических напряжений и в момент, когда в этой точке встретились две D-волны (от полюсов N и S). (Рисунок ).
Эта гипотеза и ее последствия были подтверждены сейсмологическими данными.
1. Постулат c) представлен на графике () где φ - широта сильного землетрясения, а T - время его возникновения. Каждая линия представляет собой D-волну, движущуюся по Земле с постоянной скоростью 0,15 ° / год, вызывая по пути сильные землетрясения. Точками обозначено сильное землетрясение на Алеутских островах и на Аляске (магнитуда M ≥ 7.0). Аналогичные результаты были продемонстрированы для Калифорнии, Юго-Восточной Европы, Малой Азии, Южного Чили, Южных Сандвичевых островов, Новой Зеландии, Франции и Италии. Вероятность того, что это может произойти случайно, составляет <0,025 в каждом случае.
2. Источником неравномерности вращения Земли могло быть сильное землетрясение, которое сместило огромные массы горных пород, и
для поддержания постоянного момента вращения Земли необходимо изменить угловую скорость вращения ω. Из-за низкой скорости D-волн (0,15 ° / год) требуется более 200 лет после возникновения, чтобы достичь областей, где происходят землетрясения. с магнитудой M> 8. Для проверки постулата б) необходим очень большой временной интервал сейсмологических записей. В Китае сейсмическая история документирована в течение очень длительного периода времени (с 180 г. н.э.). На графике представлены пространственно-временные отношения между 6 сильнейшими задокументированными землетрясениями в Китае. Землетрясение №1 создало на полюсах две D-волны. Один движется с Северного полюса и через 332 года спровоцировал землетрясение №2; вторая волна движется от Южного полюса и через 858 лет достигла местоположения землетрясения №4 и так далее (см. график). В сумме среднее отклонение положения D-волны в момент события и местоположения спровоцированного землетрясения составляет 0,4 °, что меньше ошибки определения положения эпицентра исторических землетрясений. 3. Из гипотезы D-волн следует, что эпицентры сильнейших землетрясений могут преимущественно возникать на дискретных D-широтах (90 / 2n) · i (i = 0, 1, 2,…), с n ≤ 5. Чтобы проверить это утверждение, области с высокой сейсмичностью на Земле были разделены на полосы, параллельные D-широте порядка <= 4 каждая шириной 5,625 ° (см. Карту).
В 43 регионах произошли землетрясения с M ≥ 8.0, в каждом из которых было выбрано самое сильное землетрясение, а в 31 регионе эпицентр сильнейшего землетрясения расположен близко к D-широте, т.е. расположен в полосе вокруг D-широты 1 °. широкий. Полоса шириной 1 ° занимает 0,36 части площади каждой области, что составляет 5,625 °. Если эпицентры случайным образом разбросаны по каждому из 43 регионов, ожидаемое количество эпицентров, которые появятся близко к D-широте, будет 43 x 0,36 = 15, а вероятность того, что 31 эпицентр будет расположен внутри полосы, будет меньше. чем 0,005.
Землетрясения - неотъемлемая часть тектонических движений на Земле. Показано, что сильные землетрясения возникают на пересечении разломов - морфоструктурных узлов. Это означает, что вблизи D-широт находятся не только землетрясения, но и крупные морфоструктурные узлы. В сочетании с гипотезой профессора Пиковского о том, что морфоструктурные узлы представляют собой трубы, доставляющие нефть из мантии в земную кору, следует, что крупные месторождения нефти / газа также преимущественно расположены на дискретных D-широтах. Это было доказано, и соответствующий параметр (расстояние до D-широты) был использован при поиске гигантских нефтегазовых месторождений (см. Выше). Тот факт, что сильные землетрясения происходят на дискретных D-широтах, влияет на тектоническую конфигурацию сети тектонических разломов. Также было обнаружено, что именно в морфоструктурных узлах чаще всего случаются аварии на нефте-, газо- и водопроводах, а также на железнодорожных рельсах.
Компьютерная медицинская диагностика
Для пациентов с геморрагическим инсультом существует два типа лечения: пассивное (медикаментозное) и активное (хирургическое). Э. Кандел (один из пионеров хирургического лечения геморрагических инсультов) обратился к выдающемуся математику профессору И. Гельфанду за помощью в сравнении эффективности этих двух методов лечения. Губерман был выбран главным архитектором проекта. Во-первых, было решено изменить цель: вместо выбора лучшего лечения в целом найти лучшее лечение для конкретного пациента - консервативное или оперативное («лечить пациента, а не болезнь»). Для этого было решено использовать технологию распознавания образов, разработанную в прошлом для геологии (см. Выше). Необходимо разработать два правила принятия решения: 1) для прогнозирования исхода (жизнь или смерть) консервативного лечения конкретного пациента, 2) для прогнозирования исхода (жизни или смерти) хирургического вмешательства того же пациента. Решения основываются на неврологических и общих симптомах, собранных в первые 12 часов после поступления пациента в больницу. Полученные правила принятия решений предварительно тестировались в течение двух лет: собранные данные отправлялись в компьютер, а два прогноза (прогнозируемые исходы операции и консервативное лечение) помещались в файл пациента. Через месяц компьютерные прогнозы сравнили с результатами. Общий результат - 90% верных прогнозов. Затем последовала клиническая реализация: компьютерные решения немедленно отправлялись дежурному хирургу, который принимает окончательное решение. За пять лет компьютерные прогнозы получили 90 пациентов. В 16 случаях компьютер настоятельно рекомендовал операцию. 11 из них были прооперированы и выжили. У 5 пациентов компьютерное предупреждение было проигнорировано (по разным причинам), и все 5 умерли . В 5 случаях настоятельно рекомендовалось отказаться от операции. Трое из них получили соответствующее лечение и выжили, двое из них были прооперированы вопреки рекомендациям компьютера и умерли.
Должности
- 1966–1991 Главный научный сотрудник Института прикладной математики им. М.В. Келдыша , Москва (Россия)
- 1989–1992 гг. - заведующий кафедрой географии Российского открытого университета (Москва).
- 1989–1997 Главный научный сотрудник, ParaGraph International, Кэмпбелл, Калифорния, США
- 1995–1996 Приглашенный научный сотрудник Национальной лаборатории Лоуренса Беркли , Калифорния, США
- 1998–2007 Основатель и генеральный директор Digital Oil Technologies, Купертино, Калифорния, США
Публикации
Более 180 статей опубликовано в научных журналах России, США, Франции, Германии, Италии и Австрии.
Избранные недавние статьи по информатике и психологии :
- 2017: [1] , «Гештальт-теория перестроена: назад к Вертхаймеру», в «Границы в психологии», https://www.frontiersin.org
- 2015: «О принципах гештальт-теории» , Gestalt Theory, 37 (1), 25-44.
- 2012 (совместно с Вадимом Максимовым и Алексом Пашинцевым): «Гештальт и понимание изображений» , Gestalt Theory, 34 (2), 143 - 166.
- 2013: Критический обзор Desolneux, Moisan & Morel (2008): От теории гештальт к анализу изображений. В: Гештальт-теория 35 (2), 183-206.
- 2008: Что такое «самоорганизация»? Путешествие маленького ребенка. 7-й Конгресс ЕЭС по системным наукам, Европейский Союз, Лиссабон, 17-19 декабря 2008 г.
- 2004: «Размышления о« Общей теории систем »Людвига Берталанфи: основы, развитие, приложения». Гештальт-теория, 26 (1), 45 - 57.
- 2002: «Кластерный анализ как гештальт-проблема». Гештальт-теория, 24 (2), 143 - 158.
- 2001: «Размышления о« Продуктивном мышлении »М. Вертхаймера: урок искусственного интеллекта. Гештальт-теория, 23 (2).
Избранный доклад по тектонофизике :
- 1972: Губерман Ш. (1972), "Критерии высокой сейсмичности определяется распознавания образов.", Тектонофизика , 13 (1-4): 415-422 v.13, Bibcode : 1972Tectp..13..415G , DOI : 10.1016 / 0040-1951 ( 72) 90031-5
Книги:
- 1987: «Неформальный анализ данных в геологии и геофизике», Недра, Москва.
- 1962: «Теория подобия и интерпретация данных ГИС», Недра, Москва.
- 2007: с Джанфранко Минати «Диалог о системах», Polimetrica, Италия. ISBN 978-8876990618
- 2009: «Необычная геология и геофизика. Нефть, руды и землетрясения», Polimetrica, Италия. ISBN 978-8876991356
Источники о его творчестве
- Зуева Е. (2009), «История компьютерного зрения в Институте прикладной математики им. М.В. Келдыша РАН», Математические машины и системы (4) http://www.immsp.kiev.ua/publications/articles/2009/2009_4/04_2009_Zueva.pdf
- Е.М. Кудрявцев, Е.Ф. Макляев, С.Д. Зотов и А.А. Лебедев (2009), «Сравнение гипотетических D-волн планетарного масштаба, вызывающих землетрясения в модели Ш.А. Губермана, с медленными уединенными упругими волнами, обнаруженными экспериментально», Вестник Физического института им. , 36 (9): 277-281, Bibcode : 2009BLPI ... 36..277K , DOI : 10,3103 / S106833560909005X , S2CID 121955600 CS1 maint: несколько имен: список авторов ( ссылка )
- Джоэл Н. Шуркин (1994), "Тщательно электронный русский", журнал San Jose Mercury News West , стр. 8–12