воскресенье, 19 августа 2018 г.

Дежавю - "болезнь" машинного зрения

"ТКТ" на протяжении ряда номеров успел рассказать лишь о части российских и зарубежных разработок в области машинного зрения. Но уже по ним видно, как сильно оно будет распространено. И отсюда вопрос: кто и как будет оценивать показания устройств машинного зрения? Если как сегодня среднестатистический человек (думающий не столько о должностных обязанностях, сколько о мизерной зарплате, бытовых неурядицах, сексуальной неконкурентоспособности и т. п.), результат известен: от Чернобыля до сбитого украинской ракетой российского авиалайнера. Удивительно, что сбит только один самолёт - хотя есть еще аварии по вине диспетчеров. Кто обучал операторов РЛС знает, что число тех, из кого можно составить расчет РЛС в природе ограничено: там, как и на других операторских постах нужны особые способности. А если для обслуживания машинного зрения множить число людей-операторов, общее качество резко ухудшится и эффект получится разрушительный.
Человеческий фактор причина многих катастроф. Но почему ледокол "Ермак" служил с 1899 по 1963 гг. в тяжелейших условиях и никто из рулевых не утопил его? Потому, что построивший его С. О. Макаров во время первого же похода в Арктику в 1899 г. обеспечил корабль, говоря современным языком, "визуальными шаблонами технологического процесса". То есть, адмирал заснял на кинопленку процесс форсирования тяжелых льдов, а затем сделал покадровый анализ и составил технологическую карту ледокольного маневра. Примерно так должно быть сегодня смоделировано поведение объектов повышенной опасности в экстремальных условиях. Но сделать это оказалось некому. И не потому, что в кинематографе нет специалистов, а потому, что их социальный статус невысок. Ведь Макарову удалась та арктическая киносъёмка потому, что он был адмирал и обладал властью, необходимой, чтобы санкционировать съёмки не с борта, а с ледовых торосов, что было рискованно и дорого (лишний расход топлива и механизмов). Точно также организация других научных съёмок требовала немалого властного ресурса. Так, В. Н. Лебедев, создавший цикл фильмов о микроорганизмах был профессор, лауреат Сталинской премии. Огромный фонд медицинских фильмов создан под личным руководством первого президента АМН, Героя Соцтруда академика Н. Н. Бурденко. Производство научных фильмов о сельском хозяйстве было всерьёз развёрнуто после доклада Н. С. Хрущева 03.11.53 г. на Пленуме ЦК КПСС. То есть, всегда инициатор - самостоятельный человек. А на всей нашей "Черноморской кинофабрике" один самостоятельный человек, да и тот - Никита Михалков.
Визуальные технологические шаблоны - ценная интеллектуальная собственность, что прекрасно понимал адмирал Макаров, написавший в книге: "Я хотел взять одного профессионала, но он требовал, чтобы снимки принадлежали ему, и не соглашался итти за деньги. Я вовсе не хотел дать ему материал для показывателей в кафе-шантане и потому решил, что мы сами займёмся этим делом" (что и поручил лейтенанту Шульцу). В СССР научно-технические киноматериалы были госсобственностью и потому киностудии вроде "Центрнаучфильма" без принципиальных проблем вели съёмки межотраслевого и межведомственного характера. Сейчас вроде бы снова капитализм, но где гарантии прав интеллектуальной собственности, если государству трудно обеспечить даже сохранность гостайн?
Конечно, традиции советской науки играют свою роль: так, фильмы В. Н. Лебедева о микроорганизмах нашли продолжение в шаблонах, на которых основана работа микровидеотестера, представленного на выставке "Медтехника-2002". Прибор служит для автоматической диагностики возбудителей инфекционных и паразитарных заболеваний - то есть, опасных для человека простейших: класс, представителям которого в человеческом обществе посвящена теория Ломброзо и поэтому можно говорить о её победе (хотя и так было ясно, что если бы Ломброзо, выдвинувший положение о существовании особого типа человека, предрасположенного к совершению преступлений в силу определённых биологических признаков, так уж сильно ошибался, то не вошел бы в историю). Ломброзо, выведя шаблоны черт преступников и других типов людей, утверждал, что должна существовать аналогия между карательной деятельностью государства, охраняющей социальную жизнь, и теми реакциями, которые обнаруживают как животные, так и растения на испытываемые ими внешние воздействия.
В. К. Случевский, современник Ломброзо, пишет, что на брюссельском (1892 г.) международном уголовно-антропологическом конгрессе Ломброзо "встретил решительных противников прежде всего со стороны криминалистов, восставших против попытки уничтожения основ существующего уголовного правосудия и замены нынешних судей-криминалистов судьями новой формации, навербованными из среды представителей естественнонаучных знаний". Аналогично, микровидеотестер являет собой новый вид медтехники, основанной на машинном зрении, которая заменит нынешних медиков-чиновников медиками-системщиками. Симптоматично, что создание микровидеотестера совпало по времени с принятием закона об электронной цифровой подписи, в связи с которым зампред Комитета Госдумы по информационной политике А. Шубин отметил важность того, что ЭЦП стала аналогом традиционной подписи именно физического лица, и теперь можно ввести такое дистанционное медицинское обслуживание, когда в сертификате подписи будет сделана запись: "для выдачи рецептов" (до 90% функций медиков - это монопольная привилегия выписать рецепт, справку, разрешение и т. п. блага). Практически, благодаря закону об ЭЦП замена чиновника уровня вплоть до замминистра возможна на обычную АСУ; должности же от замминистра и выше принадлежат к политической иерархии и поэтому автоматической замене на компьютерную систему не поддадутся.
Проверить теорию Ломброзо каждый сможет на себе после внедрения в быт видеотелефонии, основанной на передаче по узкополосным линиям аватаров (говорящих голов), повторяющих внешность и мимику абонента. Не зря говорится, что один раз увидеть лучше, чем 100 услышать: со многими мы не стали бы говорить по телефону, зная как они выглядят, априори имея в сознании шаблоны по теории Ломброзо. Много разочарований и когда встречаются после анонимного общения по Интернету. Во избежание недоразумений вводятся аватары-портреты, скрупулёзно копирующие мимику. И абонентам придётся тщательно работать над своим лицом перед выходом на связь. Не все это смогут и для них есть аватар-маска (копия знаменитости, например). Но в мире капитализма, когда предательства приходится ожидать от самых доверенных людей, прячущийся под маской, вызывает, как минимум, дополнительные сомнения. Маска скорее присуща анонимному шантажисту (аналогично, проверено, что тот, за кого всегда отвечает автоответчик, может подвести). Поэтому главное в технологиях аватаров - точность передачи мимики как демонстрация открытости и честности. Лицо - самый естественный документ и, не видя его, трудно доверять. В то же время, маски имеют свою историю и толкования, поэтому их применение чревато самыми неожиданными оргвыводами, поскольку традиционно они - атрибут актёров и злодеев.
Создание робототехники на основе машинного зрения - это продолжение борьбы биологических видов, не прекращавшейся никогда. Лицо, имеющее право принятия решений - это биологический вид, противоположный лицу, за которое кто-то решает, причем слишком часто решает либо ошибочно (если оператор), либо в свою пользу (если чиновник). Защитный рефлекс от тех, кто неправильно решает - робототехника, преимущество которой отметили Стругацкие еще на заре первых ЭВМ: "Машина не должна думать. Машина должна ездить". Машина, будучи исполнителем, не должна сама принимать решения: их может и должен принимать только потребитель услуги. 
Дороговизна печатных плат связана с тем, что в большинстве случаев контроль качества монтажа поверхностных элементов выполняется визуальным способом: по форме мениска припоя на контактах судят о качестве паяного соединения. То есть, чтобы выявить среди тысяч хороших плат одну бракованную задействована армия контролёров, чьё зрение дешевле заменить машинным. Как переходный этап созданы стереоскопические системы визуального контроля, дающие объёмную картинку каждого мениска. Когда контролировать будут роботы на основе шаблонов из постоянно корректируемой библиотеки, докладывая о характере дефекта (синтезированной речью - как на сеансе спиритизма) единственному оставшемуся в цеху человеку-оператору, тот примет решение, глянув в ту же стереоскопическую систему. В этом и смысл создаваемого стереоскопического компьютерного зрения - сделать машинное зрение "человекоподобным", чтобы человек мог перепроверять его для принятия окончательного решения. 
В данном примере решение примет не исполнитель, а как бы представитель потребителя на основе диалога с машиной. Чиновник же - это антипод диалоговой системы, и в то же время, он - система машинного зрения в том смысле, что бездушно оценивает для себя посетителя по его внешним признакам. Чиновник, будучи, по сути, исполнителем, должен не принимать решение, а вести диалог с посетителем. Конечно, он мозг, но даже мозг ведёт диалог с ампутированной конечностью, чтобы работал электронный протез. Основа же диалога в системе машинного зрения - это цветовые и геометрические шаблоны, позволяющие ей дать оценку не в категоричной а в рекомендательной форме. 
Проблема диалога с должностным лицом видна из ГОСТ 7.0-99 "Информационно-библиотечная деятельность, библиография", согласно которому информационная услуга есть "предоставление информации определённого вида потребителю по его запросу" - вне связи с его предполагаемой потребностью. А стандарт потому и закон, что он (международный, государственный, отраслевой) формируется из наиболее распространённых точек зрения наиболее влиятельных специалистов. "Чтобы правильно задать вопрос нужно знать большую часть ответа" - сказано в рассказе Шекли "Верный вопрос": в рассказе никто и не получил ответа на свои вопросы, поскольку Ответчик не счел нужным вступить со спрашивающими в диалог, задавая наводящие вопросы. Так и в жизни: посетитель не знает большей части ответа, а должностное лицо знает, но, поскольку вести диалог закон его не обязывает, оно будет намекать на благодарность. АСУ тоже будет знать, но она будет стараться услужить клиенту, ведя диалог "на равных". Чиновник среди посетителей равных не признаёт: он, так же как и софт, выставляет приоритеты, но, в отличие от софта, руководствуясь страстями. Диалог требует бесстрастности, которой обладает, например, ОС Windows. Проблема диалогового машинного зрения - это проблема операционной системы. Главные (и потому самые богатые) люди в робототехнике - это создатели диалоговых ОС типа Windows, на которую уже сейчас весь мир молится благодаря её способности к диалогу по принципу "Чего изволите?": Windows 98 может установить на свой ПК даже школьник, избавленный ею от бремени приглашать полуграмотных "знатоков". Эволюция Windows (9x/Me-NT4.0-2000 Professional-XP Professional) идёт как раз в сторону усовершенствования системы диалога. Конечно, потребители мучаются с Windows, но они должны гордиться, что им разрешено корпорацией финансировать и тестировать будущую универсальную ОС (робота для "каждой кухарки"). Всё это - бесконечный НИОКР за счет потребителя.
За прогресс всегда платит простой человек и его никогда не щадили. Так, авторы нелепых финансовых реформ в качестве подопытных кроликов употребили бухгалтеров малых предприятий - но и врачи-нацисты ставили опыты на узниках концлагерей. По числу анекдотов о себе Windows перегнала Штирлица, и один из последних связан с XP. Система распознавания голосовых команд Microsoft Speech API прячется в директории Windows в файле под именем sapisvr.exe: будучи активизирована, она пытается распознать любой шум, поступающий с микрофонного входа или сгенерированный звуковой картой, преобразовывая его в непредсказуемые команды управления.
Тем не менее, анализ названных ОС говорит о нарастании роботизации обработки визуальной информации, благодаря чему любую стадию любых процессов можно будет пропаспортировать шаблонами по примеру звукотехнических фирм, создававших звуковые процессоры, записывая акустику в лучших залах мира и составляя шаблоны "дежавю" ("это уже было").
Цифровая обработка звукового поля - технология разработанная фирмой Yamaha для измерения звуковых полей и акустических характеристик концертных залов, джазовых клубов и других помещений, предназначенных для зрелищ. Фирма создала волновой акустический датчик, позволяющий проводить точные замеры параметров вышеназванных помещений. В дальнейшем данные замеров знаменитых залов по всему миру накапливались в микросхемах обработки сигнала, что позволяет усилителям и ресиверам Yamaha воссоздавать оригинальные звуковые поля - вплоть до известного кафедрального собора.
Довольно богатой палитрой оперируют в одной лишь из операций по термической обработке металлов - отпуске стальных деталей, закалённых на мартенсит (самая твёрдая и самая хрупкая структура эвтектоидной стали), снижающем остаточные напряжения и уменьшающем хрупкость стали. При отпуске образуются различные состояния стали с теми или иными свойствами - в зависимости от температуры нагрева. Если при т. н. "низком" отпуске детали нагревают на воздухе, то для контроля температуры пользуются цветами побежалости, появляющимися на поверхности детали в связи с интерференцией белого света в плёнках окисла железа. В градусах Цельсия это: светло-желтый - 220, соломенно-желтый - 240, коричнево-желтый - 258, коричнево-красный - 265, пурпурно-красный - 275, фиолетовый - 285, васильково-синий - 295, светло-синий - 315, серый - 330 и выше. Понятно, что если определять это "на глазок", возможны ошибки и детали будут выходить из строя - что и происходит. Здесь уместнее цветовые шаблоны для систем машинного зрения. Помимо цветов побежалости есть цвета каления, которыми светится металл, нагретый до температур порядка 1300 град. которые определять глазом вообще бессмысленно.
Отметим, что температуре 265 град. соответствует именно "коричнево-красный", а не красно-коричневый цвет. Это пример навешивания ярлыков теми, кто искаженно воспринимает жизнь. Ярлык, как и штамп - субъективистская интерпретация понятия "шаблон", которое часто воспринимается как порицание, но сейчас оно - основа робототехники. Взяв в качестве шаблона работы художников-футуристов (футуризм культивировал эстетику машинной индустрии), получим шаблон для машинного зрения, смотрящего в будущее. Аналогично, научная фантастика дала массу шаблонов, легших в основу последующих конструкций. Литературовед Ю. Лотман, практиковавший структурный анализ художественных произведений, исследуя их с точки зрения семиотики, изучающей свойства знаковых систем в человеческом обществе, сказал, что искусственный интеллект - это книга. Действительно, книга - это операция сравнения с тем, что есть, или было, или будет (в случае фантастики). "Перевести глубоко личные чувства на язык жанровых формул", - сказал Лотман, сформулировав этим критерий ассоциативного мышления, в основе которого - те же шаблоны. С навешиванием ярлыков нельзя спешить, называя непонятное фашизмом, как это произошло с футуризмом или с последователем Ломброзо криминалистом Ферье, чьи наработки (уже после его смерти) вошли в УК Италии при Муссолини. 
В силу того, что множество профессий основаны на тонкостях различения цвета, принятие международного стандарта sRGB предопределило XXI век как век снятия всех возможных цветовых шаблонов во всех областях жизни. Медики по аномалиям цвета тканей человека (животных, растений), выявленным при сравнении с шаблонами, диагностируют заболевания. Кухню роботизируют, снимая все стадии кулинарных конкурсов для нарезки на шаблоны. По шаблонам отслеживается созревание различных культур в различных условиях и это означает роботизацию сельского хозяйства, которая уже началась. В Волгоградской области, где зону рискованного земледелия заселяют китайцы ввиду нехватки местного населения, создан сельхозробот на 8 ногах; электродвигатель с дизель-генератором обеспечивает скорость до 1 км/час, грузоподъёмность 2 т, цена 30 тыс. у. е. (таков порядок цен: отечественный манипулятор-сапёр стоит 80 тыс. у. е.).
Процесс "шаблонизации" должен оформиться где-то к 2010 г. (когда появится микропроцессор с тактовой частотой 20 ГГц), высвободив в развитых странах порядка 1 млрд. работников, одновременно на порядок снизив себестоимости. Основной функцией людей станет кропотливо, как пчелы, собирать шаблоны, идентифицировать и сдавать в соты-архивы, объединённые телекоммуникациями. Причем робот идентификацию выполнять не сможет ввиду маловероятности создания искусственного интеллекта. Здесь уместно вспомнить высказывание ученого Лебедева: "Книжный шкаф знает больше меня, но не он физик, а я".
Казалось бы, для России, с её драматичной демографической ситуацией, вопрос №1 - антропоморфные машины, и не просто "русскоязычные", а и распознающие образы "местного происхождения". Тем более, за рубежом есть примеры интеллектуальных систем с высоким уровнем распознавания зрительных и звуковых образов: андроид SDR-4x (Sony), робот для вечеринок Asima (Honda), музейные роботы (Mitsubishi Heavy Industries). Но в них и заключен ответ: у нас нет достаточно крупных электронных корпораций, способных работать системно (ведь робот - это многопрофильная система). Да, кое-что делается, но для такой страны это - капля в море. Неприятие роботизации - это страх за рабочие места: для себя, родни, гарема (поэтому, видимо, на телевидении не внедряются виртуальные ТВ-ведущие). Виртуальные работники становятся реальными, когда вытесняют людей с их рабочих мест. Но прогресс затормозить нельзя - от него можно только отстать: бюрократы-луддиты сделали всё, чтобы в СССР не появился свой Билл Гейтс и теперь мы зависим от американских операционных систем, которые на самом деле и есть атрибут мирового господства, а вовсе не то, чем увлечены т. н. "политологи". И вскоре понадобится астрономические суммы, чтобы либо покупать визуальные шаблоны машинного зрения для всех отраслей за рубежом, либо срочно создавать, используя даже базу умирающих киностудий. А. П. Барсуков, журнал "ТКТ" № 6, 2002 г.


Еще больше информации на данную тему содержит телеграм-канал «Человекоподобные роботы: технологии и рынки».

Комментариев нет:

Отправить комментарий

Примечание. Отправлять комментарии могут только участники этого блога.