Что является глазами компьютера
В 1998 году выпускник ННГУ им. Лобачевского Вадим Писаревский устроился на работу в небольшую IT-компанию и получил задание начать работать над технологией, о которой ничего не знал. В то время он и не предполагал, что эта работа затянется на десятилетия, а на основе созданных с его участием разработок в мире будет изготовлено несколько миллиардов гаджетов, и жизнь людей на планете Земля существенно изменится.
Как малая компания начала работу планетарного масштаба
Все началось с того, что математики и IT-специалисты – выходцы из Сарова создали Нижегородскую Программную Технологическую Лабораторию (NSTL – Nizhny Software Technology Lab[1]). Ранее они работали над исполнением контракта между Intel и Саровским ВНИИЭФ. Но сотрудничество с международными компаниями в закрытом городе атомщиков, с его режимом секретности, было очень неудобным. Поэтому несколько саровских специалистов и переехали в областной центр, сохранив при этом связи с Intel. «Мы выполняли несколько контрактов с Intel, когда мне предложили взяться за работу над библиотекой[2] компьютерного зрения, – вспоминает Валерий Федорович Курякин (в те годы один из руководителей NSTL). – У меня уже был опыт работы с компьютерным зрением, и я понимал перспективность этой технологии. И хотя тогда был вынужден разрываться между перспективными и менее перспективными, но приносящими деньги проектами (сил у компании не хватало), решил согласиться».
Сил у NSTL действительно не хватало. В то время в ней работали менее 40 человек, в основном, молодых специалистов. Да и не все сотрудники горели желанием работать неизвестно над чем. Безуспешно перепробовав нескольких программистов, руководитель NSTL дал задание начать работать над библиотекой двум вчерашним выпускникам ННГУ им. Лобачевского: Вадиму Писаревскому (сегодня – сотрудник Института искусственного интеллекта и робототехники для общества (г. Шэньчжень, Китай) и Виктору Ерухимову (сейчас – CEO & Founder в itSeez3D). О компьютерном зрении они не знали ничего, но за работу взялись с энтузиазмом. «Ощущения чего-то большого у меня не было, зато были интересные задачи и какой-то бесконечный драйв, когда все бегали с вытаращенными глазами», – вспоминает Виктор Ерухимов. В те годы нижегородские разработчики работали в парах со специалистами Intel в США, а курировали весь проект его инициаторы в Intel – Гари Брадски и Шинн Ли. Позже, когда нижегородцы показали хорошие результаты, им предоставили большую автономию.
Количество занятых в проекте сотрудников постепенно увеличивалось. «К 2000 году у нас сложилась техническая команда, – рассказывает Вадим Писаревский. – Я был техническим лидером, но не справился бы без таких людей, как Сергей Обломов, который разбирался, как строить библиотеки в Linux, Валерий Черепенников, занимавшийся оптимизацией, или Валерий Мосягин, специализировался на калибрации камер. Всего нас было уже человек десять». Примерно столько же инженеров работало и в США. И этими силами был создан первый готовый продукт.
Выпущенная в 2000 году первая версия библиотеки получилась достаточно убедительной и наделала много шума в мировом IT-сообществе. Функциональность ее по современным меркам была весьма скромной: простейшая обработка изображений, калибрация камер, возможность отслеживать движение точек на компьютере… Но некоторые разработанные тогда программы используются и до сих пор. К примеру, когда вы делаете фотографию смартфоном, вокруг лиц фотографируемых людей появляются прямоугольники, и на них наводится резкость. Эта функция присутствовала еще в первой версии библиотеки, и написанная тогда программа до сих пор используется практически без изменений. Главное же: разработка сразу стала применяться для решения практических задач. Компьютерное зрение стало использоваться, например, на конвейерах промышленных предприятий для определения координат передвигающихся деталей или для контроля правильности пайки электронных плат.
Простые советы для здоровья глаз
4. Отрегулируйте положение монитора
Почему люди чаще говорят о вреде экранов компьютеров и смартфонов, а не телевизоров? Потому что, как правило, экран компьютера или телефона расположен намного ближе к глазам, чем экран телевизора.
Постоянным пользователям следует обращать внимание на расстояние между экраном и глазами. В идеале оно должно быть не менее 51 см. Монитор при этом рекомендуется располагать ниже уровня глаз (так, чтобы верхняя часть экрана находилась на уровне глаз или чуть ниже).
Усталость глаз
Еще одна болезнь, к которой приводит длительная работа за компьютером, — это усталость глаз. Основной причиной дискомфорта и утомляемости является яркий свет, излучаемый экранами. Его влияние может усиливаться, если он резко отличается от фонового освещения.
8. Роботы
Даже Alexa от Amazon, Google Home и прочие цифровые помощники и роботы, доступные на рынке, вроде LG Hub и Kuri от Mayfield Robotics, обладают базовыми навыками компьютерного зрения и могут определить, кто с ними разговаривает, или же выгнать собаку с дивана.
А если серьезно, то компания ITRI разработала систему Intelligent Vision System, которая использует глубинное обучение и компьютерное зрение, чтобы роботы могли различать объекты разного размера (фигурки, чашки) и определять их положение. Распознав объект, робот сможет взять его и принести в нужное место. Такие навыки отлично бы пригодились для обслуживания столиков в ресторане или для игры в шахматы.
Эти фотографии появились на одном из этапов обучения компьютеров Google, которые учатся распознавать различные объекты на изображениях. Смотрите невероятные, странные и инопланетные фотографии, созданные искусственным интеллектом.
1. Когда мы смотрим на фотографию облачного неба, порой можем увидеть какие-то фигуры или контуры зверей. Что Вы видите на этой картинке?
2. Но если показать такую фотографию компьютеру, он увидит на ней гораздо больше… 3. А вот что в итоге увидела на первой фотографии нейронная сеть Google. 4. Чтобы научить компьютер какому-нибудь понятию, например, вилка, ему показывают самые разные фотографии вилок. Таким образом компьютер учится распознавать данный объект в самых разных конфигурациях (вилка в руке, вилка на столе, вилка с тремя зубцами, вилка со сломанным зубцом, деревянная вилка, пластиковая вилка и т.д.). 5. Это водопад (слева) и водопад глазами компьютера (справа).
Нейронная сеть не получает информацию о том, для чего служит вилка или какими качествами она должна обладать, она сама должна понять это по фотографиям.
6. Картина «Крик» Мунка (слева) и её видение компьютером (справа).
Нейронная сеть действует на нескольких уровнях (от 10 до 30) или слоях нейронов, каждый из которых отвечает за более сложные действия. Один слой, например, распознаёт края объектов, второй — цвета, третий — сами объекты и т.д.
7. Это «обычная» фотография озера глазами компьютера.
«Каждая картинка попадает в первый слой нейронов, который взаимодействует со следующим слоем так долго, пока не достигнет последнего. Ответ сети мы получаем именно от последнего слоя», — написано на блоге Google.
8. Такими видит горы искусственный интеллект.
Как мы можем быть уверены, что компьютер действительно способен распознать вилку (или любой другой объект)? Оказывается, есть решение, которое позволяет в этом удостовериться — стоит лишь попросить сеть показать как по её мнению выглядит данный объект. Этот метод в большинстве случаев работает, однако случается, что компьютер не понимает суть какой-то вещи. Например, на просьбу показать гантели, компьютер показывает их вместе с частью руки человека. Благодаря таким проверкам, можно найти ошибки, допущенные нейронной сетью, и научить её правильно показывать объект, обеспечив ей доступ к изображениям гантелей без руки человека, например, лежащие на столе.
9. Ещё интересней становится, когда нейронную сеть просят показать, что она видит на данной фотографии. Эта сеть специализируется на распознавании зданий на фотографиях.
10. Дело в том, что из-за петли обратной связи нейронная сеть будет пытаться распознавать несуществующие на картинке объекты и улучшать их изображение.
Например, облако, отдалённо похожее на птицу, сеть обработает и улучшит настолько, что оно действительно будет напоминать птицу, далее, на следующем уровне анализа, сеть увидит птицу и будет пытаться улучшить её изображение и так до тех пор, пока птица не появится на изображении, хотя фактически её там никогда не было.
11. Google на своём блоге объяснил, что нейронную сеть «кормят» в основном изображениями животных, потому именно их она и распознает, хотя иногда в очень сюрреалистических вариациях. На этой фотографии результат обработки фотографии сетью, которая учится распознавать здания. 12. Нейронная сеть как ребёнок, который с нуля познаёт мир. 13. Сказочные, сюрреалистические видения искусственного интеллекта человеку могут показаться несколько тревожными. 14. По крайней мере, теперь мы знаем, что снится андроидам. 15. Так нейронная сеть Google учится понимать наш мир.
Профилактика КЗС: как спасти свои глаза?
Лучший способ победить компьютерный зрительный синдром — устранить факторы, его вызывающие. Для этого достаточно придерживаться сколь простых, столь и эффективных рекомендаций.
4. Бытовые приборы
Дорогие камеры, которые показывают, что находится внутри вашего холодильника, уже не кажутся такими революционными. Но что вы скажете о приложении, которое анализирует изображение со встроенной в холодильник камеры и сообщает, когда у вас заканчиваются определенные продукты?
Элегантное устройство FridgeCam от Smarter крепится к стенке холодильника и может определять, когда истекает срок годности, сообщать, что именно находится в холодильнике, и даже рекомендовать рецепты блюд из выбранных продуктов. Устройство продается по неожиданно доступной цене — всего за $100.
6. Поменяйте монитор
Для многих из вас эта рекомендация может быть не актуальна, поскольку большинство современных рабочих мест оборудовано компьютерами со светодиодными дисплеями. Но тем, кто до сих пор пользуется ЭЛТ-мониторами, давно пора заменить их на светодиодные. ЭЛТ-мониторы вызывают усталость глаз из-за мерцания — чем ниже частота обновления монитора, тем более сильный дискомфорт вы будете испытывать.
Если вы планируете поменять монитор, то ищите новый с более высоким разрешением и большим размером дисплея. Хотя такой монитор может быть дорогим, на него все же стоит потратить деньги, если вы проводите много часов за компьютером.
Как у компьютеров появился искусственный интеллект
Первые статьи о Deep learning (глубокое обучение машин на основе нейронных сетей, которое в популярной литературе называется «Искусственный интеллект») были написаны еще в конце 90-х годов XX века. Но тогда казалось, что эта технология бесперспективна. «Когда в 2003 году я начинал заниматься машинным обучением, нейронные сети среди его алгоритмов считались абсолютным изгоем. Потому что с ними невозможно работать, их нельзя тренировать, они плохо реагируют на ошибки данных и т.д.», – рассказывает Виктор Ерухимов. В 2009 году появились первые смартфоны с фотоаппаратом и выходом в Интернет. А вслед за ними возникли миллионы изображений, которыми можно было тренировать компьютеры на больших объемах данных.
Первой запустила крупный проект такой «тренировки» NVIDIA Corporation, для которой нижегородская Itseez разработала первые алгоритмы глубокого машинного обучения. Тогда еще никто не знал, что из этого получится. А получилась новая техническая революция. «Раньше человечество не предполагало, что если нейронную сетку натренировать на миллионе изображений, то она будет обучаться и дальше уже самостоятельно, – объясняет Вадим Писаревский, – но оказалось, что количество переросло в качество. И человечество смотрит на это, как на новую игрушку, думая, что с ней еще можно сделать».
К примеру, при анализе рентгеновских снимков врачи показывают машине сотни тысяч изображений как здоровых, так и больных человеческих органов. Затем машина с помощью Искусственного интеллекта не только точнее человека определяет наличие известных современной медицине заболеваний, но и указывает на еще неизвестные аномалии. «Десять лет назад, мы рассуждали, сможет ли алгоритм детектировать пешехода на маломощном автомобильном компьютере, – сейчас этот этап пройден. Intel производит огромное количество датчиков, которые идентифицируют людей, автомобили, препятствия. Сейчас вопрос, скорее, в том, насколько автомобиль без водителя может прогнозировать поведение автомобилей с водителем с точки зрения здравого смысла и целесообразности. К примеру, когда вы выезжаете со второстепенной дороги на главную, а там пробка, вы всегда понимаете, кто вас пропускает. А машина пока нет. Но она скоро поймет. Аналогичная история в других отраслях», – рассказывает Виктор Ерухимов.
«Несколько лет мы делали проект по распознаванию дорожных знаков для автомобильных навигаторов, – вспоминает Валерий Федорович Курякин. – Знаки на дорогах часто меняются, и чтобы актуализировать карты, приходилось посылать большое количество автомобилей с цифровыми камерами на борту. Сделанные ими видеозаписи пересылались на обработку малоквалифицированным специалистам в Индии, которые их просматривали и вносили корректировки в карты вручную. При этом допускалось много ошибок. Благодаря разработанной на основе Искусственного интеллекта программе сегодня дорожные знаки считываются видеорегистраторами участников дорожного движения, и карты актуализируются в режиме реального времени без дополнительных затрат разработчиков».
Благодаря Искусственному интеллекту мир меняется. Компьютеры стали обучаться не только на основе изображений, но и звуков, и стали распознавать человеческую речь. Появились машинные переводчики, которые в режиме реального времени переводят речь с одного языка на другой. Во многих отраслях Искусственный интеллект догнал человеческий, а в некоторых уже и обошел его. Мы даже не осознаем быстроты изменений. «В начале девяностых годов я сделал систему распознавания лиц для пропускной системы в Сарове с 95% достоверностью. Там был использован технический трюк, с помощью которого всегда удавалось получить изображение в стандартном виде – человек не мог наклонить или повернуть голову как-то не так. И все равно это казалось фантастикой, – рассказывает Валерий Федорович Курякин. – А сегодня машинам удается распознать/идентифицировать человека почти с любого ракурса и при изменениях во внешности».
3. Настройте яркость и контрастность
Еще одним фактором, влияющим на утомляемость глаз, является яркость экрана. Чтобы получить оптимальную яркость, убедитесь, что вы отрегулировали ее в соответствии с яркостью вашего окружения. Проверить это можно при помощи простого теста. Откройте белый фон на экране: если экран выглядит как источник света, это значит, что необходимо уменьшить его яркость. В идеале нужно, чтобы за монитором не было окон, иначе чрезмерное количество дневного света будет вынуждать вас увеличивать яркость экрана.
Кроме яркости, нужно также установить оптимальный уровень контрастности, чтобы не приходилось щуриться и напрягать глаза, смотря на экран. Убедитесь, что чтение текста с экрана не доставляет дискомфорта. Темные буквы на светлом фоне — идеальное сочетание для чтения.
Купите электронную книгу
В современных реалиях покупка электронной книги кажется бессмысленной. И правда, зачем тратиться на сравнительно дорогое устройство, если за ту же сумму можно приобрести куда более функциональный смартфон или планшет? А между тем, «читалки» действительно помогают предотвратить развитие КЗС, что делает их практически незаменимыми для любого книголюба или человека, вынужденного много работать с текстами по долгу службы. Секрет кроется в устройстве дисплея, принципиально отличающемся от LCD- и OLED-матриц, используемых в современных мониторах.
Термины «электронная бумага» и «электронные чернила», применяемые в отношении экранов подобных устройств, — отнюдь не просто маркетинговые названия, ведь для человеческого глаза между E-Ink Carta и бумажной страницей практически нет никакой разницы. Каждый пиксель такого экрана представляет собой микрокапсулу, заполненную жидкостью, в которой плавают частицы пигмента белого (имеют положительный заряд) и черного (имеют отрицательный заряд) цветов. Изображение на экране формируется за счет перемещения пигментных частиц внутри капсул-пикселей при подаче на верхний и нижний электроды напряжения соответствующей полярности.
Сам по себе дисплей, выполненный по технологии электронных чернил, не содержит светоизлучающих элементов, то есть, человеческий глаз видит текст на E-Ink-экране только благодаря свету из внешних источников, отраженному от пигментных частиц. Проще говоря, электронная бумага «работает» точно также, как и настоящая. Это обеспечивает и еще одно важное преимущество — как и в случае со страницами бумажных книг, яркостно-контрастные параметры дисплеев электронных читалок определяются параметрами светового окружения, в котором вы находитесь.
При чтении обычных книг всегда работает «автоматическая регулировка яркости»: если вы читаете при ярком свете, то и поверхность страниц становится ярче, поскольку возрастает интенсивность отраженного светового потока, а если перейдете в плохо освещенное помещение, то яркость страниц также снизится. Аналогичным образом это происходит и с электронными книгами, что позволяет решить проблему яркостно-контрастных перепадов, неизбежно возникающих при работе с обычными мониторами.
И даже подсветка E-Ink-экранов оказывается куда более физиологичной по сравнению с тем, как это реализовано в мониторах и мобильных девайсах. Если подсветка LCD-дисплеев осуществляется за счет светодиодов, расположенных позади слоя, в котором формируется изображение, а пиксели OLED-матриц светятся сами по себе, то подсветка E-Ink-дисплеев работает точно также, как и естественное освещение. В силу особенностей электронной бумаги, расположение источника света позади пигментного слоя оказывается практически бессмысленным: чтобы оценить всю «эффективность» такого подхода, просто попробуйте посмотреть на лампу сквозь лист плотной бумаги, и вы сразу поймете, о чем идет речь. Именно поэтому свет, излучаемый светодиодами, распространяется в узком внешнем слое экрана, освещая поверхность пигментной матрицы сверху, словно вы читаете обычную книгу в свете электрической лампы.
В ридерах верхнего ценового сегмента подсветка реализована по технологии «flicker-free», то есть, у нее полностью отсутствует мерцание, что делает чтение еще более комфортным для глаз. А некоторые модели электронных книг также позволяют настраивать цветовую температуру подсветки. Хотя прямого влияния на остроту зрения данная функция не оказывает, характер освещения отражается на ментальном состоянии человека.
Так, например, оптическое излучение теплых тонов с желтоватым оттенком (около 3000K) воспринимается мозгом, как солнечный свет на закате, действуя на организм успокаивающе и расслабляюще, поэтому такая подсветка станет оптимальным выбором для любителей почитать перед сном. Холодный же белый свет (5000K), напротив, ассоциируется с полуденным солнцем, улучшая концентрацию внимания и снижая уровень сонливости, а значит, такая подсветка идеально подойдет для работы с документами.
Наконец стоит упомянуть, что поверхность E-Ink-экранов имеет матовое покрытие, «размывающее» отраженный свет и препятствующее появлению бликов, что также делает чтение более комфортным.
Лайфхак!
Читалки годятся не только для чтения романов, но и отлично подходят для работы с документами. Единственная проблема, с которой вы можете столкнуться — некорректное распознавание определенных форматов текстовых файлов, или полное отсутствие поддержки некоторых из них. Решить ее поможет бесплатный менеджер электронных книг с открытым исходным кодом Calibre, который позволяет не только удобно управлять вашей электронной библиотекой, но и может похвастаться функцией массовой конвертации файлов из одного формата в другой, благодаря чему вы сможете буквально в пару кликов перевести документы DOCX в более подходящие для электронной книги EPUB или FB2.
P.S. На просторах интернета можно отыскать немало так называемых «тренажеров» для глаз, выполненных в виде приложений или видеороликов, все тренировки на которых сводятся к слежению за движущимися объектами и трехмерными формами. Такие псевдотренажеры никак не помогут вам в борьбе с компьютерным зрительным синдромом, а лишь вызовут еще большую усталость глаз, чему, в частности, способствует любовь авторов подобных творений к кислотным цветам и ярким вспышкам.
Пускай наше сознание достаточно легко обмануть с помощью оптических иллюзий, для глаза условный бесконечный коридор, уходящий вдаль, останется все тем же плоским изображением на поверхности монитора, и сколько бы вы на него ни смотрели, цилиарная мышца по-прежнему будет находиться в сильном напряжении. Куда полезнее сделать перерыв на несколько минут и полюбоваться видом из окна. Даже если там нет ровным счетом ничего примечательного, разглядывание удаленных объектов поможет вашим глазам расслабиться и прийти в норму.
Облачные серверы от Маклауд быстрые и недорогие.
Зарегистрируйтесь по ссылке выше или кликнув на баннер и получите 10% скидку на первый месяц аренды сервера любой конфигурации!
Фото с ресурса Unsplash. Автор: Daniil Kuželev
Вы часто пользуетесь компьютером или смартфоном? Вынуждены проводить много времени за компьютером из-за работы? Тогда вы неосознанно подвергаете риску свое зрение.
В среднем разработчик программного обеспечения проводит за компьютером не менее 8 часов в день, при этом он часто использует несколько мониторов. При такой продолжительной работе остается мало времени на активный отдых, что негативно сказывается на физическом здоровье. К тому же синее излучение от экранов устройств неблагоприятно воздействует на мозг, в результате чего нарушается сон. Синий свет подавляет выработку мелатонина — гормона, который регулирует цикл сна и бодрствования.
Другим последствием длительного использования компьютера является возможность развития компьютерного зрительного синдрома.
Как не закончилась эта история
Созданная под руководством нижегородцев библиотека OpenCV приобрела всемирную популярность в IT-среде. К настоящему времени она скачана уже более 20 млн раз. Но скачивают ее не конечные пользователи, а разработчики. Пользователей у нее – несколько миллиардов. Ведь ее элементы применялись при разработке Android и iOS, а следовательно, каждый владелец смартфона на планете пользуется трудом нижегородских программистов. Использована OpenCV и при разработке многих других гаджетов и устройств. Но, как объяснил Вадим Писаревский, документировано утверждать этого нельзя: лицензия OpenCV очень либеральная и позволяет «копипастить код» (переиспользовать в любом виде), а компании-производители, если есть возможность не указывать использование в разработке своего продукта OpenCV, этого и не делают.
Мировое сообщество пока не видит потолка развития технологии компьютерного зрения. А технологии Искусственного интеллекта едва оторвались от пола. Поэтому библиотека OpenCV будет расти еще долго, и как эти технологии изменят жизнь человечества, пока не может предсказать никто.
Головные боли, ощущение рези в глазах, словно под веки кто-то насыпал песка, застилающая взор пелена — все эти симптомы отлично знакомы каждому, кто вынужден проводить за экраном компьютера по несколько часов к ряду. Большинство людей относится к проявлениям компьютерного зрительного синдрома как к чему-то само собой разумеющемуся, и совершенно напрасно, ведь запущенный КЗС способен обернуться серьезными осложнениями в будущем. Как же предотвратить их появление и навсегда избавиться от столь неприятного недуга? Попробуем разобраться.
2. Разберитесь с синим светом при помощи программы f.lux
Как я уже говорил в начале, синий свет — одна из главных причин ухудшения зрения. В небольших количествах он не опасен для глаз, однако его длительное воздействие может нанести непоправимый вред.
f.lux — это межплатформенное программное обеспечение, созданное для снижения усталости глаз. Оно настроит цветовую температуру экрана в соответствии с вашим географическим местоположением и временем суток. Эта программа особенно полезна для людей, работающих по ночам, так как она значительно уменьшает количество синего света, излучаемого экраном.
5. Цифровые вывески
Компьютерное зрение может изменить то, как выглядят баннеры и реклама в магазинах, музеях, стадионах и развлекательных парках.
На стенде Panasonic была представлена демоверсия технологии проецирования изображения на флаги. С помощью инфракрасных маркеров, невидимых для человеческого глаза, и стабилизации видео, эта технология может проецировать рекламу на висящие баннеры и даже на флаги, развевающиеся на ветру. Причем изображение будет выглядеть так, будто бы оно действительно на них напечатано.
Как к разработке компьютерного зрения привлекли мировое сообщество
Вскоре после первого успеха американский инициатор проекта Гари Брадски убедил руководство Intel развивать технологию в виде свободно распространяемой библиотеки с открытым исходным кодом. То есть, доступ к разработке Intel мог бесплатно получить любой программист мира. Сейчас, когда все крупные компании участвуют в разработке открытого кода и поддерживают проекты, разрабатываемые другими командами, это решение кажется очевидным. Но тогда, 20 лет назад, компании еще не были готовы вкладываться в разработки, которые затем выложат в открытый доступ, и конкуренты смогут использовать их бесплатно. Аргументом в пользу такого решения могло служить только то, что Intel не сможет зарабатывать на производстве и продаже более мощных процессоров, если не будет существовать программного обеспечения, требующего большей вычислительной мощности.
В 2000 году библиотека получила свое нынешнее название OpenCV. «Я думаю, что это было единственно верное решение, – заявляет Вадим Писаревский. – Такие большие проекты не в силах реализовать не только один человек, но и одна команда. Они под силу только мировому IT-сообществу». Десятки тысяч программистов со всего мира стали пользоваться разработками программистов Intel, но и тысячи энтузиастов начали присылать разработанные ими патчи[3] для развития библиотеки.
Библиотека быстро росла и превратилась в мощный инструмент для развития технологии компьютерного зрения. Если раньше каждый программист должен был начинать любую свою разработку с азов, создавая простейшие программы, то теперь он использовал для нее готовые модули OpenCV. Поэтому OpenCV резко снизил порог входа на рынок. Для иллюстрации этого тезиса один из участников проекта (сегодня – руководитель Intel IOTG Computer Vision) ирилл Корняков рассказал о своей работе со студентами: «Во время пандемии группа из трех студентов-второкурсников, сидя на карантине, за пару недель реализовала проект, позволяющий детектировать: есть ли на лице человека маска? Актуальная тогда тема. Еще лет десять назад на этот проект взяли бы группу высококвалифицированных программистов и дали бы им на работу несколько месяцев. Теперь, благодаря использованию возможностей OpenCV, такая разработка даже на уровень курсовой не тянет».
1. Используйте правило «20-20-20»
Это один из самых простых лайфхаков, который не даст глазам утомиться и который широко применяется в офтальмологии. Идея состоит в том, чтобы заставить себя фокусировать взгляд на разных объектах. Длительное фокусирование на одной точке может вызывать усталость глаз. Поэтому следуйте правилу: каждые 20 минут смотрите в течение 20 секунд на объект, расположенный в 20 футах (6 метрах) от вас.
Сначала вы будете забывать делать перерыв каждые 20 минут, и привычку будет сложно выработать. Но вот простая рекомендация, которой следовал я: установите на своем устройстве будильник на каждые 20 минут, чтобы он напоминал вам о правиле.
Это правило может показаться неприемлемым, потому что вам придется прерывать свой рабочий процесс. Но неужели вы предпочтете непрерывно наносить вред своему зрению? Выбор за вами.
2. Персонализация
В будущем благодаря технологии распознавания лиц индивидуальные настройки автомобиля станут значительно лучше.
Так, в концепт-каре Chrysler Portal есть специальные камеры, расположенные за рулем. С помощью компьютерного зрения автомобиль может мгновенно определять личность водителя еще до того, как тот сядет в машину, и загружать его любимые музыкальные композиции, настроить кресло в нужное положение, отрегулировать температуру и так далее. Машина умеет распознавать не только водителя, но и пассажиров, и точно так же автоматически регулировать сиденья и температуру и даже раскрывать шумоподавляющие «коконы», в которых можно послушать любимую музыку. Такие способности не только понравятся владельцам автомобилей, но и смогут сильно повлиять на райдшеринговые сервисы вроде Uber и Lyft.
7. Пользуйтесь компьютерами и смартфонами как можно меньше
Существует достаточно много способов сократить количество времени, которое мы проводим за экранами компьютеров и смартфонов. Сэкономленное время можно потратить с пользой — заняться активностями на свежем воздухе, что благоприятно скажется не только на зрении, но и на физическом и психическом здоровье. Новое хобби — это один из способов уменьшить количество времени, проводимого в соцсетях.
Если вы проводите много времени, читая с компьютера или телефона, попробуйте раздобыть печатную версию материалов и читайте их на бумаге. Если это книга, попытайтесь найти ее у друзей или в библиотеке. Сначала будет трудно, но со временем вы к этому привыкнете.
6. Смартфоны и дополненная реальность
Многие говорили об игре Pokemon Go как о первом массовом приложении с элементами дополненной реальности (AR). Однако как и другие приложения, пытающиеся запрыгнуть на AR-поезд, эта игра больше использовала GPS и триангуляцию, чтобы у пользователей возникло ощущение, что объект находится прямо перед ними. Обычно в смартфонах практически не используются настоящие технологии компьютерного зрения.
Однако в ноябре Lenovo выпустила Phab2 — первый смартфон с поддержкой технологии Google Tango. Эта технология представляет собой комбинацию датчиков и ПО с компьютерным зрением, которая может распознавать изображения, видео и окружающий мир в реальном времени с помощью линзы фотокамеры.
На выставке CES Asus впервые представила ZenPhone AR — смартфон с поддержкой Tango и Daydream VR от Google. Смартфон не только может отслеживать движения, анализировать окружение и точно определять положение, но и использует процессор Qualcomm Snapdragon 821, который позволяет распределять загрузку данных компьютерного зрения. Все это помогает применять настоящие технологии дополненной реальности, которые на самом деле анализируют обстановку через камеру смартфона.
Позже в этом году выйдет Changhong H2 — первый смартфон со встроенным молекулярным сканером. Он собирает свет, который отражается от объекта и разбивается на спектр, и затем анализирует его химический состав. Благодаря программному обеспечению, использующему компьютерное зрение, полученная информация может использоваться для разных целей — от выписки лекарств и подсчета калорий до определения состояния кожи и расчета уровня упитанности.
7. Камеры
В основном компьютерное зрение используется в камерах — так появляются все более умные камеры с новыми способностями, превышающими человеческие возможности.
Компания FLiR Systems выпустила несколько камер с датчиками тепла. Устройства FLIR Duo и Duo R внешне напоминают GoPro или другую экшн-камеру. Их можно прикрепить к любому дрону и отслеживать тепло в различных деловых и бытовых ситуациях — например, можно обнаружить утечку в изоляции крыши или вести воздушную топографическую съемку полей и нефтяных месторождений.
То, чего не может быть: почему наши глаза не дружат с компьютером?
Человеческое тело в его современном виде является плодом миллионов лет эволюции. Отдельные органы и их системы устроены и функционируют именно так, а не иначе, благодаря последовательному формированию и закреплению адаптаций к окружающей среде. Но в отличие от зверей и птиц человек способен не просто адаптироваться к существованию в рамках той или иной экосистемы, но и создавать новые условия обитания для своего вида.
За годы научно-технического прогресса на нашей планете сформировался уникальный объект экосферы — техносфера, частью которой являются персональные компьютеры и многочисленные мобильные гаджеты, которые мы с вами используем каждый день. В полезности этих устройств не приходится сомневаться: каждое из них делает нашу жизнь лучше, помогая решать огромное количество разнообразных задач. Вот только наше с вами тело попросту не успевает подстраиваться под стремительно меняющиеся правила игры.
Зрительная система человека оказалась решительно неготовой к считыванию информации с LCD- и OLED-дисплеев. Все дело в том, что формируемое на мониторе изображение принципиально отличается от всего, что существует в природе:
- символы и картинки, отображаемые на экране, не являются целостными, а состоят из дискретных элементов — пикселей;
- пиксели не имеют четких границ, а потому получаемые изображения оказываются гораздо менее контрастны по сравнению с реальными объектами;
- изображение на экране является самосветящимся (проекционным), тогда как человеческий глаз привык распознавать предметы исключительно в отраженном свете.
Для КЗС характерны следующие симптомы:
- снижение остроты зрения (предметы, которые ранее были четкими, кажутся размытыми);
- нарушение аккомодации (выражается в замедлении фокусировки при переводе взгляда с ближних предметов на дальние и обратно);
- эффект Мак-Калаха (при резком переводе взгляда с дисплея на черный или белый предмет он окрашивается в цвет, доминирующий на экране);
- диплопия (двоение в глазах);
- астенопия (зрительный дискомфорт, повышенная утомляемость и общее снижение работоспособности);
- головные боли, боли в области шеи.
Компьютерный зрительный синдром чреват рядом осложнений, наиболее серьезными из которых являются спазм цилиарной мышцы и привычно-избыточное напряжение аккомодации (ПИНА), которые, в свою очередь, способствуют прогрессированию миопии (близорукости), а у пользователей ПК старше 35 лет провоцируют преждевременное развитие пресбиопии (возрастной дальнозоркости, обусловленной необратимыми изменениями структуры хрусталика). В свою очередь, синдром «сухого глаза» способен вызвать развитие конъюнктивита (воспаление слизистой оболочки глаза), мейбомита (воспаление сальных желез, расположенных в толще хрящей век) и даже язвенного кератита — воспаления роговой оболочки глаза, сопровождаемого нарушением целостности ее эпителиального слоя и затрагивающего строму роговицы.
Заключение
Я поделился с вами советами, которые применяю в повседневной жизни, чтобы сохранить зрение. Однако существуют и другие различные способы. Можно даже попробовать носить компьютерные очки, получив соответствующий рецепт у врача.
В мире, где правят технологии, наши глаза ежедневно подвергаются вредному воздействию. Поэтому обязательно позаботьтесь о своем зрении!
Самые крупные стенды с компьютерным зрением принадлежат автомобильной промышленности. В конце концов, технологии беспилотных и полуавтономных автомобилей работают, во многом, благодаря компьютерному зрению.
Продукты компании NVIDIA, которая уже сделала большие шаги в области глубинного обучения, используются во многих беспилотных автомобилях. Например, суперкомпьютер NVIDIA Drive PX 2 уже служит базовой платформой для беспилотников Tesla, Volvo, Audi, BMW и Mercedes-Benz.
Технология искусственного восприятия DriveNet от NVIDIA представляет собой самообучаемое компьютерное зрение, работающее на основе нейронных сетей. С ее помощью лидары, радары, камеры и ультразвуковые датчики способны распознавать окружение, дорожную разметку, транспорт и многое другое.
NVIDIA и Audi планируют в 2020 году выпустить на трассу первую полностью автономную машину, которая будет использовать новый суперкомпьютер Xavier AI.
Генеральный директор NVIDIA Джен-Сан Хуанг представляет ИИ Co Pilot. Фото: NVIDIA
NVIDIA также представила искусственный интеллект Co Pilot, который способен распознавать лица, движения губ, направление взгляда и язык — из-за чего водить автомобиль станет удобнее. Так, например, благодаря распознаванию движения губ компьютер будет лучше понимать произносимые слова, а способность улавливать направление взгляда (анализ глаз, лица и положения головы) поможет не только определить, не заснул ли водитель, но и спасет в трудных ситуациях, когда человек не замечает опасность — например, приближающегося сзади по центру дороги мотоциклиста. Что касается считывания движения губ, то сейчас сети, использующие глубинное обучение, способны распознавать речь с точностью до 95%, в то время как человек распознает ее с точностью в 3%. Сейчас эта невероятная способность используется для улучшения распознавания речи в автомобиле, а именно в шумных ситуациях.
Настройте яркость монитора в соответствии с общим уровнем освещенности
Яркость экрана должна соответствовать уровню освещенности окружения. Чтобы правильно ее настроить, достаточно открыть пустую страницу в Word или Google Docs. Если белый лист на экране нестерпимо сияет, подобно лампе, значит яркость следует убавить. Если же он, напротив, кажется вам сероватым и тусклым, яркость необходимо увеличить.
Лайфхак!
Снизить нагрузку на глаза поможет и верный выбор размера шрифта. Для его расчета можно воспользоваться так называемым «тройным правилом»: кегль должен быть таким, чтобы вы смогли свободно прочесть текст на экране с дистанции, в три раза превышающей стандартную. То есть, если обычно вы сидите на расстоянии 60 см от монитора, то должны различать буквы и со 180 см.
Обустройте свое рабочее место
Как бы банально это ни прозвучало, но все, что необходимо знать об организации рабочего места пользователя ПК содержится в СанПиН 2.2.2/2.4.1340-03. Несмотря на то, что с 1 января 2021 года данный документ утратил юридическую силу, пройдя через так называемую «регуляторную гильотину», множество изложенных в нем требований отнюдь не потеряло своей актуальности. Единственный недостаток этого перечня правил заключается в излишней сухости изложения и громоздких оборотах, столь характерных для любых подзаконных актов. Чтобы вам не пришлось мучиться, продираясь сквозь тернии канцелярита, обозначим ключевые моменты.
Начнем с параметров вашего рабочего кабинета. Его окна должны быть ориентированы на север и северо-восток — это позволит добиться оптимального естественного освещения в дневное время и поможет избежать ситуаций, когда слепящее солнце будет светить прямо в оконный проем в утренние и вечерние часы. Если окна расположены неудачно, для рассеивания света на них необходимо установить жалюзи. Для внутренней отделки помещения лучше всего использовать диффузно-отражающие материалы с коэффициентом отражения 0.7–0.8 для потолка, 0.5–0.6 для стен и 0.3–0.5 для пола. Такая градация позволит добиться максимально естественного распределения светового потока внутри комнаты.
Рабочий стол следует разместить таким образом, чтобы свет из окон падал на него сбоку (наиболее оптимально — слева). Ни в коем случае не ставьте стол так, чтобы оконный проем оказался за вашей спиной или, напротив, прямо позади монитора. Сам монитор должен находиться непосредственно перед вашим лицом, а не сбоку. Оптимальное расстояние от глаз до поверхности экрана должно составлять 60–70 см, но не менее 50 см. Центр экрана должен располагаться ниже уровня глаз на 15–20 градусов. Чтобы не мучится с расчетами, предлагаем воспользоваться следующей табличкой:
Горизонтальное расстояние от глаз до монитора | Вертикальное смещение центра монитора вниз |
50 см | 13-15 см |
60 см | 16-18 см |
70 см | 19-20 см |
Из поля зрения необходимо убрать светильники, а также любые яркие и бликующие предметы (зеркала, керамику, картины с застекленными рамами, и т.д.). Хорошим выбором для оборудования кабинета станет мебель с антибликовой поверхностью.
Искусственное освещение должно быть как можно более равномерным и не создавать бликов на поверхности экрана. Уровень освещенности последнего не должен превышать 300 люкс, тогда как освещенность рабочего стола должна находиться в пределах 300–500 люкс: это необходимо для того, чтобы при работе с документами вам не пришлось использовать местное освещение высокой интенсивности, что также категорически запрещено. Если в процессе работы вам периодически необходимо обращаться к печатным материалам, старайтесь располагать их в пространстве между клавиатурой и монитором, либо рядом с ним на примерно таком же расстоянии (для этих целей можно воспользоваться специальным держателем).
Сухость глаз
Это состояние возникает при редком моргании. Как правило, программист настолько погружен в свои задачи, что даже забывает моргать! Исследования показывают, что, используя компьютер или смартфон, люди моргают в два раза реже.
Моргание необходимо для обновления слезной пленки, которая помогает сохранять глаза увлажненными. Редкое моргание приводит к ее разрушению, и в глазах возникает сухость. Чтобы узнать, не страдаете ли вы от синдрома сухого глаза, необходимо проконсультироваться с врачом.
Дискомфорт, раздражение, затуманенное зрение, ощущение инородного тела в глазу, покраснение глаз — все это возможные признаки синдрома сухого глаза. Если такие симптомы беспокоят вас уже долгое время, обратитесь к врачу.
Последствия компьютерного зрительного синдрома
Освойте слепой метод печати
Сразу оговоримся, что в данном случае речь не идет об эталоном десятипальцевом методе, основная цель которого заключается в том, чтобы достичь максимальной производительности при наборе текста. Безусловно, это — весьма полезный навык для любого программиста, писателя или офисного работника, однако главное, чему вы должны научиться — не смотреть на клавиатуру в процессе работы.
При этом абсолютно неважно, сколько пальцев вы задействуете и насколько верно распределяете между ними клавиши. Ведь на здоровье глаз влияет не скорость печати, а лишняя нагрузка на аккомодационный аппарат, которая возникает при постоянной перефокусировке зрения, когда вы чуть ли не каждое мгновение переводите взгляд с монитора на клавиатуру (которая, к тому же, расположена еще ближе, чем экран) и обратно. Чтобы научиться печатать вслепую, вы можете воспользоваться одним из многочисленных руководств, курсов или клавиатурных тренажеров, доступных на просторах интернета.
Лайфхак!
Обучаемость слепому методу печати во многом зависит от психофизиологических особенностей конкретного человека. На первых порах многим бывает крайне сложно отказаться от привычки подглядывать на клавиши. Здесь может помочь приобретение кейкапов без маркировки. По мере того, как вы будете запоминать расположение клавиш, меняйте кейкапы с выученными буквами и символами на пустые.
Компромиссным решением может стать переход на кейкапы с боковой гравировкой.
С одной стороны, бросив взгляд на такую клавиатуру, вы не сможете увидеть символы сразу, что делает ее очень удобной для использования в обучающих целях. В то же время, если вы напрочь забудете значение той или иной клавиши, то всегда сможете подглядеть, лишь слегка наклонив голову.
Старайтесь чаще моргать
Пускай данный совет звучит довольно странно, однако это — наиболее действенный и физиологичный способ избавления от синдрома «сухого глаза», развивающегося при КЗС. Сперва вам будет сложно отслеживать количество миганий, однако регулярно прикладывая волевые усилия и заставляя себя моргать чаще (примерно каждые 3–5 секунд), вы в конце концов приучите свой организм к новому ритму и нормализуете увлажнение роговицы.
Лайфхак!
Отличным подспорьем здесь станет бытовой увлажнитель воздуха. Повышение уровня влажности в помещении позволит снизить скорость испарения секрета слезных желез с поверхности роговицы и дополнительно защитить ваши глаза.
3. Интерфейсы
Технологии отслеживания движения глаз с помощью компьютерного зрения используется не только в игровых ноутбуках, но и в обычных, и корпоративных компьютерах, для того чтобы ими могли управлять люди, которые не могут воспользоваться руками. Tobii Dynavox PCEye Mini представляет собой устройство размером с шариковую ручку, которое станет идеальным и незаметным аксессуаром для планшетов и ноутбуков. Также эта технология отслеживания движения глаз используется в новых игровых и обычных ноутбуках Asus и смартфонах Huawei.
Тем временем продолжает развиваться жестовое управление (технология компьютерного зрения, которое может распознавать особые движения руками). Теперь оно будет использоваться в будущих автомобилях BMW и Volkswagen.
Новый интерфейс HoloActive Touch позволяет пользователям управлять виртуальными 3D-экранами и нажимать кнопки в пространстве. Можно сказать, что он представляет собой простую версию самого настоящего голографического интерфейса Железного человека (он даже точно так же реагирует легкой вибрацией на нажатие элементов). Благодаря таким технологиям, как ManoMotion, можно будет легко добавить жестовое управление практически в любое устройство. Причем для получения контроля над виртуальным 3D-объектом с помощью жестов ManoMotion использует обычную 2D-камеру, так что вам не понадобится никакое дополнительное оборудование.
Устройство eyeSight’s Singlecue Gen 2 использует компьютерное зрение (распознавание жестов, анализ лица, определение действий) и позволяет управлять с помощью жестов телевизором, «умной» системой освещения и холодильниками.
Краудфандинговый проект Hayo, пожалуй, является самым интересным новым интерфейсом. Эта технология позволяет создавать виртуальные средства управления по всему дому — просто подняв или опустив руку, вы можете увеличить или уменьшить громкость музыки, или же включить свет на кухне, взмахнув рукой над столешницей. Все это работает благодаря цилиндрическому устройству, использующему компьютерное зрение, а также встроенную камеру и датчики 3D, инфракрасного излучения и движения.
Соблюдайте правило 20–20–20
Данный способ «разгрузки» зрительного аппарата был предложен Американской оптометрической ассоциацией. Суть методики предельно проста: все, что требуется при длительной работе за компьютером — каждые 20 минут делать 20-секундные перерывы и разглядывать удаленные предметы, расположенные от вас на расстоянии не менее 20 футов (около 6 метров). В этот момент цилиарная мышца глаза максимально расслабляется, что помогает предотвратить ее спазм.
Лайфхак!
На основе правила 20–20–20 было создано немало приложений-помощников, начиная от простых напоминалок и заканчивая программами, принудительно блокирующими монитор компьютера по прошествии заданного времени (к таковым относится, например, POMY — бесплатная утилита, доступная в версиях для Windows 10 и macOS). Если вам сложно контролировать себя, рекомендуем воспользоваться одним из подобных советников.
5. Проконсультируйтесь с врачом
Несомненно, лучший и самый очевидный способ проверить здоровье глаз — это сходить на прием к врачу. В отличие от других болезней, снижение зрения заметить не так просто, потому что это постепенный и медленный процесс. К тому же чаще всего люди не обращают внимания на симптомы нечеткого зрения (вроде головной боли), поскольку это обычная боль, с которой многие сталкиваются в повседневной жизни. Это может привести к тому, что патологии зрения не будут выявлены и вылечены.
Всем постоянным пользователям компьютеров рекомендуется посещать офтальмолога раз в год, чтобы убедиться, что со зрением все в порядке.
Как OpenCV ушла от Intel к Intel
Разумеется, интерес к столь удобному инструменту быстро рос. Количество пользователей OpenCV резко увеличилось, но энтузиазм Intel по развитию этой библиотеки в середине 2000-х стал угасать. Команда с пиковой численности примерно в 30 сотрудников была уменьшена до двух человек. А в 2009 году Intel официально прекратил проект «OpenCV». Решения крупных компаний иногда трудно понять, но разработчики проекта объясняют отказ американской корпорации от OpenCV тем, что библиотека на протяжении нескольких лет не приносила компании прямого дохода. «Да, технология интересная, да, выглядела перспективно, но в то время было непонятно, как ее можно монетизировать», – рассуждает Валерий Черепенников (сегодня – вице-президент Российского Исследовательского Института Huawei (Huawei Russian Research Institute, RRI).
После отказа Intel от финансирования OpenCV Вадим Писаревский на протяжении нескольких лет поддерживал библиотеку бесплатно, «на общественных началах». И если бы он не делал этого, то проект, скорее всего, умер бы, повторив судьбу многих других открытых библиотек, оставшихся без поддержки. «Если кто-то не будет постоянно отслеживать работу с библиотекой, она затухнет. Проектов с открытым кодом тысячи, и большинство из них, к сожалению, погибли», – утверждает Валерий Черепенников.
Часть нижегородских программистов – разработчиков OpenCV – также решили не отказываться от освоенной ими темы. Они уволились из Intel и основали собственный микробизнес: Центр компьютерного зрения «Аргус». Довольно быстро этот бизнес из микро- вырос в малый, а затем и в совсем немалый. На его основе была создана компания Itseez, с офисами в Нижнем Новгороде и Сан-Франциско, в которой работали более 100 инженеров. «В то время выяснилось, что на основе OpenCV можно разрабатывать продукты, которые хорошо работают не только на процессорах Intel», – вспоминает Виктор Ерухимов. Так NVIDIA Corporation стала использовать разработки нижегородцев для развития своих графических ускорителей и автомобильных бортовых компьютеров. А разработчик персональных роботов – помощников для дома Willow Garage даже совершил революцию в робототехнике. «Я сам писал программу для Willow Garage, благодаря который робот при разряде аккумулятора зрительно находит в комнате розетку, подъезжает к ней, и своей рукой вставляет в нее вилку для подзарядки батареи», – вспоминает Виктор Ерухимов.
Компьютерное зрение стало приносить реальные деньги. Когда руководство Intel осознало, что другие компании успешно конкурируют на ими же созданной площадке, корпорация вновь взялась за развитие этой технологии сразу в трех своих подразделениях: в Нижнем Новгороде, в США и Китае. А в 2016 году Intel купил основанную своими бывшими нижегородскими сотрудниками и известную, прежде всего, ключевой ролью в развитии библиотеки OpenCV компанию Itseez.
Читайте также: