Чем когнитивные сервисы отличаются от обычных компьютеров
Статья посвящена новому поколению компьютинга, получившего название "когнитивный".
Содержание
Современная реализация
Когнитивные системы обучаются благодаря искусственным нейронным сетям. Это сложные математические модели, которые (пока только в общих чертах) имитируют принципы работы и клеточную организацию природной нервной системы. Так, искусственные нейронные сети состоят из подобий нейронов — нервных клеток мозга, представленных математическими функциями. Взаимодействие этих функций позволяет компьютерным системам многогранно анализировать изображения, речь и другие данные, обучаться с их помощью, строить гипотезы и принимать решения подобно тому, как обмен сигналами между органическими нейронами позволяет совершать аналогичные процессы людям. В этом вся магия.
Условное изображение биологической нейронной сети
Ни модные флагманские смартфоны, ни даже самые мощные игровые ПК не способны эффективно моделировать нейронные сети. Все столь популярные сегодня устройства, как ни странно, спроектированы по дедовскому принципу 70-летней давности. Его называют архитектурой фон Неймана в честь венгерского математика, который описал эту концепцию в 1940-ых годах. Ее неотъемлемая особенность и по совместительству серьезный недостаток — это последовательность вычислений. Традиционные компьютеры выполняют команды поочередно, всего по одной за раз или по несколько одновременно. Такого количества не хватает для быстрой генерации сложных нейронных сетей, поскольку клетки мозга совершают слишком много вычислений параллельно.
Чтобы обойти фон-неймановские ограничения, современные мыслящие машины строят на базе суперкомпьютеров массово-параллельной архитектуры. Она ускоряет вычисления, распределяя их между множеством синхронно работающих чипов. Например, аппаратная часть когнитивной системы IBM Watson на момент появления в 2011 году состояла из девяноста серверов с четырьмя восьмиядерными процессорами POWER7 в каждом. В качестве операционной системы для Watson IBM выбрала Linux, дополнив ее собственными программными решениями для реализации нейронных сетей и прочих когнитивных технологий. Сложно сказать, что сейчас под капотом у Watson, но в 2014 году компания заявила, что уменьшила габариты системы на 90% до размера трех коробок для пиццы, ускорив ее при этом в 24 раза. Впечатляет?
Суперкомпьютер Watson, 2011 год. Фото: IBM
По мнению аналитика компании Neuralytix Тома Петрочелли, когнитивные технологии — прекрасное дополнение к традиционной ИТ-экосистеме. Согласно прогнозам эксперта, количество полностью когнитивных приложений будет небольшим, но некоторые их функции интегрируют во многие обычные программы. Уже сейчас IBM предлагает набор облачных сервисов на базе Watson и все необходимые инструменты для их внедрения во внешние продукты. C помощью предоставленных API (наборы кодов для разработчиков) программисты могут создавать свои решения на базе платформы Watson на таких популярных языках, как Java и Node.js.
Когнитивные системы будут сосуществовать с традиционными и дополнять их, но не заменят полностью.
Важно понимать, что когнитивные технологии все еще находятся в начале своего пути. Впервые они привлекли внимание массовой аудитории четыре года назад. Тогда все тот же суперкомпьютер Watson обошел живых игроков в популярной интеллектуальной викторине Jeopardy (нашему зрителю это телевизионное шоу известно под названием «Своя игра»). IBM позиционирует его как единственную на текущий момент полноценную платформу в сфере когнитивных технологий и искусственного интеллекта. Компания ищет новых бизнес-партнеров для внедрения своих разработок и уже имеет опыт в этом направлении.
Пожалуй, Watson до сих пор остается одной из самых популярных систем в своем классе. Он уже продемонстрировал себя знатоком языка и сейчас учится видеть. Помимо Watson, некоторые источники связывают с когнитивными технологиями широко известные голосовые помощники Google Now и Siri. Конечно, есть и другие проекты менее популярных компаний. Кроме того, как отмечает Петрочелли, часть работы над подобными системами ведется на университетском уровне и в исследовательских организациях вроде SRI и Microsoft Research.
Как устроен когнитивный компьютер
Возможности и сферы применения
Варианты использования когнитивных систем безграничны. Беспилотные автомобили, дроны, очки для незрячих и любая другая техника, которая нуждается в обработке визуальных, аудио- и других форматов сенсорных данных, — все это в сумме лишь малая часть огромного плацдарма для внедрения когнитивных технологий. Если учесть лингвистические способности мыслящих систем, со временем они наверняка будут обеспечивать работу поисковиков, переводчиков, голосовых ассистентов и прочих программ, ориентированных на широкую аудиторию (если еще этого не делают). Ну и, конечно, нельзя забывать о потенциале когнитивных машин в качестве аналитических центров.
В исследовании Your Cognitive Future компания IBM поделилась официальным видением того, как когнитивные системы могут изменить наше обозримое будущее. Прогноз основан на мнениях большого количества экспертов из различных индустрий и анализе IBM собственного опыта разработки и внедрения подобных технологий. Компания выделила три направления, в которых прослеживаются самые перспективные возможности когнитивных систем: взаимодействие с пользователем, аналитика и принятие решений.
Взаимодействие с пользователем. От когнитивных систем ожидают способности вести естественный «глубокий диалог» с людьми. Мыслящие машины движутся в сторону точного распознания объектов, мимики, жестов, полноценного понимания языка со всеми его смысловыми и эмоциональными оттенками. В итоге теоретически мы будем свободно общаться с программами природным для нас способом. Звучит интригующе, но сможем ли мы когда-нибудь болтать с машинами, как Тони Старк с Джарвисом, и сколько для этого понадобится времени — пока неясно.
Тони Старк отдает голосовые команды виртуальному ассистенту Джарвису. Фото: кадр из кф. «Железный человек»
Современный уровень взаимодействия когнитивной системы с пользователем могут оценить, например, клиенты организации USAA, которая предоставляет финансовые услуги американским военным. Сайт учреждения подключен к облачной когнитивной системе Watson, которая автоматически и беспристрастно отвечает на текстовые вопросы пользователей в веб-интерфейсе. По официальной информации, сервис обучался шесть месяцев под присмотром экспертов. Люди научили его интерпретировать более 3 000 типов документов и обрабатывать несколько тысяч вопросов, независимо от формулировок.
Аналитический потенциал. На основе анализа огромных массивов информации когнитивные системы могут делать собственные выводы, к которым, возможно, даже лучшие умы человечества никогда не способны прийти самостоятельно. Исследовательский процесс когнитивной системы включает поиск закономерностей и новых идей в больших объемах данных, а также их интерпретацию. В условиях информационной перегрузки такие технологии могут стать незаменимыми помощниками ученых, аналитиков и всех других пользователей, чья работа связана с исследовательской деятельностью.
В качестве примера, который характеризует аналитические возможности когнитивных систем, IBM приводит результаты использования сервисов Watson сотрудниками Медицинского Колледжа Бейлора. С их помощью ученые выявили белки, которые воздействуют на p53 — другой белок, разрушающий раковые клетки. Это открытие должно помочь в создании новых лекарств от болезни. На него система потратила несколько недель, в течение которых обработала более 70 000 научных статей о p53. По данным IBM, специалистам понадобился бы год для этой работы без Watson.
Принятие решений. Когнитивные системы умеют самостоятельно принимать решения, опираясь на знания, полученные от экспертов, найденные данные и собственные выводы. Эти решения всегда непредвзяты. Компьютер генерирует их на основе доказательной базы, которую он формирует. Пока когнитивные системы выступают чаще умными помощниками, чем полностью автономными и самодостаточными сервисами. Они предлагают пользователю возможные варианты, но конечное решение — за человеком. При этом программы позволяют проверять обоснованность своих версий, предоставляя инструменты для проверки.
Согласно примеру IBM, ее когнитивные сервисы участвуют в процессе принятия решений для крупной американской компании WellPoint, которая предоставляет услуги медицинского страхования. По статистике сотрудники тратят до 60% рабочего времени только на сбор и обработку информации от клиентов, чтобы принять решение об оказании услуги или отказе. Если верить IBM, когнитивная система существенно экономит время персонала, выполняя большую часть аналитической работы. Она изучает записи врачей, истории болезней, комментарии клиник и т.д. и составляет на их основе соответственные рекомендации для сотрудников WellPoint.
История и предпосылки появления когнитивного компьютинга
Без слова «компьютинг» обойтись сложно, хотя оно с заметным трудом пробивается в русский язык, повторяя сложную судьбу слова «компьютер», которое поначалу появилось в сочетании с «персональный». Тогда потребовался не один год на то, чтобы «компьютер» вытеснил аббревиатуру ЭВМ. Что касается слова computing, то оно является синонимом counting или calculating, переводимых как «вычисления». Но под давлением обстоятельств это слово приобрело иной смысл, вобрав в себя разнообразные операции по использованию компьютеров, электронные процессы, происходящие внутри них (аппаратное обеспечение), управление ими (программное обеспечение) и концептуальные основы (computer science, компьютерные науки). То есть компьютинг стал частью багажа цивилизации.
Обычно выделяют три эпохи компьютинга, а его история синхронна с историей промышленных революций.
Первая революция – дифференциальная и аналитическая машины Бэббиджа, другие механические устройства и, конечно же, арифмометр Однера. Его советский вариант, известный под именем «Феликс», выпускался до начала семидесятых годов 20 века.
Вторая – табуляторы Германа Холлерита, обеспечившие могущество созданной им IBM. Компания была к ним так привязана, что не сразу признала компьютеры. Табуляторы выпускались в ряде стран. Массивные и очень шумные они оказались настолько востребованными, что даже в семидесятые годы в вузах существовала специальность «Механизация вычислительных работ».
Третья – нынешнее монопольное положение программируемых компьютеров. Все они без исключения построены по модели Джона фон Неймана. Слова «программист» и «программа» стали символом времени, однако по сути, программа - это ни что иное, как запись заранее запланированной последовательности действий.
Программное решение прекрасно подходит для замкнутых систем (древнейший пример – кулачковый вал двигателя внутреннего сгорания). Но программа, как фиксированная последовательность действий, не предполагает взаимодействия с внешним миром, способного нарушить заданный наперед порядок. Так в основном и работают универсальные компьютеры, от персональных до мэйнфреймов.
Для работы с периферийными устройствами, начиная от интерфейсных устройств и до средств связи со сложными объектами, нет иного способа реагирования, как механизм обработки прерываний. Каким бы сложным он не был, суть сводится к передаче управления к другому заранее заготовленному фрагменту программы и только.
До тех пор, пока сфера применения компьютеров ограничивалась расчетами, технологическими системами управления, системами управления базами данных и другими классическими в нынешнем смысле приложениями, программирование фон Неймана не вызывало нареканий. Огромные инженерные силы были направлены на преодоление «бутылочного горла» - другой ее слабости. Вот что сказал о ней руководитель команды создателей первого высокоуровневого языка программирования "Фортран" Джон Бэкус на церемонии вручения ему Тьюринговской премии в 1977 году:
И вот теперь, когда инженерам в определенной мере удалость с помощью многоуровневых кэшей и других уловок временно преодолеть эту слабость за счет чудовищного переусложнения архитектуры процессоров, на первый план выходит ограниченность возможностей именно программирования.
Альтернативой программирования могут стать когнитивные компьютерные системы или Cognitive Computing. Аналитики уже говорят о наступлении эры когнитивного, то есть разумного компьютинга или компьютинга со способностью к мышлению.
Сравним программируемый компьютер с когнитивным.
Исследования
Роль IBM в когнитивном компьютинге
Первым по когнитивному пути пошел Watson, победивший 14 февраля 2011 года сильнейших игроков в телевизионной игре Jeopardy! ("Рискуй!"), более известной в России как "Своя игра". С этого дня ведется отсчет эры когнитивного компьютинга.
На самом деле сам Watson в полном смысле разумным не является. В нем используются традиционные программируемые процессоры Power, а специфическим интеллектом обладает работающая на нем вопрос-ответная система, построенная по «архитектуре управления неструктурированной информацией» UIMA. Создав Watson IBM перевела рассуждения о когнитивном компьютинге в практическое русло.
У Watson были и менее удачливые предшественники, во всяком случае на уровне идеологии. Среди них система Wolfram|Alpha и библиотека знаний Cyc. Сам термин Cognitive Computing тоже не нов. Он использовался специалистами в области, известной как «когнитивная информатика» (Cognitive Informatics).
Надо быть большим оптимистом, чтобы допустить скорое появление практических когнитивных компьютеров. Однако, время торопит — при возрастающих объемах данных уже скоро не получится синхронно создавать адекватные аналитические системы. Поэтому IBM предлагает паллиативное решение — когнитивный подход с сохранением существующего технологического базиса (речь идет об интегрированных экспертных системах семейства PureSystems). На макроуровне такие решения можно признать когнитивными, но на микроуровне, на процессорном уровне они вполне традиционны.
Например, авторы PureSystems не делают попыток моделировать мозг: их главная задача в преодолении одной из слабостей современных компьютеров — работы с мелкими фрагментами данных (битами и байтами). Вот что пишут Джон Келли и Стивен Хамм из IBM в книге «Умный компьютер»:
Скорее всего, PureSystems и им подобные стоит назвать системами, управляемыми потоками данных (data driven systems).
Компьютеры новой эры отличаются от существующих ныне по нескольким основным признакам. Центром внимания в нынешних компьютерах являются процессы и процессоры, а в будущих — данные. Соответственно, фиксированные, заранее запрограммированные вычисления уступят место аналитическим подходам.
Если сегодня доминирует ручное управление системами, то в будущем — автоматическое. Одно из важнейших отличий состоит в отношении к масштабированию. Мы привыкли к двум видам масштабирования — вверх (Scale Up) и вширь (Scale Out), а теперь появляется масштабирование внутрь (Scale In), суть которого в интеграции в одну систему (как было в мэйнфеймах) всех основных компонентов, включая процессоры, память, системы хранения и коммутацию.
Дальнейшее развитие
Помимо последовательности вычислений, у современных компьютеров есть и другие недостатки. Некоторые из них затрагивают когнитивые системы. Так, процессор и память отделены друг от друга, но связаны проводником — шиной, по которой происходит обмен данными между ними. Такое строение серьезно ограничивает вычислительную мощность: можно увеличивать производительность процессора или объем памяти, но не так просто повысить пропускную способность шины. Кроме того, в многопроцессорных системах все чипы всегда активны, даже если в этом нет необходимости, что серьезно сказывается на потреблении энергии. Поэтому суперкомпьютеры еще далеки по энергоэффективности от биологического мозга, самой мощной и экономичной вычислительной «машины».
Производители электроники давно ищут способы обойти описанные ограничения, и здесь снова в первых рядах — IBM. Компания работает уже над аппаратной реализацией нейронных сетей, которая должна стать кардинально новым принципом построения когнитивных компьютерных систем. В рамках сотрудничества с организацией DARPA инженеры IBM создали нейросинаптический чип TrueNorth, спроектированный по подобию неокортекса (коры головного мозга). Опять вспоминаем биологию: место контакта между двумя нейронами называется синапсом и служит для передачи сигнала между ними. Новый чип вдохновлен этим строением, он состоит из нейросинаптических ядер, которые моделируют нейроны, связанные между собой синапсами. Такие ядра не только работают параллельно, но также автоматически «засыпают» при неиспользовании и совмещают функции вычисления и памяти — все аналогично природе клеток мозга. Благодаря перечисленным особенностям эта архитектура существенно оптимизирует производительность и энергоэффективность компьютера.
Компактный, производительный и экономичный нейропроцессор TrueNorth — большой шаг когнитивных систем к мобильности.
IBM возлагает большие надежды на будущее нейросинаптических чипов. Новая архитектура позволяет легко увеличивать мощность компьютерных систем путем подключения большого количества таких процессоров. В планах компании — связать 4 096 штук в пределах одной мыслящей системы. В то же время инженеры трудятся над Сorelet — специальным языком, предназначенным для программирования когнитивных процессоров. Существующие стандарты непригодны для новой аппаратной архитектуры, поэтому компания разрабатывает новые принципы построения алгоритмов.
Плата с шестнадцатью нейросинаптическими процессорами TrueNorth. Фото: DARPA
Нейросинаптические чипы не вытеснят полностью традиционные. IBM сравнивает обычные процессоры с левым полушарием человеческого мозга, а когнитивные — с правым. Первые хорошо справляются с логическими операциями вроде вычислений и обработки языка, вторым лучше дается восприятие образов и чувств. У нас в голове все происходит примерно так же. В будущем компания собирается объединить два типа процессоров в одной системе, чтобы сформировать более точную модель органического мозга. Так что, вполне возможно, скоро мы увидим Watson на «стероидах». Кроме того, представители IBM не исключают перспективы использования в когнитивных системах квантовых технологий, о которых мы писали ранее.
Разум вместо программирования. Наступает эра компьютеров, способных к мышлению
Человечество переживает наступление эры когнитивного, то есть разумного компьютинга или компьютинга со способностью к мышлению. Как появился термин Cognitive Computing и что за ним скрывается? Чего и когда ждать от разумных машин? Ответы на эти вопросы дает материал журналиста Леонида Черняка, подготовленный специально для TAdviser.
Первые когнитивные компьютеры "в железе"
Исследовательские проекты
По состоянию на 2017 год известно о четырех значительных проектах, нацеленных на создание нейроморфных компьютеров. Из них два — в Европе: BrainScaleS (Институт физики Гейдельбергского университета) и SpiNNaker (Манчестерский университет) и два — в США: исследования в области когнитивного компьютинга IBM и NeuroGrid (Стэнфордский университет).
Проекты находятся на разных стадиях, но важно заметить, что все четыре так или иначе воплощены «в железе». Они служат стендами для моделирования мозга и для разработки соответствующего программного обеспечения. Впрочем, термин «программное обеспечение» применительно к ним носит условный характер. В нейроморфных компьютерах схемы Тьюринга и фон Неймана, на которых строятся все универсальные процессоры (CPU), либо вообще не реализуются, либо реализуются частично, поэтому нейроморфные компьютеры не являются в полном смысле программируемыми. Скорее, они способны к обучению, и в этом смысле они аналогичны мозгу.
Два европейских проекта составляют содержание девятого из тринадцати пунктов более крупного проекта Human Brain Project, финансируемого Евросоюзом. Он называется SP9. Гейдельбергский компьютер именуется NM-PM-1, а манчестерский — NM-MC-1 (PM расшифровывается как физическая модель, а MC — как многоядерная, обе имеют общий интерфейс). И тот, и другой поддерживают PyNN - платформенно-независимый язык, служащий для создания нейронных сетей (PyNN, произносится как «пайн», — аббревиатура от Python package for simulator-independent specification of Neuronal Network models; проект, как следует из названия, объединяет Python с нейронными сетями).
Цель SP9 — создание компьютерной платформы Neuromorphic Computing Platform, которая позволит ученым проводить эксперименты с системой, моделирующей мозг (Brain Simulation Platform).
Перечисленное выше – только начало. С наступлением зрелости компьютеров когнитивной эры они превратятся в обучаемые и самообучаемые системы. Компьютеры смогут понимать данные, анализировать их, адаптировать и предлагать решения, основанные на данных. При этом, они не заменят человека, а расширят его возможности, взяв на себя рутинную работу по переработке данных и оставив за человеком возможность делать выводы и принимать решения.
Нейроморфный процессор Intel
В сентябре 2017 года Intel представила нейроморфный процессор Loihi, с помощью которого, как утверждают в компании, технологии искусственного интеллекта (ИИ) станут более доступными (подробнее).
2017: IBM: Отрасли будут готовы к внедрению когнитивных решений к 2020 году
Согласно результатам исследования IBM, представленным в сентябре 2017 года, около двух третей (64%) опрошенных руководителей департаментов маркетинга и продаж считают, что отрасли, в которых они работают, будут готовы к внедрению когнитивных технологий в ближайшие три года. Несмотря на это, только 24% респондентов обладают стратегией по внедрению этих решений.
В целом директора по маркетингу и продажам признают, что «удовлетворенность клиентов» станет ключевым фактором при принятии решения о внедрении когнитивных технологий. В то же время, многие респонденты заявили, что не уверены в готовности их организаций к успешному переходу на когнитивные системы.
По мнению опрошенных директоров по маркетингу, два основных преимущества когнитивных технологий заключаются в улучшении клиентского опыта и финансовых результатов, включая повышение доходности предприятий и возможность более эффективной оценки рентабельности маркетинговых кампаний. Директора по продажам с помощью когнитивных технологий стремятся получить всестороннее понимание своих заказчиков. Благодаря ему они смогут улучшить прогнозирование потребностей клиентов и поиск потенциальных покупателей, а также играть большую роль в реализации стратегии предприятия и повышении качества обслуживания.
Доля топ-менеджеров из предприятий-лидеров, которые за последние три года обошли своих конкурентов по таким показателям, как рост выручки, прибыльность и др., составила 13% от общего числа респондентов. Директора по маркетингу и продажам таких предприятий в подавляющем большинстве (93%) считают, что когнитивные технологии уже находятся в зрелой стадии и готовы к выходу на рынок, а 91% уверены, что когнитивные вычисления будут полезны для организации. При этом почти четверть подобных опрошенных (24%) указывают на то, что когнитивные технологии уже используются на их предприятиях. Из числа компаний– рыночных последователей (87% респондентов), только 3% указали на использование когнитивных технологий. Между тем, предприятия-лидеры играют ведущую роль в когнитивной эре: 73% из них уже собирают и обрабатывают внешние рыночные данные.
Об исследовании
Исследование, которое институт IBM Institute for Business Value (IBV) провел совместно с Oxford Economics, основано на глобальном опросе 525 директоров по маркетингу и 389 директоров по продажам из самых разных отраслей. Главная его цель — определить степень готовности экспертов по маркетингу и продажам к внедрению когнитивных технологий.
Рекомендации по переходу к когнитивным вычислениям
Для раскрытия потенциала когнитивных вычислений для решения задач в сфере маркетинга и продаж IBM IBV рекомендует директорам по маркетингу и продажам предпринять следующие действия:
Старожилы русскоязычного интернета в целом и «Компьютерры» в частности наверняка помнят, как создатель Всемирной паутины Тим Бернерс-Ли в своё время предложил термин «Семантический веб», который иногда ещё переводят как «Семантическая паутина». Семнадцатого мая 2001 года в журнале «Scientific American» была опубликована программная статья «Семантический веб», в которой господин Бернерс-Ли изложил основные черты этой новой модели. Если коротко, то семантический веб — это машинный интернет. Если обычно мы извлекаем данные из Сети посредством браузера, который преобразует HTML в понятную и удобную форму, то семантический веб строится на базе онтологий, благодаря которым компьютер может извлекать факты и делать логические заключения.
Собственно говоря, однажды на страницах «Компьютерры» уже была обозначена эта концепция, и ссылка на соответствующую статью есть даже в списке русскоязычной Википедии. В том материале под названием «Ахиллесова пята Семантического Веба» подробно и не без лёгкого хулиганства описан феномен:
«Итак, сводим воедино прекрасную картину Семантического Веба: все ресурсы Сети выглядят как “анкеты” на языке RDF, излагающие смысл, а не внешний вид; во всех имеются ссылки на схемы-описания полей этих анкет и словари общих терминов. Пользователь же вооружён не пассивным “браузером”-просмотрщиком, а активным интеллектуальным агентом, работающим на уровне данных (независимо от их источника), а не страниц. То есть: из онтологии популярных фотосайтов вытащил порносайты, отобрал с них изображения по восьмидесяти критериям вкуса пользователя и вывел аккуратным списочком, доступным для дальнейшей сортировки, фильтрации и вду-у-у-умчивого просмотра».
Однако далее мы читаем:
«Вообще говоря, превалирующим “сторонним взглядом” на перспективы идей Семантического Веба долгое время был абсолютный пессимизм и неприятие. Причины, в общем, можно легко предположить: среди всего разнообразия сайтов, созданных разнообразнейшими методами, руками авторов с разнообразнейшей квалификацией, трудно ожидать вспышки интереса к “правильной”, осмысленной выдаче данных — тем более что выгоды каждого конкретного сайта/сервиса от собственной семантичности малоочевидны, а квалификации создателей не всегда хватает на семантически правильное использование элементов простого HTML, вроде заголовков и списков. Да и сама идея полной (или по крайней мере существенной) замены современного Веба Новым Вебом казалась утопией — при полном отсутствии так называемого killer app, привлекательного и общеполезного приложения (не гипотетического, а работающего “здесь и сейчас”), которое делало бы преимущества Нового Веба очевидными любому».
Стоит заметить, что на момент окончания 2013 года Дивный Новый Веб и впрямь поживает не то чтобы слишком хорошо. Gigaom даже привела причины провала этой, многообещающей по сути, затеи. Однако в общих чертах эти причины описаны в «Компьютерре» ещё много лет назад, ведь термину «Семантический веб» уже ни много ни мало 12 лет. Гораздо интереснее то, что идея как таковая не была окончательно забыта — и оказалось, что похожую мысль собираются реализовать… в облачном пространстве.
В Сети всё больше разговоров о так называемом Cognition-as-a-Service, распознавании как сервисе. Коллеги ещё не пришли к общему русскоязычному варианту перевода этого термина, но «когнитивность как сервис» я считаю излишне калькированным вариантом. CaaS — это облачная технология, которая сделает каждое приложение «умным». Приложения смогут взаимодействовать с пользователями как виртуальные ассистенты, они станут полностью интерактивными или (в данном случае) когнитивными. Например, если ваш календарь станет когнитивным приложением, то для него откроются возможности интеллектуального взаимодействия с вами, он сможет помогать вам управлять своим временем и стать едва ли не персональным ассистентом. Разумеется, «искусственный интеллект», стоящий за таким календарём, будет находиться в облаке. Конечно, когнитивные приложения — это далеко не пресловутый искусственный интеллект в классическом понимании. Но такие приложения намного «умнее» своих современных собратьев.
Ключевое отличие когнитивных приложений от всех остальных — это общая когнитивная платформа, которая находится в облаке. Это могут быть всевозможные API, платформы и технологии, способные сделать «разумными» любые приложения, устройства и даже составляющие «интернета вещей». С течением времени и развитием CaaS всё больше приложений будут становиться интеллектуальными. В доказательство можно привести несколько проектов, которые были осуществлены за последнее время.
- Стартап Vicarious разработан как новая форма искусственного интеллекта, который способен читать защитные изображения типа CAPTACHA. В обиходе — капча, то есть изображения, которые может прочесть и распознать только человек.
- Компания Next IT анонсировала платформу Alme, на базе которой будут построены виртуальные медицинские ассистенты.
- Google сейчас активно делает свой поиск всё умнее и умнее за счёт добавления контекстуальных возможностей для поисковых запросов. Собственно говоря, голосовой поиск Google сейчас составляет серьёзную конкуренцию Siri.
- Стивен Вольфрам анонсировал Wolfram Language — язык, моделирующий практически любые явления и легко комбинирующий приложения с самыми различными типами данных. Стивен называет его «языком глобального мозга».
- Наконец, IBM сообщила о том, что она открывает доступ сторонним разработчикам, которые теперь смогут создавать когнитивные приложения на базе распознавательных способностей Watson.
Взяв на заметку только эти примеры, можно заключить, что борьба крупных вендоров за CaaS-рынок и когнитивные приложения уже началась. Google и Apple пытаются захватить рынок персональных ассистентов, IBM и Wolfram Alpha расширяют доступ к когнитивным платформам. Кто первым создаст собственное API для того, чтобы любой разработчик мог разработать когнитивное приложение на базе вычислительной экосистемы вендора? Google, Apple, Amazon, Facebook, Microsoft — все потихоньку включаются в эту игру. Хотя многим уже сейчас очевидно, что в долгосрочной перспективе проприетарная платформа не будет расти по экспоненте. А вот проект с открытым исходным кодом вполне может составить серьёзную конкуренцию глобальным игрокам.
Так или иначе, когнитивные приложения, делающие CaaS явлением осмысленным, совершают сегодня то, чего не удалось достичь посредством семантической сети. А именно — популяризируют искусственный интеллект и делают когнитивность и машинный язык абсолютно потребительскими технологиями.
Cтарший вице-президент и директор по исследованиям компании IBM доктор Джон Келли написал книгу «Умные машины», которая выйдет в свет ближайшей осенью. Она посвящёна созданию целой экосистемы когнитивных вычислений — технологий будущего, способных взаимодействовать с людьми более естественным образом. Речь идёт о разработке архитектуры и алгоритмов, имитирующих отдельные способности мозга по восприятию данных различного вида, принятию решений и самообучению по результатам анализа их эффективности.
Джон Келли пишет, что современные люди сталкиваются с постоянным ростом объёмов информации. Если раньше казалось, что это благо, помогающее развитию общества, то сейчас стало вполне очевидно: чем больше данных, тем больше проблем. Мы попросту не успеваем вникнуть в интересующие нас вопросы как следует. Поэтому люди часто принимают необдуманные решения, ознакомившись только с одной точкой зрения. За недостатком времени анализ новых данных откладывается, а затем они вспоминаются уже как проверенная информация.
Директор может разгрузить себя, поручив большую часть обработки данных секретарю, ассистентам и даже целому штату аналитиков. Обычным людям всё сложнее противостоять давлению инфосреды. Когнитивные компьютерные технологии способны помочь в будущем как руководителям крупных компаний, так и обывателям. Умный поиск, семантический анализ, распознавание образов, прокладка маршрута с учётом пробок и оценка состояния водителя в фоне — это всё только начало.
Среди действующих когнитивных систем наиболее известен суперкомпьютер IBM Watson с программой искусственного интеллекта, созданной под руководством Дэвида Феруччи в рамках проекта DeepQA. Этот суперкомпьютер обыграл в 2011 году двух чемпионов в викторине Jeopardy. В ролике ниже приводятся пояснения о работе его алгоритма и необычной структуре использованной базы данных.
Как и в случае с победившим Каспарова суперкомпьютером Deep Blue, для IBM это была лишь демонстрация возможностей. Реальная область практических применений будет совершенно иной.
Специалисты компании рассчитывают в ближайшие двадцать лет создать компактную или даже носимую систему, имитирующую работу миллиардов нейронов и триллионов синапсов. Применений для неё найдётся масса — как в гражданском, так и в военном секторе.
Общественности говорят в основном о медицинских аспектах применения. К примеру, указывается, что с помощью такого электронного ассистента слабовидящие люди смогут не только лучше ориентироваться, но и жить более полноценной жизнью. У здорового человека мозг обрабатывает терабайты графических данных ежедневно, и заменить функции зрительной коры не сможет ни один носимый компьютер классической архитектуры.
Основная проблема целой отрасли в том, что архитектура компьютеров и базовые подходы к программированию сформировались в ту пору, когда на ЭВМ решали довольно узкий круг прикладных математических задач. Они были вычислительно сложными, а их постановкой занимался штат опытных программистов.
От современных компьютеров требуется гораздо больше. Всевозможные «умные устройства» должны большей частью самостоятельно получать и успевать обрабатывать массу разнородных данных. Результат требуется выдавать через дружественный интерфейс, чтобы помочь человеку в его повседневной жизни или просто развлечь его.
Для этого компьютерная техника должна постоянно развиваться в направлении «очеловечивания» и всё больше опираться на алгоритмы самообучения. Иными словами – как можно точнее копировать суть работы мозга, сохраняя запредельную скорость обработки числовых данных.
Компания IBM при поддержке Корнеллского университета и DARPA уже многие годы разрабатывает такой искусственный мозг. До сих пор в научном мире нет единого мнения о многих аспектах функционирования неокортекса. Поэтому задача не состоит в том, чтобы воссоздать на массиве транзисторов работу коры головного мозга в деталях. Скорее есть понятное желание сотворить на базе компьютерных технологий нечто работающее похожим образом. Требуется не более быстрый автомат, а гибкая вычислительная система, хотя бы частично проявляющая свойства мышления живых организмов.
Значимых успехов в этой области удалось достичь в прошлом году: тогда с помощью второго по мощности суперкомпьютера из списка Топ-500 сымитировали работу ста триллионов синапсов. Конечно, эмуляция происходила с большой долей условности, а скорость обработки сигналов была оценена в полторы тысячи раз ниже, чем у реальной группы нейронов. Более быстрая и точная имитация работы всего нескольких нейронов по-прежнему требует десятков тысяч процессорных ядер.
В IBM Research стараются научить компьютеры не просто считать быстрее, но и проявлять отдельные элементы мыслительного процесса. По мнению исследователей, компьютеры будущего не должны слепо следовать алгоритму, как это было до сих пор. Они станут учитывать множество второстепенных факторов, свой прошлый опыт и будут даже немного колебаться в принятии решений — совсем как человек.
Агентство перспективных оборонных научно-исследовательских разработок США щедро финансирует связанную с этой инициативой программу SyNAPSE (Системы нейроморфной адаптивной масштабируемой пластичной электроники). Её главная цель — обеспечить компьютеры теми способностями, которые у человека пока ещё развиты лучше.
Особенно это касается восприятия, умения принимать решения в условиях жёсткого дефицита достоверных данных и придумывать нестандартные выходы из ситуаций, в которых не приходилось бывать прежде.
Интерес DARPA вполне понятен. Сегодня управляемые операторами БПЛА уже показали свою эффективность. Осталось убрать операторов и связанные с ними задержки в передаче управляющих команд, чтобы Пентагон получил более совершенные и самодостаточные образцы боевой авиации.
В IBM Research убеждены, что так называемые когнитивные вычислительные системы найдут самое широкое применение и вскоре полностью изменят наши представления о компьютерной технике, которая до сих пор базируется на архитектуре фон Неймана.
Впервые о проекте открыто заговорили в 2008 году. Через год коллектив IBM Research отчитался о завершении подготовительного этапа — так называемой «фазы 0», на которой был сформулирован план исследований и решены общие вопросы.
К 2011 году был завершён первый этап проекта, заключавшийся в разработке фундаментальной архитектуры вычислительных блоков, эмулирующих работу нейронов. Ключевым требованием была масштабируемость архитектуры, поскольку от отдельных групп нейронов по мере роста доступной вычислительной мощности требовалось переходить к имитации работы целых отделов коры головного мозга.
Сегодня коллектив IBM Research говорит о новых успехах. Команде удалось провести объёмное исследование под названием «крупномасштабное корковое моделирование». Оно было сфокусировано на таких особенностях работы мозга, как сверхнизкий уровень энергопотребления и высочайшая плотность хранения данных. По результатам длительного эксперимента был создан новый алгоритм, позволяющий моделировать работу мозга более точно и ценой меньших затрат.
На его основе под руководством ведущего специалиста Дхармендра Модха был разработан язык программирования, ориентированный на создание приложений для когнитивных вычислений. Дальнейший этап — создание полноценной среды разработчика, поддерживающей весь цикл программирования — от проектирования до отладки и развертывания нового поколения приложений, способных частично имитировать свойства мозга. В конце неделе IBM представит свои разработки на Международной совместной конференции по нейронным сетям в Далласе.
На 17 апреля 2017 года Cognitive Services (ранее Project Oxford) - набор API-интерфейсов, посредством которых разработчики могут создавать интеллектуальные приложения с поддержкой изображений и речи, различных языков, технологий обработки знаний и поиска.
В составе набора:
- API-интерфейс для распознавания лиц - определение, анализ, группировка лиц на фотографиях и присвоение им тегов
- Content Moderator - автоматическая модерация изображений, текста и видео
- API распознавания эмоций - персонализация взаимодействия с пользователем посредством распознавания эмоций
- API компьютерного зрения - извлечение важной информации из изображений.
API-интерфейс для распознавания лиц
Распознает на изображениях лица по лицевым прямоугольникам и лицевым атрибутам, включая внешние признаки, позу и прогнозирование лицевых атрибутов на основе машинного обучения.
- Соотнесение лиц
- Проверяет, принадлежат ли два портрета одному человеку, с оценкой степени достоверности.
- Запрос позволяет по изображению лица найти похожие лица из коллекции лиц.
- Объединяет лица в группы на основе визуального сходства.
- Определяет, какому пользователю принадлежит лицо из запроса, на основании предоставленных пользователем данных о людях и их лицах.
API модерации изображений
Автоматически оценивает наличие оскорбительного и нежелательного содержимого на изображениях различных типов, в том числе на измененных изображениях. В Content Moderator предусмотрены распознавание текста (OCR) и обнаружение лиц, увеличивающие вероятность выявления нежелательного и спекулятивного содержимого. Технология позволяет выявлять нечеткие соответствия настраиваемым спискам запрещенных и разрешенных данных.
API модерации текста
Автоматически обнаруживает ненормативную лексику на более 100 языках и сопоставляет текст с настраиваемыми списками. Content Moderator также проверяет наличие вредоносных программ, фишинговых URL-адресов, а также использование личных сведений.
API модерации видеоОбеспечивает упреждающее обнаружение содержимого для взрослых на видео благодаря облачной модерации в службах мультимедиа Azure.
Средство пользовательской проверкиСпециальные средства позволяют рабочим группам проверять результаты автоматизированной обработки, утверждать и изменять теги для их переопределения.
API распознавания эмоцийЭтот API помогает создать приложения, реагирующие на настроение, распознающие эмоции и адаптирующиеся под человека. По выражению лица этот облачный API может распознавать удовлетворение, отсутствие эмоций, печаль, презрение, гнев, отвращение, страх и удивление. Алгоритмы искусственного интеллекта определяют эти эмоции на основе мимических шаблонов, применимых даже к разным культурам.
- Анализ изображения - Помогает получать информацию о визуальном содержимом изображений. Добавляет теги, описания и модели, предназначенные для определенных сфер для безошибочного определения и обозначения содержимого. Используется с параметрами для определения непристойных материалов и содержимого для взрослых, включая автоматическое ограничение такого содержимого. Определяет типы изображений и цветовые схемы на фотографиях.
- Создание эскизов - создаёт удобные в хранении эскизы из любых входных изображений. Функция создания эскизов изменяет изображения в соответствии с требованиями к размеру, форме и стилю. Применяет интеллектуальную обрезку для создания эскизов, отличающихся от исходных изображений пропорциями, но содержащих интересующую область.
- Считывание текста на изображениях - функция оптического распознавания символов позволяет выявлять текст на изображениях и извлекать распознанные слова в поток символов, пригодный для машинного чтения.
- Распознавание знаменитостей - модель "Знаменитости" — один из примеров моделей, предназначенных для определенных сфер. Функция распознавания знаменитостей может распознать 200 тыс. известных деятелей бизнеса, политики, спорта и индустрии развлечений всего мира.
Text Analytics API
Данный API позволяет анализировать эмоциональную окраску повествования по шкале от 0% (очень негативная) до 100% (очень позитивная). Сервис поддерживает русский и английский, а также еще 13 языков: французский, немецкий, итальянский, испанский, датский, голландский, финский, греческий, норвежский, польский, португальский, шведский и турецкий.
По информации Microsoft, сфера применения технологии может быть очень широкой. Решение будет полезно, к примеру, представителям бизнеса для выявления соотношения положительных и отрицательных отзывов о компании, или же специалистам по коммуникациям для отслеживания тональности публикаций.
Модель использования: Text Analytics API можно интегрировать, например, с Twitter, а затем визуализировать результаты эмоционального анализа твитов с помощью Microsoft Power BI в сервисе автоматизации Microsoft Flow.
Возможно, накопленной человечеством информации уже достаточно, чтобы открыть секрет бессмертия, ответить на вопрос о существовании внеземных цивилизаций или найти лекарства от многих до сих пор неизлечимых болезней. Но сколько пройдет лет, прежде чем ученые, полагаясь только на свои силы, соберут, сопоставят и правильно интерпретируют все необходимые теории и факты? Если оцифровать миллионы научных статей, таблиц, схем, учебников, снимков, аудио- и видеоматериалов и загрузить их в самый мощный компьютер, даже он не сильно ускорит процесс. Машина не может распознать изображения, звуки и понять язык учебников на том смысловом уровне, на котором все это воспринимаем мы — Homo sapiens. Для компьютера такая информация лишь массив неструктурированных данных, опираясь на которые он не поможет нам совершить нужные открытия. Но ситуацию в корне меняют когнитивные технологии. С их помощью машины учатся понимать человеческий язык в любой естественной для нас форме, видеть, слышать и чувствовать окружающий мир через сенсоры и даже пытаются гипотетически мыслить.
Сейчас, когда воплощение концепций вроде «интернета вещей» заставляет расти объемы неструктурированной информации, словно дождь количество грибов, появление когнитивных систем выглядит как никогда актуальным. Строгая математическая логика, которой подчинены традиционные компьютеры, позволяет им решать только предопределенные программистом задачи и только с четко организованными данными вроде чисел и символьных строк. А это всего-навсего 20% от общего количества доступной сегодня информации. Значит, с помощью привычных вычислительных машин мы не можем использовать остальные 80% данных (так называемые Dark Data), которые остаются неструктурированными. Сложно представить, скольких возможностей стоит нам такое упущение. «Какова цена незнания? Какова цена отсутствия лекарства от рака?», — нагнетают эксперты. Вот тут-то и должны проявить себя когнитивные — они же мыслящие или обучающиеся — технологии, уже названные некоторыми специалистами следующей вехой в развитии информационных систем.
Что такое когнитивные технологии?
Когнитивные технологии — это программные и аппаратные средства, которые имитируют работу человеческого мозга.
В скором будущем мыслящие системы приобретут мобильный формат, но пока это корпоративные суперкомпьютеры, функции которых доступны другим устройствам через облачные сервисы. Благодаря особой архитектуре когнитивные системы совмещают гигантские вычислительные мощности с инновационными способами обработки данных, похожими на наши мыслительные процессы. В перспективе от таких систем ожидают полноценного восприятия любой информации, представленной в привычном для человека виде. Это, к примеру, устная и письменная речь, визуальные образы, эмоции, чувства — все то, что помогает нам выражать мысли естественным путем.
Неудивительно, если дочитав до этого момента, вы вспомнили какой-нибудь монструозный SkyNet или недавние высказывания Хокинга и Маска насчет потенциальных угроз со стороны искусственного интеллекта. Эксперты по когнитивным системам спешат нас успокоить, дескать, мыслящие компьютеры лишены самосознания и личных мотиваций в привычном понимании этих понятий. По мнению доктора Джона Келли из компании IBM, которая имеет непосредственное отношение к когнитивным технологиям, не нужно противопоставлять машину человеку. Келли и его коллеги называют своей целью союз человека и машины, где последняя — только придаток, который должен расширить возможности первого.
Перспективы распространения
По словам представителей IBM, уже через десять лет не останется такой индустрии, которую обойдут стороной когнитивные технологии. Согласно отчету аналитической фирмы International Data Corporation, к 2018 году половина всех пользователей будет взаимодействовать с когнитивными технологиями на регулярной основе. Но чтобы добиться успеха, компании, которые стоят за мыслящими системами, должны решить ряд проблем. Том Петрочелли относит к таковым сложность разработки и отсутствие навыков для внедрения когнитивных технологий в корпоративном сегменте. Кроме того, поскольку организациям придется отдавать большое количество данных в облако для обработки сторонними системами, нужно будет решать вопросы доверия к производителям этих систем.
Подписывайтесь на наш нескучный канал в Telegram, чтобы ничего не пропустить.
Сферы применения когнитивных компьютеров
К когнитивному компьютингу относят всё, что так или иначе связано с моделированием мозговых процессов. Это системы с обучением, майнинг данных, распознавание образов (фото, видео, речь), обработка текстов на естественных языках (Natural Language Processing, NLP) и многое другое. Нацелен когнитивный компьютинг на создание таких систем, которые могут решать поставленные задачи без участия человека.
Из видимых сейчас приложений когнитивного компьютинга можно назвать распознавание речи, сентимент-анализ, распознавание лиц. В отличие от компьютеров третей эры, где доминирует программирование, взаимодействие с когнитивными компьютерами будет осуществляться посредством обучения. Алгоритмы машинного обучения могут извлекать информацию из данных, обрабатывать ее и тем самым способствовать получению новых знаний.
Читайте также: