Как выглядит браузер алиса
Наш голосовой помощник расширил ареал обитания. С сегодняшнего дня Алиса доступна не только на смартфонах, но и в Яндекс.Браузере для Windows. Поселившись в Браузере, Алиса не изменила своим привычкам: она всё так же готова пошутить, поболтать, сыграть в города, сообщить погоду или рассказать, сколько весит слон. А самое главное, что с её приходом у пользователей появился новый способ взаимодействия с Браузером и компьютером — с помощью голоса.
С Алисой можно не только говорить, но и переписываться в чате — вы сами выбираете удобный способ общения.
Теперь, отвернувшись за чашкой чая, можно попросить Алису открыть Википедию или любимый канал на YouTube, восстановить в Браузере последнюю закрытую вкладку или поставить песню Dancing Queen — а если громкость на нуле, добавьте: «Включи звук». Алиса умеет управляться не только с Браузером, но и с компьютером в целом. Она готова запустить Word или калькулятор или, скажем, открыть настройки экрана. А когда работа завершена, скажите: «Выключи компьютер» — и Алиса выполнит просьбу.
Список умений Алисы будет расти — мы постоянно обучаем её новому. В обучении участвуют не только сотрудники Яндекса. Недавно мы открыли платформу Яндекс.Диалоги. С её помощью сторонние разработчики смогут привить Алисе тот или иной навык — например, обучить её игре. Сначала новые навыки будут появляться в бета-версии приложения Яндекс для Android, а позже Алиса сможет применять их повсюду. Если вам не хватает какой-то возможности, сообщите об этом нам: через форму обратной связи или в комментариях к посту.
Чтобы Алиса заработала на компьютере, установите Яндекс.Браузер или обновите его до последней версии. Включить или отключить помощника можно в настройках. Алиса активируется, когда вы нажимаете кнопку с микрофоном в панели задач или на странице новой вкладки в Браузере. А если работает голосовая активация, просто скажите «Привет, Алиса» или «Слушай, Алиса» — и спрашивайте о чём угодно.
> "У Windows нет хорошего работающего API для закрытия произвольного окна. Например, мы не можем гарантировать корректного закрытия или того, что вообще найдем нужную программу для закрытия,"
Писал как-то софтину для закрытия игр через апи винды. Правда, я или изначально запускал игры как дочерний процесс, или запускал их через стим, т.е. убивал дочерний процесс стима. Но расширяя задачу можно дописать поиск по запущенным приложениям и их заголовкам, с 90% программ можно закрыть ориентируясь по названию
Я думал они остались только в образовательных учреждениях далёких уголков нашей страны, где не особо рвутся финансировать закупку нового оборудования в школы, детские сады и образовательные организации.
Здравствуйте. Алису можно как отключить, так и удалить совсем (весь Браузер при этом удалять не требуется:).
Чтобы отключить помощника, откройте настройки Браузера и в разделе «Поиск» снимите галку «Включить голосового помощника Алису».
Чтобы удалить Алису совсем, откройте Панель управления и в разделе «Установка и удаление программ» выберите «Голосовой помощник Алиса».
Скажите, пожалуйста, согласо какому пункту Лицензионного соглашения Яндекс решил установить на мой компьютер дополнительное програмное обеспечение (не модуль браузера, а отдельную программу) «Голосовой помощник Алиса»?
добрый день. Об Алисе в Браузере вы можете прочитать в пунктах 5.9 и 5.12 лицензионного соглашения браузера: https://yandex.ru/legal/browser_agreement/. Установка дополнительных компонентов (даже в виде "отдельных" программ) для Браузеров – обычная практика. Их ведь так удобнее удалять, чем встроенные компоненты :-)
Расскажите нам, пожалуйста, чему ещё стоит обучить Алису, чтобы сделать её максимально полезной.
Я не давал согласия на установку на мой компьютер никаких _отдельных программ_.
Эта «обычная», по вашим словам, практика, насколько я сейчас понимаю, нарушает ваше же Лицензионно соглашение.
Если это так, то не нужно оправдывать такое нарушение тем, что мне же будет удобнее удалить. Т.к. я изначально ничего не разрешал мне устанавливать.
Если эта (очень сомнительная с этической точки зрения) практика разрешена Лицензионным соглашением, то укажите, пожалуйста, конкретный пункт.
я ведь вам привел точные номера пунктов.
"Пользователь также уведомлен и соглашается, что при установке Программы ему могут быть установлены дополнительные программы, необходимые для реализации отдельных функций Программы."
Спасибо за уточнение, мне показалось, что эти пункты относятся к Алисе. Теперь прочитал пункт 5.9.
Итого: в пункте 5.9 закреплена крайне сомнительная с этической точки зрения практика «при установке Программы […] могут быть установлены дополнительные программы».
Никаким «удобством последующего удаления» это не нужно прикрывать. (Это даже не смешно).
Принципиально следующее: если вы ставите на мой компьютер что-то, не спросив меня об этом, в явном и понятном для меня виде, — это отстой.
Не будьте отстоем, Яндекс, не делайте так больше, пожалуйста.
Как убрать к чёртовой матери Алису с андроида!? В настройках отключил, как убрать иконку микрофона, на всех страницах мешает! Это просто мерзость, почему не подумали о тех кому на фиг не нужна эта алиса? Или что в итоге сносить браузер к чертям?
Добавьте Алисе встроенный таймер, будильник, и напоминания как в Сири, ещё было бы хорошо если бы Алиса озвучивала суть напоминания (например:
- Алиса, напомни через 5 минут позвонить Данилу.
- Напоминаю - Позвони Данилу,
- Напомни 25 апреля в 20.00 о том, что завтра День рождение у Кирила.
.
)
В Сири не хватает озвучивания.
Предложение. Сделайте возможность редактировать список программ: добавлять/удалять. Например, Paint мне там не нужен. Без этого смысла в данной функции не вижу.
После обновления не получается активировать Алису, ее просто нет.
В "Программы и компоненты" она есть. При попытке восстановить или изменить программу заваливает ошибками.
Здравствуйте. Причин может быть несколько. Чтобы мы могли разобраться, что именно произошло, напишите, пожалуйста, в службу поддержки. Для этого нажмите на значок настроек (☰) в правом верхнем углу Браузера, выберите Дополнительно —> Сообщить о проблеме и опишите, что произошло. Спасибо!
Очень жаль, что вы поступили настолько неэтично. Нельзя не спрашивая у человека вторгаться в его операционную систему.
Даже внутри браузера про некоторые новые функции нужно спрашивать, включать ли их или нет (как вы делаете с экономией заряда батерии для ноутбуков).
А здесь я включил браузер и через минуту вы вторглись в мою операционную систему (панель задач) и без спросу навязали мне функции, которыми я пока не собирался пользоваться (что очень легко было заранее понять по моим предыдущим действиям на ваших сервисах).
Если бы вы спросили у меня, хочу ли я включить Алису для компьютера — я бы включил ее просто чтобы попробовать. И это было бы мое решение, которое я знал бы как отменить.
После того, что вы сделали, первая реакция: отключить и удалить браузер. Уверен она будет такой у многих, хоть и не всем это удастся сделать.
Похоже лозунг don't be evil пора брать на вооружение и вам. Очень жаль.
---
Ваш очень лояльный, но очень расстроенный пользователь.
как бы нужно было все-таки читать лицензионное соглашение, когда вы устанавливали браузер, там написано черным по белому. да и думаю вы забыли про артикль.
Если удалить Я.браузер, то Алиса тоже удалится? Будет ли корректно работать бета Алисы, где можно было выбрать любой браузер? у меня сохранился экзешник=)
Добрый день, а можно научить Алису чистить кеш с определенным интервалом? Для Вашего браузера тема очень актуальная! А тя разработчиков сделать возможность вообще не кешировать страницы. Я, например, только из-за того, что яндекс браузер кеширует все подряд и надолго, не использую этот браузер. А из-за обилия рекламы от яндекса и навязчивых молитв сделать яндекс поиском по умолчанию, хотя он и так по умолчанию))) я и знакомым не рекомендую им пользоваться. Должна быть возможность отказаться от "сделать по умолчанию", а не постоянное закрывание миллионов повторяющих друг-друга просьб браузера при каждом поисковом запросе. Понятно, что яндекс. Браузер является родственником хрома, но у гугла такой агрессии к пользователю нет. Если политика компании яндекс в этих вопросах изменится, я с радостью и сам пользоваться буду и другим советовать его. А так, пока еще очень много дырок в нем.
Отвратительно! Просто ужас какой-то, я должен после каждого обновления браузера сносить вашу алису. Может вы все же предоставите мне выбор, ставить этот ужас или иметь возможность отказаться?
Ставил браузер, совсем мне не нужный, на свой комп, только из-за Алисы!
Что мне не понравилось:
1. Необучаема! От слова - совсем! Мне нужен помощник, заточенный под мои задачи (работа с большими массивами информации разной направленности). Мне не интересно, что "обучение" доступно только разработчикам. Мне нужна своя, индивидуальная Алиса! Мне интересно, чтобы словарный запас бота пополнялся постоянно в процессе работы, и не зависел от воли и фантазии разработчиков и периодических обновлений.
2. При открытии (или "наведения фокуса") другого окна, Алиса отключается. Приходиться каждый раз заново активизировать бота. Он должен работать постоянно в момент запуска компа, и не зависеть от открытия/закрытия страниц/приложений.
3. Раздражает постоянное всплывание диалогового окна Алисы, которое закрывает открытую страницу. Мне не интересно, что она пишет, мне интересны голосовые ответы. Эту функцию, надо сделать запрашиваемой, т.е. открытие диалогового окна по команде/требованию/просьбе пользователя.
3. Не интересно, когда вместо ответа "своими словами", бот запускает поисковик. И крутись с этим как хочешь. Необходимо, чтобы бот "умел" читать тексты как с веб-страниц, так и с текстовых редакторов. Мне нужна информация, а не геморрой с её поиском.
4. Надо, чтобы бот можно обучить открывать конкретные страницы, по заданным URL адресам, или запоминал открытые страницы, и при их упоминании открывал/закрывал, или сворачивал/разворачивал окна.
5. Плохая идея, когда при отсутствии интернета, бот отключается - вообще. Перестаёт выполнять функции не связанные с сетью: открывать закрывать программы, осуществлять поиск файлов и папок на компе, и всё в этом духе.
С компьютером "дружит" плохо. Вместо того, чтобы начать поиск информации с компа(ту же музыку, игры и т.д.), лезет сразу в интернет.
6. При запросе запусти, например группу . Запускает не музыку, а сам браузер (нафиг не нужный).
7. Плохо, что файлы Алисы, её базы знаний, находятся в другом месте. Очень плохо. Без Инета, она не искусственный интеллект, а бесполезная нефункциональная программа, занимающая место на жёстком диске.
Это краткий список проблем. Их много. Пока разбираюсь.
З.Ы,
Для хохмы, читал Пушкина)) У бота проявилось ограничение на количество набираемого/надиктованного текста. Вопрос: сколько знаков/букв можно набирать/надиктовывать за один раз?
Хотелось бы, чтобы голос у Алисы был более приятным, молодым .
Интересно, если она сможет переводить тексты, сайты .
Господа, я вас очень уважаю, но.
Вы в большинстве своем подражаете за конкурентом. Бездумно.
Но, то, что делает конкурент. Он давно уже не так уж очень развивает свой основной продукт. Он его развивает, чтобы держать на уровне, чтобы по определению люди привыкали, как дышать, пользоваться другими продуктами. Свои-не свои, работают вместе. Винды 10, Гугл. топы. Которые работают вместе и ведут и строят.
Вы, извиняюсь, пытаетесь не отстать. Только вот вопрос от чего? Они ведут к своим или дружественным сервисам. Нужно ли подражание тут.
Может быть нужно создать свой спутник к звездам? Хотя, во многом вы уже опоздали - они уже захватили и диктуют правила.
Но, единственный путь - не отставать, и, параллельно найти свой путь, который будет ближе людям по душе. Как продукт интуитивно понятный с обучением, а не обучение, а если знаешь, как тебе удобнее - сам разберись, как, например та же винда 10.
Только походу, Вы, или ваши руководители, хотят быстрых результатов, чтобы их можно было показать(((
Так сделайте 2 направления: "Сейчас" и "Будущее". Независимых. С разными целями и задачами. И т.п.
Блин, так же не получится. Одни люди выкручивают правила игры, чтобы им вписать другой бизнес. А вы подстраиваетесь под правила игры, т.к. они топы) Хотя они же жертвуют для основных интересов.
П.С. Хорошо, хоть скины для Алисы первыми (?) задумались придумать. Я про конкурс. Сейчас вроде в Америке бум на голосовики, там люди уже не думают.
Сделайте Алису адекватной, со скинами - это привлечет молодеж - уж не знаю на сколько, вы тут по всем статьям проигрываете(((
"Яндекс" создает онлайн-сервисы и приложения, которые отличаются высоким качеством и пользуются популярностью. Фирменный браузер с "Алисой" занимает второе место по числу установок в России.
Браузер с Алисой пользуется популярностью.
Общая информация о браузере "Яндекс" с "Алисой"
Этот веб-обозреватель был впервые представлен и стал доступным для загрузки в 2012 г. на регулярной конференции. С этого момента браузер постоянно улучшается и совершенствуется. В процессе развития несколько раз менялся общий дизайн и вид страницы настроек.
Голосовая помощница "Алиса" была интегрирована в браузер в марте 2018 г. До этого момента ассистент был доступен в виде отдельного приложения, которое изначально называлось "Яндекс.Строка" и поддерживало поиск на компьютерах с Windows 7+.
Главные особенности голосового помощника
Основное преимущество "Алисы" перед конкурентами – возможность "понимать" обращенную к нему речь. Это позволяет выполнять поиск целыми фразами без предварительной подготовки. Достаточно нажать на кнопку и сказать запрос. Кроме того, возможности помощницы расширяются с помощью навыков.
Для каких устройств подходит
Браузер с "Алисой" работает на следующих устройствах:
- компьютеры и ноутбуки с операционными системами Windows, MacOS и Linux (в последнем случае – в виде бета-версии);
- смартфоны и планшеты с ОС Android 5.1+;
- iPhone и iPad с iOS 11 и более поздних версий.
Стоит учитывать, что "Алиса" не входит в состав облегченной версии обозревателя – "Яндекс.Браузера – Лайт".
Преимущества использования
При использовании браузера от "Яндекса" пользователь получает несколько преимуществ:
- быстрый доступ ко всем сервисам компании;
- высокую производительность;
- возможность использования расширений из каталогов Opera и Google Chrome;
- поиск по страницам с учетом морфологии русского языка;
- перевод текста на изображениях;
- синхронизацию истории, закладок, паролей с аккаунтом;
- быстрый переход к началу сайта при щелчке по вкладке;
- режим чтения;
- шифрование соединения при подключении через Wi-Fi без пароля.
Многое из перечисленного доступно и в мобильных версиях браузера.
Возможности и функционал обозревателя
Помимо интегрированного голосового ассистента, "Яндекс.Браузер" предлагает следующие возможности:
- диспетчер учетных данных, обеспечивающий надежную защиту логинов и паролей;
- механизм вывода видеороликов в отдельное масштабируемое окно;
- боковая панель для удобного доступа к сервисам "Яндекса";
- турборежим, ускоряющий открытие страниц при медленном соединении;
- мощный защитный механизм Protect, оберегающий пользователя от фишинговых и мошеннических сайтов.
Построенный на движке Chromium браузер от "Яндекса" поддерживает все основные функции, например умную строку и предсказание действий для ускорения загрузки. Кроме того, обозреватель обновляется автоматически.
Скачивание и установка
"Алиса" уже входит в состав "Яндекс.Браузера". После его скачивания голосовой помощник автоматически установится и будет запускаться при включении компьютера. Какие-либо другие дополнительные приложения инсталлировать не требуется.
На компьютер
Ссылка на бесплатное скачивание 32-разрядной версии обозревателя находится на основной странице проекта. Установка браузера поддерживается на операционных системах Windows 7, 8.1 и 10. Для XP и Vista предусмотрена версия 17.4.1.
На телефон
Браузер с "Алисой" для смартфона скачивается из соответствующего магазина:
- Play Market – для "Андроида";
- Apple App Store – на iOS.
Для устройств Huawei и Honor браузер представлен в фирменном магазине AppGallery.
Настройки «Алисы»
Настройка голосового ассистента на всех устройствах заключается в активации, деактивации и изменении кодовой фразы для запуска. Кроме того, на компьютере или ноутбуке можно выбрать микрофон, используемый для управления. Еще пользователю доступна очистка истории общения с "Алисой".
Управление голосовым помощником
Чтобы управлять голосовой помощницей от "Яндекса", следует нажать на кнопку на панели задач или новой вкладке браузера и просто произнести запрос в микрофон. Например, можно попросить "Алису" уточнить следующие сведения:
- прогноз погоды;
- интенсивность дорожных пробок;
- программу телепередач и т.д.
Если пользователь хочет виртуально пообщаться с "Алисой", то он должен сказать соответствующую фразу. В результате все произнесенные слова будут обрабатываться искусственным интеллектом, что приведет к подбору подходящего ответа. Когда пользователь пожелает закончить разговор, он должен сказать или написать "Хватит". После этого ассистент вернется в стандартный режим.
Пользователь также может ввести запрос в виде текста в соответствующее поле, если помощник неточно распознает речь или в случае, когда говорить неудобно. Если браузер свернут, то он тотчас развернется при запуске "Алисы" из панели задач Windows. Чтобы завершить работу с помощником, следует щелкнуть в любой части окна.
Включение
Для включения помощника на компьютере следует открыть новую вкладку и щелкнуть по значку "Алисы" в боковом меню. На панели задач Windows появится иконка ассистента. Если боковая строка не видна, следует вызвать параметры "Яндекс.Браузера" и проставить требуемый чекбокс. Галочка для разрешения голосовой активации находится ниже по списку. Похожие действия нужно выполнить и на смартфоне.
Деактивация
Если нет потребности использовать "Алису" (например, для повышения скорости работы старых устройств), ее можно деактивировать. На компьютере эта операция выполняется в 2 этапа:
- Закрыть голосовой помощник и выгрузить его из памяти. Для этого щелкнуть правой кнопкой на значок и выбрать единственный пункт.
- Удалить программу "Алиса", которая устанавливалась вместе с "Яндекс.Браузером".
Чтобы деактивировать помощника на смартфоне, нужно переставить соответствующий переключатель в настройках приложения. Значки "Алисы" исчезнут из интерфейса.
Возможные сложности и проблемы
Если соединение с интернетом присутствует, но нет реакции на запросы, то проблема кроется в микрофоне. Эта неполадка чаще всего проявляется на стационарных компьютерах. Для ее устранения проверяют соединение микрофона и уровень усиления. На Windows 10 еще и разрешают доступ к устройствам записи звука для классических приложений, к которым относится браузер от "Яндекса".
После этого задают настроенный микрофон как основной не только в параметрах системы, но и в настройках браузера. В результате ассистент "услышит" пользователя. На Android и iOS проверяют права доступа к микрофону, а также закрывают приложения, которые блокируют его.
Отрицательные стороны "Яндекс.Браузера" с "Алисой"
Существенные недостатки у веб-обозревателя от "Яндекса" отсутствуют. Среди незначительных минусов можно выделить трудности перевода страниц встроенным сервисом, а также анимированный фон, способный замедлять слабые устройства.
В этой лекции впервые рассматриваются технологические решения, на основе которых работает Алиса — голосовой помощник Яндекса. Руководитель группы разработки диалоговых систем Борис Янгель hr0nix рассказывает, как его команда учит Алису понимать желания пользователя, находить ответы на самые неожиданные вопросы и при этом вести себя прилично.
— Я расскажу, что внутри у Алисы. Алиса большая, в ней много компонент, поэтому я немного поверхностно пробегусь.
Алиса — голосовой помощник, запущенный Яндексом 10 октября 2017 года. Она есть в приложении Яндекса на iOS и Android, а также в мобильном браузере и в виде отдельного приложения под Windows. Там можно решать свои задачи, находить информацию в формате диалога, общаясь с ней текстом или голосом. И есть киллер-фича, которая сделала Алису довольно известной в рунете. Мы пользуемся не только заранее известными сценариями. Иногда, когда мы не знаем, что делать, мы используем всю мощь deep learning, чтобы сгенерировать ответ от имени Алисы. Это получается довольно забавно и позволило нам оседлать поезд хайпа.
Как выглядит Алиса высокоуровнево?
Пользователь говорит: «Алиса, какую ожидать завтра погоду?»
Первым делом мы его речь стримим в сервер распознавания, он превращает ее в текст, и этот текст затем попадает в сервис, разработкой которого занимается моя команда, в такую сущность, как классификатор интентов. Это машиннообученная штука, задача которой — определить, чего же пользователь хотел сказать своей фразой. В этом примере классификатор интентов мог сказать: окей, наверное, пользователю нужна погода.
В основе концепции Dialog Manager лежит концепция, известная тем, кто занимается диалоговыми системами, как form-filling. Идея в том, что пользователь своими репликами как бы заполняет некую виртуальную форму, и когда он в ней заполнит все обязательные поля, его потребность можно удовлетворить. Движок event-driven: каждый раз, когда пользователь что-то делает, происходят какие-то события, на которые можно подписываться, писать их обработчики на Python и таким образом конструировать логику диалога.
Когда нужно в сценариях сгенерировать фразу — например, мы знаем, что пользователь говорит про погоду и нужно ответить про погоду, — у нас есть мощный язык шаблонов, который позволяет нам эти фразы писать. Вот так это выглядит.
Это надстройка над питонячьим шаблонизатором Jinja2, в которую добавили всякие лингвистические средства, например возможности склонять слова или согласовывать числительные и существительные, чтобы можно было легко когерентный текст писать, рандомизировать кусочки текста, чтобы увеличивать вариативность речи Алисы.
В классификаторе интентов мы успели попробовать множество разных моделей, начиная от логистической регрессии и заканчивая градиентным бустингом, рекуррентными сетями. В итоге остановились на классификаторе, который основан на ближайших соседях, потому что он обладает кучей хороших свойств, которых у других моделей нет.
Например, вам часто надо иметь дело с интентами, для которых у вас есть буквально несколько примеров. Просто учить обычные классификаторы мультиклассовые в таком режиме невозможно. Например, у вас оказывается, что во всех примерах, которых всего пять, была частица «а» или «как», которой не было в других примерах, и классификатор находит самое простое решение. Он решает, что если встречается слово «как», то это точно этот интент. Но это не то, чего вы хотите. Вы хотите семантической близости того, что сказал пользователь, к фразам, которые лежат в трейне для этого интента.
В итоге мы предобучаем метрику на большой датасете, которая говорит о том, насколько семантически близки две фразы, и потом уже пользуемся этой метрикой, ищем ближайших соседей в нашем трейнсете.
Еще хорошее качество этой модели, что ее можно быстро обновлять. У вас появились новые фразы, вы хотите посмотреть, как изменится поведение Алисы. Все, что нужно, это добавить их множество потенциальных примеров для классификатора ближайших соседей, вам не нужно переподбирать всю модель. Допустим, для нашей рекуррентной модели это занимало несколько часов. Не очень удобно ждать несколько часов, когда вы что-то меняете, чтобы увидеть результат.
Семантический теггер. Мы пробовали conditional random fields и рекуррентные сети. Сети, конечно, работают намного лучше, это ни для кого не секрет. У нас там нет уникальных архитектур, обычные двунаправленные LSTM с attention, плюс-минус state-of-the-art для задачи тегирования. Все так делают и мы так делаем.
Единственное, мы активно пользуемся N-best гипотез, мы не генерируем только самую вероятную гипотезу, потому что иногда нам нужна не самая вероятная. Например, мы перевзвешиваем зачастую гипотезы в зависимости от текущего состояния диалога в dialog manager.
Если мы знаем, что на предыдущем шаге мы задали вопрос про что-то, и есть гипотеза, где теггер что-то нашел и гипотеза, где не нашел, то наверное, при прочих равных первое более вероятно. Такие трюки нам позволяют немного улучшить качество.
А еще машиннообученный теггер иногда ошибается, и не совсем точно в самой правдоподобной гипотезе находят значение слотов. В этом случае мы ищем в N-best гипотезу, которая лучше согласуется с тем, что мы знаем о типах слотов, это позволяет тоже еще немного качество заработать.
Еще в диалогах есть такое явление Анафора. Это когда вы с помощью местоимения ссылаетесь на какой-то объект, который был раньше в диалоге. Скажем, говорите «высота Эвереста», и потом «в какой стране он находится». Мы анафоры умеем разрешать. Для этого у нас две системы.
Одна general-purpose система, которая может работать на любых репликах. Она работает поверх синтаксического разбора всех пользовательских репликах. Если мы видим местоимение в его текущей реплике, мы ищем known phrases в том, что он сказал раньше, считаем для каждой из них скорость, смотрим, можно ли ее подставить вместо этого местоимения, и выбираем лучшую, если можем.
А еще у нас есть система разрешения анафор, основанная на form filling, она работает примерно так: если в предыдущем интенте в форме был геообъект, и в текущем есть слот для геообъекта, и он не заполнен, и еще мы в текущий интент попали по фразе с местоимением «туда», то наверное, можно предыдущий геообъект импортировать из формы и подставить сюда. Это простая эвристика, но производит неплохое впечатление и круто работает. В части интентов работает одна система, а в части обе. Мы смотрим, где работает, где не работает, гибко это настраиваем.
Есть эллипсис. Это когда в диалоге вы опускаете какие-то слова, потому что они подразумеваются из контекста. Например, вы можете сказать «расскажи погоду», а потом «а на выходных?», имея в виду «расскажи погоду на выходных», но вы хотите повторять эти слова, потому что это ни к чему.
С эллипсисами мы тоже умеем работать примерно следующим образом. Эллиптические фразы или фразы-уточнения — это отдельные интенты.
Если есть интент get_weather, для которого в трейне фразы типа «расскажи погоду», «какая сегодня погода», то у него будет парный интент get_weather_ellipsis, в котором всевозможные уточнения погоды: «а на завтра», «а на выходные», «а что там в Сочи» и так далее. И эти эллиптические интенты в классификаторе интентов на равных конкурируют со своими родителями. Если вы скажете «а в Москве?», классификатор интентов, например, скажет, что с вероятностью 0,5 это уточнение в интенте погода, и с вероятностью 0,5 уточнение в интенте поиска организаций, например. И затем диалоговый движок перевзвешивается scores, которые назначил классификатор интентов, который назначил их с учетом текущего диалога, потому что он, например, знает, что до этого шел разговор о погоде, и вряд ли это было уточнение про поиск организаций, скорее это про погоду.
Такой подход позволяет обучаться и определять эллипсисы без контекста. Вы можете просто откуда-то набрать примеров эллиптических фраз без того, что было раньше. Это довольно удобно, когда вы делаете новые интенты, которых нет в логах вашего сервиса. Можно или фантазировать, или чего-то придумывать, или пытаться на краудсорсинговой платформе собрать длинные диалоги. А можно легко насинтезировать для первой итерации таких эллиптических фраз, они будут как-то работать, и потом уже собирать логи.
Вот жемчужина нашей коллекции, мы называем ее болталкой. Это та самая нейросеть, которая в любой непонятной ситуации чего-то от имени Алисы отвечает и позволяет вести с ней зачастую странные и часто забавные диалоги.
Болталка — на самом деле fallback. В Алисе это работает так, что если классификатор интентов не может уверенно определить, чего хочет пользователь, то другой бинарный классификатор сперва пытается решить — может, это поисковый запрос и мы найдем что-то полезное в поиске и туда отправим? Если классификатор говорит, что нет, это не поисковый запрос, а просто болтовня, то срабатывает fallback на болталку. Болталка — система, которая получает текущий контекст диалога, и ее задача — сгенерировать максимально уместный ответ. Причем сценарные диалоги тоже могут являться частью контекста: если вы говорили про погоду, а потом сказали что-то непонятное, сработает болталка.
Это позволяет нам делать вот такие штуки. Вы спросили про погоду, а потом болталка ее как-то прокомментировала. Когда работает, выглядит очень круто.
Болталка — DSSM-подобная нейронная сеть, где есть две башни энкодера. Один энкодер кодирует текущий контекст диалога, другой — ответ-кандидат. У вас получается два embedding-вектора для ответа и контекста, и сеть обучается так, чтобы косинусное расстояние между ними было тем больше, чем уместнее данный ответ в контексте и чем неуместнее. В литературе эта идея давно известна.
Почему у нас вроде неплохо все работает — кажется, что чуть лучше, чем в статьях?
Никакой серебряной пули нет. Нет техники, которая позволит внезапно сделать классно разговаривающую нейронную сеть. Нам удалось достичь неплохого качества, потому что мы в качестве понемножку выиграли везде. Мы долго подбирали архитектуры этих башен-энкодеров, чтобы они лучше всего работали. Очень важно правильно подобрать схему сэмплирования отрицательных примеров в обучении. Когда вы обучаетесь на диалоговых корпусах, у вас есть только положительные примеры, которые когда-то кем-то были сказаны в таком контексте. А отрицательных нет — их нужно как-то генерировать из этого корпуса. Там есть много разных техник, и одни работают лучше, чем другие.
Важно, как вы выбираете ответ из топа кандидатов. Можно выбирать наиболее вероятный ответ, предлагаемый моделью, но это не всегда лучшее, что можно сделать, потому что при обучении модель учитывала не все характеристики хорошего ответа, которые существуют с продуктовой точки зрения.
Есть ряд дополнительных метрик, которые мы стараемся оптимизировать. Это когда Алиса к пользователю на «ты» обращается, говорит о себе в мужском роде и произносит всякие дерзости, гадости и глупости.
Сегодня мы начинаем открытое бета-тестирование платформы Яндекс.Диалоги, с помощью которой любой разработчик сможет обучить Алису новым навыкам и привлечь пользователей к своим сервисам и разработкам. В этом посте мы не будем пересказывать всю документацию, но дадим общее представление о работе платформы на примере самой популярной игры для Алисы.
Голосовой помощник Алиса, о котором мы впервые рассказывали на Хабре осенью прошлого года, уже работает в приложении Яндекс, Яндекс.Браузере, а также в бета-версии для Windows. Каждый день миллионы пользователей этих продуктов решают с помощью голосового помощника определённые задачи – например, узнают прогноз погоды. Мы регулярно добавляем новые возможности, но охватить все интересы пользователей самостоятельно невозможно. Заполнить этот пробел призваны навыки Алисы, об особенностях создания которых мы и расскажем под катом.
Если вы разрабатываете текстовую игру, информационного бота или даже сервис доставки еды на дом, то теперь вы можете добавить их в Алису. На техническом уровне это значит, что вы можете подключить сервис, работающий на вашем сервере, к платформе Алисы. Когда пользователь активирует такой навык, Алиса транслирует реплики пользователя на ваш сервер, и отвечает переданным вами текстом. Распознавание речи в текст и обратно платформа берёт на себя. Для пользователя разговор с использованием навыка выглядит как обычный диалог с голосовым помощником.
Чтобы не превращать этот пост в пересказ и так достаточно подробной документации, мы расскажем об особенностях создания навыков на примере игры в города.
Алиса, давай сыграем в города
В прошлом году мы начали обучать Алису различным играм. Мы никогда об этом не рассказывали, но почти все они были добавлены с помощью платформы Яндекс.Диалоги, к тестированию которой мы и открываем сегодня доступ. Наиболее популярной среди них является игра в города, которую мы и рассмотрим более детально.
Игра, как и любой другой навык, начинается с распознавания фразы вида «Алиса, включи игру в города». Слово «включи» – это сигнал Алисе о том, что нужно запустить навык, а не искать ответ с помощью поиска. Таких сигнальных слов несколько. А часть «игру в города» в произнесенной фразе – это одно из активационных имён, которые задаются разработчиком при публикации навыка в платформе Диалоги. Голосовой помощник умеет понимать различные морфологические формы одного и того же активационного имени, чтобы срабатывать даже при неточных совпадениях.
В обычной ситуации Алиса ищет ответы с использованием сервисов Яндекса, но если речь идёт о навыке, то после распознавания активационного имени она отправляет POST-запрос на сервер, указанный разработчиком. Запрос представляет из себя привычный JSON и содержит текст от пользователя, а также служебную информацию (идентификаторы пользователя и сессии).
Бэкенд навыка может быть написан на любом удобном для разработчиков языке. В нашем случае мы обошлись привычным C++, но для документации подготовили примеры на Node.js и Python. Фактически требование к серверу лишь одно – он должен отвечать на запрос в течение 1,5 секунд.
Ответ также передается в JSON-формате и содержит текст, который будет озвучен Алисой. Давайте взглянем на реальный пример такого ответа из нашей игры:
Обратите внимание, что кроме обычного текста вы можете передавать и текст в формате TTS (text-to-speech). С помощью этой разметки вы можете управлять произношением Алисы. Это полезно, когда нужно расставить акценты в тексте или выдержать паузу.
Кроме того, в приведённом выше JSON-ответе вы можете заметить упоминания кнопок. У пользователей не всегда есть возможность ответить голосом. Заставлять писать ответы с помощью клавиатуры слишком жестоко (хотя такая возможность тоже всегда была в Алисе), поэтому разработчики навыков могут использовать кнопки. Кстати, они удобны ещё и тем, что подсказывают пользователю доступные голосовые команды.
С технической стороны всё просто. Куда сложнее было продумать механику так, чтобы не отпугивать пользователей сложностью игры. Хотим поделиться с вами несколькими хитростями, на которые мы пошли при разработке игры в города. Они не относятся к работе платформы, поэтому мы спрятали их за спойлер, но, возможно, они помогут и другим разработчикам создать собственные успешные игры.
В мире тысячи городов, о большинстве из которых никто из нас не слышал, но Яндекс их знает. Если бы Алиса использовала в игре свои знания о малоизвестных городах, то это оттолкнуло бы игроков. Игра не должна демонстрировать явное превосходство над игроком. Необходимо поддерживать иллюзию игры с живым и почти равным соперником. Поэтому мы специально сделали так, чтобы в свой ход она называла только самые известные города.
Проиграть в игру очень просто. Особенно, когда против вас играет справочник городов мира :) Но этого нельзя допускать, потому что после поражения к вам могут и не вернуться. Не стремитесь к победе над игроком – процесс важнее результата. Поэтому в нашей игре нельзя проиграть окончательно: Алиса всегда готова поделиться подсказкой.
Игра в города достаточно однообразна. Но если игра не приносит новые знания или впечатления при каждом запуске, то её быстро забросят. В нашем случае Алиса не просто отвечает названием города, но и старается рассказать интересный факт о нём. Пользователи это ценят. Кстати, по этой же причине Алиса принимает в качестве ответа города из художественных произведений (например, Минас Тирит из вселенной Толкина).
Как создать свой навык?
1. Познакомьтесь с документацией Яндекс.Диалогов, где подробно описаны особенности платформы. Там же мы подготовили для вас описание быстрого старта с использованием бесплатного сервиса Now, который поможет разобраться в основах платформы без использования собственного сервера.
2. Зарегистрируйте созданный навык в Яндекс.Диалогах. Там же можно протестировать навык до его публикации, имитируя запросы от пользователей (скриншот).
3. Опубликуйте навык. Он будет размещён в каталоге Алисы, предварительный доступ к которому уже открыт в бета-версии приложения Яндекс (пункт «Что умеет Алиса» в меню Алисы). В будущем пользователи смогут узнавать о лучших навыках не только из каталога, но с помощью прямых рекомендаций голосового помощника.
Бета-версия платформы Диалоги ещё далека от финальной версии. Сейчас у каждого разработчика есть шанс повлиять на развитие навыков Алисы и поделиться с нами своими идеями и пожеланиями, которые мы постараемся учесть к моменту полноценного запуска. Оставить свой отзыв можно в комментариях, через Обратную связь, а также в нашем чате в Телеграме. Спасибо!
Людям свойственно наделять личностью даже по-настоящему неодушевлённые объекты. Это регулярно проскакивает в речи людей. Так уж работает человеческое восприятие — люди говорят с техникой и сложными устройствами. Стоит ли удивляться, что когда появился голосовой помощник Алиса от компании «Яндекс», его сразу же очеловечили. И затем начали представлять, как бы выглядела Алиса в реальности.
Рождение Алисы
Голосовой помощник Алиса был представлен компанией «Яндекс» в октябре 2017 года. Это программа, которая обучается при помощи нейронных сетей. Она распознаёт человеческую речь, сравнивает текущий запрос с предыдущими, ищет информацию в интернете и затем выдаёт ответ — голосом или текстом. Скорее всего, именно наличие у программы женского голоса и стало первым шагом на пути к её «очеловечиванию».
Теоретически, чем дольше существует Алиса, тем более точными и разнообразными становятся её ответы. Это и отличает её от большинства существующих голосовых помощников — она обучается воспринимать новые формулировки и сама использует их в речи. Конечно, не стоит обманываться — речь не идёт про полноценный искусственный интеллект. Программа не способна думать, она лишь обрабатывает информацию из постоянно растущей базы данных.
Голосовой помощник Алиса распознаёт шутки и шутит сама
Представление Алисы «Яндексом»
Так какой же именно образ пытались создать разработчики сети? Образ молодой девушки, безусловно. На вопросы о возрасте Алиса обычно отвечает неоднозначно и результаты разнятся у пользователей. Но обычно фигурируют цифры больше 14 лет и меньше 25. При этом по манере речи Алису можно описать как умную девушку, которая не лезет за словом в карман и всегда может помочь делом или уместной шуткой.
Но почему «Яндекс» не идёт дальше в создании образа Алисы? Почему бы не представить официальное изображение её внешности? Вероятно, компания хочет создать образ, близкий каждому. Поэтому и позволяет людям представлять Алису так, как хотят именно они. Поступи они иначе, кто-нибудь из пользователей всё равно был бы разочарован, потому что уже привык представлять Алису по своему: моложе или старше, а может с другим цветом волос.
Отсутствие официальной внешности делает Алису ближе пользователям
Предположения о внешности Алисы
Но если нет официальных данных о внешности Алисы, то, может, есть хотя бы слухи и предположения? Пожалуй, к ним можно отнести внешность актрисы озвучания Алисы. Ведь мы слышим её голос, фактически общаемся с ней. Конечно, это не значит, что Алиса выглядит именно так, но и не учитывать этого фактора нельзя.
Алису озвучивает российская актриса Татьяна Шитова. Родилась она в 1975 году, то есть сейчас ей уже 43 года. Татьяна очень популярная актриса дубляжа, которая помимо Алисы озвучивала многие знаменитые роли в фильмах или компьютерных играх. Она русский голос Йеннифер из знаменитой серии игр про Ведьмака и, например, Харли Квин из «Отряда самоубийц».
Но стоит ли всё же примерять внешность актрисы на саму Алису? На самом деле таких причин нет. Как Татьяна Шитова не похожа на персонажей, которых она озвучивает в фильмах и играх, так она может быть и совсем непохожа на Алису, хоть та и говорит её голосом.
Алису озвучивает очень популярная в России актриса дубляжа
Представление Алисы пользователями
Выходит, что внешность Алисы каждый пользователь представляет по-своему. Но почему людям важно иметь какое-либо представление о внешности Алисы? Благодарить за это стоит создателей программы. Её манера общения действительно напоминает живого человека, с характером. А значит, осознанно или нет, но пользователи начинают наделять Алису и другими человеческими чертами. Именно по этой причине в интернете так популярны хуманизации Алисы.
Хуманизация — это визуальное представление нечеловеческого существа (например, животного или робота) в виде человека. Обычно фанаты хуманизируют героев мультфильмов или компьютерных игр, но изредка этому процессу подвергаются и различные программы. Так, сейчас в сети существует немало хуманизаций популярных браузеров (opera, firefox и т.д.). Алису этот процесс тоже не обошёл стороной.
Фотогалерея: фанарты с хуманизацией Алисы
Более роботизированная внешность показывает суть персонажа Так как Алиса говорит с публикой, микрофон — подходящий атрибут Алису иногда рисуют в очках, чтобы подчеркнуть её интеллект Хуманизации в аниме стиле очень популярны Чаще всего Алису изображают милой молодой девушкой Все изображения представляют Алису как приятную девушку Про Алису даже есть небольшие комиксы В интернете можно наткнуться на фан-арты разного качества (Анастасия Воропай) Некоторые видят Алису маленькой девочкой с большими глазами
Представления пользователей о внешности Алисы очень разнообразны. Но так как разработчики не представили внешность голосового помощника официально, нельзя сказать, какие из них верны, а какие — нет. Всё же идея именно в том, что Алиса должна понравиться каждому, а значит, вы можете представлять её себе так, как вам захочется.
Всем привет! Мне нравится писать для людей, о компьютерной сфере — будь то работа в различных программах или развлечение в компьютерных играх. Стараюсь писать только о вещах, с которым знаком лично. Люблю путешествовать и считаю, что только в пути можно по-настоящему познать себя.
Читайте также: