Компьютерный и информационный дискурс принцип элизы
Принцип работы Элизы заключается в исследовании введенных пользователем комментариев на наличие ключевых слов. Если найдено ключевое слово, то применяется правило, по которому комментарий пользователя преобразуется и возвращается предложение-результат. Если же ключевое слово не найдено, Элиза либо возвращает пользователю общий ответ, либо повторяет один из предыдущих комментариев. Вдобавок Вейзенбаум запрограммировал Элизу на имитацию поведения психотерапевта, работающего по клиент-центрированной методике . Это позволяет Элизе «притвориться, что она не знает почти ничего о реальном мире». Применяя эти способы, программа Вейзенбаума могла вводить в заблуждение некоторых людей, которые думали, что они разговаривают с реально существующим человеком, а некоторых было «очень трудно убедить, что Элиза […] не человек». На этом основании некоторые утверждают, что Элиза — одна из программ (возможно первая), которые смогли пройти тест Тьюринга. Однако это утверждение очень спорно, так как людей, «задающих вопросы», инструктировали так, чтобы они думали, что с ними будет разговаривать настоящий психотерапевт, и не подозревали о том, что они могут разговаривать с компьютером.
Работа Колби — PARRY — была описана, как «Элиза с мнениями»: программа пыталась моделировать поведение параноидального шизофреника, используя схожий (если не более продвинутый) с Элизой подход, примененный Вейзенбаумом. Для того чтобы проверить программу, PARRY тестировали в начале 70-х, используя модификацию теста Тьюринга. Команда опытных психиатров анализировала группу, составленную из настоящих пациентов и компьютеров под управлением PARRY, используя телетайп. Другой команде из 33 психиатров позже показали стенограммы бесед. Затем обе команды попросили определить, кто из «пациентов» — человек, а кто — компьютерная программа. Психиатры лишь в 48 % случаев смогли вынести верное решение. Эта цифра согласуется с вероятностью случайного выбора. Заметьте, что эти эксперименты не являлись тестами Тьюринга в полном смысле, так как для вынесения решения данный тест требует, чтобы вопросы можно было задавать в интерактивном режиме, вместо чтения стенограммы прошедшей беседы.
Пока что ни одна программаи близко не подошла к прохождению теста. Хотя такие программы, какЭлиза(ELIZA), иногда заставляли людей верить, что они говорят с человеком, как, например, в неформальном эксперименте, названномAOLiza, но эти случаи нельзя считать корректным прохождением теста Тьюринга по целому ряду причин:
Человек в таких беседах не имел никаких оснований считать, что он говорит с программой, в то время как в настоящем тесте Тьюринга человек активно пытается определить, с кем он беседует.
Документированные случаи обычно относятся к таким чатам, какIRC, где многие беседы отрывочны и бессмысленны.
Многие пользователи Интернета используют английскийкак второй или третий язык, так что бессмысленный ответ программы легко может быть списан на языковый барьер.
Многие просто ничего не знают об Элизе и ей подобных программах, и поэтому не сочтут собеседника программой даже в случае совершенно нечеловеческих ошибок, которые эти программы допускают.
Диалоговые системы давно и прочно вошли в нашу жизнь. В заглавии упомянута и на картинке представлена ELIZA — диалоговая система-психоаналитик (сейчас, ее назвали бы чат-бот), родом из 60-ых годов. Если вам интересно, как человек дошел до общения с ботами-психоаналитиками и что еще есть интересного в диалоговых системах, добро пожаловать под кат.
В самом деле сейчас диалоговые системы можно встретить где угодно: если вы звоните в банк, вы общаетесь (по крайней мере сначала) с диалоговой системой, когда вы делаете заказ или пытаетесь задать маршрут в навигаторе — тоже, может быть, вы пользуетесь Siri от Apple или Cortana от Microsoft, и это тоже они.
Чем привлекательны диалоговые интерфейсы? Тем, что это естественный для человека способ получения информации. (Собственно, поэтому робот, с которым вы разговариваете, когда куда-то звоните, называет “автоинформатор”.)
Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Касумова Марина Юрьевна
В электронном дискурсе происходит сложное взаимодействие устного и текстового аспектов коммуникации , результатом которого является компьютерный дискурс с новыми структурными и стилистическими свойствами.
Похожие темы научных работ по языкознанию и литературоведению , автор научной работы — Касумова Марина Юрьевна
Функционирование эпистемических модальных модификаторов в Интернет-дискурсе (на материале англоязычных Интернет-форумов)
Классификация
Диалоговые системы можно охарактеризовать по следующим признакам: General — Task-oriented (общего назначения — задачеориентированный) и Open Domain — Closed Domain (способный говорить на любую тему или только на строго определенную). В каждой из пар первый компонент существенно сложнее второго. Давайте рассмотрим несколько примеров:
Начнем с самого простого — с автоинформаторов, они совершенно точно task-oriented и closed domain.
Вышеупомянутая ELIZA — closed domain (она умеет говорить только на тему психоанализа), но при этом general — у нее нет четко поставленной задачи, с ней можно “поболтать”.
Еще один пример бота, c которым можно поболтать, — CharRNN от Андрея Карпаты (Andrej Karpathy). Сама CharRNN — это просто нейросетевая модель, которая умеет продолжать данную ей строку, если натренировать ее, например, на субтитрах к фильмам и сериалам, то она научится “отвечать” на ваши реплики. В этом смысле она является general — у нее нет четко выраженной цели — и open domain — потенциально может говорить на любую тему. Проблема заключается только в том, что эта модель исключительно простая, она просто продолжает данную ей строку, не имея никакого понятия о диалоге, фразах и даже отдельных словах.
Из примеров остались два: ConvAI — это наше соревнование, о котором ниже, и true AI. Почему я отдельно выделил, что AI здесь “настоящий”? Потому что сейчас пошла мода называть AI все, что угодно, вплоть до автоинформаторов. Я же хотел подчеркнуть, что это полноценный искусственный интеллект, способный говорить на любую тему. И — самое важное — он способен вести беседу, то есть имеет представление о диалоге.
Текст научной работы на тему «Компьютерный дискурс как новый вид коммуникации»
КОМПЬЮТЕРНЫЙ ДИСКУРС КАК НОВЫЙ ВИД КОММУНИКАЦИИ
Интернет, коммуникация, электронный дискурс, гипертекст.
Интернет рождает новые формы языковой и межкультурной коммуникации. Возникновение виртуальной среды как нового вида среды существования человека привело к формированию новых дискурсивных практик. Язык в новой среде подвергается большим изменениям. Кроме этого, смена материального носителя письменного текста и каналов передачи информации оказывает влияние на свойство самого текста. Вместе с тем развитие и распространение Интернет-технологий вносит в жизнь новые реалии, требующие своего обозначения. В настоящее время в электронных средах происходит сложное взаимодействие устного и текстового аспектов коммуникации, результатом которого является электронный дискурс с принципиально новыми структурными и стилистическими свойствами.
Как известно, в любом научном, профессиональном и культурном сообществе существуют свои устоявшиеся языковые практики, содержательно и тематически определенные формы создания текстов. В современной науке такие институционализированные формы и практики принято называть дискурсами. При исследовании дискурсов объектом изучения выступает не столько конкретный текст, сколько его социальный контекст. Другими словами, текст анализируется не сам по себе, а в качестве социальной репрезентации.
Репрезентация, согласно С. Холлу, есть та практика, благодаря которой возникает общепринятое знание, составляющее ядро культуры. Это производство смысла посредством языка. Язык как система репрезентации представляет собой концептуальную смысловую карту, генерирующую ментальные связи между реально существующими объектами, абстрактными и вымышленными образами. Эти связи могут быть восприняты только при условии принадлежности авторов и читателей текста к единому культурному полю. Именно так функционируют дискурсы, создавая объяснения, понятные носителям той или иной культуры.
Таким образом, коммуникация в современном лингвистическом представлении понимается как процесс перекодировки вербальной сферы в невербальную и невербальной сферы в вербальную как принуждение другого к выполнению того или иного действия.
Известно, что понятие дискурса так же неопределенно, как понятия языка, общества, идеологии, однако часто наиболее расплывчатые понятия становятся наиболее популярными. «Дискурс» есть коммуникативное событие, происходящее между говорящим, слушающим (наблюдателем и др.) в процессе коммуникативного действия в определенном временном, пространственном и другом контексте. Это коммуникативное действие бывает речевым, письменным и имеет вербальные и невербальные составляющие.
В 50-е гг. ХХ в. Э. Бенвенист, разрабатывая теорию высказывания, применил традиционный для французской лингвистики термин discours в новом значении - как характеристику «речи, присваиваемой говорящим». З. Харрис опубликовал в 1952 г. статью «Discourse analysis», где рассматривал метод дистрибуции по отношению к сверхфразовым единствам.
Э. Бенвенист подразумевал под дискурсом экспликацию позиции говорящего в высказывании, а в трактовке Харриса объектом анализа становилась последовательность высказываний, отрезок текста, больший, чем предложение.
Таким образом, научная дискуссия о дискурсе как самостоятельном концепте началась с описания соотношения текста и дискурса. Некоторые ученые предлагают трактовать дискурс как «текст плюс ситуация», в то время как текст, соответственно, определялся как «дискурс минус ситуация» [ван Дейк 1989: 87].
Термин «дискурс» не имеет однозначной дефиниции и может принимать разные значения, это зависит от того, какие специфические аспекты его проявления хочет акцентировать исследователь. А.Ж. Греймас рассматривает одиннадцать подобных аспектов [Греймас 1996].
Первоначальная многозначность термина предопределила и дальнейшее расширение его семантики. В 60-е гг. ХХ в. М. Фуко, развивая идеи Э. Бенвениста, предложил свою трактовку дискурсивного анализа. По мнению Фуко, приоритетным является установление позиции говорящего, но не по отношению к порождаемому высказыванию, а по отношению к другим взаимозаменяемым субъектам высказывания и выражаемой ими идеологии в широком смысле этого слова. Тем самым для французской школы дискурс - анализа - это прежде всего определённый тип высказывания, присущий определённой социально-политической группе или эпохе.
Р. Водак рассматривает дискурс как текст в контексте, с одной стороны, и как набор текстов - с другой, Т. ван Дейк определяет дискурс как действие: «Я понимаю дискурс как специфическую форму использования языка и как специфическую форму социальной ситуации» [ван Дейк 1997: 345].
Констатируем, под «дискурсом» понимается речевая ситуация, т. е. текст, погруженный в ситуацию реального общения. Таким образом, дискурс не просто общение, в нем существуют явные цели и определенные участники со своими социальными, психологическими, национально-культурными статусными характеристиками. Но какие именно цели и какие участники - зависит от конкретного типа дискурса.
В работах отечественных лингвистов термин «компьютерный дискурс» употребляется также в нескольких значениях - это и многожанровая разновидность публичной монологической и диалогической речи, которая рождается в процессе «компьютерного общения», и так могут называть все тексты, объединенные общей тематикой, связанной с современными информационными технологиями.
И если в настоящее время наиболее общее понимание дискурса подразумевает связанный текст в единстве с факторами, влияющими на его порождение и восприятие (прагматическими, социокультурными, психологическими и др.), то это позволяет говорить о том, что в Интернете формируется новая сфера межличностной коммуникации, которую и называют компьютерным дискурсом.
Наиболее подходящей для анализа компьютерного дискурса нам представляется интерак-ционная модель коммуникации, которая в качестве главного принципа выдвигает взаимодействие, помещенное в социокультурные условия ситуации. Эта модель была разработана Д. Шиффрин (Schiffrin D.) и представлена М.Л. Макаровым [Макаров 2003: 38].
Применительно к Сети электронная коммуникация представляется некоторым авторам сложной комбинацией дискурсов: передача личной почты (бытовой дискурс), официальный обмен и запрос информации (деловой дискурс), обсуждение научных вопросов в группах
новостей или конференций (научный дискурс), рекламные баннеры и сайты (рекламный дискурс) и т. д. [Галичкина 2001:45].
А.Н. Гребнев рассматривает электронную коммуникацию (ЭК) как социальную информационную коммуникацию, где каналом коммуникации выступает электронная (цифровая) среда [Гребнев 2006: 221]. ЭК исследуется этим автором в рамках направления компьютерно-опосредованной коммуникации (CMC, Computer-mediated communication).
- асинхронная конференц-связь (conferencing):
- электронная почта (e-mail);
- Интернет-форумы (Internet forum или message board) или электронная доска (BB, bulletin board);
- группы новостей (newsgroups);
- чаты (chat rooms);
- видеоконференции (video conferencing);
- голосовые конференции (voice conferencing);
- разделение данных (data conferencing или whiteboard).
Традиционный письменный текст, попадая в сетевое информационное пространство, меняется: он обретает гипертекстовую форму. Фрагментарный гипертекст, объединенный в единое функциональное целое при помощи системы межтекстовых переходов - это одновременно и удобная визуальная форма, которая может быть адекватно воспринята с экрана монитора, и реализация преимуществ компьютерных технологий, позволяющих материализовать интертекстуальность.
Обычно компьютерный дискурс выделяется на основании канала общения. Это общение приобретает специфические черты, которые можно систематизировать:
1) электронный сигнал становится каналом общения;
3) дистантность, т. е. разделенность в пространстве и во времени;
4) опосредованность (так как осуществляется с помощью технического средства);
5) высокая степень проницаемости;
6) наличие гипертекста;
7) креолизованность компьютерных текстов в целом, включающая в себя буквенные, образно-зрительные и образно-слуховые компоненты;
8) статусное равноправие участников;
9) передача эмоций, мимики, чувств с помощью «смайликов»;
10) объединение различных типов дискурса;
11) специфическая компьютерная этика [Галичкина 2001: 55].
В электронной коммуникации выделяются определенные форматы или речевые жанры, типичные формы речи, представляющие функциональные стили с определенными перечнями конститутивных признаков. На современном этапе развития компьютерной коммуникации выделяются следующие жанры: электронная почта, электронные разговоры чаты, электронные доски объявлений (BBS) и компьютерные конференции [Галичкина 2001:63]. Но эта классификация весьма условна, т. к. по многим конституционным признаком эти жанры могут пересекаться. Английский лингвист Д. Кристал в монографии «Язык и Интернет» выделяет пять жанров, называя их при этом ситуации использования Интернета. Это электронная почта; синхронные и асинхронные чаты, включая BBS; виртуальные миры (MOOs, MUDs, MUCKs, MUSEs и т. д.); ВЕБ-тексты.
Компьютерный дискурс продуцирует и собственные жанры. Общение в чатах, форумах, гостевых книгах, конференциях, по электронной почте является достаточно специфическим явлением, стирающим границы между устной и письменной формами коммуникации. Но язык, используемый в компьютерном дискурсе, обладает особенностью функционирования - он употребляется в письменной форме. Естественная письменная русская речь в сфере электронной коммуникации характеризуется адаптацией средств разговорной речи (интонация, тон, громкость) к письменной форме (подчеркивание, выделение текста цветом, большими буквами). Другой важной особенностью представления текста в электронном виде является использование различных паралингвистических средств (рисунок, фотография, а также шрифт, цвет, графические символы и др.).
При этом возникает новая форма языкового взаимодействия - письменная разговорная речь, а с ней и новые речевые жанры. В сфере электронной коммуникации уже выделяют следующие жанры письменной речи: а) чат; б) форум; в) гостевая книга; г) сетевой дневник; д) блог.
Новая фактура речи в электронной коммуникации интерактивна, манипулятивна, мультимедийна и часто имеет структуру гипертекста. Компьютерному дискурсу как виду общения в электронных сетях присущи определенные конститутивные признаки (сигнал, гипертекст, дистан-тность и др.). Нужно отметить, что в электронной коммуникации границы между жанрами мягче и подвижнее. Это объясняется тем, что процесс формирования «новых» жанров продолжается. Эта ситуация говорит о том, что в Интернете свои законы коммуникации, вследствие этого язык Интернета нельзя кодифицировать. Сегодня не существуют четкие языковые нормы употребления в сфере электронной коммуникации, однако исследователи говорят о значимости лингвистического аспекта Интернета [Бергельсон 2002; Войскунский 2003; Иванов 2000 : 123] и даже о возникновении виртуальной языковой личности [Компанцева 2004 : 267].
Письменная коммуникация теряет часть смыслоразличительных средств, присущих устной коммуникации, в первую очередь интонацию, мимику и жесты (то есть именно те средства выражения, которые передают эмоциональный компонент par excellence). При этом виртуальный жанр не способствует детализации описания, присущей традиционной письменной речи. В связи с этим роль компенсаторных механизмов (способствующих пониманию) выполняют «смайлики» - графические символы, получающиеся в текстовом режиме и кириллицы, и латиницы на обычной клавиатуре:
(2). 1.:-)- знак улыбки;
:-( - выражение неодобрения или печали;
:-0 - означает крик.
Обобщая взгляды на электронную коммуникацию, некоторые исследователи составляют её «типологическую» модель, описывая этот феномен, исходя из следующих параметров:
- по признаку масштабности (массовая, групповая и внутриличностная);
- по признаку времени (краткая и неограниченная во времени, синхронная и асинхронная);
- по форме (письменная (текстовая и графическая) и устная (при наличии звукового модема)).
Таким образом, констатируем: возникновение виртуальной среды как принципиально нового вида среды существования человека привело к формированию новых дискурсивных практик. Под компьютерным дискурсом мы подразумеваем ряд электронных текстов в ситуации реального общения, особый вид деятельности и существования в Интернет-пространстве.
В электронном дискурсе происходит сложное взаимодействие устного и текстового аспектов коммуникации, результатом которого является компьютерный дискурс с новыми структурными и стилистическими свойствами.
Проводя исследования, лингвисты компьютерного дискурса на современном этапе накапливают эмпирические данные для дальнейшей их систематизации и обобщения. Результаты создания теоретической базы могут быть применимы в самых разных областях: рекламе, бизнесе, образовании, высоких технологиях и т. д.
3. Галичкина Е.Н. Специфика компьютерного дискурса на английском и русском языках: дис. канд. филол. наук. Астрахань, 2001. С. 45.
4. Гребнев А.Н. Методология коммуникационной научно-образовательной среды // Труды XIII Всероссийской научно-методической конференции «Телематика-2006». СПб., 2006. Т. 1. С. 220-222.
5. Дейк Т.А. ван. Язык. Познание. Коммуникация. М.: Прогресс, 1989. 307 с.
6. Иванов Л.Ю. Язык Интернета: заметки лингвиста // Словарь и культура русской речи. М., 2000 и др.
7. Компанцева Л.Ф. Гендерные основы Интернет-коммуникации в постсоветском пространстве. Луганск, 2004. С. 267.
В статье рассматриваются основные понятия, используемые для обозначения типов дискурса новой коммуникативной среды, обусловленной возникновением электронных устройств и Интернета: «компьютерный дискурс», «электронный дискурс», «интернет-дискурс», «сетевой дискурс», «виртуальный дискурс». Рассмотрены основные подходы к пониманию анализируемых терминологических единиц. Осуществлена попытка разграничения описываемых понятий.
Ключевые слова : компьютерный дискурс, электронный дискурс, интернет-дискурс, сетевой дискурс, виртуальный дискурс, цифровой дискурс.
Развитие современных технологий обусловило возникновение виртуальной коммуникативной среды, послужившей основой для формирования новых типов дискурса. В настоящее время существует большое количество работ, посвященных рассмотрению лингвистической специфики новых разновидностей дискурса, однако единого подхода к пониманию этого феномена не выработано до сих пор. Как следствие в современной научной литературе не существует единого понимания дискурсов новой коммуникативной среды, в связи с чем в работах по коммуникативистике сегодня используются различные терминологические обозначения, которые признаются синонимичными [3,6] либо, напротив, неравнозначными понятиями [8,9,13]. Речь идет о следующих обозначениях: электронный дискурс / электронная коммуникация , компьютерный дискурс / компьютерно-медийный дискурс , интернет-дискурс ( дискурс интернета ), виртуальный дискурс , сетевой дискурс . Достаточно близкими по смыслу к перечисленным терминам оказываются обозначения: компьютерная коммуникация [4]; компьютерно-опосредованная коммуникация ( КОК ) [7; 15]; интернет-коммуникация [2]; интернет-опосредованная коммуникация [1]. Стоит отметить, что термин компьютерно-опосредованная коммуникация ( Computer-Mediated Communication ( CMC ) используется преимущественно в зарубежных работах и может обозначать «как функциональную разновидность языка, так и особую коммуникативную среду» [6]. Е. И. Горошко отмечает, что обозначение КОК используется в тех случаях, когда акцентируется влияние канала передачи информации, а также роль медийной среды как части речевой деятельности [6].
Разграничивая термины электронный дискурс , компьютерный дискурс , интернет-дискурс , виртуальный дискурс , сетевой дискурс , О. В. Лутовинова говорит о том, что понятия электронного дискурса и компьютерного дискурса являются тождественными и используются для обозначения текста, погруженного в ситуацию общения при помощи компьютера [14]. Такой же позиции относительно данной пары обозначений придерживаются Е. Е. Ефремова [8] и А.В, Зеленовская [9]. Интернет-дискурс и сетевой дискурс также находятся в синонимичных отношениях, если речь идет об общении в Глобальной сети. Однако термин сетевой дискурс обозначает общение не только в интернете, но и в других сетях, в частности локальных (под локальной сетью понимается компьютерная система, которая покрывает относительно небольшую территорию или несколько зданий). Таким образом, данная группа терминов включает указание на средство связи, за счет которого создается коммуникативная среда.
Виртуальный дискурс , по мнению О. В. Лутовиновой, не является синонимичным ни одному из рассмотренных выше терминов в силу того, что его конститутивные свойства во многом обусловлены средой его бытования, т. е. виртуальной средой. В то же время исследователь Е. Е. Ефремова говорит о том, что компьютерный дискурс «представляет собой коммуникацию в виртуальной среде, и в этом состоит его важнейший отличительный признак» [8, с.62].
А. В. Зеленовская, говоря о соотношении виртуального и компьютерного дискурса, приходит к следующему выводу: «Сравнивая компьютерный (электронный) дискурс, интернет-дискурс, и виртуальный дискурс, можно констатировать, что, с одной стороны, виртуальный дискурс будет пониматься уже, чем компьютерный дискурс. С другой стороны, виртуальный дискурс трактуется шире, чем компьютерный, поскольку для общения в виртуальной реальности может использоваться не только Интернет, но и другие средства связи…» [9, с. 19].
Рассматривая соотношение электронного дискурса и электронной коммуникации в зарубежной лингвистике, Е. И. Горошко подчеркивает, что второе понятие оказывается значительно шире первого, так как электронный дискурс связан с описанием языковой и речевой специфики компьютерной «текстовой» коммуникации, которые изучаются при помощи дискурсивного или лингвистического анализа [6].
Необходимость разведения терминов электронный дискурс , электронная коммуникация и электронное общение обосновывается и в диссертации Е. П. Кондрашова [12]. Основание для разграничения данных феноменов ученый видит в том, что понятия общение , коммуникация и дискурс не признаются равнозначными в современной социальной парадигме научного знания. Кроме того, Е. П. Кондрашов подчеркнул неоднозначность термина виртуальный дискурс , обусловленную тем, что лексема виртуальный опирается на два словарных значения. Неоднозначная трактовка понятия, по мнению ученого, может привести к тому, что такие типы дискурса, как, например, театральный дискурс, также будут причисляться к виртуальному дискурсу. Поэтому наиболее релевантным Е. П. Кондрашов признает термин компьютерный дискурс .
Анализ работ, затрагивающих специфику компьютерного , электронного , сетевого , виртуального и интернет-дискурсов , показывает, что в большинстве случаев исследователи не разводят рассматриваемые термины и выделяют для них одни и те же конститутивные признаки и особенности. Результаты проведенного анализа представлены в таблице ниже. Следует подчеркнуть, что в таблице отражены наиболее значимые и частотные признаки того или иного типа дискурса.
Конститутивные свойства дискурсов новой коммуникативной среды
ConvAI
Теперь пришло время рассказать о нашем соревновании, чем оно отличается от приведенного выше и зачем мы решили его делать.
ConvAI — это Conversational Intelligence Challenge, соревнование разговорного искусственного интеллекта. А раз это соревнование, то нужно как-то участников сравнивать. И тут оказывается, что стандартные метрики сравнения текстов, известные по машинному переводу BLEU, ROUGE, etc. здесь не работают.
Получается, что машинные метрики, которые мы знаем, не коррелируют с человеческими суждениями (в то время как человеческие оценки между собой прекрасно коррелируют — верхняя правая картинка). Источник [1].
Из этого следует, что сравнивать системы общего назначения между собой пока не представляется возможным — мы просто не знаем, как это делать. Но зато мы совершенно точно можем сравнивать задачеориентированные системы с помощью простейшей метрики Task Completion Rate (TCR).
То есть мы можем их сравнить по количеству диалогов, которые достигли цели. В качестве цели для нашего соревнования мы выбрали обсуждение небольшого куска текста, например, короткой новостной статьи или отрывка из Википедии. Человек, пообщавшись на тему представленного текста с другим человеком/ботом, ставит свою оценку. При этом мы не даем пользователю информации о “естественности” или “искусственности” интеллекта собеседника. Базируясь на собранных оценках мы сможем отранжировать ботов наших участников так, чтобы построить цепочку от самого простого CharRNN до человека. (По крайней мере, мы на это надеемся.)
Стоит еще упомянуть, что наш challenge прошел жесткий отбор и был выбран, как NIPS Live Competition этого года. А также то, что соорганизаторами соревнования являются Йошуа Бенжио (Yoshua Bengio), который не нуждается в представлении, а также Александр Рудницкий (Alexander Rudnicky) и Алан Блэк (Alan W. Black) из университета Карнеги-Мэллон (Carnegie-Mellon University).
Всю информацию про соревнование, включая правила, API нашего сервера и другое, можно найти на его сайте convai.io.
Заключение
Надеемся, что у вас сформировалось некоторое представление о диалоговых системах. Более того, если вы хотите попробовать себя в их создании, то мы будем рады вас видеть в качестве участника или добровольца (нам нужны люди, которые будут разговаривать с ботами наших участников). Если вы не представляете, с чего начать, то мы специально для вас сделали базовое решение. Оно требует немного пререквизитов для запуска — по факту, один только Docker. Так что — дерзайте!
P.S. Если вам интересно поучаствовать в создании искусственного интеллекта не только во время соревнования, но и на постоянной основе, у нас есть открытые позиции. Информацию можно почерпнуть на сайте ipavlov.ai.
Датасеты
Отдельно стоит сказать про доступные датасеты для исследований в области разговорного интеллекта. Существует несколько общедоступных датасетов для диалоговых систем [2]. Прежде всего, стоит выделить Dialog State Tracking Challenge, в этом году он, кстати, будет проводиться уже в шестой раз. Он рассчитан на системы, которые могут вести диалог, отслеживая его состояние (state), то есть является, пожалуй, самым близким к цели нашего соревнования. Но у этого датасета есть важная особенность — он является closed domain, то есть исключительно рассматривает одну конкретную тему. Open domain и task-oriented общедоступного датасета не существует, и мы рассчитываем, что после нашего соревнования будет сформирован новый датасет, состоящий из разговоров добровольцев и участников команд с ботами, который будет выложен в общий доступ для всех исследователей.
Computer discourse as a new kind of communication
In an electronic discourse there is a complex interaction of oral and text aspects of communication , which results in the appearance of a new discourse, namely, computer discourse with new structural and stylistic properties.
Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Зеленовская А.В.
В статье рассматривается понятие « дискурс » и различные подходы к определению его разновидностей, таких как « компьютерный дискурс », « интернет-дискурс », « виртуальный дискурс ».
Похожие темы научных работ по языкознанию и литературоведению , автор научной работы — Зеленовская А.В.
Компьютерно-опосредованная коммуникация или электронный дискурс? к определению основного понятия в лингвистическом изучении Интернета
Специфика эвфемизации в условиях компьютерно-опосредованной коммуникации (на материале английского языка)
Текст научной работы на тему «Понятия «Компьютерный дискурс» «Интернет-дискурс», «Виртуальный дискурс»»
ПОНЯТИЯ «КОМПЬЮТЕРНЫЙ ДИСКУРС» «ИНТЕРНЕТ-ДИСКУРС», «ВИРТУАЛЬНЫЙ ДИСКУРС»
Челябинский государственный университет, г. Челябинск
В статье рассматривается понятие «дискурс» и различные подходы к определению его разновидностей, таких как «компьютерный дискурс», «интернет-дискурс», «виртуальный дискурс».
Ключевые слова: дискурс, компьютерный дискурс, интернет-дискурс, виртуальный дискурс.
В настоящее время компьютерные и Интернет технологии занимают все более значимое место в жизни современного человека. Однако Интернет -нечто большее, чем просто суперсовременная технология, ускоряющая распространение информации. Благодаря Интернету существенно расширилась как межличностная, так и социально значимая коммуникация. Язык становится не только средством общения, но и средством создания виртуальной реальности, так как искусственные языки программирования являются лишь технологическим средством, благодаря которому Интернет работает, а подлинным языком виртуального сообщества оказываются естественные языки аудитории пользователей.
Преподаватель кафедры Делового иностранного языка.
ЯЗЫК И КУЛЬТУРА
и имеет два значения. С одной стороны, это целенаправленная и контекстно связанная форма обмена мыслями, сведениями, идеями между двумя или более сторонами и преимущественно в процессе человеческого общения. С другой - специальные программные средства, делающие возможным такой вид общения [10, с. 394].Этот вид коммуникации осуществляется с помощью электронных средств связи, которые становятся доступными благодаря различным видам сервиса в интернете. Однако следует заметить, что термин компьютерно-опосредованная коммуникация используется двояко, обозначая как функциональную разновидность языка, так и особую коммуникативную среду. В отечественных исследованиях чаще встречается такие термины, как «виртуальный дискурс», «компьютерный дискурс» и «интернетдискурс».
Изучение этого понятия имеет довольно длительную историю. Термин «дискурс» очень часто встречается в современных научных работах и статьях. Впервые этот термин встречается в работе американского лингвиста Зел-лига Харриса в 1952 году, но до сих пор данная категория допускает множество научных трактовок. Американский ученый-лингвист Т Ван Дейк понимает дискурс «как специфическую форму использования языка и как специфическую форму социальной ситуации» [4, с. 345]. Кубрякова Е.С., российский лингвист, отмечает, что «под дискурсом следует иметь в виду именно когнитивный процесс, связанный с реальным речепроизводством, созданием речевого произведения, текст же является конечным результатом процесса речевой деятельности, выливающимся в определенную законченную (и зафиксированную) форму [6, с. 164]. Олешков М.Ю. в своей докторской диссертации, посвящённой системному моделированию институционального дискурса, даёт более подробное определение: «Дискурс (интенционально обусловленная реализация текста в речевой ситуации) - семиотический процесс совокупной коммуникативной деятельности взаимодействующих сторон в рамках коммуникативной ситуации, текущая речевая деятельность, обслуживающая коммуникативную сферу, и возникающие в результате этой деятельности и реализуемые в семиотическом пространстве с помощью вербальных и невербальных знаков тексты, имеющие определённую структуру, жанровые особенности и прецедентный тезаурус» [9, с. 12].
Таким образом, дискурс -это текст, погружённый в ситуацию реального общения. Мы можем употреблять этот термин, описывая интернет-коммуникацию, так как в данном случае рассматривается текст в ситуации общения, но в виртуальной реальности.
Лутовинова О.В. предложила следующее разграничение понятий «виртуальный дискурс», «компьютерный дискурс» и «интернет-дискурс». «Термины «компьютерный дискурс» и «электронный дискурс» являются синонимичными и обозначают текст, погруженный в ситуацию общения
Общие вопросы языкознания
посредством электронных средств связи, а точнее по средством компьютера. «Интернет-дискурс» предполагает общение в Глобальной сети. Виртуальный же дискурс подразумевает не только изменившийся канал связи, но и специфические особенности, накладываемые виртуальной реальностью» [7, с. 10].
Бурное развитие средств, обеспечивающих каналы передачи информации, определило новый тип дискурса - компьютерный дискурс. Российских лингвист Е.Н. Галичкина выделила следующие признаки компьютерного дискурса: 1) электронный сигнал становится каналом общения; 2) виртуальность; 3) дистантность в пространстве и во времени; 4) опосредован-ность (так как осуществляется с помощью технического средства); 5) высокая степень проницаемости; 6) наличие гипертекста; 7) креолизованность компьютерных текстов в целом, включающая в себя буквенные,образно-зрительные и образно-слуховые компоненты; 8) статусное равноправие участников; 9) передача эмоций, мимики и чувств с помощью «смайликов»; 10) объединение различных типов дискурса; 11) специфическая компьютерная этика [3, с. 15].
Компьютерный дискурс предполагает общение не только между людьми посредством Интернета, но и общение человека с компьютером. Тем не менее, понятие «компьютерный дискурс» можно трактовать двояко. С одной позиции, это любое общение в компьютерных сетях, общение с использованием особого рода электронных сигналов коммуникации [8, с. 286]. С другой стороны, компьютерный дискурс можно определить, как общение только на темы, связанные с компьютерами.
Интернет-дискурс представляет собой процесс создания текста в совокупности с прагматическими, социокультурными, психологическими факторами, целенаправленное социальное действие, включающее взаимодействие людей [5, с. 59]. Интернет-дискурс отличается, прежде всего, по каналу коммуникации - в отличие от устного и письменного - только через сеть Интернет. Кроме того, это глобальный способ коммуникации, объединяющий в единое сообщество наибольшее количество участников [13, с. 42-58].
Таким образом, можно сказать, что среди исследователей до сих пор нет единого подхода к определению дискурса, связанного с Интернетом. Иссле-
ЯЗЫК И КУЛЬТУРА
дователи выделяют «виртуальный дискурс», «компьютерный дискурс» и «интернет-дискурс». Являясь одним из типов электронного дискурса, интернет-дискурс обладает его чертами, а также имеет собственные особенности. Он представляет собой динамично развивающийся лингвистический феномен, частью которого является интернет-текст, опосредованный через сеть Интернет. Кроме того, это глобальный способ коммуникации, объединяющий в единое сообщество наибольшее количество участников (пользователей сети).
1. Арутюнова Н.Д. Дискурс // Лингвистический энциклопедический словарь. - М.: «Советская энциклопедия», 1990. - С. 136-137.
2. Водак Р. Язык. Дискурс. Политика / пер. с англ. и нем. - Волгоград: Перемена, 1997. - 15 с.
3. Галичкина Е.Н. Специфика компьютерного дискурса на английском и русском языках: автореф. дисс. . канд. филол. наук / Е.Н. Галичкина. - Астрахань, 2001. - 15 с.
4. Дейк Т. ван. Язык. Познание. Коммуникация / пер. с англ. - М.: Прогресс, 1989. - 345 с.
5. Загоруйко И.Н. Интернет-дискурс в современном коммуникационном пространстве / И.Н. Загоруйко // Вестник КГУ им. Н.А. Некрасова. - 2012. -Вып. 3. - 59 с.
6. Кубрякова Е.С. Эволюция лингвистических идей во второй половине ХХ века (опыт парадигмального анализа) // Язык и наука конца ХХ века. -М.: Рос. Гуманит. Ун-т, 1995. - 164 с.
7. Лутовинова О.В. Лингвокультурологические характеристики виртуального дискурса: автореф. дисс. . докт. филол. наук / О.В. Лутинова. -Волгоград, 2009. - С. 10-11.
8. Маклюэн Г.М. Понимание медиа: внешние расширения человека / ГМ. Маклюэн. - М.; Жуковский: «КАНОН-пресс-Ц», «Кучково поле», 2003. -286 с.
9. Олешков М.Ю. Системное моделирование институционального дискурса (на материале устных дидактических текстов): автореф. дисс. . докт. филол. наук / М.Ю. Олешкова. - Нижний Тагил, 2007. - 12 с.
10. Розина И.Н. Интернет-сообщество специалистов в области коммуникации // Новые инфокоммуникационные технологии в социально-гуманитарных науках и образовании:современное состояние, проблемы, перспективы развития / под общ. ред. А.Н. Кулика. - М.: Логос, 2003. - С. 392-399.
Общие вопросы языкознания
12. Слышкин Г.Г. Дискурс и концепт (о лингвокультурном подходе к изучению дискурса) / Г.Г. Слышкин // Языковая личность: институциональный и персональный дискурс. - Волгоград: Перемена, 2000. - 39 с.
13. Смирнов Ф.О. Национально-культурные особенности электронной коммуникации на английском и русском языках: дисс. . канд. филол. наук / Ф.И. Смирнов. - Ярославль, 2004. - С. 42-58.
МОНОЛИНГВИСТИЧЕСКИИ ЭФФЕКТ ИМ. Ф.С. УБАЕВОИ (ЧАСТЬ 1)
© Сайфуллаева Р.Р.* *, Сайфуллаев Ш.Р.*
Национальный университета Узбекистана, Республика Узбекистан, г. Ташкент ОАО «Петр Великий», г. Санкт-Петербург
Данная работа, посвященная научному открытию, является результатом наших междисциплинарных научных исследований и относится к стыку сразу нескольких областей познания о человеке и обществе, а именно: филологии и психологии, биологии и эволюции, а точнее, в области филологии - языкознания - к разделу синтаксиса любого разговорного языка, в области биологии - к разделу микробиология растущего головного мозга ребенка, в области психологии - к разделам интеллектуального развития мышления человека, а также и воспитания и образования ребенка с ранних лет, и в области эволюции - к разделу генезиса членораздельной речи и истокам происхождения разговорных языков.
Ключевые слова: научное открытие, филология, языкознание, лингвистика, психолингвистика, родной язык и нации, синтаксис и монолингвы, развитие, интеллект.
* Профессор Национального университета Узбекистана, доктор филологических наук, Г ранд-доктор психологии, академик Европейской Академии Естественных Наук.
* Президент ОАО «Петр Великий», Действительный Государственный советник, Действительный член Союза научных и инженерных обществ и Европейской Академии Естественных Наук, профессор.
Читайте также: