Современные компьютерные технологии виды статистических пакетов
Программный продукт, предназначенный для статистической обработки данных. Отечественные статистические пакеты, представленные на рынке. Статистические пакеты STATA, STADIA, SPSS, STATISTICA и др., их особенности, возможности, преимущества и недостатки.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | реферат |
Язык | русский |
Дата добавления | 30.01.2014 |
Размер файла | 18,5 K |
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Статистический пакет - программный продукт, предназначенный для статистической обработки данных.
Являются надежным инструментом повышения качества принимаемых решений. В пакет, как правило, входит: деловая графика, дисперсионный анализ, регрессионный анализ, анализ временных рядов и пр.
Для успешной работы любой организации в условиях рынка и конкуренции, конечно, необходим тщательный анализ имеющейся информации о создании продукции, её сбыте, эксплуатации, а также анализ информации о конкурентах и т. п. Конечно можно положиться на интуицию, но, скорее всего, правильное решение будет принято, только если у вас имеется огромный многолетний опыт в этой сфере деятельности. Но можно (и даже нужно, несмотря на весь опыт) пойти другим путём -- воспользоваться специальными средствами для обработки информации. И вот здесь-то и потребуется профессионализм -- необходимо правильно выбрать программное обеспечение, корректно ввести информацию, которую вы хотите проанализировать, выбрать методы и алгоритмы для решения именно этой задачи и многое другое.
Можно выделить 2 вида статистических пакетов.
Из зарубежных пакетов это STATGRAPHICS, SPSS, SYSTAT, BMDP,SAS, CSS, STATISTICA, S-plus, и др. Из отечественных можно назвать такие пакеты, как STADIA, ЭВРИСТА, МЕЗОЗАВР, ОЛИМП: Стат-Эксперт, Статистик-Консультант, САНИ, КЛАСС-МАСТЕР и др.
Отечественные статистические пакеты, которые устойчиво представлены на рынке в течение последних лет, в значительной степени лишены таких недостатков, которые есть у западных продуктов. Они предполагают наличие широкого первоначального статистического образования, доступной литературы и консультационных служб. Поэтому они содержат мало экранных подсказок и требуют внимательного изучения документации на английском языке.
Одним из обязательных этапов любого научного исследования является статистический анализ данных. Продолжительное время анализ медицинских данных был уделом специалистов, так как это требовало серьезной предварительной подготовки. С появлением и совершенствованием современных программ обработки данных статистическая обработка поднялась на новый уровень. Теперь исследователь-медик может и не иметь математической подготовки. Достаточно оперировать статистическими понятиями и, самое главное, правильно выбрать метод анализа. Все осуществимо благодаря компьютеру и новейшим программам.
Все программы статистической обработки данных можно разделить на профессиональные, полупрофессиональные (популярные) и специализированные. Статистические программы относятся к наукоемкому программному обеспечению, цена их часто недоступна индивидуальному пользователю. Профессиональные пакеты имеют большое количество методов анализа, популярные пакеты - количество функций, достаточное для универсального применения. Специализированные же пакеты ориентированы на какую-либо узкую область анализа данных. Создатели программных статистических пакетов заявляют, что их продукт превосходит аналоги. Отсутствие у большинства исследователей времени для освоения нескольких программ, делает непростым ее выбор. В данной статье приведена базовая информация о присутствующих на рынке основных полупрофессиональных программных пакетах пригодных для статистической обработки биомедицинских данных.
STADIA. Программа отечественной разработки с 16-и летней историей. Включает в себя все необходимые статистические функции. Она прекрасно справляется со своей задачей - статистическим анализом. Но. Программа внешне фактически не изменяется с 1996 года. Графики и диаграммы, построенные при помощи STADIA, выглядят в современных презентациях архаично. Цветовая гамма программы (красный шрифт на зеленом) очень утомляет в работе. К положительным качествам программы можно отнести русскоязычный интерфейс и наличие книг описывающих работу.
SPSS (Statistical Package for Social Science). Самый часто используемый пакет статистической обработки данных с более чем 30-и летней историей). Отличается гибкостью, мощностью применим для всех видов статистических расчетов применяемых в биомедицине. Недавно вышла 13-я англоязычная версия. Существует русскоязычное представительство компании которое предлагает полностью русифицированную версию SPSS 12.0.2 для Windows. Появился учебник на русском языке, позволяющий шаг за шагом освоить возможности SPSS, репетитор по статистике на русском языке, помогающий в выборе нужной статистической или графической процедуры для конкретных данных и задач, а также справка по SPSS Base и SPSS Tables. Российский офис SPSS регулярно проводит учебные курсы по анализу данных при помощи программного обеспечения SPSS. На русский язык переведена книга по SPSS, которая вышла в свет в 2002 году в Киевском издательстве «Диасофт» под названием «SPSS 10: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей».
STATA. Профессиональный статистический программный пакет с data-management system, который может применятся для биомедицинских целей. Один из самых популярных в образовательных и научных учреждениях США наряду с SPSS. Официальный сайт. Программа хорошо документирована, издается специальный журнал для пользователей системы. Однако возможности предварительного ознакомления с демо-версией нет.
STATISTICA. Производителем программы является фирма StatSoft Inc. (США), которая выпускает статистические приложения, начиная с 1985 года. STATISTICA включает большое количество методов статистического анализа (более 250 встроенных функций) объединенных следующими специализированными статистическими модулями: Основные статистики и таблицы, Непараметрическая статистика, Дисперсионный анализ, Множественная регрессия, Нелинейное оценивание, Анализ временных рядов и прогнозирование, Кластерный анализ, Факторный анализ, Дискриминантный функциональный анализ, Анализ длительностей жизни, Каноническая корреляция, Многомерное шкалирование, Моделирование структурными уравнениями и др. Несложный в освоении этот статистический пакет может быть рекомендован для биомедицинских исследований любой сложности.
Статистический пакет STATISTIKA
Statistica-- пакет для всестороннего статистического анализа, разработанный компанией StatSoft.
Алгоритмы математической статистики, реализованные в пакете:
Многомерная линейная и нелинейная регрессия;
Дискриминантный и кластерный анализ, деревья классификаций;
Проверка гипотез о виде распределения;
Некоторые алгоритмы непараметрической статистики;
Прогнозирование временных рядов на основе одномерных моделей АРПСС.
Преимущества и недостатки пакета STATISTICA
Преимущества пакета STATISTICA:
- Наибольший из всех изученных пакетов инструментарий визуализации полученных результатов;
- Наличие руссифицированной версии;
- В пакете представлена полная реализация алгоритмов статистической классификации;
- Наличие возможности реализовать и использовать собственные алгоритмы (через написание макросов).
- Алгоритмы интеллектуального анализа данных (Data Mining).
Недостатки пакета STATISTICA:
- Применение пакета требует высокой теоретической подготовки в ТВиМС. статистический обработка данные пакет
- Отсутствие реализации некоторых важных тестов временных рядов (в частности - тестов на стационарность).
В случае парной регрессии уравнение определяется по двум наборам данных, один из которых представляет значения зависимой переменной y, а другой - независимой переменной х. В случае множественной регрессии уравнение определяется по нескольким наборам данных, один из которых представляет значения зависимой переменной y, а другие независимыми переменными х1, х2,, xm. Получение уравнения регрессии происходит в два этапа: подбор вида функции и вычисление параметров функции. Выбор функции, в большинстве случаев, производятся среди линейной, квадратичной, степенной и др. видов функций (табл. 2). К функции предъявляются следующие требования: она должна быть достаточно простой для использования ее в дальнейших вычислениях и график этой функции должен проходить вблизи экспериментальных точек так, чтобы сумма квадратов отклонений y-координаты всех экспериментальных точек от y-координат графика функции была ба минимальной (метод наименьших квадратов). Таблица 2 - Виды функций, применяемых в регрессионных моделях Парная (простая) регрессия Множественная регрессия Линейная регрессия y=ax b, y = а0 a1x1 amxm Квадратичная (параболическая) y=ax2 bx c y= а0 a1x12 am xm2 Степенная y=axb y = а0 x1 a1 x2 a2 xm am Логарифмическая y=al x b, Гиперболическая y = а0 a1 (1/x1) am(1/xm) Экспоненциальная y=aebx где a, b, c - коэффициенты парной регрессии. где а0, a1, a2,,am - коэффициенты множественной регрессии, - объем совокупности, m - количество факторных признаков. ? Какой вид регрессионного анализа (парный или множественный) в большей степени отвечает реальным условиям? ? Можно ли учесть все факторы х1, х2,, xm, в случае множественной корреляции? Для количественной оценки точности построения уравнения регрессии предназначен коэффициент детерминации R2, равный квадрату коэффициента корреляции и указывающий, какой процент изменения функции у объясняется воздействием факторов хk. Чем его значение ближе к 1, тем уравнение точнее описывает исследуемую зависимость. Значимое уравнение (с R2 близким к 1) используется, как правило, для прогнозирования изучаемого явления. Прогноз - это вероятностное суждение о будущем, полученное путем использования совокупности научных методов. Например, прогнозирование финансового состояния выполняется для того, чтобы получить ответы на два вопроса: «как это может быть (какими могут стать финансовые показатели, если не будут приняты меры по их изменению)» и «как это должно быть (какими должны стать финансовые показатели фирмы для того, чтобы ее финансовое состояние обеспечивало высокий уровень конкурентоспособности)». Прогнозирование с целью получения ответа на первый вопрос принято называть исследовательским, на второй - нормативным. Существует два способа прогнозов по уравнению регрессии: в пределах экспериментальных значений (интерполяция) и за пределами (экстраполяция). Применимость всякой регрессионной модели ограничена, особенно за пределами экспериментальной области, т.к. характер зависимости может существенно измениться. Поэтому достоверность исследовательского прогноза может быть невысокой. Однако его выполнение полностью обосновано. 1.2 Статистический пакет S A IS ICA Так как статистические методы находят широкое применение во всех сферах производства, то рынок компьютерных технологий предлагает большое количество прикладных программ, которые позволяют проводить такой анализ.
Иногда это можно сделать, изменив порядок следования команд в коде, предназначенном для проведения атаки. Иногда проще организовать нападение таким образом, чтобы взламывать пакеты выборочно. Так же как антивирусным компьютерным программам нужно постоянное обновление и пополнение новыми образцами кода, этому типу системы обнаружения вторжений необходимо постоянное обновление базы данных образцов нападения. Не ясно, сможет ли когда-нибудь такая база данных не отстать в соревновании с инструментом хакера. Другим принципом работы системы обнаружения вторжений является обнаружение аномалии. IDS осуществляет некоторое статистическое моделирование вашей сети и вычисляет, что является нормой. Затем, если происходит какое-либо отклонение от нормы, она подает звуки тревоги. Здесь все может быть сделано по правилам (система знает, что нормально, и сигнализирует обо всем остальном), с использованием статистики (система статистически вычисляет, что нормально, и сигнализирует обо всем остальном) или с применением методов искусственного интеллекта
SPSS Statistics (Statistical Package for the Social Sciences) -- компьютерная программа для статистической обработки данных, предназначенная для проведения прикладных исследований в первую очередь социальных науках.
По сравнению с ранее приведенными пакетами, обладает существенно меньшим инструментарием статистического анализа данных.
Преимущества и недостатки пакета SPSS
Преимущества пакета SPSS:
- Имеются русифицированные версии пакета.
- Позволяет параллельно обрабатывать несколько подвыборок.
- Простота в освоении.
- Имеются специфические методы, нацеленные исключительно на маркетинговые и социологические исследования (например, Conjoint analysis). Удобен при обработке результатов опроса.
- Имеется модуль для автоматизации процесса разработки анкеты и ввода результатов опросов (Data Entry).
Недостатки пакета SPSS:
- Отсутствует возможность реализации собственных алгоритмов;
- Существенно уступает в глубине анализа данных.
Список использованной литературы
1. Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере / Под ред. В. Э. Фигурнова. 3-е изд., перераб. и доп. М.:ИНФРА - М. 2003. 544 с.
3. Тюрин Ю.Н. Исследования по непараметрической статистике (непараметрические методы и линейная модель): Автореф. дисс. … д-ра физ.-мат. наук. М., 1985. 33 с.
Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Величко В.В.
В наши дни практически каждый человек неразрывно связан с компьютером. Ведь мы живем в развивающейся стране, где абсолютно каждый хочет усовершенствовать свои навыки и умения. Так как каждая минута на счету, подобная техника существенно сокращает время работы. На сегодняшний день принятие управленческих, производственных, финансовых, кадровых и других решений все чаще основывается на всестороннем анализе данных, что позволяет давать оценки вероятности их выполнения и зачастую приостанавливать принятие необдуманных решений и так же делать более основательные выводы и прогнозы.
11.1. Группы статистических пакетов
Потребность в средствах статистического анализа данных в различных областях деятельности, особенно в науке, очень велика, что и послужило причиной развития рынка компьютерных программ для статистической обработки данных. За последние 20 лет активное развитие получили компьютерные программы, позволяющие проводить статистический анализ больших объемов данных с целью выявления закономерностей, сравнения вероятных альтернатив выбора, построения прогнозов развития событий, обнаружения связей между явлениями и процессами и пр. Существующие программы постоянно совершенствуются в части ускорения работы с данными, улучшения представления результатов анализа данных, повышения удобства интерфейса, совершенствования справочной системы, увеличения числа встроенных в программу статистических процедур, средств обработки данных и пр.
- соответствие характеру решаемых задач;
- объем обрабатываемых данных;
- требования, предъявляемые к квалификации пользователя (уровень знаний в области статистики);
- имеющееся в наличии компьютерное оборудование.
Статистические пакеты по признаку функциональности могут быть разделены на 3 основные группы.
Универсальные пакеты, или пакеты общего назначения (например, SPSS, STATA, STATISTICA, S-PLUS, Stadia, STATGRAPHICS, SYSTAT, Minitab).
Эти пакеты не ориентированы на специфическую предметную область и могут применяться для анализа данных из различных областей деятельности. Как правило, они предлагают широкий диапазон статистических методов и имеют относительно простой интерфейс. С такими пакетами рекомендуется работать начинающим пользователям, владеющим лишь базовыми знаниями в области статистики, а также опытным пользователям на начальных этапах работы с данными, когда еще четко не определены статистические методы, которые будут применяться для решения того или иного вопроса. Многопрофильность универсального пакета позволяет провести пробный анализ различных типов данных с использованием широкого диапазона статистических методов. Большинство существующих универсальных пакетов имеют много пересечений по составу встроенных статистических процедур.
Для того чтобы статистический пакет считался универсальным, он должен удовлетворять ряду требований:
- содержать достаточно широкий набор стандартных статистических методов;
- быть достаточно простым для быстрого освоения и использования непрофессиональным пользователем;
- работать с достаточно большими базами данных и отвечать высоким требованиям к вводу, преобразованию и организации хранения данных;
- осуществлять обмен данными с широко распространенными пакетами и базами данных;
- иметь обширный набор средств графического представления данных и результатов их анализа;
- иметь подробное документационное сопровождение и справочную систему, позволяющую начинающему пользователю с легкостью находить ответы на вопросы, связанные с работой программы и возможностями применения средств анализа данных.
Профессиональные пакеты (например, SAS, BMDP).
Профессиональные пакеты отличаются от универсальных тем, что позволяют работать со сверхбольшими объемами данных, применять узкоспециализированные методы анализа, создавать собственную систему обработки данных. Как правило, подобные пакеты сложны в освоении для непрофессионалов. В то же время подготовленным пользователям работа с профессиональным пакетом предоставит больше возможностей для глубокого и детального анализа данных, построения сложных моделей и адаптации системы к собственным потребностям. Профессиональные пакеты более дорогостоящи, чем универсальные. Например, стоимость покупки SAS Analytics Pro на один год для индивидуального пользования составляет 5 360 EUR 2 Цена по состоянию на август 2010 года. . Эти факторы делают современные профессиональные статистические пакеты слишком тяжеловесными для массового применения в различных областях деятельности.
В некоторых областях деятельности анализируемые данные настолько специфичны, что к ним следует применять особые методы статистического анализа, как правило, не представленные в универсальных пакетах.
Специализированные пакеты позволяют проводить анализ с использованием ограниченного числа специализированных статистических методов или применимы к использованию для решения вопросов, относящихся к отдельно взятой предметной области . Как правило, с подобными статистическими пакетами работают специалисты, хорошо знакомые с методами анализа данных в той области, на которую ориентирован пакет. Так, статистический пакет BioStat создан для анализа данных в области биологии и медицины и будет подробнее рассмотрен ниже. Российский статистический пакет MESOSAUR специализируется на анализе одномерных и многомерных временных рядов и построении регрессионных моделей. Еще один российский статистический пакет DATASCOPE специализируется на проведении анализа многомерных данных.
Целесообразно пользоваться соответствующими специализированными пакетами, когда требуется систематически решать задачи из конкретной области или применять ограниченный круг сложных статистических процедур для анализа данных из нескольких областей человеческой деятельности.
Большинство представленных на рынке статистических пакетов обладают гибкой модульной структурой, которая может пополняться и расширяться за счет пользовательских модулей, дополнительно закупаемых или находящихся в свободном доступе в Интернете. Подобная гибкость позволяет адаптировать большинство пакетов к потребностям конкретного пользователя.
По мнению профессионалов, статистический пакет должен удовлетворять следующему минимальному набору требований 3 Айвазян С.А., Степанов В.С. Инструменты статистического анализа данных. М., 2000. :
- модульность;
- ассистирование при выборе способа обработки данных;
- использование простого проблемно-ориентированного языка для формулировки задания пользователя;
- автоматическая организация процесса обработки данных;
- ведение банка данных пользователя и составление отчета о результатах проделанного анализа;
- диалоговый режим работы пользователя с пакетом;
- совместимость с другим программным обеспечением.
Как правило, представленные на рынке статистические пакеты регулярно обновляются. При этом в новой версии сохраняются или совершенствуются возможности предыдущей, а также добавляются новые возможности работы с данными. В большинстве случаев обновленные версии пакета сохраняют исходное название, изменяется лишь порядковый номер, присваиваемый конкретной версии. Самые распространенные пакеты имеют русскоязычную версию.
В этой главе представлен обзор наиболее известных программных продуктов, разработанных для статистической обработки данных на компьютере и относящихся к упомянутым ранее трем основным группам программ (см. таблицу 11.1), перечислены их основные характеристики и возможности статистического анализа данных.
При рассмотрении каждого пакета отдельно будут отмечены возможности статистического анализа, которые он предоставляет пользователям. Необходимо отметить, что существует минимальный набор статистических методов анализа, который включен во все рассмотренные пакеты:
- описательная статистика (базовые статистические методы, проверка нормальности распределения данных);
- дисперсионный анализ;
- непараметрическая статистика (анализ таблиц сопряженности, непараметрические сравнения, дисперсионный анализ);
- контроль качества;
- анализ выживаемости;
- кластерный анализ;
- факторный анализ;
- дискриминантный анализ;
- регрессионный анализ;
- обработка данных (сортировка, отбор, трансформация данных ).
Текст научной работы на тему «Сравнительный анализ статистических пакетов программ»
МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №5/2016 ISSN 2410-6070
Рисунок 4 - ошибки по скорости.
Список использованной литературы:
1 В.Г. Потемкин. Система MATLAB. Справочное пособие. - М.: Диалог МИФИ, 1997 г.
2 Д.И. Воскресенский, Р.А. Грановская, Н.С. Давыдова и др./Под ред. Д.И. Воскресенского. Антенны и устройства СВЧ (Проектирование фазированных антенных решеток): Учебное пособие для вузов. - М.: Радио и связь, 1981 г.
3 Кузьмин С. З. Цифровая радиолокация. Введение в теорию. Киев.: Издательство КВЩ,, 2000. 428 с.
4 Трухачев А. А. Характеристики обнаружения и сопровождения траекторий // Радиотехника, 2009. №6. С.
5 Pulford G. Taxonomy of multiple target tracking methods // Radar, Sonar and Navigation, IEE Proceedings - (Volume:152 , Issue: 5), 2005
6 Кондрашов К. С., Жураковский В. Н., Автозахват траекторий в режиме автономного обзора в условиях низкой точности входных данных // [Электронный ресурс] «Наука и образование», электронное издание МГТУ им. Н. Э. Баумана, №11, 2013, DOI: 10.7463/1113.0638017, дата обращения 23.11.2015.
© Логвиненко А. С., Былдин А. Ю., Жураковский В. Н., 2016.
Студент группы 15БИ(ба)ИСЭ Факультет экономики и управления Оренбургский Государственный Университет г. Оренбург, Российская Федерация
СРАВНИТЕЛЬНЫЙ АНАЛИЗ СТАТИСТИЧЕСКИХ ПАКЕТОВ ПРОГРАММ
В наши дни практически каждый человек неразрывно связан с компьютером. Ведь мы живем в развивающейся стране, где абсолютно каждый хочет усовершенствовать свои навыки и умения. Так как каждая минута на счету, подобная техника существенно сокращает время работы. На сегодняшний день
_МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №5/2016 ISSN 2410-6070_
принятие управленческих, производственных, финансовых, кадровых и других решений все чаще основывается на всестороннем анализе данных, что позволяет давать оценки вероятности их выполнения и зачастую приостанавливать принятие необдуманных решений и так же делать более основательные выводы и прогнозы.
Статистический пакет, сравнительный анализ, STATISTICA, SPSS, STATA, R, EViews.
Несомненно, потребность в средствах статистического анализа данных в разносторонних областях деятельности человека очень велика, это и поспособствовало развитию рынка компьютерных программ для статистической обработки данных. За последние два десятилетия компьютерные программы начали активно развиваться, и в настоящий момент позволяют проводить статистический анализ больших объемов, данных с целью выявления закономерностей, сравнения вероятных альтернатив выбора, построения прогнозов развития событий, обнаружения связей между явлениями и процессами. Программы постоянно совершенствуются в части ускорения работы с данными, улучшения представления результатов анализа данных, увеличения удобства интерфейса, совершенствования справочной системы, повышения числа встроенных в программу статистических процедур, средств обработки данных и др.
В связи с вышесказанным, опираясь на мнение таких ученых как: Бородкин Л.И. [1], Волков Г.Г. [2], Гефан Г.Д. [3], Глушаков А.И. [4], Панарина Д.В. [5], Тифанова И. В. [6], Цыпин А.П. [7, 8] и др., проведем анализ достоинств и недостатков статистических пакетов программ.
« SPSS, STATA, STATISTICA, EViews, R Профессиональные пакеты • SAS, BMDP
• BioStat, MESOSAUR, DATASCOPE
Рисунок 1 - Классификация статистических пакетов по функциональности
Далее остановимся на рассмотрим особенностей универсальных пакетов программ.
Первая версия пакета SPSS была выпущена в 1968 г. Основу пакета составляет базовый модуль, позволяющий осуществлять управление данными и содержащий наиболее распространенные методы статистического анализа данных.
Достоинствами SPSS принято считать такие факторы как: развитый аппарат статистического анализа; универсальность; широкий набор статистических и графических процедур анализа данных, а также процедур создания отчетов; высокая скорость вычислений, простой и удобный интерфейс и др.
К недостаткам можно отнести высокую цену по сравнению со статистическими пакетами аналогичного уровня (стоимость покупки для индивидуального пользования сроком на год составляет около 7200 $).
_МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №5/2016 ISSN 2410-6070_
Первая версия пакета STATA была выпущена в 1985 г. Пакет позиционируется как инструмент анализа, предназначенный для специалистов, которые занимаются научными исследованиями. По мнению разработчиков, благодаря гибкой модульной структуре пакет применим для анализа данных из различных областей знаний.
Преимущества пакета это: широкий набор средств статистического анализа данных (в том числе реализована возможность построения регрессии на панельных данных и географически взвешенной регрессии); широкий спектр возможностей по управлению данными; возможность программирования всей последовательности команд; использование координатного указателя; интерактивный справочник; создание графики полиграфического качества и др.
Недостатком пакета являются отсудите русифицированной версии и требования к знанию пользователем основ программирования (для максимального использования возможностей пакета).
EViews - статистический пакет в основном для анализа эконометрических данных временных рядов, анализа и моделирования панельных данных, построения регрессионных моделей. Пакет успешно может быть использован для решения следующих задач: анализ научной информации; финансовый анализ; макроэкономическое прогнозирование; моделирование экономических процессов; прогнозирование состояний рынков.
Недостатки пакета являются: фактически отсутствует возможность реализации собственных алгоритмов; слабые возможности визуализации; отсутствие русифицированной версии; необходимость использования командной строки.
Первая версия пакета STATISTICA была выпущена в 1991 г. Пакет предоставляет пользователям следующие возможности статистического анализа данных как одномерного, так и многомерного характера, помимо этого среди инструментов пакета можно назвать нейронные сети и блок процедур посвященных промышленной статистике (в т.ч. статистике качества).
Недостатки пакета являются: отсутствие реализации некоторых важных тестов временных рядов; слабо проработанный блок методов, нацеленных на эконометрическое моделирование; высока стоимость -более 3000 $.
R - это интерпретационный язык программирования с открытым кодом, программная среда, которая позволяет проводить статистические расчеты и производить работу обработки данных. Статистический пакет R был разработан в 1995 году. В данном пакете доступен совершенно весь анализ, который проводится в других статистических пакетах, от самых простых до самых сложных. Доступно линейное и нелинейное моделирование, анализ временных рядов, проверка статистических гипотез, возможности работы с двухмерной и трехмерной графикой. Также несомненным достоинством является бесплатное распространение пакета.
К недостаткам можно отнести отсутствие русификатора, методической литературы на русском языке, необходимость продвинутого уровня программирования.
В рамках выполняемого исследования, был проведен опрос мнения 20 пользователей рассмотренных пакетов программ, по 5-ти бальной системе, усредненные результаты представлены в таблице 1.
Оценка по функциональности и доступности статистических пакетов
Пакеты Удобство пользования Количество методов Наличие методического обеспечения Стоимость
SPSS 4,4 5,0 4,5 5,0
STATA 4,3 4,4 4,2 1,4
STATISTICA 3,3 3,5 3,7 3,6
EViews 3,3 2,5 2,4 2,7
Как видим наилучшую оценку среди пользователей завоевал пакет R, далее можно отметить STATA, особо стоит выделить стоместной параметр, который в условиях значительного укрепления доллара является одним из определяющих факторов.
На основе вышеизложенного можно сделать некоторые выводы: статистические программы относятся к наукоемкому программному обеспечению, цена их часто недоступна индивидуальным пользователям.
МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №5/2016 ISSN 2410-6070
Профессиональные пакеты имеют большое количество методов анализа, популярные пакеты - количество функций, достаточное для универсального применения. Специализированные же пакеты ориентированы на какую-либо узкую область анализа данных. Создатели программных статистических пакетов заявляют, что их продукт превосходит аналоги.
Список использованной литературы:
1. Бородкин Л.И. Статистические методы и пакеты статистических программ / Л.И. Бородкин, И.М. Гарскова // В сборнике: Историческая информатика Белова Е.Б., Бородкин Л.И., Гарскова И.М., Изместьева Т.Ф., Лазарев В.В. Москва, 1996. С. 224-266.
2. Волков Г.Г. Система компьютерной математики и статистические пакеты прикладных программ в учебном процессе экономического ВУЗа / Г.Г. Волков, Е.А. Григорьев // Вестник Российского университета кооперации. 2009. № 1 (3). С. 229-240.
3. Гефан Г.Д. Активное применение компьютерных технологий в преподавании вероятностно-статистических дисциплин в техническом ВУЗе / Г.Д. Гефан // Вестник Красноярского государственного педагогического университета им. В.П. Астафьева. 2014. № 1 (27). - С. 57-61.
4. Глушаков А.И. Применение статистических программ и методов в медико-биологических научных исследованиях / А.И. Глушаков // Казанский медицинский журнал. 2009. №4. - С. 550-555.
5. Панарина Д.В. Использование статистических пакетов в экономических информационных системах / Д.В. Панарина // Экономика и предпринимательство. 2015. № 12-2 (65-2). С. 192-194.
6. Тифанова И. В. Использование статистического пакета SPSS в преподавании статистических дисциплин у студентов различных специальностей / И. В. Тифанова // Наука и современность. 2010. № 3-1. - С. 329-333.
© Величко В.В., 2016
студентка 3 курса факультета перерабатывающих технологий Кубанский государственный аграрный университет
студентка 3 курса факультета перерабатывающих технологий Кубанский государственный аграрный университет
студентка 4 курса факультета перерабатывающих технологий Кубанский государственный аграрный университет Научный руководитель: А.А.Нестеренко
Кубанский государственный аграрный университет г. Краснодар, Российская Федерация
ПРИМЕНЕНИЕ ПИЩЕВЫХ ДОБАВОК ДЛЯ СНИЖЕНИЯ КАЛОРИЙНОСТИ КОЛБАС
При разработке норм физиологических потребностей человека в пищевых веществах и энергии одним из критичных факторов явился размер энергетических затрат.
В настоящее время отмечается активный рост количества компьютерных программ, позволяющих проводить статистический анализ данных с целью выявления связей и закономерностей, построения прогнозов. Отрасль развивается стремительными темпами. Разнообразие статистических пакетов обусловлено широким кругом решаемых задач в различных областях человеческой деятельности. На сегодняшний день на мировом рынке существует около 1000 распространенных пакетов, решающих задачи статистического анализа [1]. Хронология развития пакетов анализа данных представлена в таблице 1.
Таблица 1. Хронология развития пакетов анализа данных
Основные пакеты анализа данных
SSP, BMDP, SAS, SPSS, различные библиотеки
Statgraphics, STATA, SPSS, SAS, Systat
Statgraphics, STATA, SPSS, SAS,
В России получили широкое распространение следующие зарубежные пакеты: STATGRAPHICS, SYSTAT, SAS, ВМDР, SPSS, Statistica.
Из отечественных разработок стоит отметить следующие: STADIA, ЭВРИСТА, СТАТЭксперт, МЕЗОЗАВР, САНИ.
Рисунок 1- Статистика программных средств
Пакеты для обработки данных разделяют на следующие категории:
1. Специализированные пакеты. К ним относят пакеты, содержащие методы из одного - двух разделов статистики или методы, используемые в конкретной предметной области.
2. Пакеты общего назначения, также их называют универсальными. Благодаря широкому диапазону статистических методов и доступному интерфейсу они являются наиболее удобными для пользователя.
3. Профессиональные пакеты предназначены для обработки больших объемов данных, в них встроены узкоспециализированные методы анализа.
Кратко рассмотрим основные характеристики пакетов STATISTICA и SPSS Statistics.
STATISTICA - программный пакет для статистического анализа от компании StatSoft, реализующий функции анализа, управления, добычи, визуализации данных с привлечением статистических методов. Одним из существенных преимуществ STATISTICA является большое количество литературы по работе с инструментами программы. Наличие очень мощного модуля для нейросетевого моделирования сделало пакет популярным среди людей с технологическим образованием. В последней версии программы появилась возможность параллельной обработки нескольких подгрупп данных [3].
SPSS Statistics- это полнофункциональная статистическая система, предназначенная для решения исследовательских и бизнес-задач при помощи анализа данных. Имеющиеся специфические методы, нацеленные исключительно на маркетинговые и социологические исследования (например, Conjoint analysis) делают данный пакет более популярным среди людей с социально-экономическим образованием [4]. По мнению некоторых специалистов, SPSS занимает ведущее положение среди программ, предназначенных для статистической обработки информации.
Современный уровень развития информационных технологий предоставляет пользователям широкий выбор доступных статистических пакетов, удовлетворяющих разнообразные потребности.
Список литературы
1. Румянцева Е.Л. Информационные технологии: Учеб. пособие / Под ред. прф. Л.Г. Гагариной. – М.: ИД «ФОРУМ»: ИНФРА-М, 2007.
4. Дубнов П.Ю. Обработка статистической информации с помощью SPSS. М.: ACT, НТ Пресс, 2004.
Аннотация: В современном мире принятие управленческих, производственных, финансовых, кадровых и других решений все чаще основывается на всестороннем анализе данных, что позволяет делать более обоснованные выводы и прогнозы, давать оценки вероятности их выполнения и зачастую предотвращать принятие необоснованных и непродуманных решений.
Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Величко В.В.
Информационные технологии при проведении экономико-статистических исследований на основе исторических временных рядов
Разработка программного обеспечения для имитационного моделирование как совершенствование Инвест анализа
Подобные документы
Спектр задач, которые решают математические программные пакеты (Maple, MathCad, Mathematica и MatLab). Математические исследования, требующие вычислений и аналитических выкладок. Разработка и анализ алгоритмов. Визуализация, научная и инженерная графика.
презентация [148,7 K], добавлен 06.01.2014
Развитие новых информационных и телекоммуникационных технологий. Решение экономической задачи с использованием табличного процессора Microsoft Excel. Возможности Excel при работе с функциями. Математические и статистические пакеты прикладных программ.
курсовая работа [452,8 K], добавлен 01.04.2009
курсовая работа [36,8 K], добавлен 23.06.2011
Сущность понятия "диапазон ячеек". Правила образования выражений. Приоритеты выполнения операций в выражениях. Категории стандартных функций: математические; статистические; логические; финансовые. Стандартные действия, которые можно выполнять с данными.
лабораторная работа [19,0 K], добавлен 11.12.2009
Базы данных, содержащие информацию о графических редакторах. Предметная область, словарь понятий и терминов. Построение функциональных зависимостей. Синтез схемы базы данных на основании функциональных зависимостей. Построение неизбыточного покрытия.
Упоминание о использовании системы SAS занимает одно из ведущих мест в публикациях, посвященных исследованию качества жизни. Алгоритмы шкалирования опросников зачастую распространяются в виде командного скрипта на встроенном языке системы.
Система SAS известна с 1976 г. и способна работать под управлением практически любой операционной системы (ОС). Установка SAS на компьютер приводит к инсталляции своей собственной операционной системы, которая, однако, способна обмениваться данными из приложений, работающих под управлением других ОС.
SAS включает свыше 20 различных программных продуктов, объединенных друг с другом "средствами доставки информации" (Information Delivery System или IDS, так что весь пакет иногда обозначается как SAS/IDS). Под понятием IDS подразумевается, что пользователю SAS достаточно поставить на свой компьютер кроме ОС систему SAS и этим ограничиться для 100% информатизации деятельности (все остальные функции типа задач, решаемых на основе Excel, Word, любой из СУБД и др. полностью возьмет на себя SAS/IDS). Традиционно сложилось, что основными отечественными пользователями системы являются предприятия ВПК, крупные бизнесмены (некоторые банки, включая Центробанк, биржи, торговые фирмы), некоторые атомные станции, крупнейшие медицинские и геофизические центры, крупные государственные структуры.
Основным достоинством SAS является непревзойденная мощность по набору статистических алгоритмов среди универсальных пакетов. Кроме того, SAS предоставляет пользователю возможность подключения собственных оригинальных алгоритмов.
Использованием SAS возможно решить практически любые задачи как систематизации данных, так и практически любого вида статистического анализа. Однако, высокая стоимость системы и малая распространенность ее в России делает ее малоизвестной среди отечественных специалистов, занимающихся исследованием качества жизни.
Пакет SPSS предназначен в первую очередь для статистиков-профессионалов. Он включает развитый аппарат статистического анализа, соизмеримый по мощности с SAS. Программу SPSS для Windows считают в настоящее время одним из лидеров среди универсальных статистических пакетов. Алгоритмы шкалирования опросников качества жизни распространяются также в виде скриптов на языке SPSS, причем научиться самостоятельно писать подобные алгоритмы способен даже специалист без начального программистского образования.
SPSS имеет удобные графические средства (более 50 типов диаграмм), а также развитые средства подготовки отчетов. Аналитические параметры отображаются на экране в виде простых и понятных меню и диалоговых окон. Новая контекстно-ориентированная справочная система содержит пошаговые инструкции для наиболее важных операций. В литературных источниках, посвященных исследованию качества жизни, упоминания об использовании SPSS встречаются практически наравне с упоминаниями о SAS.
Универсальная статистическая система SYSTAT разработана одноименной фирмой, которая с сентября 1994 г. поглощена корпорацией SPSS. Главное достоинство пакета - исключительно широкий диапазон и глубина проработки функционального наполнения. Здесь есть широкие возможности и для слабо подготовленного в статистике пользователя и для достаточно искушенного статистика. Для исследователя качества жизни этот программный продукт представляет интерес благодаря наличию алгоритмов анализа шкал опросников, таких как анализ внутреннего постоянства, многомерное шкалирование, классический и логит-анализ пунктов шкалы.
Пакет MINITAB развивается более 20 лет и широко известен в США, где он является одним из основных учебных пакетов. Пакет также работает на компьютерах Macintosh.
MINITAB хорошо продуман по разделу описательной (дескриптивной) статистики, хорошо сконструирован и управляется с помощью удобного меню, или, по желанию пользователя, через команды, составлять которые помогают диалоговые окна пакета. Часто используемые команды можно запускать по их первой букве. Общее число команд превышает 200. Можно составлять специальные макросы для выполнения последовательностей команд.
Импорт/экспорт данных из других Windows-приложений делается через стандартный буфер обмена. В пакете имеются разнообразные возможности по управлению данными.
Пользователь Minitab при исследовании качества жизни может легко и быстро решать практически все типовые задачи, в основном из области получения описательных статистик и сравнения групповых средних, анализа временных рядов. Если на этапе создания и валидации опросника исследования качества жизни требуется применение методов многомерной статистики, то Minitab позволяет находить главные компоненты или же проводить стандартный линейный или даже квадратичный дискриминантный анализ, использовать алгоритмы факторного и кластерного анализа.
Кроме того, Minitab позволяет получать множество хороших и сложных полноцветных графиков. В плане характеристики мощность Minitab достаточно силен и разнообразен, поэтому говорят, что первые четыре буквы пакета скорее надо поменять на Maxi.
Ряд авторов считает, что пакет Statistica является хорошо сбалансированным по соотношению "мощность/удобство". Наличие достаточно широкого спектра функциональных алгоритмов делает его достаточно привлекательным для статистиков-профессионалов. В частности, он включает в себя ряд непараметрических методов анализа, методы многомерного анализа: дискриминантного, факторного кластерного, логлинейного и др. В области исследования качества жизни Statistica 6.0 предоставляет возможности анализа шкал и пунктов, а также обладает развитым блоком анализа мощности и необходимого количества наблюдений.
Средства манипулирования исходными данными в пакете Statistica хорошо развиты. Данные относительно легко отредактировать, можно создавать новые переменные ("признаки"), выбирать отдельные наблюдения или "вырезать" подмножество данных по строкам и/или по столбцам таблицы "объект-признак". Благодаря обширной панели инструментов, для выполнения большинства манипуляций достаточно несколько щелчков мышки, так как почти для всех функций пакета здесь имеются пиктограммы.
Сильной стороной пакета является графика и средства редактирования графических материалов. В пакете представлены сотни типов графиков 2D или 3D, матрицы и пиктограммы. Предоставляется возможность разработки собственного дизайна графика.
Средства управления графиками позволяют работать одновременно с несколькими графиками, изменять размеры сложных объектов, добавлять художественную перспективу и ряд специальных эффектов, разбивку страниц и быструю перерисовку. Например, 3D-графики можно вращать, накладывать друг на друга, сжимать или увеличивать. Передовая анимационная техника позволяет увидеть на графиках, какие точки изменились под влиянием изменений в одной из переменных.
Пакет STADIA разработан ведущими специалистами Московского государственного университета им. М. В. Ломоносова (главный разработчик - А. П. Кулаичев) совместно с НПО "Информатика и компьютеры". Первая версия пакета была создана в конце 70-х гг. для БЭСМ-6. С тех пор пакет постоянно модифицировался, пополняя свои функциональные и сервисные возможности.
Пакет STADIA является единственным российским статистическим пакетом, представленном на рынке, который можно отнести к классу универсальных пакетов, то есть в нем представлены все самые распространенные методы статистического анализа данных от описательной статистики и проверки различных гипотез до анализа временных рядов и контроля качества, а также многомерных (факторный, кластерный, дискриминантный анализ, шкалирование) и непараметрических методов анализа. Таким образом, пакет подходит для решения практически всех задач, встречающихся в исследовании качества жизни.
Пакет STADIA, в отличие от SAS и SPSS, не поддерживает обработку миллионов наблюдений, но прекрасно справляется с данными выборочных обследований нескольких сотен или тысяч респондентов. Пакет ориентирован на конкретные статистические расчеты и построение сопутствующих графиков во всех областях прикладной статистики, снабжая пользователя попутно всей необходимой информацией о работе статистических процедур.
В настоящее время пакет используется в учебном процессе и научно-практической работе более чем в 150 университетах России, включая 17 университетов медицинского профиля. Среди пользователей пакета не только ведущие медицинские центры страны (НИИ им. Сербского, НИИ педиатрии РАМН, НИИ дефектологии, институт медико-биологических проблем, НИИ медицинского приборостроения и др.), но и поликлиники, больницы, медсанчасти городов: Москвы, Самары, Перми, Тулы, Уфы, Липецка, Архангельска, Кисловодска, Оренбурга, Бердянска и др.
Пакет STADIA простой в освоении, недорогой (профессиональная версия стоит 500 у.е.) и очень мощный инструмент статистического анализа данных ограниченных объемов. Он учитывает уровень статистической подготовки российского пользователя, позволяет быстро найти необходимый метод обработки данных, представить результаты анализа в табличной и графической формах и продолжить их оформление в других средствах среды Windows (текстовых и графических редакторах).
STATGRAPHICS включает более 250 статистических процедур, применяющихся в бизнесе, экономике, маркетинге, медицине, биологии, социологии, психологии, на производстве и в других областях. Каждой группе процедур соответствует собственное меню. Результаты представляются в табличной форме или на удобных для восприятия графиках.
Версия 5.1 обогащена диалоговой системой ввода данных из других приложений и выбора методов анализа. Уникальной особенностью STATGRAPHICS является процедура регрессионного анализа, где представлено сравнение полученной регрессионной зависимости с альтернативными моделями. При исследовании статистических связей между показателями качества жизни и клинико-лабораторными данными этот модуль может оказаться неоценимым.
Модуль Statistical Advisor кратко поясняющий суть любого проведенного анализа оказывает помощь в интерпретации результатов. Таким образом, STATGRAPHICS является достаточно полезным программным продуктов для исследования качества жизни, доступным как для начинающего исследователя, так и для совершенствующегося эксперта.
11.2. Пакет SPSS
По мнению разработчиков пакета, SPSS является одним из лидирующих программных продуктов в области статистического анализа данных для решения вопросов в правительственной, академической и бизнессфере.
SРSS является модульной программой. Ее основу составляет базовый модуль (SPSS Base ), позволяющий осуществлять управление данными и содержащий наиболее распространенные методы статистического анализа данных: проведение описательной статистики ; построение линейных и нелинейных моделей ; осуществление преобразования данных; проведение факторного, кластерного, дисперсионного анализов; вычисление корреляций; построение графиков; подготовка отчетов и пр.
Для проведения расширенного и углубленного анализа данных могут быть установлены дополнительные модули пакета. Для пакета IBM SPSS Statistics 19 разработаны 16 различных модулей. Например, модуль IBM SPSS Advanced Statistics предназначен для проведения анализа сложных взаимосвязей при помощи процедур, учитывающих свойства исследуемых данных, что позволяет продвинуться за рамки базового анализа данных. В модуль встроены мощные инструменты построения моделей. Модуль IBM SPSS Bootstrapping ("Самогенерация") позволяет аналитикам проверять устойчивость построенных моделей, а модуль IBM SPSS Direct Marketing (" Прямой маркетинг") предоставляет возможность маркетологам самостоятельно выполнять основные виды анализа. Модуль IBM SPSS Data Entry автоматизирует процесс разработки анкеты и ввода результатов опросов.
Достоинства SPSS:
- развитый аппарат статистического анализа;
- универсальность (может быть использован для решения широкого круга вопросов из различных предметных областей, требующих проведения статистического анализа данных);
- широкий набор статистических и графических процедур (более 50 типов диаграмм) анализа данных, а также процедур создания отчетов;
- высокая скорость вычислений, простой и удобный интерфейс;
- детальная контекстно-ориентированная справочная система, позволяющая неопытному пользователю с большей легкостью ориентироваться в программе;
- возможность свободного скачивания демонстрационной версии продукта на официальном сайте компании, наличие версий продукта на различных языках;
- совместимость с операционными системами Windows, Mac, Linux;
- наличие значительного количества литературы по работе с пакетом.
Недостатки SPSS:
- высокие требования к системе компьютера (требуется 1GB оперативной памяти, 800MB памяти на жестком диске и процессор с частотой 1GHz и выше);
- высокая цена по сравнению со статистическими пакетами аналогичного уровня (стоимость покупки для индивидуального пользования сроком на год составляет около 1000 долл. 6 Цена по состоянию на август 2010 года. ).
Последняя версия SPSS включает в себя следующие новые возможности:
- импорт данных из Excel и SAS;
- экспорт результатов в MS Office, PDF; сохранение результатов в формате HTML;
- одновременная работа с несколькими наборами данных;
- построение диаграммы для переменных с множественными ответами;
- построение диаграммы с двумя осями Y;
- улучшенный редактор синтаксиса с поддержкой автозавершения и цветового кодирования команд ;
- быстрая подготовка данных к анализу посредством Автоматизированной подготовки данных (IBM SPSS Data Preparation), позволяющей облегчить процесс интеллектуального анализа данных , выявляя и исправляя ошибки в данных и объясняя пропущенные значения. Также посредством этой функции можно подготовить отчет с рекомендациями о возможности использования данных для анализа.
На рис.11.1 представлено окно редактора данных SPSS. В левом нижнем углу окна расположены две вкладки: Данные ( Data View) и Переменные (Variable View), позволяющие переключаться с режима просмотра значений переменных в режим просмотра их характеристик.
Результаты статистического анализа приводятся в диалоговом окне под названием Вывод ( Output ) (рис.11.2).
Читайте также: