» » Основные статистические характеристики. Аналитический анализ

Основные статистические характеристики. Аналитический анализ

Лабораторная работа №9

Статистический анализ данных

Цель работы: научиться обрабатывать статистические данные в электронных таблицах с помощью встроенных функций; изучить возможности Пакета анализа в MS Excel 2010 и его некоторые инструменты: Генерация случайных чисел, Гистограмма, Описательная статистика.

Теоретическая часть

Очень часто для обработки данных, полученных в результате обследования большого числа объектов или явлений (статистических данных ), используются методы математической статистики.

Современная математическая статистика подразделяется на две обширные области: описательную и аналитическую статистику . Описательная статистика охватывает методы описания статистических данных, представления их в форме таблиц, распределений и пр.

Аналитическая статистика называется также теорией статистических выводов. Ее предметом является обработка данных, полученных в ходе эксперимента, и формулировка выводов, имеющих прикладное значение для самых различных областей человеческой деятельности

Полученный в результате обследования набор чисел называетсястатистической совокупностью.

Выборочной совокупностью (или выборкой ) называется совокупность случайно отобранных объектов. Генеральной совокупностью называется совокупность объектов, из которой производится выборка. Объемом совокупности (генеральной или выборочной) называется число объектов этой совокупности.

Для статистической обработки результаты исследования объектов представляют в виде чисел x 1 , x 2 , …, x k . Если значение x 1 наблюдалось n 1 раз, значение x 2 наблюдалось n 2 раз, и т.д., то наблюдаемые значения x i называются вариантами , а числа их повторений n i называются частотами . Процедура подсчета частот называется группировкой данных.

Объем выборки n равен сумме всех частот n i :

Относительной частотой значения x i называется отношение частоты этого значения n i к объему выборки n :

Статистическим распределением частот (или просто распределением частот ) называется перечень вариант и соответствующих им частот, записанных в виде таблицы:



Распределением относительных частот называется перечень вариант и соответствующих им относительных частот.


Основные статистические характеристики.

Современные электронные таблицы имеют огромный набор средств для анализа статистических данных. Наиболее часто используемые статистические функции встраиваются в основное ядро программы, то есть эти функции доступны с момента запуска программы. Другие более специализированные функции входят в дополнительные подпрограммы. В частности, в Excel, такая подпрограмма называется Пакетом анализа. Команды и функции пакета анализа называют Инструментами анализа. Мы ограничимся изучением нескольких основных встроенных статистических функций и наиболее полезных инструментов анализа из пакета анализа в электронной таблице Excel.

Среднее значение.

Функция СРЗНАЧ вычисляет выборочное (или генеральное) среднее, то есть среднее арифметическое значение признака выборочной (или генеральной) совокупности. Аргументом функции СРЗНАЧ является набор чисел, как правило, задаваемый в виде интервала ячеек, например, =СРЗНАЧ (А3:А201).

Предварительная информация по МЕТОДАМ ОБРАБОТКИ РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА

ПОДГОТОВКА ПЕРВИЧНЫХ ДАННЫХ К АНАЛИЗУ

Наблюдая и измеряя характеристики объекта, экспериментатор собирает первичный статистический материал. Дальнейшая задача состоит в такой обработке и представлении первичных данных, которые позволили бы оценить и сопоставить результаты для проверки гипотез, для выявления существенных свойств и закономерностей изучаемого процесса. В основе методов обработки лежит предварительное упорядочение, cиcтeмaтизaция первичных данных и вычисление их статистических характеристик.

Обобщенный алгоритм подготовки данных может быть представлен следующим операциями:
а) все данные формулируются и записываются в необходимой краткой форме;
б) проводится группировка данных, то есть распределение их на однородные группы в соответствии с интересующими экспериментатора признаками. Данные в каждой группе упорядочиваются - классифицируются, сортируются, структурируются в соответствии с той моделью, которая разрабатывалась при составлении плана-программы устанавливаются характеристики (признаки, параметры каждой группы данных и производится подсчет абсолютного числа факторов, характеризующих группуг) данные внутри каждой сформированной группы располагаются в ряд (вариационный ряд) по убыванию или возрастанию признака. Определяется наибольшее и наименьшее значения признака;
д) вариационные ряды данных, полученных в номинальной или порядковой шкале, ранжируются. Интервалы группировки по рангам выбираются оптимальными (слишком крупные интервалы скрывают нюансы явлений, слишком дробные - затрудняют o6pаботку). В результате этой операции появляются новые количественные данные;
е) проводится статистическая обработка полученных количественных данных, заключающаяся в вычислении некоторых статистических характероистик и оценок, позволяющих глубже понять особенности экспериментальных явлений;
ж) составляются наглядные материалы, отображающие полученную информацию: таблицы, графики, диаграммы, схемы и др., по которым в дальнейшем устанавливаются и анализируются связи между параметрами экспериментальных объектов.

СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ

Экспериментатору необходимо знание ряда простейших понятий математической статистики и умение с ними работать.
Все множество интересующих исследователя однородных явлений, событий или их показателей называется генеральной совокупностью данных объектов. Та часть последней, которая подвергается экспериментальному изучению, называется выборочными совокупностью или выборкой.
Величина (объем) выборки представляет собой абсолютное (счетное) количество однородных объектов исследования (явлений, событий или их характеристик).
Выборка характеризуется рядом статистических характеристик, наиболее употребительными из которых являются: среднее арифметическое значение, дисперсия, среднее квадратичное отклонение среднего арифметического.

Среднее значение данного показателя выборочной совокупности (арифметическое среднее, выборочное среднее ) - это отношение суммы всех измеренных значений показателя к величине выборки.

Если в выборке есть повторяющиеся значения, то составляется таблица сгруппированных данных, следующего вида:

Тогда = , где n= .

Среднее значение недостаточно полно характеризует выборку; за ним скрывается “поведение” самого показателя явления-“разброс”, различное распределение его значений около среднего (так называемая “функция распределения”).

Выборочной дисперсией (s 2) статистического показателя называется среднее значение квадратов отклонений отдельных его значений от среднего выборочного; дисперсия определяется по формуле:

S 2 = (2)

Для сгруппированных данных S 2 = .

Выборочнымсредним квадратическим отклонением называется корень квадратный из выборочной дисперсии.

Выборочные дисперсия и среднее квадратичное отклонение играют большую роль при определении степени достоверности результатов.
Генеральная совокупность также обладает всеми вышеперечисленными статистическими характеристиками, которые в общем случае не совпадают с характеристиками выборки. Для эксперимента особое значение, имеет оценка той ошибки, которая допускается, если по выборочным характеристикам судить о генеральной совокупности.
В практике вычислений величина расхождения средних значений генеральной и выборочной совокупностей определяется средней квадратической ошибкой выборочного среднего, которая вычисляется по формуле

Мода - это наиболее часто встречающеесязначение в выборке. Мода применяется, например, при определении размера одежды, обуви, пользующейся наибольшим спросом у покупателей. Модой для дискретного ряда является значение, обладающая наибольшей частотой.

Медиана - это значение признака, которое лежит в основе ранжированного ряда и делит этот ряд на две равные по численности части.

Для определения медианы в дискретном ряду при наличии частот сначала вычисляют полусумму частот , а затем определяют, какое значение признака приходится на нее. (Если отсортированный ряд содержит нечетное число признаков, то значение среднего в упорядоченном ряду будет медианой, порядковый номер медианы вычисляют по формуле:

(n + 1)/2,

в случае четного числа признаков медиана будет равна среднему арифметическому из двух признаков находящихся в середине ряда.

Молчанов Сергей

Статистика знает всё»,- утверждали Ильф и Петров в своем знаменитом романе «Двенадцать стульев» и продолжали: «Известно, сколько какой пищи съедает в год средний гражданин республики... Известно, сколько в стране охотников, балерин... станков, велосипедов, памятников, маяков и швейных машинок... Как много жизни, полной пыла, страстей и мысли, глядит на нас со статистических таблиц!..» Зачем нужны эти таблицы, как их составлять и обрабатывать, какие выводы на их основании можно делать – на эти вопросы отвечает статистика (от итальянского stato – государство, латинского status – состояние).Статистика - наука, изучающая, обрабатывающая и анализирующая количественные данные о самых разнообразных массовых явлениях в жизни.

Цели работы:Сформировать представление о статистических исследованиях, обработки данных и интерпретации результатов.

Скачать:

Предварительный просмотр:

«Статистика знает всё»,— утверждали Ильф и Петров в своем знаменитом романе «Двенадцать стульев» и продолжали: «Известно, сколько какой пищи съедает в год средний гражданин республики... Известно, сколько в стране охотников, балерин... станков, велосипедов, памятников, маяков и швейных машинок... Как много жизни, полной пыла, страстей и мысли, глядит на нас со статистических таблиц!..» Зачем нужны эти таблицы, как их составлять и обрабатывать, какие выводы на их основании можно делать - на эти вопросы отвечает статистика (от итальянского stato - государство, латинского status - состояние).

Статистика — наука, изучающая, обрабатывающая и анализирующая количественные данные о самых разнообразных массовых явлениях в жизни.

Цели работы:

Сформировать представление о статистических исследованиях, обработки данных и интерпретации результатов.

Сбор статистической информации, обработка и анализ результатов с точки зрения, что математическое образование- необходимый элемент развития.

Задачи работы:

Составить наглядную картину математического образования в классе.

Сформировать представление о возможности описания и обработки данных с помощью различных статистических характеристик.

Управление и прогнозирование дальнейшего развития математического образования..

Гипотеза. Статистика позволяет выявить проблемы математического образования в нашем классе.

Актуальность: Повышение мотивации при обучении математическим наукам, связь с конкретными жизненными ситуациями. Умение сбора, обработки и анализа статистических данных при приведении исследовательской работы.

План:

I. Введение:

История развития статистики.

Статистические характеристики.

II. Исследовательская работа:

Анкета.

Таблица всех данных.

Диаграммы и выводы (размахи, моды, частоты, полигоны частот, среднее арифметическое).

Общий вывод:.

История статистики .

Статистика имеет многовековую историю. Уже в древний период истории человечества хозяйственные и военные нужды требовали наличия данных о населении, его составе, имущественном положении. С целью налогообложения организовывались переписи населения, производился учет земель.

Первая публикация по статистике - это «Книга Чисел» в Библии, в Ветхом Завете, в которой рассказано о переписи военнообязанных, проведенной под руководством Моисея и Аарона.

Впервые термин «статистика» мы находим в художественной литературе - в «Гамлете» Шекспира (1602 г., акт 5, сцена 2). Смысл этого слова у Шекспира - знать, придворные.

Вначале под статистикой понимали описания экономического и политического состояния государства или его части. Например, к 1792 г. относится определение: «статистика описывая состояния государства в настоящее время или в некоторый известный момент в прошлом». В настоящее время деятельность государственных статистических служб вполне укладывается в это определение.

Однако постепенно термин «статистика» стал использоваться более широко. По Наполеону Бонапарту, «статистика - это бюджет вещей». Согласно формулировке 1833 г. «Цель статистики заключается в представлении фактов в наиболее сжатой форме».

Приведем еще два высказывания.

Статистика состоит в наблюдении явлений, которые смогут быть, подчинены или выражены посредством чисел (1895 г.).

Статистика - это численное представление фактов из любой области исследования в их взаимосвязи.

Со временем собирание данных о массовых общественных явлениях приобрело регулярный характер.

С середины XIX в. благодаря усилиям великого бельгийского ученого-математика, астронома и статистика Адольфа Кетле (1796-1874 гг.) были выработаны правила переписей населения и установлена регулярность их проведения в развитых странах. Для координации развития статистики по инициативе А. Кетле проводились международные статистические конгрессы, а в 1885 г. был основан Международный статистический институт, существующий и сейчас.

Становление государственной статистики в России можно отнести к концу XII - началу XIII в., хотя первые переписи земель и населения с постоянно усложнявшейся программой проводились еще в Киевской Руси (IX - XII вв.). Реформы Петра I (1672-1725), которыми были охвачены все основные направления общественной жизни: экономика страны, административное управление, армия, культура и быт населения, а также войны вызывали потребность в полном и точном учете материальных ресурсов и населения. В этот период высший правительственный орган - Сенат - через систему коллегий не только руководил экономикой страны, но и являлся центром по проведению важнейших статистических работ, там собирались полученные материалы обследований, отчеты подведомственных коллегиям производств и заведений, а также местной администрации.

Петровская реформа налоговой системы связана с появлением новой единицы, ею стала «душа» мужского пола, что потребовало подушной переписи населения - ревизии. Первая ревизия была объявлена 26 ноября 1718 г., ревизию проводила армия.

В начале XIII в. в России зарождался и текущий учет населения. Так, в 1702 г. был издан указ о подаче в Патриарший Духовный приказ приходскими священниками недельных ведомостей о родившихся и умерших. В первой половине XIII в. проводились уже переписи рабочих фабрик и мануфактур.

Первая половина XIX в. связана с новым этапом в развитии отечественной статистики. В сентябре 1802 г. в соответствии с Высочайшим манифестом императора Александра I вводится письменная отчетность министерств. Так началось операционно-структурное оформление государственной статистики в России. Этот год принято считать годом рождения российской государственной статистики.

В 1811 г. впервые был создан официальный центр правительственной статистики - Статистическое отделение при Министерстве внутренних дел; сюда поступала отчетность губерний. Первым руководителем Статистического отделения был К.Ф. Герман.

Российские ученые внесли большой вклад в развитие статистической науки. Большое значение, например, имеет работа Д.П. Журавского «Об источниках и употреблении статистических сведений», изданная в 1846 году. Определив статистику как «счет по категориям», Журавский отмечал, что статистика необходима для «изучения всего, относящегося к человеку». Журавский определил важнейшие разделы социальной статистики:

статистика народонаселения - необходимость его исчисления по классам и занятиям;

изучение народного быта, жилища, питания;

статистика театров, клубов, дворянских собраний, народных увеселений;

статистика учреждений, охраняющих права собственности;

статистика нищеты, бедности, сиротства;

статистика самоубийств с указанием средств, причин, званий, возраста и прочих характеристик лиц, лишивших себя жизни.

Во всех предложениях Д.П. Журавский проводил идею как можно более точного и полного выявления дифференциации людей по условиям их жизни, по состоятельности.

Особое место в истории российской статистики принадлежит земской статистике. При земствах, органах местного самоуправления, с середины 70-х годов XIX века были созданы специальные статистические бюро. Земские статистики собирали и разрабатывали огромный статистический материал, который использовался для глубоких экономических и социальных исследований пореформенной России. Работа земской статистики характеризуется не только сбором и разработкой статистических данных, но и развитием статистической методологии.

Видными земскими статистиками были В.И. Орлов, П.П. Червинский, Ф.А. Щербина, А.П. Шликевич.

В 90-х годах были созданы фабрично-заводские инспекции, которые вели текущую статистику, разрабатывали данные по статистике труда, в том числе о составе рабочей силы, несчастных случаях, стачках и др.

Стала развиваться промышленная статистика. Под руководством В.Е. Варзара в 1900, 1908 и 1912 гг. были проведены первые переписи промышленности.

Начальный этап советской статистики (1917-1930 гг.) отличается исключительной интенсивностью: проводится большое число специально организованных, статистических

переписей и обследований, плодотворно работают различные научные коллективы, строится первый баланс народного хозяйства.

Последующее развитие советской статистики тормозилось созданием в 30-е годы административно-бюрократической системы, массовыми репрессиями, в том числе и лучших экономистов и статистиков (Н.Д. Кондратьева, А.В. Чаянова, В.Г. Громана, О.А. Квитнина и многих других).

В это время формируются отраслевые статистики, складывается система объемных показателей, скрывающая негативные тенденции в развитии народного хозяйства. Активно разрабатываются и качественные статистические показатели (индексы производительности труда, себестоимости и др.). Статистика подчиняется решению оперативных задач, оценке выполнения плана в ущерб ее аналитическим функциям.

В годы Великой Отечественной войны перед советской статистикой стояли задачи по оперативному учету трудовых, материальных ресурсов, перемещение производственных сил страны в восточные районы.

После войны роль и значение статистики возросли: развернулись балансовые работы, углубилась теория индексного метода и расширилась практика его применения, получили распространение экономико-математические модели и методы, развитие прикладной статистики.
Слово «статистика» часто ассоциируется со словом «математика», и это пугает студентов, связывающих это понятие со сложными формулами, требующими высокого уровня абстрагирования.

Однако, как говорит Мак-Коннелл, статистика — это прежде всего способ мышления, и для ее применения нужно лишь иметь немного здравого смысла и знать основы математики. В нашей повседневной жизни мы, сами о том не догадываясь, постоянно занимаемся статистикой. Хотим ли мы спланировать бюджет, рассчитать потребление бензина автомашиной, оценить усилия, которые потребуются для усвоения какого-то курса, с учетом полученных до сих пор отметок, предусмотреть вероятность хорошей и плохой погоды по метеорологической сводке или вообще оценить, как повлияет то или иное событие на наше личное или совместное будущее, — нам постоянно приходится отбирать, классифицировать и упорядочивать информацию, связывать ее с другими данными так, чтобы можно было сделать выводы, позволяющие принять верное решение.

Все эти виды деятельности мало отличаются от тех операций, которые лежат в основе научного исследования и состоят в синтезе данных, полученных на различных группах объектов в том или ином эксперименте, в их сравнении с целью выяснить черты различия между ними, в их сопоставлении с целью выявить показатели, изменяющиеся в одном направлении, и, наконец, в предсказании определенных фактов на основании тех выводов, к которым приводят полученные результаты. Именно в этом заключается цель статистики в науках вообще, особенно в гуманитарных. В последних нет ничего абсолютно достоверного, и без статистики выводы в большинстве случаев были бы чисто интуитивными и не могли бы составлять солидную основу для интерпретации данных, полученных в других исследованиях.

Для того чтобы оценить огромные преимущества, которые может дать статистика, мы попробуем проследить за ходом расшифровки и обработки данных, полученных в эксперименте. Тем самым, исходя из конкретных результатов и тех вопросов, которые они ставят перед исследователем, мы сможем разобраться в различных методиках и несложных способах их применения. Однако, перед тем как приступить к этой работе, нам будет полезно рассмотреть в самых общих чертах три главных раздела статистики.

1. Описательная статистика, как следует из названия, позволяет описывать, подытоживать и воспроизводить в виде таблиц или графиков

2. Задача индуктивной статистики — проверка того, можно ли распространить результаты, полученные на данной выборке, на всю популяцию, из которой взята эта выборка. Иными словами, правила этого раздела статистики позволяют выяснить, до какой степени можно путем индукции обобщить на большее число объектов ту или иную закономерность, обнаруженную при изучении их ограниченной группы в ходе какого-либо наблюдения или эксперимента. Таким образом, при помощи индуктивной статистики делают какие-то выводы и обобщения, исходя из данных, полученных при изучении выборки.

3. Наконец, измерение корреляции позволяет узнать, насколько связаны между собой две переменные, с тем чтобы можно было предсказывать возможные значения одной из них, если мы знаем другую.

Существуют две разновидности статистических методов или тестов, позволяющих делать обобщение или вычислять степень корреляции. Первая разновидность — это наиболее широко применяемые параметрические методы, в которых используются такие параметры, как среднее значение или дисперсия данных. Вторая разновидность — это непараметрические методы, оказывающие неоценимую услугу в том случае, когда исследователь имеет дело с очень малыми выборками или с качественными данными; эти методы очень просты с точки зрения как расчетов, так и применения. Когда мы познакомимся с различными способами описания данных и перейдем к их статистическому анализу, мы рассмотрим обе эти разновидности.

  1. Модой называют число ряда, которое встречается в этом ряду наиболее часто. Можно сказать, что данное число самое «модное» в этом ряду.
  2. Средним арифметическим ряда чисел называется частное от деления суммы этих чисел на их количество. Среднее арифметическое является важной характеристикой ряда чисел но иногда полёзно рассматривать и другие средние
  3. Одним из статистических показателей различия или разброса данных является размах.

Размах — это разность между наибольшим и наименьшим значениями ряда данных.

Медианой ряда, состоящего из нечетного количества чисел, называется число данного ряда, которое окажется посередине, если этот ряд упорядочить. Медианой ряда, состоящего из четного количества чисел, называется среднее арифметическое двух стоящих посередине чисел этого ряда.

Eсть более удобный способ нахождения среднего арифметического, а также других статистических характеристик — составление таблицы частот.

Виды и способы статистического наблюдения .

Статистическое наблюдение различается по видам и по источникам сведений.

Виды статистического наблюдения.

Систематическое наблюдение - текущее: наблюдение проводится на основе первичных документов, содержащих информацию, необходимую для достаточно полной характеристики изучаемого явления.

Статистическое наблюдение - периодическое. Примером может служить перепись населения.

Наблюдение, проводимое время от времени - единовременным.

Виды статистического наблюдения могут быть сплошными и не сплошными.

Сплошным называется наблюдение, учитывающее все без единицы изучаемой совокупности.

Не сплошное наблюдение ориентируется на учет некоторой достаточно массовой части единиц наблюдения.

В статистической практике применяются различные виды не сплошного наблюдения:

выборочное;

способ основного массива;

анкетное;

монографическое.

Качество не сплошного наблюдения уступает результатам сплошного.

Для получения представительной характеристики всей статистической совокупности по некоторой части ее единиц применяют выборочное наблюдение, основанное на научных принципах формирования выборочной совокупности. Случайный характер отбора единиц совокупности гарантирует беспристрастность результатов выборки.

Способы статистического наблюдения .

В зависимости от источников собираемых сведений различают наблюдение:

непосредственное,

документальное

опрос.

Непосредственным называют наблюдение, осуществляемое путем подсчета, измерения значений признаков, снятия показаний приборов специальными лицами, осуществляющими наблюдениями, иначе говоря - регистраторами.

Документальное наблюдение - это такое наблюдение, когда запись ответа на вопросы формуляра наблюдения производится на основании соответствующих документов.

Опрос - это наблюдение, при котором ответы на вопросы формуляра наблюдения записываются со слов опрашиваемого.

Сбор и группировка статистических данных.

Для изучения различных общественных и социально-экономических явлений, а также некоторых процессов, происходящих в природе, проводятся специальные статистические исследования. Всякое статистическое исследование начинается с целенаправленного сбора информации об изучаемом явлении или процессе. Этот этап называется этапом статистического наблюдения.

Для обобщения систематизации данных, полученных в ходе статистического наблюдения, их по какому-либо признаку разбивают на группы, и результаты группировки сводят в таблицы.

Наглядное представление статистической информации.

Для наглядного представления данных, полученных в результате статистического исследования, широко используются различные способы их изображения.

Одним из хорошо известных вам способов наглядного представления ряда данных является построение столбчатой диаграммы.

Столбчатые диаграммы используют тогда, когда хотят проиллюстрировать динамику изменения данных во времени или распределение данных, полученных в результате

Для наглядного изображения соотношения между частями исследуемой совокупности удобно использовать круговые диаграммы.

Для построения круговой диаграммы круг разбивается на секторы, центральные углы которых пропорциональны относительным частотам, определенным для каждой группы данных.

Динамику изменения статистических данных во времени часто иллюстрируют с помощью полигона. Для построения полигона отмечают в координатной плоскости точки, абсциссами которых служат моменты времени, а ординатами - соответствующие им статистические данные. Соединив последовательно эти точки отрезками, получают ломанную, которую называют полигоном.

Одна из основных задач статистики как раз и состоит в надлежащей обработке информации. Конечно, у статистики есть много других задач: получение и хранение информации, выработка различных прогнозов, оценка их достоверности и т. д. Ни одна из этих целей не достижима без обработки данных. Поэтому, первое, чем стоит заняться — это статистическими методами обработки информации.

В нашем классе решили выяснить, каков уровень знаний по теме «Решение систем линейных уравнений с двумя переменными», для чего составили специальную контрольную работу из шести заданий

В алфавитном списке учеников возле каждой фамилии проставили число верно решенных задач. Получился следующий ряд чисел:

Ф.И.

Кол-во задач

Агафонова Л

Башаров а

Гуселетов Д

Дармаева К

Коневин В

Коротков В

Криволапова М

Мисюркеев А

Мисюркеев В

Минеева Д

Михайлов А

Молчанова О

Молчанов С

Наумов С

Попов с

Постникова М

Реховская Ю

Сатаева Н

Тереньтьева Т

Ушакова Л

Чагдурова Н

ТОлстихин С

Разуваев А

Ангельский м

На основании этого ряда трудно сделать какие-либо определенные выводы о том, как справились с работой. Чтобы удобнее было анализировать информацию, в подобных случаях числовые данные ранжируют, располагая их в порядке возрастания. В результате ранжирования ряд примет такой вид:

2; 2;

3; 3; 3; 3;

4; 4; 4; 4; 4; 4

5; 5; 5;5;5;5

6; 6; 6; 6;

Мы видим, что ряд разбился на 6 групп. Каждая группа представляет определенный результат эксперимента: решена одна задача, решены две задачи и т. д.

В нашей выборке частота появления события «семиклассник решил одну задачу» равна 1. Относительная частота этого события равна отношению его частоты к объему выборки, т. е. 1:23, или4,3 %. Для события «девятиклассник решил все задачи» частота равна 4, а относительная частота равна 4:23—, или 17,4%, и т. д.

Чтобы результаты легче воспринимались, их представляют в табличном и графическом виде.

………

Составив таблицу, полезно себя проверить: сложив все частоты, мы должны получить объем выборки, т. е. число 50, а сложив все относительные частоты, мы должны получить 100%.

Для графического представления данных на основе этой таблицы построим диаграмму частот.

С помощью ранжирования ряда, таблицы и графических иллюстраций мы уже получили первоначальные сведения о закономерностях интересующего нас ряда данных. Но вам известны такие статистические характеристики ряда данных, которые позволяют сделать более качественный статистический анализ.

Так, например, интересно знать наиболее типичный результат выполнения предложенной работы. Используя представленные в таблице данные, легко видеть, что наиболее часто встречающийся результат — «решены три задачи». Как вы знаете, на языке статистики это означает, что число 4 является модой данного числового ряда.

Также полезно найти среднее арифметическое этого ряда:

(1+2*2+3*4+4*6+5*6+6*4+:23=4.2Значит, можно сказать, что в среднем девятиклассник решает четыре задачи. (В данном случае среднее арифметическое ряда данных совпало с его модой, но, конечно, это происходит совсем не всегда.)

Этапы статистического исследования

К этапам статистического исследования относятся:

Статистическое наблюдение - массовый научно организованный сбор первичной информации об отдельных единицах изучаемого явления.

Группировка и сводка материала - обобщение данных наблюдения для получения абсолютных величин (учетно-оценочных показателей) явления.

Обработка статистических данных и анализ результатов для получения обоснованных выводов о состоянии изучаемого явления и закономерностях его развития.

Все этапы статистического исследования тесно связаны друг с другом и одинаково важны. Недостатки и ошибки, возникающие на каждой стадии, сказываются на все исследовании в целом. Поэтому правильное использование специальных методов статистической науки на каждом этапе позволяет получить достоверную информацию в результате статистического исследования.Методы статистического исследования:

Статистическое наблюдение;

Сводка и группировка данных;

Расчет обобщающих показателей (абсолютные, относительные и средние величины);

Статистические распределения (вариационные ряды);

Выборочный метод;

Корреляционно-регрессионный анализ;

Ряды динамики;

Индексы.

Современную математическую статистику определяют как науку о принятии решений в условиях неопределенности. Можно выделить две основные задачи математической статистики:

Указать способы сбора и группировки статистических сведений, полученных в результате наблюдений или в результате поставленных экспериментов.

Итак, задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов.

М Этапы выполнения исследовательской работы:

I. Сбор данных.

Включает в себя:

Изучение поставленной задачи.

Определение значимых понятий.

Подбор источников информации.

Сбор информации.

II. Группировка данных.

Включает в себя:

Разделение данных в группы по признаку.

Построение таблицы данных.

III. Анализ данных.

Включает в себя:

Нахождение статистических характеристик.

Обобщение полученных результатов.

IV. Отчет.

Мы провели исследование в 7»а»и «б» классах о необходимости изучения математики.

Сбор данных: учащимся школы была предложена для заполнения анкета. /Приложение 1/

Группировка данных: по данным анкетирования была составлена таблица. /Приложение 2/

Анализ данных: результаты приведенные в таблице были представлены в виде диаграмм. /Приложение 3/

……

Обработанные данные можно использовать:

Для работы классных руководителей с семьей.

Для практического применения на уроках математики..

Для руководителей школы.

Литература:

Экономическая статистика. «Учебник», 2-е издание дополненное. Рекомендовано Министерством общего и профессионального образования РФ. Москва. ИНФРА-М. 2006 г. Авторы: Ю. Н. Иванов; С. Е. Казаринова и др. Под редакцией Ю. Н. Иванова, Доктора экономических наук.

Б.С.Э. Компьютерное издание 2006 г.

Республика Коми в России. Госкомстат России. Госкомстат Р.К. 2007 г.

Сыктывкар в цифрах. Госкомстат Р. К. 2007 г.

Типичная оценка (мода): 4 Позиция 2. Досуг учащихся

(Что чаще всего делают дети в свободное от уроков время)

Таблица социологического опроса

Занятия

Английский яз.

Компьютерные игры

Читают книги

Смотрят телевизор

Дзюдо (секция)

Волейбол (секция)

гуляют на улице

Кол-во учащихся

https://accounts.google.com


Подписи к слайдам:

в ыполнил:Молчанов Сергей 7»Б» Руководитель: Телешева Л.А.-учитель математики МОУ «Баргузинская сош» Статистические характеристики и исследования

Статистика знает все « Stato »-государство « Status »-состояние Статистика - наука, изучающая, обрабатывающая и анализирующая количественные данные о самых разнообразных массовых явлениях в жизни.

Сформировать представление о статистических исследованиях, обработки данных и интерпретации результатов. Сбор статистической информации, обработка и анализ результатов с точки зрения математического образования- необходимый элемент развития. цель исследования:

Составить наглядную картину математического образования в классе. Сформировать представление о возможности описания и обработки данных с помощью различных статистических характеристик. Управление и прогнозирование дальнейшего развития математического образования.. Задачи:

Статистика позволяет выявить проблемы математического образования в нашем классе. Гипотеза

: Повышение мотивации при обучении математическим наукам; связь с конкретными жизненными ситуациями: умение сбора, обработки и анализа статистических данных при приведении исследовательской работы. Актуальность

План: История статистики. Статистические характеристики. Исследование на тему: «Необходимость предметов математического цикла». Исследование на тему: «Любимое занятие в свободное время».

Первая публикация по статистике – это «Книга Чисел» в Библии, в Ветхом Завете, в которой рассказано о переписи военнообязанных, проведенной под руководством Моисея и Аарона.

Впервые термин «статистика» мы находим в художественной литературе – в «Гамлете» Шекспира (1602 г., акт 5, сцена 2). Смысл этого слова у Шекспира – знать, придворные.

статистика - это прежде всего способ мышления, и для ее применения нужно лишь иметь немного здравого смысла и знать основы математики. Мак-Коннелл

Разделы статистики описательная индуктивная корреляция

Основные статистические характеристики Среднее арифметическое Мода Размах Медиана

Средним арифметическим ряда чисел называется частное от деления суммы этих чисел на их количество. Модой обычно называется число ряда, которое встречается в этом ряду наиболее часто.

Размах – это разность наибольшего и наименьшего значений ряда данных. Медианой – ряда, состоящего из нечётного количества чисел, называется число данного ряда, которое окажется посередине, если этот ряд упорядочить.

Виды статестического наблюдения Систематическое Статестическое(периодическое) Единовременное Сплошное Несплошное

№ Ф.И. Количество верно выполненных заданий 1 Агафонова Люда 3 2 Башаров Анлрей 6 3 Гуселетов Дима 4 4 Дармаева Ксения 4 5 Коневин Виталий 6 6 Коротков Володя 2 7 Криволапова Маша 5 8 Мисюркеев Алеша 3 9 Мисюркеев Володя 3 10 Минеева Даша 5 11 Михайлов А 5 12 Молчанова Оля 5 13 Молчанов С 6 14 Наумов П 6 15 Попов С 4 16 Постникова М 4 17 Реховская Юля 3 18 Сатаева Настя 5 19 Терентьева Таня 5 20 Ушакова Лена 5 21 Чагдурова Наташа 4 22 Толстихин Андрей 1 23 Разуваев Алеша 2 24 Ангельский Миша 4 Результат контрольной работы по теме "Решение систем линейных уравнений с двумя переменными"

Рассмотрим ряд чисел 3 6 4 4 6 2 5 3 3 5 5 5 6 6 4 4 3 5 5 5 4 1 2 4

В результате ранжирования ряд примет вид: 1; 2; 2; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4 5; 5; 5;5;5;5 6; 6; 6; 6;

Относительная частота события Мода 4 Медиана 4 Размах от 1 до 6 Среднее арифметическое (1+2*2+3*4+4*6+5*4+6*4):23=4,3

I. Сбор данных.: Изучение поставленной задачи. Определение значимых понятий. Подбор источников информации. Сбор информации. Анализ данных: результаты приведенные в таблице были представлены в виде диаграмм. II. Группировка данных. Разделение данных в группы по признаку. Построение таблицы данных. III. Анализ данных. Нахождение статистических характеристик. Обобщение полученных результатов. IV. Отчет.

Необходимость изучения математики исследование №1

Какой школьный предмет нравится больше всего? _________________- Какой школьный предмет лёгок в изучении? ______________________ Какой предмет труднее всего дается в изучении? __________________ Сколько часов в день вы тратите на приготовление домашнего задания?_____________________________________________________ Нравится ли вам математика?___________________________________ Нужна ли вам математика в будущем? ____________________________ Нужна ли Вам помощь при выполнении домашних заданий по предметам математического цикла?_______________________________________________________ Как Вы оцениваете свои знания по математике? Имею отметку___________________… Знаю на_______________________….. Могу на…________________________ Что является, на Ваш взгляд, причиной неуспехов или неудач, если они случаются?________________________________________ __________________________________________________________Хотите ли Вы улучшить свои результаты по предметам математического цикла?____________________________________ _________________________________________________________

Вопрос 1 Какой школьный предмет нравится более всего?

Вопрос 2 Какой школьный предмет самый трудный в изучении?

Вопрос 3 Сколько всего времени тратите на выполнение домашнего задания по математике?

Вопрос 4 Нравится ли тебе заниматься изучением математики?

Нужна ли математика в будущей вашей профессии? Да -100%

Нужна ли тебе помощь при выполнении домашнего задания по математике

Кто тебе помогает разобрать трудную тему по математике? Мама -45% Учитель-35 % Учебник -20% Папа-15% Бабушк10% Сестра-10% Друзья-5% Никто-5%

Как ты оцениваешь свои знания по математике?

Хочешь ли заниматься по математике еще лучше

Мотивация учебной деятельности исследование №3

Вид деятельности Ежедневно Несколько раз в неделю В воскресенье 1 Читаю газеты и журналы 2 Читаю художественную литературу 5 Хожу на вечера отдыха 6 Смотрю кино передачи 7 Играю в спортивные игры 8 Занимаюсь общественной работой 9 Занимаюсь охотой, рыбалкой

11 Занимаюсь художественной самодеятельностью 12 Хожу в походы 13 Занимаюсь радиоделом 14 Занимаюсь шитьём, рукоделием 15 Учусь играть на музыкальном инструменте 16 Слушаю музыку, делаю записи 17 Увлекаюсь коллекционированием 18 Увлекаюсь танцами, хожу на дискотеки 19 Люблю что-нибудь изготовить своими руками 20 Вожусь с животными

21 В свободное время помогаю родителям 22 Провожу время безо всякой цели 23 В свободное время работаю 24 (Если занят в свободное время ещё чем-то, допиши здесь!)

Ежедневно

Несколько раз в неделю

В воскресенье

Вывод: Таким образом, ученики нашего класса ежедневно чаще всего слушают музыку, помогают родителям, смотрят телевизор,; несколько раз в неделю - занимаются спортом и делают что-нибудь своими руками,; в воскресенье – читают и играют на компютере, смотрят телевизор

Заключение: И так, на примере моей исследовательской работы вы убедились, что статистические характеристики и исследования играют значительную роль в нашей жизни и используются не только в математике, но и в других отраслях науки.

Спасибо за внимание

К основным статистическим характеристикам ряда измерений (вариацион­ного ряда) относятся характеристики положения (средние характе­ристики, или центральная тенденция выборки ); характеристики рассеяния (ва­риации, или колеблемости ) и х арактеристики формы распределения.

К характеристикам положения относятся среднее арифметическое значе­ние (среднее значение ), мода и медиана.

К характеристикам рассеяния (вариации, или колеблемости ) относятся: размах вариации , дисперсия , среднее квадратическое (стандартное ) отклонение , ошибка средней арифметической (ошибка средней ), коэффициент вариации и др.

К характеристикам формы относятся коэффициент асимметрии, мера ско­шенности и эксцесс.

Характеристики положения

1. Среднее арифметическое значение

Среднее арифметическое значение – одна из основных характеристик вы­борки.

Она, как и другие числовые характеристики выборки, может вычисляться как по необработанным первичным данным, так и по результатам группировки этих данных.

Точность вычисления по необработанным данным выше, но процесс вычисления оказывается трудоёмким при большом объёме выборки.

Для несгруппированных данных среднее арифметическое определяется по формуле:

где n - объем выборки, х 1 , х 2 , ... х n - результаты измерений.

Для сгруппированных данных:

,

где n - объем выборки, k – число интервалов группировки, n i – частоты интервалов, x i – срединные значения интервалов.

2. Мода

Определение 1. Мода - наиболее часто встречающаяся величина в данных вы­борки. Обозначается Мо и определяется по формуле:

где
- нижняя граница модального интервала,- ширина интервала группи­ровки,
- частота модального интервала,
- частота интервала, предшествую­щего модальному,
- частота интервала, последующего за модаль­ным.

Определение 2. Модой Мо дискретной случайной величины называется наиболее вероятное её значение.

Геометрически моду можно интерпретировать как абсциссу точки максимума кривой распределения. Бываютдвухмодальные и многомодальные распределения. Встречаются распределения, которые имеют минимум, но не имеют максимума. Такие распределения называютсяантимодальными .

Определение. Модальным интервалом называется интервал группировки с наибольшей частотой.

3. Медиана

Определение . Медиана - результат измерения, который находится в сере­дине ранжированного ряда, иначе говоря, медианой называется значение признака Х , когда одна половина значений экспериментальных данных меньше её, а вторая половина – больше, обозначается Ме .

Когда объем выборки n - четное число, т. е. результатов измерений четное количество, то для определения медианы рассчитывается среднее значение двух показателей выборки, находящихся в середине ранжированного ряда.

Для данных, сгруппированных в интервалы, медиану определяют по фор­муле:

,

где
- нижняя граница медианного интервала;ширина интервала группи­ровки, 0,5n – половина объёма выборки,
- частота медианного интервала,
- накопленная частота интервала, предшествующего медианному.

Определение. Медианным интервалом называется тот интервал, в котором накопленная частота впервые окажется больше половины объёма выборки (n / 2) или накопленная частость окажется больше 0,5.

Численные значения среднего, моды и медианы отличаются, когда имеет место несимметричная форма эмпирического распределения.

ДЕПАРТАМЕНТ ОБРАЗОВАНИЯ ГОРОДА МОСКВЫ

ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ПРОФЕССИОНАЛЬНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ

КОЛЛЕДЖ СВЯЗИ № 54 имени П.М. ВОСТРУХИНА

Статистические характеристики.

Учебное пособие к занятию часть 1.

Разработчик:

Преподаватель математики

Т.Н. Рудзина


– это математические понятия , с помощью которых описываются отличительные особенности и свойства совокупности данных , полученных с помощью наблюдений или каким-то другим способом. Значение характеристик состоит еще и в том, что они «подсказывают» , с каких позиций целесообразно анализировать имеющуюся совокупность данных .

К статистическим характеристикам относятся:

среднее арифметическое , размах , мода , медиана .

Рассмотрим пример:

При изучении учебной нагрузки учащихся выделили группу из 12 семиклассников. Их попросили отметить в определенный день время (в минутах), затраченное им на выполнения домашнего задания по алгебре. Получили такие данные:

23, 18, 25 20, 25, 25, 32, 37, 34, 26 34, 25 .

Имея этот ряд данных, можно определит ь, сколько минут в среднем затратили учащиеся на выполнение домашнего задания по алгебре.

Для этого указанные числа надо сложить и сумму разделить на 12:


Число 27 , полученное в результате, называют средним арифметическим рассматриваемого ряда чисел.

Определение :

Средним арифметическим ряда чисел называется частное от деления суммы этих чисел на число слагаемых.

Обычно среднее арифметическое находят тогда, когда хотят определить среднее значение для некоторого ряда данных: среднюю урожайность пшеницы с 1 га в районе, средний суточный удой молока от одной коровы на ферме, среднюю зарплату одного рабочего бригады за смену и т.д. Заметим, что среднее арифметическое находят только для однородных величин. Не имеет смысла, например, использовать в качестве обобщающего показателя среднюю урожайность зерновых и бахчевых культур. Причем и для однородных величин вычисление среднего арифметического бывает иногда лишено смысла, например нахождение средней температуры больных в госпитале, среднего размера обуви…


В рассмотренном примере мы нашли, что в среднем учащиеся затратили на выполнение домашнего задания по алгебре по 27 мин. Однако анализ приведенного ряда данных показывает, что время, затраченное некоторыми учащимися, существенно отличается от 27 мин., т.е. от среднего арифметического. Наибольший расход равен 37 мин., а наименьший – 18 мин. Разность между наибольшим и наименьшим расходом времени составляет 19 мин. В этом случае говорят, что размах ряда равен 19.

Определение :

Размахом ряда чисел называется разность между наибольшим и наименьшим из этих чисел.

Размах находят тогда, когда хотят определить, как велик разброс данных в ряду.


При анализе сведений о времени, затраченном семиклассниками на выполнение домашнего задания по алгебре, нас могут интересовать не только среднее арифметическое и размах полученного ряда данных, но и другие показатели. Интересно, например, знать, какой расход времени является типичным для выделенной группы учащихся, т.е. какое число встречается в ряду данных чаще всего. Нетрудно заметить, что таким числом является число 25. Говорят, что число 25 – мода рассматриваемого ряда.

Определение :

Модой ряда чисел называется число, наиболее часто встречающееся в данном ряду .

Ряд чисел может иметь более одной моды или не иметь моду совсем.

Например, в ряду чисел 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 две моды – это числа 47 и 52 , так как каждое из этих чисел встречается два раза, а остальные числа встречаются в ряду менее двух раз, а в ряду чисел 69, 68, 66, 70, 67, 71, 74, 63, 73, 72 – моды нет.


Рассмотрим еще одну статистическую характеристику.

Начнем с примера. В таблице показан расход электроэнергии в январе жильцами девяти квартир

Составим из данных, приведенных в таблице, упорядоченный ряд:

64, 72, 72, 75, 78 , 82, 85, 91, 93.

В полученном упорядоченном ряду девять чисел. Не трудно заметить, что в середине ряда расположено число 78: слева от него записано четыре числа и справа тоже четыре числа. Говорят, что число 78 является срединным числом, или, иначе, медианой , рассматриваемого упорядоченного ряда чисел (от латинского слова mediana , которое означает «среднее»). Это число считают также медианой исходного ряда данных.


Приведем теперь другой пример. Пусть при сборе данных о расходе электроэнергии к указанным девяти квартирам добавили еще десятую. Получили такую таблицу:

Так же как в первом случае, представим полученные данные в виде упорядоченного ряда чисел:

64, 72, 72, 75, 78 , 82 , 85, 88, 91, 93

В этом числовом ряду четное число членов и имеются два числа, расположенные в середине ряда: 78 и 82 .

Число 80 , не являясь членом ряда, разбивает этот ряд на две одинаковые по численности группы: слева от него находятся пять членов ряда и справа тоже пять членов ряда:


64, 72, 72, 75, 78, 82, 85, 88, 91, 93

Говорят, что в этом случае медианой рассматриваемого упорядоченного ряда, а также исходного ряда данных, записанного в таблице, является число 80 .

Определение :

Медианой упорядоченного ряда чисел с нечетным числом членов называется число, записанное посередине, а медианой упорядоченного ряда чисел с нечетным числом членов называется среднее арифметическое двух чисел, записанных посередине.

Медианой произвольного ряда чисел называется медиана соответствующего упорядоченного ряда.


Если в упорядоченном числовом ряду содержится 2 n -1 членов, то медианой ряда является n -й член, так как n – 1 членов стоит до n -го члена и n – 1 членов – после n -го члена.

Если в упорядоченном ряду содержится 2 n членов, то медианой является среднее арифметическое членов, стоящих на n -м и n + 1 -м местах.

В каждом из рассмотренных выше примеров, определив медиану , мы можем указать номер квартиры, для которой расход электроэнергии жильцами превосходит срединное значение, т.е. медиану .

Рассмотрим еще один пример.

Известно, что 34 сотрудника отдела приобрели акции некоторого акционерного общества. Данные о числе акций, приобретенных сотрудниками, представлены в виде следующего упорядоченного ряда:

2, 2, 2, 2, 2, 3, 3, ……, 3, 4, 4, ……., 4, 100

Найдем медиану этого ряда. Так как всего в ряду 34 числа, то медиана равна среднему арифметическому 17– го и 18- го членов, т.е. равна (3 + 4) : 2 = 3,5

Вычисляя среднее арифметическое этого ряда, найдем, что оно приближенно равно 6,2, т.е. в среднем сотрудники отдела приобрели примерно по 6 акций. Мы видим, что в данном случае медиана лучше отражает реальную ситуацию, так как все сотрудники, кроме одного, приобрели не более 4 акций.

Такие показатели, как среднее арифметическое , мода и медиан а, по-разному характеризуют данные, полученные в результате наблюдений. Поэтому на практике при анализе данных в зависимости от конкретной ситуации используют либо все три показателя, либо некоторые из них.

Если, например, анализируются сведения о годовых доходах нескольких туристических фирм города, то удобно использовать все три показателя. Среднее арифметическое покажет средний годовой доход фирм, мода будет характеризовать типичный показатель годового дохода, медиана позволит определить туристические фирмы, годовой доход которых ниже среднего показателя.

Если изучают данные о размерах мужской обуви, проданной в определенный день в универмаге, то удобно воспользоваться таким показателем как мода , который характеризует размер, пользующийся наибольшим спросом. Находить в этом случае среднее арифметическое или медиану не имеет смысла .

При анализе результатов, показанных участниками заплыва на дистанцию 100 и, наиболее приемлемой характеристикой является медиана . Знание медианы позволит выделить для участия в соревнованиях группу спортсменов, показавших результаты выше среднего.

Статистические характеристики : среднее арифметическое , мод а, медиана называются средними результатами измерений .