Слайды и текст этой онлайн презентации
Слайд 1
Лекция Тема: «Математическая статистика»
Курс: 2
Дисциплина: «Математика»
Подготовила: преподаватель высшей категории Бирюкова Людмила Николаевна
Ставрополь 2018 год
Слайд 2
Термин статистика происходит от латинского слова «status».
В Средние века это означало политическое состояние государства.
В науку этот термин ввёл немецкий учёный Годфрид Ахенваль.
Зарождение статистики, как науки, следует отнести ко второй половине XVΙΙ века.
Слайд 3
В настоящее время термин «Статистика» употребляется в четырёх значениях:
1. Комплекс дисциплин, обладающих определённой спецификой и изучающих количественную сторону массовых явлений и процессов в их неразрывной связи с их качественным содержанием – учебный предмет в ВУЗ-ах и СУЗ-ах;
2. Отрасль практической деятельности по сбору, обработке, анализу и публикации массовых цифровых данных о самых различных явлениях и процессах общественной жизни;
3. Совокупность цифровых сведений, характеризующих состояние массовых явлений и процессов общественной жизни;
4. Статистические методы, применяемые для изучения социально-экономических явлений и процессов.
Слайд 4
Статистика как наука имеет свой предмет исследования. Она исследует не отдельные факты, а массовые социально-экономические явления и процессы, выступающие как множество отдельных факторов, обладающих как индивидуальными, так и общими признаками.
Слайд 5
Статистические данные – это сведения о числе объектов какого - либо множества, обладающих некоторым признаком.
Пример.
Сведения о количестве отличников в каждом учебном заведении;
сведения о числе разводов на число вступивших в брак;
сведения о количестве новорожденных и др.
Слайд 6
На основании статистических данных можно делать научно – обоснованные выводы. Для этого статистические данные определенным образом должны быть систематизированы и обработаны.
Математическая статистика изучает математические методы систематизации, обработки и использования статистических данных для научных и производственных нужд.
Слайд 7
Основной метод обработки данных – выборочный
Явления и процессы в жизни общества изучаются статистикой посредством статистических показателей, представляющих собой обобщённую числовую характеристику какого-либо явления в единстве с качественной стороной в условиях конкретного места и времени.
Слайд 8
Различают следующие статистические показатели:
учётно-оценочные, которые в зависимости от специфики изучаемого явления могут отображать или объёмы их распространенности в пространстве или достигнутые на определённые моменты (даты) уровни развития. (Например: численность населения в России на начало 2002 года составила 146,3 млн. чел.);
аналитические показатели, применяются для анализа статистической информации и характеризуют особенности развития изучаемого явления: типичность признака, соотношение его отдельных частей, меру распространения в пространстве, скорость развития во времени и т.д. В качестве аналитических показателей в статистике применяются относительные и средние величины, показатели вариации и динамики, тесноты связи и др.
Слайд 9
Различают следующие статистические показатели:
Одной из важных категорий статистической науки, тесно связанной с показателями, является понятие признака, под которым понимается характерное свойство изучаемого явления, отличающее его от других явлений.
Признаки бывают:
атрибутивные, выраженные смысловыми понятиями (пол – мужской, женский; магазин – продовольственный, промтоварный, хозяйственный);
количественные – признаки, выраженные числовыми значениями (возраст человека, стаж работы, размер заработной платы и т.д.);
варьирующие, принимающие различные значения у отдельных единиц изучаемого явления (товарооборот, валовой сбор и т.д.).
Слайд 10
Статистика рассматривает статистические совокупности.
Статистическая совокупность представляет собой множество единиц изучаемого явления, объединённых в соответствии с задачей исследования единой качественной стороной, т. е.
признаками
Целью изучения статистических совокупностей является выявление закономерностей.
Закономерность – это то общее что определяет единство и однородность совокупности.
Слайд 11
Статистическое исследование
Сплошное Выборочное
Исследуется отобранные некоторым образом объекты
Исследуется каждый объект совокупности
Слайд 12
Генеральная совокупность – совокупность всех исследуемых объектов
Выборочная совокупность (выборка) – совокупность случайно отобранных объектов
Случайный отбор – это такой отбор, при котором все объекты генеральной совокупности имеют одинаковую вероятность попасть в выборку
Слайд 13
Выборка
повторная бесповторная
Объект извлекается из генеральной совокупности, исследуется и возвращается в генеральную совокупность, берется следующий, исследуется и возвращается и т.д.
Объект извлекается из и не возвращается, берется генеральной совокупности, исследуется следующий
Слайд 14
Объём выборки – это число равное количеству объектов генеральной или выборочной совокупности.
Пример.
Из 10000 изделий для контроля отобрали 100 изделий.
Объем генеральной совокупности равен 10000, объем выборки – 100.
Слайд 15
Математическая статистика занимается вопросом: можно ли установив свойство выборки, считать, что оно присуще всей генеральной совокупности.Для этого выборка должна быть достаточно представительной, т.е. достаточно полно отражать изучаемое свойство объектов.
Поэтому отбор объектов в выборку осуществляется случайно, а изучаемому свойству должна быть присуща статистическая устойчивость: при многократном повторении исследования наблюдаемые события повторяются достаточно часто (статистическая устойчивость частот)
Слайд 16
Для статистической обработки результаты исследования объектов, составляющих выборку, представляют в виде числовой выборки (последовательности чисел или числового ряда)
Показатели описательной статистики можно разбить на несколько
групп:
- показатели положения, описывающие положение экспериментальных
данных на числовой оси. Примеры таких данных – максимальный и минимальный элементы выборки, среднее значение, медиана, мода и др.;
Слайд 17
показатели разброса, описывающие степень разброса данных относительно центральной тенденции. К ним относятся: выборочная дисперсия, разность между минимальным и максимальным элементами (размах, интервал выборки) и др.;
показатели асимметрии: положение медианы относительно среднего и др.;
- графические представления результатов – гистограмма, частотная диаграмма и др.
Слайд 18
Разность между наибольшим значением числовой выборки и наименьшим называется размахом выборки
Слайд 19
Рассмотрим числовую выборку объема n, полученную при исследовании некоторой генеральной совокупности
Значение x1 встречается в выборке n1 раз
x2 встречается n2 раза
…….
xn встречается nn раз
Числа называются частотами значений
Отношения частот к объему выборки
называются относительными частотами значений
Слайд 20
Если составлена таблица в первой строке значения выборки, а во второй частоты значений, то она задает статистический ряд, если второй строке относительные частоты значений, то такая таблица задает выборочное распределение
x1.x2.x3.….xn
n1.n2.n3.….nn
x1.x2.x3.….xn
n1/n.n2/n.n3/n.….nn/n
Слайд 21
Пример.
Для выборки определить объем, размах, найти статистический ряд и выборочное распределение:
3, 8, -1, 3, 0, 5, 3, -1, 3, 5
Объем: n = 10, размах = 8 – (-1) =9
Статистический ряд:
Выборочное распределение:
xi.-1.0.3.5.8
ni.2.1.4.2.1
xi.-1.0.3.5.8
.0,2.0,1.0,4.0,2.0,1
(убеждаемся 0,2 + 0,1 + 0,4 + 0,2 + 0,1 = 1)
Слайд 22
Мода (mo) — это наиболее частое значение в выборке, или среднее значение класса с наибольшей частотой. Мода как центральная тенденция используется чаще всего для того, чтобы дать общее представление о распределении. В некоторых случаях у распределения могут быть две моды, в таком случае это свидетельствует о бимодальном распределении, что указывает на наличие двух относительно самостоятельных групп.
Медиана (me) соответствует центральному значению в последовательном ряду всех полученных значений выстроенном в порядке возрастания. Если же в ряду чётное количество показателей , то берут среднее арифметическое двух средних значений
Слайд 23
Среднее арифметическое (m) — это показатель центральной тенденции, полученный делением суммы всех значений данных на число
этих данных. Среднее
арифметическое используется для
представления количественных
переменных с нормальным
распределением.
Указание в представлении данных
меры центральной тенденции
(среднее, медиана, мода)
автоматически сообщает
о нормальности распределения
признака.
При нормальном распределении все три показателя
более или менее совпадают, а при асимметричном распределении — нет.
Слайд 24
Графические изображения выборки
Если выборка задана значениями и их частотами или статистическим рядом, то строится полигон
Полигон частот Полигон относительных частот
Это ломаная с вершинами в точках
Это ломаная с вершинами в точках
Слайд 25
При большом объеме выборки строится гистограмма
Гистограмма частот гистограмма относительных частот
Для построения гистограммы промежуток от наименьшего значения выборки до наибольшего разбивают на несколько частичных промежутков длины h
Для каждого частичного промежутка подсчитывают сумму частот значений выборки, попавших в этот промежуток (Si) .
Значение выборки, совпавшее с правым концом частичного промежутка (кроме последнего промежутка), относится к следующему промежутку
Затем на каждом промежутке, как на основании, строим прямоугольник с высотой
Ступенчатая фигура, состоящая из таких прямоугольников, называется гистограммой частот.
Площадь такой фигуры равна объёму выборки .
Слайд 26
Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основанием которых являются частичные промежутки длины h, а высотой отрезки длиной
где i – сумма относительных частот значений выборки, попавших в i промежуток
Площадь такой фигуры равна 1
Пример.
В результате измерения напряжения в электросети получена выборка. Построить гистограмму частот, если число частичных промежутков равно 5
Слайд 27
218, 224, 222, 223, 221, 220, 227, 216, 215, 220, 218, 224, 225, 219, 220, 227, 225, 221, 223, 220, 217, 219, 230, 222
n = 24
Наибольшее значение – 230
Наименьшее значение – 215
Интервал: 230 – 215 = 15
Длина частичных промежутков:
Составим таблицу:
Слайд 28
№.интервал..
1.[215; 218).3.
2.[218; 221).8.
3.[221; 224).6.
4.[224; 227).4.
5.[227; 230].3.
Слайд 30
Выборочные характеристики
Для выборки объема n
Выборочное статистическое ожидание (выборочное среднее) – это среднее арифметическое значений выборки
Если выборка задана статистическим рядом, то
Слайд 31
Выборочная дисперсия – это среднее арифметическое квадратов отклонений значений выборки от выборочного среднего
Если выборка задана статистическим рядом, то
Слайд 32
Несмещенная выборочная дисперсия
Пример.
Для выборки найти
Выборка: 4, 5, 3, 2, 1, 2, 0, 7, 7, 3
n = 10