1.5 Популяції з періодичною варіацією
Якщо популяція містить періодичний тренд, наприклад, звичайну синусоїду, то ефективність систематичної вибірки залежить від значення . Це можна наочно побачити на рис. 1.5.1. Висота кривої на ньому відповідає спостереженню .
Рис.1.5.1. Періодична варіація
Вибіркові точки представляють найменш сприятливий для систематичної вибірки випадок. Він має місце, якщо дорівнює періоду синусоїди або цілому числу, яке кратне цьому періоду. Кожне спостереження в систематичній вибірці буде однаковим, тому вибірка не буде більш точною, ніж одиничне спостереження, добуте з популяції навмання.
Найбільш сприятливим буде випадок (вибірка ), коли - непарне число, яке кратне напівперіоду. Середнє значення кожної систематичної вибірки буде в точності дорівнювати середньому для популяції, оскільки відхилення вверх або вниз від прямої на рис. 1.5.1 взаємно урівноважаться. Отже, дисперсія середнього вибірки буде дорівнювати нулю. У проміжках між цими двома випадками ефективність вибірки буде залежати від співвідношення між та довжиною хвилі.
Популяції, які можна описати точною синусоїдою, на практиці, не зустрічаються. Однак популяції з більш або менш вираженим періодичним трендом − не рідкість. Прикладами можуть бути транспортний потік на певній ділянці дороги на протязі доби та об’єм продаж у магазині на протязі семи днів тижня. Для оцінювання середнього за деякий період часу було б, очевидно, не доцільно формувати систематичну вибірку, роблячи спостереження щоденно о 4 годині дня кожний четвер. Навпроти, потрібно розосереджувати вибірку вздовж періодичної кривої, у випадку продаж, наприклад, слідкуючи за тим, щоб кожний день тижня був однаково представлений у вибірці.
У деяких популяціях зустрічаються менш помітні періодичні коливання. Наприклад, якщо є ряд щоденних платіжних відомостей для невеликої ділянки підприємства, то список робітників у кожній з них може бути складений у одному й тому ж порядку та містити від 19 до 23 прізвищ. Тоді систематична вибірка кожного 20-го робітника за період декількох тижнів може включати записи, які відносяться до одного і того ж робітника або до двох чи до трьох робітників, що належать до найбільш високооплачуваної групи. Аналогічно систематична вибірка прізвищ з міського довідника, де під однаковим прізвищем, спочатку, значиться голова домогосподарства, а потім його діти, може містити дуже багато голів домогосподарств чи дуже багато дітей. Якщо часу вистачає, щоб дослідити характер періодичності, то систематичну вибірку можна побудувати так, щоб скористатися її особливостями. В супротивному разі, коли періодичність передбачається, але характер її невідомий, краще застосовувати просту або стратифіковану випадкову вибірку.
1.6 Автокорельовані популяції
Для багатьох реальних популяцій є підстави очікувати, що два спостереження та будуть більш схожими, якщо одиниці та розташовані в ряді недалеко одна від одної. Таке буває, коли будь-які природні причини обумовлюють повільну зміну значень при просуванні вздовж ряду. В математичній моделі такої ситуації можна вважати, що між та існує додатна кореляція, яка залежить тільки від відстані між ними, , та прямує до нуля при збільшенні цієї відстані.
Для з’ясування того, чи можна застосовувати цю модель до конкретної популяції, можна обчислити коефіцієнти кореляції між парами спостережень, що знаходяться на відстані одиниць одне від одного, та побудувати графік відповідних значень як функції . Цей графік, чи функція, яку він представляє, називається корелограмою. Навіть якщо модель можна застосовувати до будь-якої скінченої популяції, корелограма для неї не буде гладкою функцією через неправильності, обумовлені скінченим характером популяції. При порівнянні систематичного та стратифікованого випадкового відборів із популяцій, що описуються моделлю, ці неправильності ускладнюють отримання результатів для будь-якої скінченої популяції. Таке порівняння можна провести, якщо розглядати середнє з цілого ряду популяцій, отриманих навмання з деякої нескінченої надпопуляції, до якої можна застосувати цю модель. Такий прийом вже застосовувався в теоремі 1.3.2.
Отже, ми припускаємо, що спостереження вилучені з над популяції, для якої
(1.6.1)
де
при довільних .
Здобуття одного набору значень з цієї надпопуляції призводить до утворення деякої скінченої популяції обсягом .
Середня дисперсія по всім скінченим популяціям при систематичному відборі позначається через
.
Для цього класу популяцій неважко показати, що стратифікований випадковий відбір краще простого випадкового відбору, але відносно систематичного відбору загального твердження сформулювати не можна. Всередині цього класу існують надпопуляції, для яких систематичний відбір краще стратифікованого випадкового відбору, але існують і такі, для яких, при певних значеннях , систематичний відбір поступається стратифікованому випадковому відбору.
Якщо припустити, що корелограма є випуклою вниз функцією, то можна довести одну загальну теорему.
Теорема 1.6.1. Якщо, разом з умовами (1.6.1), виконується
, ,
то при будь якому обсязі вибірки
.
Далі, за винятком випадку , виконується
.
Теорема 1.6.1 була доведена Кокреном у 1946 році.
Наведемо частину доведення при , яка показує, яку роль відіграє умова випуклості вгору. Члени пари, які утворюють систематичну вибірку, завжди відстоять один від одного на одиниць. Отже,
.
У випадку стратифікованої вибірки для кожної одиниці, що вилучається з відповідної страти, існує можливих місць, що утворюють можливих комбінацій розташування вибірки. Числа комбінацій, для яких відстань між одиницями складає , будуть такими:
Відстань |
| Підсумок |
Число комбінацій |
|
Отже, середнє значення , яке береться по всім комбінаціям, може бути подане у вигляді
Аналогічно можна виразити у вигляді
Отже,
Якщо
,
то неважко показати, що кожний член всередині дужок додатний. Теорема доведена.
Середня відстань між одиницями дорівнює як для систематичної вибірки, так і для стратифікованої вибірки, але завдяки умові випуклості стратифікована вибірка більш програє у точності, коли відстань між одиницями менше , ніж виграє, коли ця відстань більше .
В 1949 році Кенуй показав, що нерівності, які містяться у твердженні теореми 1.6.1, залишаються справедливими, якщо зробити менш жорсткими дві умови (1.6.1), а саме
.
В цьому випадку кожна з трьох середніх дисперсій для надпопуляції збільшується в однаковому ступені.
... ірювання; 6) обчислення довірчої випадкової похибки і загальної похибки результату опосередкованого вимірювання; при нелінійній залежності знаходять систематичну похибку опосередкованих вимірювань, обумовлену перехресними членами у рівнянні. При прямих одноразових вимірюваннях початкових величин процедура визначення результату Y опосередкованих вимірювань зберігається такою самою, як і при ...
... . Приміщення механічно очищають і знезаражують 5-процетним розчином формальдегіду або 3-процентним розчином лізолу. М'ясо, шкурки і пух хворих кролів ніяким обмеженням не підлягають. Токсоплазмоз. Кролі, як і інші ссавці, сприйнятливі до токсоплазмозу. Хворі на цю хворобу кролі можуть бути джерелом зараження людини і тварин. Етіологія. Збудник — Toxoplasma gondii має форму півмісяця і нагадує ...
... ів є актуальною, оскільки на її основі реально можна розробити формувальні, розвивальні та оздоровчі структурні компоненти технологічних моделей у цілісній системі взаємодії соціальних інститутів суспільства у формуванні здорового способу життя дітей та підлітків. На основі інформації, яка отримана в результаті діагностики, реалізується методика розробки ефективних критеріїв оцінки інноваційних ...
... є грубим. 2.8. Методи вилучення систематичних похибок з результатів вимірювань Систематичні похибки, незалежно від характеру їх змінювання в часі при постановці і проведенні вимірювального експерименту, повинні бути виявлені і вилучені з результатів вимірювань або хоча б зменшені, для чого важливо знати джерела і причини їх виникнення. За цією ознакою розрізняють такі систематичні похибки: ...
0 комментариев