2. Сводка и группировка статистических данных
В результате первой стадии статистического исследования (статистического наблюдения) получают статистическую информацию, представляющую собой большое количество первичных, разрозненных сведений об отдельных единицах объекта исследования (например, информация о каждом гражданине страны при переписи населения: возраст, пол, национальность, образование и др.). Дальнейшая задача статистики заключается в систематизации этих материалов в определенном порядке и сводной характеристике всей совокупности фактов при помощи обобщающих показателей, отражающих сущность социально-экономических явлений и определенные статистические закономерности.
Статистическая сводка – это научно организованная обработка материалов наблюдения, включающая в себя систематизацию, группировку данных, составление таблиц, подсчет групповых и общих итогов, расчет производных показателей (средних, относительных величин). Она позволяет перейти к обобщающим показателям совокупности в целом и отдельных ее частей, осуществлять анализ и прогнозирование изучаемых процессов.
Проведение сводки включает 3 этапа:
- предварительный контроль материалов (проверка исходных данных);
- группировка данных по заданным признакам, определение производных показателей;
- оформление результатов сводки в виде статистических таблиц.
Под группировкой в статистике понимают расчленение единиц статистической совокупности на группы, однородные в каком-либо существенном отношении, и характеристику таких групп системой показателей в целях выделения типов явлений, изучения их структуры и взаимосвязей.
С помощью метода группировок решаются следующие задачи:
1) выделение социально-экономических типов явлений;
2) изучение структуры явления и структурных сдвигов, происходящих в нем;
3) выявление связи и зависимости между явлениями.
Результаты группировки оформляются в виде группировочных таблиц, делающих информацию обозримой.
По задачам систематизации данных различают типологические, структурные и аналитические группировки.
Типологическая группировка
Необходимость данной группировки обусловливается наличием качественных различий между изучаемыми явлениями.
Необходимо выделить в составе массового явления те части, которые однородны по качеству и условиям развития, в которых действуют одни и те же закономерности влияния факторов. В результате такой группировки выделяются социально-экономические типы. Типологические группировки предназначаются для выявления качественно однородных групп совокупностей, т.е. объектов, близких друг другу одновременно по всем группировочным признакам. Этот вид группировок в значительной степени определяется представлениями экспертов о том, какие типы явлений могут встретиться в изучаемой совокупности.
Примерами типологических группировок могут служить группировки хозяйственных объектов по формам собственности (табл. 2.1); населения по общественным группам; работников на занятых преимущественно физическим и преимущественно умственным трудом и т.д.
Таблица 2. 1
Группировка полиграфических предприятий одного из городов России по формам собственности
Структурная группировка
Структурной называется группировка, в которой происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому-либо изменяющемуся признаку. С помощью таких группировок могут изучаться: состав населения по полу, возрасту, доходу (табл. 2.2), месту проживания; состав предприятий по численности занятых, стоимости основных фондов и т.д.
Таблица 2. 2
Группировка населения по величине среднедушевых денежных доходов за 2006 год
Решая вопрос о величине интервала групп (или, что то же, о числе групп), необходимо иметь в виду, что следует выбирать такое число групп, чтобы при этом не наблюдалось существенных отклонений от равномерного распределения внутри каждой группы.
Особо выделяют ряды распределения. Ряд распределения – это группировка, в которой для характеристики групп (упорядоченно расположенных по значению признака) применяется один показатель – численность группы. Другими словами, это ряд чисел, показывающий, как распределяются единицы некоторой совокупности по изучаемому признаку.
В зависимости от того, какой признак (количественный или качественный) взят за основу группировки данных, различают соответственно типы рядов распределения.
Если за основу группировки взят качественный признак, то такой ряд распределения называют атрибутивным (распределение по видам труда, по полу, по профессии, по религиозному признаку, национальной принадлежности и т.д.).
Если ряд распределения построен по количественному признаку, то такой ряд называют вариационным. Построить вариационный ряд – значит упорядочить количественное распределение единиц совокупности по значениям признака, а затем подсчитать числа единиц совокупности с этими значениями (построить групповую таблицу).
Выделяют три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд.
Ранжированный ряд – это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака. Ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются.
Другие формы вариационного ряда – групповые таблицы, составленные по характеру вариации значений изучаемого признака. По характеру вариации различают дискретные (прерывные) и непрерывные признаки.
Дискретный ряд – это такой вариационный ряд, в основу построения которого положены признаки с прерывным изменением (дискретные признаки). К последним можно отнести тарифный разряд, количество детей в семье, число работников на предприятии и т.д. Эти признаки могут принимать только конечное число определенных значений.
Дискретный вариационный ряд представляет таблицу, которая состоит из двух граф. В первой графе указывается конкретное значение признака, а во второй – число единиц совокупности с определенным значением признака.
Если признак имеет непрерывное изменение (размер дохода, стаж работы, стоимость основных фондов предприятия и т.д., которые в определенных границах могут принимать любые значения), то для этого признака нужно строить интервальный вариационный ряд.
Групповая таблица здесь также имеет две графы. В первой указывается значение признака в интервале «от – до» (варианты), во второй – число единиц, входящих в интервал (частота).
Частота (частота повторения) – число повторений отдельного варианта значений признака, обозначается f i , а сумма частот, равная объему исследуемой совокупности, обозначается
где m - число вариантов значений признака (число групп).
Очень часто таблица дополняется графой, в которой
подсчитываются накопленные частоты m k f S
(для k - ой группы), которые показывают, какое количество единиц совокупности имеет значение признака не большее, чем данное значение.
Частоты ряда f i могут заменяться частостями wi , выраженными в относительных числах (долях или процентах). Они представляют собой отношения частот каждого интервала к их общей сумме, т.е.:
Аналитическая группировка
Явления общественной жизни и отражающие их признаки тесно взаимосвязаны между собой. Группировка, выявляющая взаимосвязи между изучаемыми явлениями называется аналитической группировкой. Всю совокупность признаков можно разделить на две группы: факторные и результативные.
Факторными называются признаки, под воздействием которых изменяются другие – они и образуют группу результативных признаков. Взаимосвязь проявляется в том, что с возрастанием значения факторного признака систематически возрастает или убывает среднее значение признака результативного. В основу группировки кладется факторный признак, каждая выделенная группа характеризуется средними значениями результативного признака. Из таблицы 2.3 видно, что чем продолжительнее договорные связи магазина с поставщиками, тем выше качество поставляемой книжной продукции.
Таблица 2. 3
Группировка продолжительности договорных связей книжного магазина и качества продукции
Все рассмотренные группировки объединяет то, что единицы совокупности разделены на группы по какому-либо признаку. Если группы образованы по одному признаку, то группировка называется простой.
Комбинационной называется группировка, в которой расчленение совокупности на группы производится по двум и более признакам, взятым в сочетании. Сначала группы образуются по одному признаку, затем полученные группы делятся на подгруппы по другому признаку и т.д. В случае если группировка осуществляется не последовательно по отдельным признакам, а одновременно по комплексу признаков, ее называют многомерной.
Построение группировки начинается с определения состава группировочных признаков. Группировочным признаком называется признак, по которому проводится разбиение единиц совокупности на отдельные группы. В основание группировки могут быть положены как количественные (имеют числовое выражение), так и качественные (отражают состояние единицы совокупности) признаки.
Если число единиц совокупности n достаточно велико и их распределение близко к нормальному закону (распределение Гаусса), то для оценки числа групп можно использовать формулу Стерджесса:
(результат округляют до целого числа).
Если число групп определено или задано, остается решить вопрос о величине групповых интервалов. Интервал – это значения признака, лежащие в определенных границах. Интервалы группировок могут быть закрытыми и открытыми. Закрытыми называются интервалы, у которых имеется верхняя и нижняя границы. Открытые – это интервалы, у которых задана только одна граница: верхняя у первого, нижняя у последнего. Например: группы предприятий по числу работающих в них сотрудников (чел.): до 100, 100-200, 200-300, 300 и более. Если границы интервалов соседних групп совпадают, то нужно заранее определится, в какую группу будем относить единицы объекта с данным значением признака (чтобы избежать повторного счета).
При типологической группировке интервалы должны намечаться таким образом, чтобы они отграничивали социально-экономические типы, установленные на основе экономической теории.
Если интервалы равные, то
где xmax- максимальное значение признака, где xmin - минимальное
значение признака, h - длина интервала.
При анализе разнородных данных, например, при анализе материала, собранного в различные периоды времени, относящегося к различным отраслям народного хозяйства, возникает необходимость применения вторичной группировки.
Кроме того, методом вторичной группировки пользуются для того, чтобы показать интенсивность развития процессов и явлений в разнообразных условиях.
Вторичная группировка – образование новых групп на основе ранее сделанных группировок. Получение новых групп на основе имеющихся возможно двумя способами перегруппировки: путем укрупнения интервалов и на основе долевой перегруппировки.
Результаты группировочного материала оформляются в виде таблиц, где он излагается в наглядно-рациональной форме.
Статистическая таблица – это цифровое выражение итоговой характеристики всей наблюдаемой совокупности или ее составных частей по одному или нескольким существенным признакам.
Статистическая таблица содержит два элемента: подлежащее и сказуемое. Подлежащее статистической таблицы есть перечень групп или единиц, составляющих исследуемую совокупность единиц наблюдения. Сказуемое статистической таблицы – это цифровые показатели, с помощью которых дается характеристика выделенных в подлежащем групп и единиц.
Различают простые, групповые и комбинационные таблицы. В простых таблицах, как правило, содержится справочный материал, где дается перечень групп или единиц, составляющих объект изучения. При этом части подлежащего не являются группами одинакового качества, отсутствует систематизация изучаемых единиц. Сказуемое этих таблиц содержит абсолютные величины, отражающие объемы изучаемых процессов.
Групповые и комбинационные таблицы предназначены для научных целей, где, в отличие от простых таблиц, в сказуемом – средние и относительные величины на основе абсолютных величин.
Групповая таблица – это таблица, где статистическая совокупность разбивается на отдельные группы по какому-либо одному существенному признаку, при этом каждая группа характеризуется рядом показателей.
Комбинационная таблица – это таблица, где подлежащее представляет собой группировку единиц совокупности по двум и более признакам, которые распределяются на группы сначала по одному признаку, а затем на подгруппы по другому признаку внутри каждой из уже выделенных групп. Комбинационная таблица устанавливает существенную связь между факторами группировки. Такого рода статистические таблицы позволяют осуществить всесторонний анализ, но они менее наглядны.
Практикой выработаны определенные требования к составлению и оформлению таблиц.
1. Таблица по возможности должна быть краткой.
2. Каждая таблица должна иметь подробное название, из которого становится известно:
а) какой круг вопросов излагает и иллюстрирует таблица;
б) каковы географические границы представленной статистической совокупности;
в) за какой период времени, которому они относятся;
г) каковы единицы измерения (если они одинаковы для всех табличных клеток). Если единицы измерения неодинаковы, то в верхних или боковых заголовках обязательно следует указывать, в каких единицах приводятся статистические данные (тонн, штук, рублей и пр.).
3. Таблица может сопровождаться примечаниями, в которых указываются источники данных, более подробно раскрывается содержание показателей, даются и другие пояснения, а также оговорки в случае, если таблица содержит данные, полученные в результате вычислений.
4. При оформлении таблиц обычно применяются такие условные обозначения: знак тире (–) – когда явление отсутствует; х – если явление не имеет осмысленного содержания; многоточие (…) – когда отсутствуют сведения о размере явления (или делается запись «Нет сведений»).
Если сведения имеются, но числовое значение меньше принятой в таблице точности, оно выражается дробным числом (0,0).
Округленные числа приводятся в таблице с одинаковой степенью точности (до 0,1; до 0,01 и т.п.). Если в таблице приводятся проценты роста, то во многих случаях целесообразно проценты от 300 и более заменять отношениями в разах. Например, писать не «1000 %», а «в 10,0 раз».
Процесс получения обобщающих характеристик составляет сущность особого этапа статистического исследования – сводки.
Сводка – это характеристика выделенных групп и совокупности в целом с помощью статистических показателей. Статистический показатель – это обобщающая характеристика социально-экономических явлений и процессов в конкретных условиях места и времени.
Обобщающие показатели могут быть представлены абсолютными, относительными и средними величинами.
Путем непосредственного суммирования первичных данных получают обобщающие абсолютные показатели, которые характеризуют численность совокупности и объем (размер) изучаемого явления в конкретных границах времени и места. Например, численность населения России по переписи на 9 октября 2002 г. Составила 145,2 млн. человек, валовой внутренний продукт в 2006 г. – 26 781,1 млрд. руб. Первый показатель характеризует численность населения на определенный момент, и получают такие абсолютные величины по результатам сводки данных единовременного наблюдения. Второй показатель характеризует размер явления за определенный период, и он получен как результат сводки данных текущего наблюдения.
... (13) и (15) значения, сравниваются с критическими tк, которые принимаются согласно данным таблицы Стьюдента с учетом заданного уровня значимости (a) и числа степеней свободы (k = n - 2). В социально-экономических исследованиях уровень значимости a обычно принимают равным 5%, т.е. a = 0,05, что соответствует доверительной вероятности 95%. Параметр признается существенным при условии, если tф > ...
... уравнения для оценки неизвестных значении зависимой переменной. Решение названных задач опирается на соответствующие приемы, алгоритмы, показатели, применение которых дает основание говорить о статистическом изучении взаимосвязей. Следует заметить, что традиционные методы корреляции и регрессии широко представлены в разного рода статистических пакетах программ для ЭВМ. Исследователю остается ...
... т. е. выявить "восприимчивые" точки, используя которые можно управлять системой. Одним из способов познания социально-экономических процессов является сочетание количественного и качественного анализа и определение на этой основе математических методов в экономических исследованиях. Ими пользуются разные экономические школы (неокейнсианская, монетаристская, неолибетальная и др.). Количественные ...
... статистическую информацию, прогнозы, оценки и т.п. в форме печатных изданий, компьютерных дисков, а также путем телефонного переключения с использованием персональных ЭВМ. Основными задачами социально-экономической статистики в условиях рыночной экономики являются систематическое описание и анализ следующих социально-экономических явлений и процессов: численность и структура населения страны, ...
0 комментариев