1 Модуль основы статистики и таблицы
Необходим для предварительной обработки данных, осуществления разведочного анализа, определения зависимости между ними, разбиения их различными способами на группы, просмотра этих группы визуально и определение взаимосвязи между данными. Обычно с этого модуля начинается работа в системе.
Этот статистический модуль включает в себя приведенные ниже группы статистических процедур.
- Описательные статистики, группировки, разведочный анализ
STATISTICA предлагает широкий выбор методов разведочного статистического анализа. Система может вычислить практически все описательные статистики, включая медиану, моду, квартили, определенные пользователем процентили, средние и стандартные отклонения, доверительные интервалы для среднего, коэффициенты асимметрии, эксцесса (с их стандартными ошибками), гармоническое и геометрическое среднее, а также многие другие описательные статистики.
-Корреляции
Этот раздел включает большое количество средств, позволяющих исследовать зависимости между переменными. Возможно вычисление практически всех общих мер зависимости, включая коэффициент корреляции Пирсона, коэффициент ранговой корреляции Спирмена, Тау Кендалла, Гамма, коэффициент сопряженности признаков С и многие другие.
- t - критерии (и другие критерии для групповых различии)
t-критерии для зависимых и независимых выборок, а также статистика Хоттелинга.
2 Модуль Множественная регрессия
Модуль Множественной регрессии включает в себя исчерпывающий набор средств множественной линейной и фиксированной нелинейной (в частности, полиномиальной, экспоненциальной, логарифмической и др.) регрессии, включая пошаговые, иерархические и другие методы.
Система STATISTICA позволяет вычислить всесторонний набор статистик и расширенной диагностики, включая полную регрессионную таблицу, частные и частичные корреляции и ковариации для регрессионных весов, матрицы прогонки, статистику Дурбина-Ватсона, расстояния Махаланобиса и Кука, удаленные остатки и многие другие. Анализ остатков и выбросов может быть проведен при помощи широкого набора графиков, включая разнообразные точечные графики, графики частичных корреляций и многие другие. Система прогноза позволяет пользователю выполнять анализ "что - если". Допускаются чрезвычайно большие регрессионные задачи (до 300 переменных в процедуре разведочной регрессии).
Кроме данных модулей в программе имеется широкий набор других модулей: Модуль Дискриминантного анализа; Модуль непараметрической статистики; Модуль факторный анализ; Модуль многомерное шкалирование; Модуль анализ надежности;. Модуль кластерный анализ; Модуль анализ временных рядов и т.д.
1.3 Анализ многофакторной связи выходов продуктов обогащения, качества и марочного состава угля, поступающего на переработку
Задачу оптимального управления развитием горных работ и качеством угля на шахтах необходимо рассматривать с учетом технологических требований обогатительной фабрики на которую поставляется уголь для дальнейшей переработки.
Для центральной обогатительной фабрики "Карагандинская" весьма актуальным является вопрос о том, как зависит выход концентрата от качества исходного угля, его марочного состава и при каком соотношении марок достигается максимальный выход концентрата. Поэтому, наряду с разработкой методов рационального развития горных работ на шахтах, связанных поставками углей на обогатительную фабрику, было проведено исследование зависимости выхода концентрата от участия марок К и КЖ в шихте и их качественных показателей. Исследования проводились на базе статистического материала, представленного в таблице 1.1 .
Многофакторное влияние на величину зависимой переменной в общем виде можно выразить зависимостью:
Y = f(x1 , x2 ,…………,xn) (1.16)
где Y зависимая переменная ( в нашем случае - выход концентрата)
хi, - независимые переменные ( горно-технические и технико-
экономические показатели модели).
Отбор информативных факторов, оказывающих наибольшее влияние на уровень формирования У и построение множественных регрессионных моделей проводилось в следующей последовательности.
Вначале проверялись на однородность исследуемые факторы, вычислялись и изучались основные одномерные статистические характеристики принятых к анализу факторов: их средние значения, среднеквадратические отклонения , коэффициенты вариации. Затем исследовались парные связи между факторами. Используя возможности современного компьютерного обеспечения вычислительных процессов на базе статистических данных представленных в таблице 2.1, было установлено наличие корреляции между выходом концентрата и технологическими показателями обогащаемого угля. Были определены параметры корреляционных формул для каждого независимого переменного и определены коэффициенты парной корреляции которые представлены на рисунках 1- 8 приложения А. Гистограммы по каждому независимому переменному с наложенной плотностью нормального распределения приведены на рисунках 9 – 17 приложения А. Рисунки 9 – 17 свидетельствуют о нормальном распределении исследуемых параметров. Наиболее тесная связь наблюдается между выходом концентрата и процентным участием марок угля в обогащаемой шихте. Коэффициент парной корреляции г = 0.568.
Для более наглядного отображения связей исследуемых параметров, путем аппроксимации в трехмерном пространстве построены графики зависимости выхода концентрата от технологических параметров обогащаемого угля, которые представлены на рисунках 1.1– 1.12. Изображение в трехмерном пространстве связи исследуемых факторов позволяет визуально определять области, представляющие наибольший интерес для дальнейшего, более глубокого исследования. Рассекая квадратичную поверхность через равные интервалы, мы получаем линии равного уровня значений выхода концентрата, которые при проекции на плоскость, образуемую осями независимых переменных, определяют области значений, при которых наблюдается наибольший выход концентрата.
На рисунке 1.1 изображена зависимость выхода концентрата (У ) от зольности угля марки К (х2 ) и зольности угля марки КЖ (х6 ) в обогащаемой шихте. Анализ рисунка позволяет сделать вывод, что максимальный выход концентрата достигается при зольности угля марки К не более 31.0 % и зольности угля марки КЖ не более 26.3 %.
Рисунок 1.2 отражает изображенную в трехмерном пространстве зависимость выхода концентрата от зольности угля марки К (x2) и процентного содержания угля марки КЖ (х5) в исходной шихте. Можно предположить, что наибольший выход концентрата достигается при содержании в шихте угля марки КЖ не более 42.0 %.
Рисунки 1.3, 1.4 и 1.5 иллюстрируют поверхности зависимости выхода концентрата(Y) , зольности и влажности (х2-4), зольности и сернистости (х2-3 ) угля марки К, участия угля марки К в шихте (х1) и зольности угля мари К (х2). Максимальный выход концентрата наблюдается при влажности угля марки К ниже чем 6.60 %, содержании серы ниже , чем 0.57 %.
На рисунке 1.6 изображена в трехмерном пространстве зависимость выхода концентрата Y , от процентного содержания угля марки КЖ (x5) , влажности угля марки КЖ (х8). Можно предположить, что наибольший выход концентрата будет при значениях содержания угля марки КЖ не менее 42,0 % и влажности угля марки КЖ не более 6,60 %.
Рисунок 1.7 иллюстрирует зависимость выхода концентрата от влажности угля марки КЖ (х8 ) и зольности угля марки К (х2 ), максимальный выход концентрата будет при влажности угля марки КЖ не более 6,63 %.
На рисунках 1.8, 1.9 и 1.10 изображены в трехмерном пространстве зависимости выхода концентрата от содержания в процентах угля марки К в исходной шихте (х1) и зольности (х6) угля марки КЖ, влажности (х4 ) угля марки К и серы (х7 ) угля марки КЖ . Можно предположить, что наибольший выход концентрата будет при зольности угля марки КЖ не более 27,5 %, серы не более 0,88 % и влажности не более 7,15 % при содержании угля марки К в исходной шихте не более 60%.
Рисунок 1.11 иллюстрирует поверхность зависимости выхода концентрата от процентного содержания угля марки К в исходной шихте (х1) и сернистости(х3) угля марки К. Анализ рисунка позволяют сделать вывод, что для достижения максимального выхода концентрата сернистость угля марки К не должна превышать 0,53 % при содержании угля марки К не более 57,0 %.
Рисунок 1.12 иллюстрирует поверхность зависимости выхода концентрата от процентного содержания угля марки КЖ (x5) и содержания серы в угле марки КЖ (x7). Анализ рисунка позволяет сделать вывод, что для достижения максимального выхода концентрата сернистость угля марки КЖ не должна превышать 0,88 % при содержании содержании угля марки КЖ не более 38 %.
Все данные вышеприведенных исследований сведены в таблицу 1.2
Таблица 1.2 Расчетные значения независимых переменных
Зависимость | Полученные значения параметров (%) | |||||||||
Y | X | X | X1 | X2 | X3 | X4 | X5 | X6 | X7 | X8 |
Y | X2 | X6 | <31.00 | <26.3003 26.3 | ||||||
Y | X2 | X5 | >30.50 | >42.00 | ||||||
Y | X2 | X4 | <28.50 | <6.60 | ||||||
Y | X2 | X3 | <30.80 | <0.57 | ||||||
Y | X2 | X1 | <58.00 | >30.50 | ||||||
Y | X5 | X8 | >42.00 | <6.60 | ||||||
Y | X2 | X8 | <28.50 | <6.63 | ||||||
Y | X1 | X6 | <70.00 | <27.50 | ||||||
Y | X1 | X4 | <56.00 | <7.15 | ||||||
Y | X1 | X7 | <62.00 | <0.88 | ||||||
Y | X1 | X3 | <57.00 | <0.53 | ||||||
Y | X5 | X7 | >38.00 | <0.88 |
Сравнивая полученные теоретические значения параметров (X1 –X8) с принимаемыми фактическими значениями которые они могут принимать (см. табл. 1.3), можно заключить, что для максимизации выхода концентрата входящие параметры должны принимать следующие значения:
X1 = 51.00 - 56.00 %;
X2= 26.00 - 32.00 %;
X3= 0.41 - 0.53 %;
X4= 6.50 - 7.20 %;
X5= 4.20 - 4.80 %;
X6= 24.00 - 26.30 %;
X7= 0.71 - 0.88 %;
X8= 6.10 - 6.60 %.
Таблица 1.3 Статистические значения исследуемых параметров
Переменные | Количество значений | Среднее значение | Минимальное значение | Максимальное значение | Стандартное отклонение |
Y | 36 | 56,04 | 42,20 | 60,90 | 4,59 |
X1 | 36 | 64,93 | 51,50 | 85,40 | 8,15 |
X2 | 36 | 30,86 | 26,20 | 32,20 | 0,97 |
X3 | 36 | 0,48 | 0,41 | 0,78 | 0,07 |
X4 | 36 | 6,82 | 6,50 | 7,30 | 0,18 |
X5 | 36 | 35,06 | 14,60 | 48,50 | 8,15 |
X6 | 36 | 26,78 | 24,00 | 30,60 | 1,18 |
X7 | 36 | 0,81 | 0,71 | 0,91 | 0,04 |
X8 | 36 | 6,40 | 6,10 | 6,90 | 0,17 |
На стадии многомерного статистического анализа проводился отбор существенных факторов изучаемых явлений, построение многофакторных моделей и оценка их адекватности с помощью принятых в регрессионном анализе критериев.
Предварительный анализ построенных по стандартной программе моделей, показал, что наибольшую статистическую значимость исследуемые факторы имеют в моделях вида:
Y= a0+a1x1+a2x2+….+anxn (1.17)
где Y - результирующий фактор;
а0 - свободный член ;
аi , - коэффициенты регрессии ;
хi - исследуемые факторы.
В результате реализации модели была получена теоретическая зависимость выхода концентрата (%) от процентного участия в обогащаемой шихте марок К и КЖ, их качественных характеристик, а также зависимость выхода концентрата и экономических показателей работы ЦОФ за исследуемый период. Статистические оценки полученного уравнения приведены в таблице 1.4.
Таблица 1.4 Статистические оценки модели множественной регрессии зависимости выхода концентрата от качественных характеристик и марочного состава угля
Множественная линейная регрессия для Y1 R=0.923016 RI=0.851959 Уточнение RI=0.800713 F (9, 26)=16.626 p<0.00000 Ст. Ошибка: 2.0495 | ||||||
N=36 | Beta | cт.ошибка Beta | B | cт.ошибка В | Стьюдент t=(26) | p-уровень |
Свободный | 122.734 | 24.5866 | 4.9919 | 0.00003 | ||
X1 | -0.3826 | 0.0888 | -0.2155 | 0.0500 | -4.3046 | 0.00021 |
X2 | -0.1095 | 0.0829 | -.05167 | 0.3913 | -1.3203 | 0.19821 |
X3 | -0.1083 | 0.0947 | -7.1023 | 6.2100 | -1.1436 | 0.26317 |
X4 | -0.0176 | 0.0835 | -0.4396 | 2.0782 | -0.2115 | 0.83411 |
X6 | -0.0068 | 0.0852 | -0.0267 | 0.3314 | -0.0807 | 0.93622 |
X7 | -0.8071 | 0.0898 | -8.3107 | 9.2534 | -0.8981 | 0.37736 |
X8 | -0.1326 | 0.0855 | -3.3921 | 2.1887 | -1.5497 | 0.13327 |
где R – коэффициент множественной корреляции;
RI – квадрат коэффициента множественной корреляции;
Уточнение RI - скорректированный коэффициент детерминации определяемый по формуле: 1 – (1- RI)/(n/(n-p))
Ст. ошибка – мера рассеяния наблюдаемых значений относительно регрессионной кривой;
Свободный – значение свободного члена в уравнении регрессии;
t- критерий, используемый для проверки гипотезы о равенстве 0 членов регрессии;
F- критерий значимости уравнения (критерий Фишера);
Р – уровень значимости.
Анализ таблицы позволяет сделать вывод о высоком уровне адекватности полученной модели, коэффициент множественной корреляции R = 0,923016.
В соответствии с расчетом, теоретическая зависимость выхода концентрата от исследуемых факторов имеет вид :
Y = 122.73484 - 0.21553 X1 - 0.51671 Х2 - 7.10231 Х3 - 0.43965Х4 -
– 0.02678 Х5 -8.31077 X7 -3.39213 X8 (1.18)
Значимость уравнения регрессии определяется его предсказательной силой, т.е. надежно прогнозировать средние значения зависимой переменной У по заданным значениям независимых переменных. Для оценки значимости уравнения применяют F-критерий Фишера, который в рассматриваемом уравнении равен F(9,26)= 16.625 , что больше табличного значения(Fтабл=2.88). Это говорит о том, что это уравнение является значимым. В таблице 2.5 приведены парные коэффициенты корреляции.
При анализе корреляционной матрицы видно, что максимальное значение парного коэффициента корреляции г =0.57, т.е. наиболее тесная связь наблюдается между выходом концентрата и количественным участием угля марок К и КЖ в обогащаемой шихте.
Этот вывод подтверждает проверка значимости коэффициентов регрессии по критерию Стьюдента (таблица 1.5). Для коэффициента регрессии при независимой переменной х1 ( участие марки К в шихте, %) t- критерий Стьюдента равен -4.304674, что больше табличного значения (tтабл=2.05), а это значит что нулевая гипотеза отвергается и коэффициент регрессии значим.
Таблица 1.5 Парные коэффициенты корреляции
Количество наблюдений N =36 | ||||||||
Y | Y | X1 | X2 | X3 | X4 | X5 | X6 | X7 |
Y | 1.00 | -0.57 | 0.02 | -0.10 | 0.15 | -0.23 | 0.02 | 0.06 |
X1 | -0.57 | 1.00 | -0.16 | 0.13 | -0.14 | 0.19 | -0.34 | -0.12 |
X2 | 0.02 | -0.16 | 1.00 | -0.09 | 0.21 | -0.19 | 0.22 | -0.14 |
X3 | -0.10 | 0.13 | -0.09 | 1.00 | 0.23 | 0.07 | -0.35 | 0.08 |
X4 | 0.15 | -0.14 | 0.21 | 0.23 | 1.00 | -0.19 | 0.04 | 0.10 |
X5 | -0.23 | 0.19 | -0.19 | 0.07 | -0.19 | 1.00 | -0.14 | 0.28 |
X6 | 0.02 | -0.34 | 0.22 | -0.35 | 0.04 | -0.14 | 1.00 | 0.01 |
X7 | 0.06 | -0.12 | -0.14 | 0.08 | 0.10 | 0.28 | 0.01 | 1.00 |
На рисунке 1.13 и 1.14 показано поле корреляции выхода концентрата (Y ) в зависимости от процентного участия угля марки К и КЖ в обогащаемой шихте. Определена теоретическая линия регрессии. О тесноте связи свидетельствует достаточно высокий коэффициент парной корреляции. Распределение функции и аргумента приближается к распределению по нормальному закону. На рисунках 1.15 и 1.16 представлены частоты распределения значений параметров X2 и X6 с наложенной плотностью нормального распределения. Данные графики свидетельствуют о нормальности распределения исследуемых значений. На рисунках 1.17 и 1.18 представлено распределение остатков при построении теоретической зависимости Y=f(X2) и Y=f(X6). Данные рисунков показывают о нормальном характере распределения остатков, что свидетельствует о корректности полученных моделей.
Также, используя полученное уравнение регрессии, был найден теоретически максимально возможный выход концентрата (Y) при заданных условиях. Варьируя содержанием угля марки К (х1) в исходной шихте с шагом 0.2 % , при этом остальные независимые переменные, входящие в уравнение были приняты постоянными величинами, равными средним значениям исследуемых факторов, был получен теоретически максимально возможный выход концентрата, равный 65.07 %. Данные расчеты были произведены с помощью программы EXCEL.
Таким образом, в результате реализации модели была найдена теоретическая зависимость выхода концентрата от количественного и качественного состава исходной шихты для обогащения на ЦОФ "Карагандинская". В результате анализа было установлено, что наибольшее влияние на выход концентрата оказывает процентное соотношение марок угля в исходной шихте, максимальный выход концентрата достигается при коэффициенте марочного состава для угля марки К равном 0.55, для угля марки КЖ соответственно 0.45.
Определенные оптимальные параметры по результатам многомерного корреляционного анализа (X1-X8), позволяют получить минимально возможный выход концентрата равный 59.63% (при среднем выходе концентрата 56,04%). Теоретически максимально возможный выход концентрата может достигать 65.07%. Рациональное соотношение марок и определенное в результате исследования влияние показателей качества исходной шихты на выход продуктов обогащения дают, в свою очередь, возможность значительно рационализировать календарное планирование.
0 комментариев