3. Синтез данных
Синтез данных – наиболее важная процедура обработки информации – логическое объединение элементов информации, внешне не обладающих связями, в систему единой направленности. Здесь упор делается на выдвижение обоснованной гипотезы. На этом этапе работы с информацией решаются следующие задачи:
- установление связей между разрозненными элементами и укладывание их в единую логическую схему (например, описательная модель объекта или модель поведения);
- формулирование на основе полученных моделей гипотезы;
- определение потребностей в недостающих сведениях и постановка задачи по их нахождению;
Наиболее используемые варианты синтеза:
v Описание;
v Причинно – следственный анализ;
v Гипотетический метод.
v Описание и его методы.
Описание производится в рамках той задачи, которую аналитик ставит перед собой. Описание служит лишь умозрительному познанию, показу различных сторон изучаемого объекта или события. С помощью описания информация приводятся к такому виду, который позволяет использовать ее в качестве материала для объяснения происходящего. Описание – это модель описываемого предмета. Описывать событие – значит отвечать на вопросы о его качественных и количественных сторонах. Эти вопросы формулируются очень просто: «какой?, какое?, какая?, сколько?» и т.д. Поэтому описание отличается от простой констатации фактов, которая лишь отвечает на вопросы: «что?», «где?», «когда?». При простой констатации фактов сотрудник показывает наличие или отсутствие некоего события. А при описании он обращает внимание на свойства явления или объекта.
Главное при описании заключается в характеристике объекта интереса, то есть в выяснении качеств, а особый интерес при этом уделяется качествам, свойственным только этому объекту, либо узкому кругу объектов. Иными словами тому, что выделяет его из общей массы подобных. Аналитик прежде всего должен выявить те особенные качества явления, которые дают наиболее полное представление об исследуемой стороне этого предмета. Чем детальнее, правильнее в этом смысле описание, тем больше сведений дает оно о том, что описывается.
А) Группировка данных.
Этот метод заключается в упорядочивании данных по определенным признакам. Группировка позволяет связать разрозненные факты в единую систему, соответствующую тому или иному предположению, рабочей гипотезе и т.п. Группировка может производиться по разным признакам в зависимости от задачи, поставленной автором. Например, по датам, по месту происшествия, по связи с неким объектом.
Б) Типологизация данных.
Типологизация – это поиск устойчивых сочетаний свойств исследуемых ситуаций, процессов, событий, феноменов. Например, признаки, характеризующие какую то группу людей в зависимости от их отношения к религии, места в системе управления обществом, взаимоотношения с силовыми структурами, социального статуса и других отличительных свойств.
Наиболее используемый способ группировки данных состоит в том, что составляется блок-схема описания объекта интереса. Сначала формируются укрупненные блоки. Затем, внутри этих блоков формируются группы, а внутри них уже ячейки.
Таким образом, формируется структура описания объекта. После того как эта структура создана можно переходить собственно к группировке данных. Каждый новый информационный блок изучается с целью выявления в нем информации, которая подходит под описание какого-либо из ячеек. Если такая выявляется, то она переносится в эту ячейку с обязательным указанием атрибутов информационного блока, из которого была извлечена. Вполне возможно, что в одну ячейку может попасть несколько цитат из разных информационных блоков. Если они не противоречат друг другу – возможно их объединение. Если есть противоречие, то необходима дополнительная проверка для установления истины. По окончании такого исследования получается достаточно лаконичное и четкое описание интересующего вас объекта.
v Причинно-следственный анализ и его методы.
Причинная зависимость это связь явлений, одно из которых порождает другое. Первое явление называется причиной, а второе следствием. Во времени причина всегда предшествует следствию. Но причинно–следственную связь нельзя сводить к простой последовательности событий. Из того, например, что самолет взлетает после того как в него загружают багаж, не следует, что факт появления багажа на борту есть причина полета воздушного судна.
Логические методы причинно – следственного анализа:
Метод исключения
Суть этого метода заключается в том, что, анализируя сложный комплекс причинно–следственных отношений, можно обнаружить непосредственную причину путем исключения всех предполагаемых обстоятельств (реально не влияющих, хотя и присутствующих), способных вызвать сходные события, кроме одного фактора, который после тщательной проверки и принимается за причину изучаемого явления.
Метод сходства
Использование метода сходства обусловлено тем, что интересующие события, причину которых аналитик хочет установить, возникают в самых разных обстоятельствах, но при этом всегда при наличии одного и того же фактора. Сущность этого метода сводится к следующему: если наблюдаемое событие возникает в различных обстоятельствах, но при наличии одного общего фактора, то этот фактор и есть причина происходящего. Используя данный метод, можно изучить разные условия возникновения одного и того же события и вычислить из них один и тот же общий фактор, вызывающий это явление. С определенной долей вероятности можно утверждать, что этот фактор и есть причина, интересующая аналитика.
Метод одного различия
Сей метод сводится к сопоставлению случая, когда интересующее событие наступает, со случаем, когда оно не наступает. В обоих случаях должны быть одни и те же условия, за исключением одного, которое в одном из случаев отсутствует. Иначе говоря – если в одних и тех же обстоятельствах при наличии какого–то фактора событие наступает, а при его отсутствии исследуемое явление не происходит, то этот фактор и есть причина изучаемого явления.
Гипотетический метод
Началом объяснения причины события чаще всего становится гипотеза. Под гипотезой понимается неким образом обоснованное, но нуждающееся в более глубоком доказывании предположение о причине исследуемого аналитиком факта. Гипотеза представляет собой умозаключение, в котором есть неизвестные элементы. Создавая гипотезу, пользуются аналогией, индуктивным, дедуктивным методами. Часто, при выяснении причины исследуемых событий аналитик прибегает к аналогии. Создавая гипотезу аналитик, фактически, пытается объяснить, почему так, а не иначе, вписав в свою гипотезу все собранные факты по делу.
Моделирование
Построение модели некоего объекта или события достаточно трудоемкий процесс, но в конце пути получается отличный инструмент прогнозирования. На самом деле моделированием, как и анализом каждый из нас занимается постоянно. Просто это происходит неосознанно. Что такое моделирование ситуации – это построение некой виртуальной копии объекта изучения с соблюдением определенных нами правил. Эти правила зависят от глубины изучения объекта-оригинала и от желаемой точности в копировании свойств.
Есть три основных метода моделирования:
- экспертные системы;
- статистический метод;
- самообучающиеся алгоритмы.
Экспертные системы просто хранят в себе знания экспертов об определенной области. Эти знания сформулированы в виде правил. Это наиболее простой способ построения моделей – простой для понимания и для реализации. Его простота позволяет использовать практически в любых сферах деятельности человека.
Статистический метод заключается в накоплении статистических данных по исследуемому процессу и описание, на основе этих данных, происходящих изменений. У него есть некоторые ограничения – данный метод требует серьезных познаний в статистике (математике) и пригоден для структурированной информации, например информации выраженной в цифрах.
Самообучающиеся алгоритмы (наиболее известный вариант – нейронные сети) это некое сильно упрощенное подобие организации человеческого мозга. Есть масса мини-объектов, между которыми можно построить неограниченное количество связей. Именно организация этих связей и есть описываемая модель. Работа с подобными системами сводится к тому, что мы вливаем в эту сеть историю изучаемого процесса. Система выбирает закономерности и формирует модель процесса. Постепенно, методом проб и ошибок, эта модель оттачивается и получается необходимый инструмент.
Самообучающиеся алгоритмы – наиболее приемлемый метод для построения моделей на основе неструктурированной информации (текстовой информации). Но данный метод имеет свои особенности и сложности. Перед внесением данных в нейросеть их нужно тщательно обработать, удалив «мусор». Иначе внеся «мусор» на входе – получите «мусор» и на выходе. В первую очередь необходимо выбрать основополагающие свойства оригинала. Те свойства, которые оказывают максимальное воздействие на интересующие нас стороны существования объекта изучения.
Приемы анализа:
1) Построение последовательности событий (Исторический метод).
Данный метод является одним из наиболее простых и позволяет быстро понять, что происходит. С него начинается изучение той или иной области, того или иного объекта. Суть его заключается в следующем – все поступающие данные выстраиваются по времени описываемых событий. После чего определяется что за чем следует, какой факт какое событие предопределяет, что чему сопутствует и т.п. Иначе говоря, восстанавливается хронология событий. Это один из наиболее эффективных и используемых приемов обработки информации.
При построении цепочки событий, особенно если аналогично рассматриваются и параллельные происшествия, становиться многое понятно. Используя данный метод можно выяснить, как развивались события, что зачем следует и что чему предшествует, можно выявить определенные закономерности.
Разновидности данного метода используются для исследования потоков товаров – откуда, куда, через кого и когда проходил товар (или груз, или информация). Результатом такого исследования становится диаграмма событий. Сами события располагаются вдоль выбранной оси (горизонтальной или вертикальной), на которой есть разметка времени. А от предшествующего события к последующему ведет стрелка. С помощью такой визуализации удобно отображать большие объемы информации, выявлять аномалии и отклонения, находить «скопления» событий и т.п.
2) Выявление связей.
Этот метод можно охарактеризовать как определение всего, что так или иначе связано с изучаемым объектом или событием. Такие связи могут быть явными и неявными. К явным относятся прямо установленные. К неявным относятся те связи, которые нельзя доказать фактами, но которые могут существовать. Например, один юридический адрес у нескольких организаций может указывать на то, что они созданы одной юридической конторой, а на основе этого можно предположить и более значимую связь, которая, безусловно, требует дополнительной проверки. Неявные связи не являются фактами, но они указывают на то, в каком направлении нужно вести поиск. А это уже задание оперативникам.
Оптимальным представлением выявленных связей является визуальная форма – диаграмма связей. Объекты, между которыми выявлены связи, обозначаются разными геометрическими фигурами – в зависимости от принятых условностей. Например, человек – круг, а организация – прямоугольник. А связи – линиями. Если исследовать таким образом телефонные контакты или почту, можно учитывать направление связи используя для обозначения связи стрелки, а не линии. В центре такой диаграммы удобнее всего располагать объект с наибольшим количеством связей с другими объектами.
3) Выявление силы связей.
Данный прием хорошо иллюстрируется анализом телефонных контактов. Все контакты (связи) между объектами сортируются в зависимости от того, между кем они возникают. Затем оцениваются по частоте возникновения либо по продолжительности действия. На основе данных о силе связей строятся гипотезы и вырабатываются рекомендации для дальнейшего поиска.
Таким способом хорошо анализировать детализацию телефонных контактов. При наличии такой детализации за определенный период можно определить с каким абонентом у исследуемого наиболее тесные контакты, с кем контакты в нерабочее время, с кем в рабочее. Если такую статистику сравнить со статистикой одного из контактеров исследуемого лица, то можно выявить еще и их общие контакты, и их плотность.
Необходимо выделить несколько типов силы связей:
- частота;
- плотность;
- стабильность.
В примере с телефонными переговорами частота обозначает сколько раз осуществлялся контакт. Плотность указывает продолжительность разговоров. А стабильность описывает регулярность таких контактов – раз в день, пять раз в день или раз в неделю.
Если данные о силе связей нанести на диаграмму связей, получится еще более информативный документ. Силу связи можно обозначать толщиной и / или формой линии, или указанием силы связи цифрами на самой линии или рядом с ней. Цифра может обозначать выбранный вами признак: количество контактов, длительность контактов, или их плотность и т.п.
4) Резюмирование текста.
На предыдущих этапах вы попробовали реферирование, а теперь используем близкий по приемам метод – резюмирование. Технология следующая. Исследуемый текст читается три раза.
При первом прочтении выделяются слова, несущие основную смысловую нагрузку – ключевые слова – они выделяются. Это могут быть имена, названия, даты, профессиональные выражения и т.п.
При втором прочтении внимание концентрируется на ключевых словах, при этом выделяются короткие, не содержащие ничего лишнего словообразования (словосочетания), отражающие основные мысли исследуемого текста и характеризующие ключевые слова – также выделяются.
На третьем прочтении внимание обращается только на выделенные словообразования и на их основе строятся простые, краткие предложения, описывающие смысл сообщения. После чего делается вывод об основном смысле изучаемого текста.
Есть второй способ резюмирования – текст делится на законченные блоки (например, абзац) и содержание этих блоков пересказывается в одном предложении.
Существует и еще один способ – табличный. Он используется, в основном, для приведения к единому виду большого количества сходных по тематике информационных блоков. Изначально определяются, интересующие исследователя признаки. Затем составляется унифицированная форма объединения информации – обычно таблица (отсюда и название метода). После этого из каждого информационного блока выделяются признаки соответствующие выделенным признакам и заносятся в таблицу. Например, мы хотим таким образом обработать информацию о «заказных» убийствах. Определяем, что существенными для нас являются следующие данные: способ убийства, место убийства, причина убийства. Исходя из этого, обрабатываем имеющуюся информацию – разносим выявленные признаки в соответствующие ячейки таблицы. Далее к обработанной таким образом информацией можно применить и статистические методы, но изначально проводится подготовка текста – резюмирование. Фактически это структуризация информации.
В процессе обработки текста (в том числе и резюмировании) не забывайте о своей конечной цели. Старайтесь понять как (каким образом) данный информационный фрагмент может вам помочь, в чем он будет полезен, как его можно и нужно использовать. В конечном счете потребителю вашего труда (если это не вы сами) нужно с минимальными затратами времени получить ответ на свой вопрос, а не массу сопутствующего материала.
Потребителю информации в ряде случаев и подробности событий не нужны – ему нужна информация для решения его насущных проблем и ничего лишнего. Все максимально приземлено и заточено под интересы заказчика. Такая обработка информации это попытка ограниченными ресурсами добиться максимального результата.
Анализ сценариев.
В данном случае, основываясь на существующих положении дел и тенденциях, аналитик пытается нарисовать картину развития ситуации. Наиболее распространен способ, при котором рассматривается три варианта развития событий: пессимистический, реалистический и оптимистический сценарии.
Перед тем как начать описывать сценарии нужно тщательно изучить силы влияющие на исследуемый объект (или ситуацию):
- что за силы могут влиять, посредством чего происходит влияние,
- с какой активностью происходит влияние,
- устанавливаются причинно-следственные связи самой процедуры влияния.
А в процессе описания сценариев полезно иметь перед глазами список этих сил. Обычно написание сценариев начинается с вопроса типа «если объект Х почувствует, что его компания теряет рынок, что он предпримет?» Не видите никакого сходства с самонастраивающимися алгоритмами? Анализ сценариев схож по своей методе с нейронными сетями, но ограничен всего тремя вариантами (максимум, минимум и оптимум). Но здесь также необходимо определить факторы, влияющие на объект изучения, сила, с которой это влияние происходит и что обычно происходит при таком влиянии. И только после этого можно начинать предполагать, а что же будет в дальнейшем.
... решений или являются вводными для процесса стратегического планирования. Конкурентная разведка основана на факторе времени и привязана к нему. Указанные обстоятельства, а также все возрастающая потребность бизнеса России в практическом использовании конкурентной разведки, подвигли группу российских специалистов в области конкурентной разведки на создание и регистрацию в г. Москве 29 августа ...
... позволяет развивать корпоративные знания и опыт предприятия для инновационных изменений, сокращения времени для накопления практик и интеллектуальных активов и четкого позиционирования конкурентных преимуществ предприятия. Использование решения позволяет осуществлять единый сквозной поиск по всем источникам неструктурированных информационных ресурсов, включая Lotus Notes, Microsoft Exchange ...
... чем принято окончательное решение, обдумываются и тщательно взвешиваются 10-15 различных вариантов. Решение в значительной мере основывается на результатах конкурентной разведки. В компании создана специальная группа, которая объединяет и дает возможность тесно взаимодействовать профессионалам КР в рамках всей компании. Они регулярно встречаются и совместно с представителями других структур « ...
... выплатой компенсируются затраты на обучение лиц, не имевших работы в течение двух лет, при условии их последующего трудоустройства на данном предприятии. В послевоенный период в странах Европейского Союза получило развитие программирование и прогнозирование социально-экономической сферы. Принимаемые программы сходны между собой и по методике составления, потому что орудием обеспечения их ...
0 комментариев