Информационные процессы, кодирование и сбор информации
План
1. Информационные процессы
2. Кодирование информации
3. Сбор информации
Вывод
1. Информационные процессы
Если обратиться в далекое прошлое, то жалобы на обилие информации обнаруживаются тысячелетия назад.
Пример.
На глиняной дощечке (шумерское письмо IV тысячелетия до нашей эры) начертано: «Настали тяжелые времена. Дети перестали слушаться родителей, и каждый норовит написать книгу».
Особенно модным стало жаловаться на непереносимость информационного бремени с XVII века. В XX веке заговорили ни более ни менее, как об информационной катастрофе. Информационный кризис — это возрастающее противоречие между объемом накапливаемой в обществе информации и ограниченными возможностями ее переработки отдельно взятой личностью. По оценкам специалистов в настоящее время количество информации, циркулирующей в обществе, удваивается примерно каждые 8-12 лет. Появилась уверенность в том, что для того, чтобы справиться с такой лавиной информации, недостаточно возможностей человеческого организма. Для этого нужны специальные средства и методы обработки информации, ее хранения и использования. Сформировались новые научные дисциплины — информатика, кибернетика, бионика, робототехника и др., имеющие своей целью изучение закономерностей информационных процессов, то есть процессов, цель которых — получить, передать, сохранить, обработать или использовать информацию.
В наиболее общем виде информационный процесс (ИП) определяется как совокупность последовательных действий (операций), производимых над информацией (в виде данных, сведений, фактов, идей, гипотез, теорий и пр.) для получения какого-либо результата (достижения цели).
Информация не существует сама по себе, она проявляется в информационных процессах.
Информационные процессы всегда протекают в каких-либо системах.
Информационные процессы могут быть целенаправленными или стихийными, организованными или хаотичными, детерминированными или вероятностными, но какую бы мы ни рассматривали систему, в ней всегда присутствуют информационные процессы, и какой бы информационный процесс мы ни рассматривали, он всегда реализуется в рамках какой-либо системы — биологической, социальной, технической, социотехнической.
Пример.
«Танец» пчел — процесс передачи информации от пчел-разведчиков пчелам-сборщикам меда. Обучение в школе — это процесс передачи информации, накопленной предыдущими поколениями людей, подрастающему поколению.
Электронная почта (как совокупность соответствующих аппаратных средств и программ) предназначена для обеспечения передачи информации между компьютерами.
В зависимости от того, какого рода информация является предметом информационного процесса и кто является его субъектом (техническое устройство, человек, коллектив, общество в целом), можно говорить о глобальных информационных процессах, или макропроцесссах, и локальных информационных процессах, или микропроцессах.
Схема взаимосвязи информационных процессов показана на рис. 1., где линиями без стрелок показаны включения одних процессов в другие (нижних на схеме в верхние), а линиями со стрелками — последовательность выполнения процессов.
Рис.1. Схема взаимосвязи информационных процессов
Пример.
Процесс познания, распространение информации посредством СМИ, информационные войны, организация архивного хранения информации — глобальные ИП. Сравнение данных, двоичное кодирование текста, запись порции информации на носитель — локальные ИП.
Наиболее общими информационными процессами являются три процесса: сбор, преобразование, использование информации.
Каждый из этих процессов распадается, в свою очередь, на ряд процессов, причем некоторые из последних могут входить в каждый из выделенных обобщенных процессов.
Так, сбор информации состоит из процессов поиска и отбора. В свою очередь поиск информации осуществляется в результате выполнения процедур целеполагания и использования конкретных методов поиска.
Методы поиска бывают «ручные» или автоматизированные. Они включают в себя такие процедуры, как формирование поискового образа (в явном или неявном виде), просмотр поступающей информации с целью сравнения её с поисковым образом.
Отбор информации производится на основе ее анализа и оценки ее свойств (объективность, достоверность, актуальность и пр.) в соответствии с выбранным критерием оценки. Отобранная информация сохраняется.
Хранение информации — это распространение её во времени. Хранение информации невозможно без выполнения процессов кодирования, формализации, структурирования, размещения, относящихся к общему процессу преобразования информации.
В то же время кодирование, формализацию, структурирование можно вполне обоснованно отнести к процессам обработки информации. Наряду с вышеперечисленными к процессам обработки информации относятся также информационное моделирование, вычисления по формулам (численные расчеты), обобщение, систематизация, классификация, кластеризация, схематизация и т. п.
Обработка информации составляет основу процесса преобразования информации.
Информация может быть передана (распространена в пространстве) для её последующего использования, обработки или хранения. Процесс передачи информации включает в себя процессы кодирования, восприятия, расшифровки и пр.
Важнейшим процессом использования информации субъектом является процесс подготовки и принятия решений. Наряду с этим часто использование информации сводится к процессам формирования документированной информации (документов в том смысле, в каком этот термин используется в делопроизводстве) с целью подготовки информационного или управляющего воздействия.
Пример.
Бухгалтер на основании имеющихся первичных документов (накладных, нарядов, табелей учета времени, инструкций по налогообложению и пр.) составляет сводную ведомость.
Сообщение о крупной аварии может стать основой для подготовки пакета документов о введении чрезвычайного положения.
В реальной практике широко используются процедуры, входящие в процесс защиты информации. Защита информации — важный компонент процессов хранения, обработки, передачи информации в системах любого типа, особенно в социальных и технических системах. К ней относятся разработка кода (шифра), кодирование (шифрование), сравнение, анализ, паролирование и т. п.
После того, как процесс использования информации завершен, например, решение принято и субъект приступил к его реализации, как правило, возникает новая задача и необходимы новая информация либо уточнение уже имеющейся. Это приводит к тому, что субъект вновь обращается к процедуре сбора информации и пр. Поэтому, говоря об информационных процессах, следует подчеркивать не только их взаимосвязь, но и цикличность. Отсюда ясно происхождение понятий «информационный цикл», «жизненный цикл информации».
Человек всегда стремится автоматизировать выполнение рутинных операций и операций, требующих постоянного внимания и точности. То же справедливо и по отношению к информационным процессам.
Универсальным устройством для автоматизированного выполнения информационных процессов в настоящее время является компьютер. Немалую роль в этом играют вычислительные системы и сети.
2. Кодирование информации
Информационный процесс кодирования информации встречается в нашей жизни на каждом шагу. Любое общение между людьми происходит именно благодаря тому, что они научились выражать образы, чувства и эмоции с помощью специально предназначенных для этого знаков и сигналов — звуков, жестов, букв и пр.
Одну и ту же информацию мы можем выразить разными способами.
Пример. Каким образом можно сообщить об опасности?
1. Если на вас напали, вы можете просто крикнуть «Караул!» (англичанин крикнет «Help me!»).
2. Если имеется прибор под высоким напряжением, то требуется оставить предупреждающий знак (рисунок черепа или молнии).
3. На оживленном перекрестке регулировщик помогает избежать аварии с помощью жестов.
4. Если ваш корабль тонет, то вы передадите сигнал «SOS» (... - - - ...); для этих целей на флоте могут использовать также семафорную и флажковую сигнализацию.
В каждом из этих примеров необходимо знать правило, по которому отображается информация, правило кодирования. Такое правило назовем кодом.
Код (фр. code — кодекс, свод законов). Начиная с середины XIX века это слово, помимо основного значения, означало книгу, в которой словам естественного языка сопоставлены группы цифр или букв.
Чаще всего кодирование — это процесс представления информации в виде знаков (поскольку дискретные сигналы воспринимать и обрабатывать проще, чем непрерывные).
Знак вместе с его смыслом называют символом.
Используемый для кодирования конечный набор отличных друг от друга знаков называется алфавитом.
Существует множество алфавитов.
• алфавит кириллических букв {А, Б, В, Г, Д, Е, ...};
• алфавит латинских букв {А, В, С, D, E, F, ...};
• алфавит десятичных цифр {0, 1, 2, 3, 4, 5, 6, 7, 8, 9};
•алфавит знаков зодиака {, , , , , , , , , , , }
• набор знаков азбуки Брайля для слепых;
• набор китайских идеограмм;
• математическая символика и др.;
• набор знаков генетического кода {А, Ц, Г, Т}. Важнейшие технические коды для кодирования текстов,
записанных на естественных языках, возникли с появлением электрического телеграфа, например:
• азбука Морзе;
• набор знаков второго международного телеграфного кода (телекс).
При кодировании информации для технических устройств особенно важное значение имеют наборы, состоящие всего из двух знаков: {+, -}; {•, -}; {0, 1}; {да, нет}.
Алфавит, состоящий из двух знаков, называют двоичным, а каждый знак из этого алфавита — двоичным знаком.
Кодирование используется для представления информации в виде, удобном для хранения и передачи. Рассмотрим простейшие задачи кодирования и декодирования.
Пример. Попробуем закодировать числа от 0 до 100, не используя арабских или римских цифр.
Прежде всего необходимо придумать алфавит или выбрать какой-либо из известных.
Можно ли использовать в качестве «букв» алфавита знаки или гласные буквы русского алфавита?
Да, можно выбрать любой набор отличающихся друг от друга знаков.
Каждому числу, которое нужно закодировать, поставим в соответствие одну «букву» выбранного нами алфавита. Например:
Во всех трех случаях из приведённого примера мы не решили поставленной задачи. Мы не смогли закодировать числа от 0 до 100, используя предложенные алфавиты. Получается, что наш алфавит обязательно должен состоять из 101 знака? Но с помощью всего десяти арабских цифр вы можете записать любое число. А римских цифр для кодирования первых 101 числа требуется всего пять: I, V, X, L, С.
Нужен другой подход, другое правило.
Покажем, что используя всего три символа, например , можно закодировать (зашифровать, представить) любое число. Для этого каждое число будем представлять не одним, а несколькими символами из нашего алфавита.
В нашем правиле кодирования появляется понятие «длина кода».
Длиной кода назовем количество знаков, которое используется для представления кодируемого числа (или слова).
То есть термин «код» используется в двух смыслах — как правило кодирования и как набор знаков для кодирования некоторого символа.
Количество знаков в алфавите кодирования и длина кода — совершенно разные вещи. Например, в русском алфавите 33 буквы, а слова могут быть длиной в 1, 2, 3, ... буквы.
Посмотрим, сколько чисел мы можем закодировать, если длина кода составляет не более 2 знаков.
Воспользуемся правилом, схематично представленным на рис. 2.
Рис. 2. Схематичное представление правила кодирования
Если посмотреть на схему, то видно, что на первое место в каждом коде ставится код предыдущего уровня, а к нему дописываются по одному все знаки алфавита в заданном алфавитном порядке. Такое правило кодирования позволяет перебрать все возможные коды и никогда не повториться.
Из таблицы (справа от рис. 2) видно, что при длине кода не более 2 знаков всего можно закодировать 12 (3 + 9) разных чисел. Чтобы закодировать числа 12, 13, ..., следует увеличить длину кода.
Пример.
Рассмотрим задачу, обратную к задаче кодирования из предыдущего примера. Есть закодированная информация:. Коды вам известны. Длина кода — не более 2 знаков. Определите исходное число. Так как длина кода может быть 1 или 2, то
• могли быть закодированы три числа — 1, 2, 0;
• могли быть закодированы два числа — 1, 9;
• могли быть закодированы два числа — 8, 0.
Все три решения справедливы. Как вы думаете, почему? Есть ли способ, который приведет нас к однозначному решению поставленной задачи?
Коды переменной (непостоянной) длины в технике встречаются довольно редко. Исключением является лишь код Морзе.
Пример. Взгляните на международную азбуку Морзе:
Для отправителя приведенная таблица выглядит вполне логично, ибо буквы в ней расположены в алфавитном порядке. Но для человека, получающего сообщения, она неудобна.
В каком же порядке следует расположить знак азбуки Морзе, чтобы получив сигнал, мы могли, не теряя времени, определить, какой букве он соответствует. Представим азбуку Морзе в виде дерева:
При получении сигнала — это либо точка, либо тире — записываем букву и спускаемся по дереву: если точка — влево от текущей вершины, если тире — вправо, если пауза — записываем букву текущей вершины, если длинная пауза — записываем букву и отмечаем конец слова.
По общепринятому правилу радистов продолжительность передачи точки равна продолжительности паузы, продолжительность передачи тире равна продолжительности передачи трех точек, продолжительность передачи пропуска (между буквами) равна продолжительности трех пауз.
Азбука Морзе — это пример троичного кода с набором знаков «точка», «тире», «пауза». Паузу в качестве разделителя между буквами и словами необходимо использовать, так как длина кода непостоянна.
В кодах с постоянной длиной закодированные символы могут следовать друг за другом непосредственно, без всяких разделителей. Местоположение этих символов устанавливается с помощью отсчета. И таким образом сообщение может быть раскодировано однозначно.
Наиболее простым для кодирования является двоичный алфавит. Чем меньше знаков в алфавите, тем проще должна быть устроена «машина» для распознавания (дешифровки) информационного сообщения. Однако чем меньше знаков в алфавите, тем большее их количество (большая длина кода) требуется для кодирования информации.
Вернемся к примеру с кодированием чисел. Будем использовать для представления (кодирования) чисел от 0 до 100 алфавит и код постоянной длины. Какова должна быть длина кода?
В случае, когда длина кода равна п, с помощью алфавита, состоящего из 3 знаков, можно закодировать 3n различных состояний (чисел, букв, комбинаций). Приведем одно из возможных объяснений. В каждой из п позиций может стоять один из 3-х знаков алфавита. Для первой позиции существует 3 возможности. Для каждой из этих возможностей рассмотрим 3 возможности для второй позиции — всего будем иметь 3*3 = 9 возможностей. Рассуждая далее аналогично для остальных позиций, получим возможностей (комбинаций, состояний) расположения 3-х знаков в п позициях. Знаками двоичного алфавита можно закодировать 2n различных состояний; если имеется алфавит, состоящий из k знаков, то можно закодировать knразличных состояний.
Итак, если алфавит состоит из k знаков и используется код с постоянной длиной п, то можно закодировать различных состояний.
Пример.
Определим, какой длины должен быть код, чтобы, используя разные алфавиты, закодировать 10, 33, 100, 200, 1000 различных символов.
Проанализируйте таблицу:
Итак, для кодирования М различных символов кодом постоянной длины с помощью алфавита из k знаков, требуется длина кода (с учетом того, что длина кода — это целое число), равная
В вычислительной технике для кодирования информации используется двоичный алфавит {0,1}. Это позволяет использовать достаточно простые устройства для представления и автоматического распознавания (дешифровки, декодирования) программ и данных. Конструкция декодирующего устройства максимально упрощается, ведь оно должно уметь различать всего два состояния (например, 1 — есть ток в цепи, 0 — тока в цепи нет). По этой причине двоичная система и нашла такое широкое применение.
В вычислительной технике в настоящее время широко используется двоичное кодирование с алфавитом {0,1}. Наиболее распространенными кодами являются ASCII (American standard code for information interchange — американский стандартный код для обмена информацией), ДКОИ-8, Win1251.
Передача сообщений всегда осуществляется во времени. Процесс кодирования также требует определенного количества времени, которым зачастую нельзя пренебрегать. При кодировании могут ставиться определенные цели и применяться различные методы. Наиболее распространенные цели кодирования:
• экономность (уменьшение избыточности сообщения, повышение скорости передачи или обработки);
• надежность (защита от случайных искажений);
• сохранность (защита от нежелательного доступа к информации);
• удобство физической реализации (двоичное кодирование информации в ЭВМ);
• удобство восприятия (схемы, таблицы).
Одно и то же сообщение можно закодировать разными способами, то есть выразить на разных языках. В процессе развития человеческого общества люди выработали большое число языков кодирования.
К ним относятся:
• разговорные языки (русский, английский, хинди и др., всего более 2000);
• язык мимики и жестов;
• язык рисунков и чертежей;
• языки науки (языки математики, химии и т. д.);
• языки искусства (языки музыки, живописи, скульптуры);
• специальные языки (эсперанто, морской семафор, азбука Морзе, азбука Брайля для слепых и т. д.);
Среди специальных языков особо выделим языки программирования.
Программирование — кодирование информации на языке, «понятном» компьютеру.
Задачи, связанные с кодированием и декодированием сообщений, изучаются в теории кодирования — одном из разделов теории информации.
... , связанный с формированием представлений о системно-информационном подходе к анализу окружающего мира, о роли информации в управлении, специфике самоуправляемых систем, общей закономерности информационных процессов в системах различной природы. Основой мировоззрения, главным его компонентом является научная картина мира, рассматриваемая как высший уровень систематизации и обобщения научных ...
... , что можно продолжить работу с информационной системой нажав кнопку продолжить. Рисунок 6 - Главное окно программы. После загрузки базы данных выходит главное окно программы «Информационная система учета заявок ЗАО «ЦРТ Сервис», где диспетчер ведет контроль неисполненных заявок а также прием от клиентов на выполнение сервисного обслуживания или ремонта. Если диспетчеру требуется ...
... для получения необходимых ему отчетов по заработной плате. Задачей решаемой разработанной системой является автоматизация этих процессов. 2.2. Состав функций реализуемых системой · сбор информации о начисленной работникам заработной плате и об удержанном подоходном налоге ото всех структурных подразделений Газпрома; · передача информации от удаленных рабочих станций на сервер через ...
... с отражаемыми объектами. Как отмечено в [А6], предпочтение аспектной концепции должно быть отдано, в частности, потому, что только она позволяет говорить об объективном существовании информации. Информация и сложные системы К определению понятия системы Рассмотренные выше аспекты, стороны понятия информации относятся либо к статической информации, рассматриваемой в определенный момент времени, ...
0 комментариев