1.3 Гипертекстовая технология WWW, URL, HTML
World Wide Web переводится на русский язык как “Всемирная Паутина”. И, в
сущности, это действительно так. WWW является однимиз самых совершенных
инструментов для работы в глобальной мировой сети Internet. Эта служба появилась
сравнительно недавно и все еще продолжает бурноразвиваться.
Наибольшее количество разработок имеют отношение к родине WWW - CERN, European
ParticlePhysics Laboratory; но было бы ошибкой считать, что Web является
инструментом, разработанным физиками и для физиков. Плодотворность и
привлекательность идей,положенных в основу проекта, превратили WWW в систему
мирового масштаба, предоставляющую информацию едва ли не во всех областях
человеческойдеятельности и охватывающую примерно 30 млн. пользователей в 83
странах мира.
Главное отличие WWW от остальных инструментов для работы с Internet
заключается в том, что WWWпозволяет работать практически со всеми доступными
сейчас на компьютере видами документов: это могут быть текстовые файлы,
иллюстрации, звуковые и видеоролики, и т.д.
Что такое WWW? Это попытка организовать всю информацию в Internet, плюс любую
локальнуюинформацию по вашему выбору, как набор гипертекстовых документов. Вы
перемещаетесь по сети, переходя от одного документа к другому по ссылкам. Всеэти
документы написаны на специально разработанном для этого языке, который
называется HyperText Markup Language (HTML). Он чем-то напоминает
язык,использующийся для написания текстовых документов, только HTML проще.
Причем, можно использовать не только информацию, предоставляемую Internet, но
исоздавать собственные документы. В последнем случае существует ряд практических
рекомендаций к их написанию.
Вся польза гипертекста состоит в создании гипертекстовых документов,если вас
заинтересовалкакой либо пункт в таком документе, то вам достаточно ткнуть туда
курсором для получения нужной информации. Также в одном документе возможно
делать ссылки надругие, написанные другими авторами или даже расположенные на
другом сервере. В то время как вам это представляется как одно целое.
Гипермедиа это надмножество гипертекста. В гипермедиа производятся операции не
только надтекстом но и над звуком, изображениями, анимацией.
Существуют WWW-серверы для Unix, Macintosh, MS Windows и VMS, большинство из
нихраспространяются свободно. Установив WWW-сервер, вы можете решить две задачи:
1. Предоставить информацию внешним потребителям - сведения о вашей фирме,
каталоги продуктов и услуг, техническую или научную информацию.
2. Предоставить своим сотрудникам удобный доступ к внутренним
информационным ресурсам организации.Это могут быть последние
распоряжения руководства, внутренний телефонный справочник, ответына
часто задаваемые вопросы дляпользователей прикладных систем , техническая
документация и все, что подскажет фантазия администратора и
пользователей.Информация, которую вы хотите предоставить пользователям WWW,
оформляется в виде файлов наязыке HTML. HTML - простой язык
разметки, который позволяет помечать фрагменты текста изадавать
ссылки на другие документы, выделять заголовки нескольких
уровней, разбивать текст на абзацы, центрироватьих и т. п.,
превращая простой текст в отформатированный гипермедийный документ.
Достаточно легко создать html-файлвручную, однако, имеются
специализированные редакторы и преобразователи файлов из других
форматов.
Для просмотра документов используются специальные просмоторщики, такие как
Mosaic, Netscape,Internet Explorer, lynx, www и другие. Mosaic и Netscape удобно
использовать на графических терминалах. Для работы на символьных терминалах
можнопорекомендовать lynx.
Архитектура WWW-технологии
От описания основных компонентов перейдем к архитектуре взаимодействия
программного обеспечения в системе WorldWide Web. WWW построена по хорошо
известной схеме “клиент-сервер”. На схеме 1.2 показано, какразделены функции в
этой схеме. Программа-клиент выполняет функции интерфейса пользователя и
обеспечивает доступ практически ко всем информационным ресурсам Internet. В
этом смысле она выходитза обычные рамки работы клиента только с сервером
определенного протокола, как это происходит в telnet, например. Отчасти,
довольно широкораспространенное мнение, что Mosaic или Netscape, которые
являются WWW-клиентами, это просто графический интерфейс в Internet, является
отчасти верным.Однако, как уже было отмечено, базовые компоненты WWW-технологии
(HTML и URL) играют при доступе к другим ресурсам Mosaic не последнюю роль, и
поэтому мультипротокольные клиенты должны бытьотнесены именно к World Wide Web,
а не к другим информационным технологиям Internet. Фактически, клиент—это
интерпретатор HTML. И как типичныйинтерпретатор, клиент в зависимости от команд
(разметки) выполняет различные функции.
Схема 1.2
Схема 1.2 Структура ”клиент - сервер” .
В круг этих функций входит не только размещение текста на экране, но обмен
информацией ссервером по мере анализа полученного HTML-текста, что наиболее
наглядно происходит при отображении встроенных в текст графических образов.
Прианализе URL-спецификации или по командам сервера клиент запускает
дополнительные внешние программы для работы с документами в форматах,
отличныхот HTML, например GIF, JPEG, MPEG, Postscript и т. п. Вообще говоря для
запуска клиентом программ независимо от типа документа была
разработанапрограмма Luncher, но в последнее время гораздо большее
распространение получил механизм согласования запускаемых программ через
MIME-типы. Другуючасть программного комплекса WWW составляет сервер протокола
HTTP, базы данных документов в формате HTML,управляемые сервером, и программное
обеспечение, разработанное в стандарте спецификации CGI. До самого последнего
времени (до образованияNetscape) реально использовалось два HTTP-сервера:
сервер CERN и сервер NCSA. Но в настоящее время число базовых серверов
расширилось. Появился оченьнеплохой сервер для MS-Windows и Apachie-сервер для
Unix-платформ. Существуют и другие, но два последних можно выделить из
соображений доступностииспользования. Сервер для Windows - это shareware, но
без встроенного самоликвидатора, как в Netscape. Учитывая распространенность
персоналок внашей стране, такое программное обеспечение дает возможность
попробовать, что такое WWW. Второй сервер -это ответ на угрозу коммерциализации.
Netscape уже не распространяет свой сервер Netsite свободно и прошел слух,
чтоNCSA-сервер также будет распространяться на коммерческой основе. В
результате был разработан Apachie, который по словам его авторов будетfreeware,
и реализует новые дополнения к протоколу HTTP, связанные с защитой от
несанкционированного доступа, которые предложены группой поразработке этого
протокола и реализуются практически во всех коммерческих серверах.
База данных HTML-документов—это часть файловой системы, которая содержит
текстовые файлы в формате HTML и связанные сними графику и другие ресурсы.
Особое внимание хотелось бы обратить на документы, содержащие элементы экранных
форм. Эти документы реальнообеспечивают доступ к внешнему программному
обеспечению.
Прикладное программное обеспечение, работающее с сервером, можно разделить на
программы-шлюзы и прочие. Шлюзы—этопрограммы, обеспечивающие взаимодействие
сервера с серверами других протоколов, например ftp, илис распределенными на
сети серверами Oracle. Прочие программы—это программы, принимающие данные от
сервера и выполняющие какие-либо действия: получение текущей даты,
реализациюграфических ссылок, доступ к локальным базам данных или просто
расчеты.
Завершая обсуждение архитектуры World Wide Web хотелось бы еще раз
подчеркнуть, что ее компоненты существуютпрактически для всех типов
компьютерных платформ и свободно доступны в сети. Любой, кто имеет доступ в
Internet, может создать свой WWW-сервер,или, по крайней мере, посмотреть
информацию с других серверов.
Основные компоненты технологии World Wide Web
К 1989 году гипертекст представлял новую, многообещающую технологию, которая
имела относительно большое числореализаций с одной стороны, а с другой стороны
делались попытки построить формальные модели гипертекстовых систем, которые
носили скорее описательныйхарактер и были навеяны успехом реляционного подхода
описания данных. Идея Т. Бернерс-Ли заключаласьвтом, чтобы применить
гипертекстовую модель к информационным ресурсам, распределенным в сети, и
сделать это максимально простым способом.Он заложил три краеугольных камня
системы из четырех существующих ныне, разработав:
язык гипертекстовой разметки документов HTML (HyperText Markup Lan-guage);
• универсальный способ адресации ресурсов в сети URL (Universal Resource
Locator);
• протокол обмена гипертекстовой информацией HTTP (HyperText Transfer
Protocol).
Позже команда NCSA добавила к этим трем компонентам четвертый:
• универсальный интерфейс шлюзов CGI (Common Gateway Interface).
Идея HTML—пример чрезвычайно удачного решения проблемы построения
гипертекстовой системы припомощи специального средства управления отображением.
На разработку языка гипертекстовой разметкисущественное влияние оказали два
фактора: исследования в области интерфейсов гипертекстовых систем и желание
обеспечить простой и быстрый способ создания гипертекстовой базы
данных,распределенной на сети.
В 1989 году активно обсуждалась проблема интерфейса гипертекстовых систем,
т.е. способов отображения гипертекстовойинформации и навигации в гипертекстовой
сети. Значение гипертекстовой технологии сравнивали со значением
книгопечатания. Утверждалось, чтолист бумаги и компьютерные средства
отображения/воспроизведения серьезно отличаются друг от друга, и поэтому форма
представления информации тожедолжна отличаться. Наиболее эффективной формой
организации гипертекста были признаны контекстные гипертекстовые ссылки, а
кроме того былопризнано деление на ссылки, ассоциированные со всем документом в
целом и отдельными его частями.
Самым простым способом создания любого документа является его набивка в
текстовом редакторе. Опыт создания хорошоразмеченных для последующего
отображения документов в CERN_е был - трудно найти физика, которыйне
пользовался бы системой TeX или LaTeX. Кроме того к тому времени существовал
стандарт языка разметки—Standard Generalised Markup Language (SGML).
Следует также принять во внимание, что согласно своим предложениям Бернерс-Ли
предполагал объединить в единую систему имеющиесяинформационные ресурсы CERN, и
первыми демонстрационными системами должны были стать системы для NeXT и
VAX/VMS.
Обычно гипертекстовые системы имеют специальные программные средства
построения гипертекстовых связей. Самигипертекстовые ссылки хранятся в
специальных форматах или даже составляют специальные файлы. Такойподход хорош
для локальной системы, но не для распределенной на множестве различных
компьютерных платформ. В HTML гипертекстовые ссылки встроеныв тело документа и
хранятся как его часть. Часто в системах применяют специальные форматы хранения
данных для повышения эффективности доступа.В WWW документы—это обычные ASCII-
файлы, которые можно подготовить в любом текстовом редакторе. Таким образом,
проблема созданиягипертекстовой базы данных была решена чрезвычайно просто.
В качестве базы для разработки языка гипертекстовой разметки был выбран SGML
(Standard Generalised Markup Language).Следуя академическим традициям,
Бернерс-Ли описал HTML в терминах SGML (как описывают язык программирования в
терминах формыБекуса-Наура). Естественно, что в HTML были реализованы все
разметки, связанные с выделением параграфов,шрифтов, стилей и т. п., т.к.
реализация для NeXT подразумевала графический интерфейс. Важным компонентом
языка стало описание встроенных и ассоциированных гипертекстовых
ссылок,встроенной графики и обеспечение возможности поиска по ключевым словам.
С момента разработки первой версии языка (HTML 1.0) прошло уже пять лет. За
это время произошло довольно серьезноеразвитие языка. Почти вдвое увеличилось
число элементов разметки, оформление документов все больше приближается к
оформлению качественныхпечатных изданий, развиваются средства описания не
текстовых информационных ресурсов и способы взаимодействия с прикладным
программнымобеспечением. Совершенствуется механизм разработки типовых стилей.
Фактически, в настоящее время HTML развивается в сторону создания
стандартногоязыка разработки интерфейсов как локальных, так и распределенных
систем.
Вторым краеугольным камнем WWW стала универсальная форма адресации
информационных ресурсов. Universal ResourceIdentification (URI) представляет
собой довольно стройную систему, учитывающую опыт адресации и идентификации
e-mail, Gopher, WAIS, telnet,ftp и т. п. Но реально из всего, что описано в
URI, для организации баз данных в WWW требуется только Universal Resource
Locator (URL). Безналичия этой спецификации вся мощь HTML оказалась бы
бесполезной. URL используется в гипертекстовых ссылках и обеспечивает доступ к
распределеннымресурсам сети. В URL можно адресовать как другие гипертекстовые
документы формата HTML, так и ресурсыe-mail, telnet, ftp, Gopher, WAIS,
например. Различные интерфейсные программы по разному осуществляют доступ к
этим ресурсам. Одни, как напримерNetscape, сами способны поддерживать
взаимодействие по протоколам, отличным от протокола HTTP, базового для WWW,
другие, как например Chimera,вызывают для этой цели внешние программы. Однако,
даже в первом случае, базовой формой представления отображаемой информации
является HTML, ассылки на другие ресурсы имеют форму URL. Следует отметить, что
программы обработки электронной почты в формате MIME также имеют возможность
отображать документы, представленные в формате HTML. Дляэтой цели в MIME
зарезервирован тип “text/html”.
Третьим в нашем списке стоит протокол обмена данными в World Wide Web
-HyperText TransferProtocol. Данный протокол предназначен для обмена
гипертекстовыми документами и учитывает специфику такого обмена. Так в
процессе взаимодействия, клиент может получить новый адрес ресурса на сети
(relocation), запросить встроенную графику, принять и передать параметры и
т. п. Управление в HTTP реализовано в виде ASCII-команд. Реально
разработчик гипертекстовой базы данных сталкивается с элементами протокола
только при использовании внешних расчетных программ или при доступе к
внешним относительно WWW информационным ресурсам, например базам данных.
Последняя составляющая технологии WWW - это уже плод работы группы NCSA --
спецификация Common Gateway Interface. CGIбыла специально разработана для
расширения возможностей WWW за счет подключения всевозможноговнешнего
программного обеспечения. Такой подход логично продолжал принцип публичности и
простоты разработки и наращивания возможностей WWW.Если команда CERN предложила
простой и быстрый способ разработки баз данных, то NCSA развила этот принцип на
разработку программных средств. Надозаметить, что в общедоступной библиотеке
CERN были модули, позволяющие программистам подключать свои программы к серверу
HTTP, ноэто требовало использования этой библиотеки. Предложенный и описанный в
CGI способ подключения не требовал дополнительных библиотек и
буквальноошеломлял своей простотой. Сервер взаимодействовал с программами через
стандартные потоки ввода/вывода, что упрощает программированиедо предела. При
реализации CGI чрезвычайно важное место заняли методы доступа, описанные в
HTTP. Ихотя реально используются только два из них (GET и POST), опыт развития
HTML показывает, что сообщество WWW ждет развития и CGI по мереусложнения
задач, в которых будет использоваться WWW-технология.
ГЛАВА 2
Защита информации в глобальной сети Internet
... информации и дезорганизации работы абонентских пунктов; - организационно-технические мероприятия, направленные на обеспечение сохранности конфиденциальных данных. 2. Основные методы и средства защиты информации в сетях Разобрать подробно все методы и средства защиты информации в рамках ВКР просто невозможно. Охарактеризую только некоторые из них. 2.1 Физическая защита информации К ...
... и локальных сетей и принесенному ими ущербу Несмотря на кажущийся правовой хаос в рассматриваемой области, любая деятельность по разработке, продаже и использованию средств защиты информации регулируется множеством законодательных и нормативных документов, а все используемые системы подлежат обязательной сертификации Государственной Технической Комиссией при президенте России. 2.3 ...
... действий могут носить плачевный характер (см. введение) и, поэтому в следующем разделе речь идет о классификации информационных угроз и экономической оценки ущерба от их реализации. Защита информации – это защищенность информационных систем, информационных ресурсов хозяйствующего субъекта, а также объектов его интеллектуальной собственности от внешних и внутренних угроз, затрудняющих эффективное ...
... Pro 2008 по результатам тестирования брандмауэров в лаборатории Matousec показал наилучшие результаты даже при настройках по умолчанию. Глава 3. Разработка рекомендаций по составу программного комплекса для защиты информации в ЛВС Кунгурского сельскохозяйственного колледжа Прежде, чем рекомендовать состав программного комплекса по защите информации в ЛВС КСХК. Необходимо реализовать политику ...
0 комментариев