1.3 Гипертекстовая технология WWW, URL, HTML

World Wide Web переводится на русский язык как “Всемирная Паутина”. И, в

сущности, это действительно так. WWW является однимиз самых совершенных

инструментов для работы в глобальной мировой сети Internet. Эта служба появилась

сравнительно недавно и все еще продолжает бурноразвиваться.

Наибольшее количество разработок имеют отношение к родине WWW - CERN, European

ParticlePhysics Laboratory; но было бы ошибкой считать, что Web является

инструментом, разработанным физиками и для физиков. Плодотворность и

привлекательность идей,положенных в основу проекта, превратили WWW в систему

мирового масштаба, предоставляющую информацию едва ли не во всех областях

человеческойдеятельности и охватывающую примерно 30 млн. пользователей в 83

странах мира.

Главное отличие WWW от остальных инструментов для работы с Internet

заключается в том, что WWWпозволяет работать практически со всеми доступными

сейчас на компьютере видами документов: это могут быть текстовые файлы,

иллюстрации, звуковые и видеоролики, и т.д.

Что такое WWW? Это попытка организовать всю информацию в Internet, плюс любую

локальнуюинформацию по вашему выбору, как набор гипертекстовых документов. Вы

перемещаетесь по сети, переходя от одного документа к другому по ссылкам. Всеэти

документы написаны на специально разработанном для этого языке, который

называется HyperText Markup Language (HTML). Он чем-то напоминает

язык,использующийся для написания текстовых документов, только HTML проще.

Причем, можно использовать не только информацию, предоставляемую Internet, но

исоздавать собственные документы. В последнем случае существует ряд практических

рекомендаций к их написанию.

Вся польза гипертекста состоит в создании гипертекстовых документов,если вас

заинтересовалкакой либо пункт в таком документе, то вам достаточно ткнуть туда

курсором для получения нужной информации. Также в одном документе возможно

делать ссылки надругие, написанные другими авторами или даже расположенные на

другом сервере. В то время как вам это представляется как одно целое.

Гипермедиа это надмножество гипертекста. В гипермедиа производятся операции не

только надтекстом но и над звуком, изображениями, анимацией.

Существуют WWW-серверы для Unix, Macintosh, MS Windows и VMS, большинство из

нихраспространяются свободно. Установив WWW-сервер, вы можете решить две задачи:

1. Предоставить информацию внешним потребителям - сведения о вашей фирме,

каталоги продуктов и услуг, техническую или научную информацию.

2. Предоставить своим сотрудникам удобный доступ к внутренним

информационным ресурсам организации.Это могут быть последние

распоряжения руководства, внутренний телефонный справочник, ответына

часто задаваемые вопросы дляпользователей прикладных систем , техническая

документация и все, что подскажет фантазия администратора и

пользователей.Информация, которую вы хотите предоставить пользователям WWW,

оформляется в виде файлов наязыке HTML. HTML - простой язык

разметки, который позволяет помечать фрагменты текста изадавать

ссылки на другие документы, выделять заголовки нескольких

уровней, разбивать текст на абзацы, центрироватьих и т. п.,

превращая простой текст в отформатированный гипермедийный документ.

Достаточно легко создать html-файлвручную, однако, имеются

специализированные редакторы и преобразователи файлов из других

форматов.

Для просмотра документов используются специальные просмоторщики, такие как

Mosaic, Netscape,Internet Explorer, lynx, www и другие. Mosaic и Netscape удобно

использовать на графических терминалах. Для работы на символьных терминалах

можнопорекомендовать lynx.

Архитектура WWW-технологии

От описания основных компонентов перейдем к архитектуре взаимодействия

программного обеспечения в системе WorldWide Web. WWW построена по хорошо

известной схеме “клиент-сервер”. На схеме 1.2 показано, какразделены функции в

этой схеме. Программа-клиент выполняет функции интерфейса пользователя и

обеспечивает доступ практически ко всем информационным ресурсам Internet. В

этом смысле она выходитза обычные рамки работы клиента только с сервером

определенного протокола, как это происходит в telnet, например. Отчасти,

довольно широкораспространенное мнение, что Mosaic или Netscape, которые

являются WWW-клиентами, это просто графический интерфейс в Internet, является

отчасти верным.Однако, как уже было отмечено, базовые компоненты WWW-технологии

(HTML и URL) играют при доступе к другим ресурсам Mosaic не последнюю роль, и

поэтому мультипротокольные клиенты должны бытьотнесены именно к World Wide Web,

а не к другим информационным технологиям Internet. Фактически, клиент—это

интерпретатор HTML. И как типичныйинтерпретатор, клиент в зависимости от команд

(разметки) выполняет различные функции.

Схема 1.2

Схема 1.2 Структура ”клиент - сервер” .

В круг этих функций входит не только размещение текста на экране, но обмен

информацией ссервером по мере анализа полученного HTML-текста, что наиболее

наглядно происходит при отображении встроенных в текст графических образов.

Прианализе URL-спецификации или по командам сервера клиент запускает

дополнительные внешние программы для работы с документами в форматах,

отличныхот HTML, например GIF, JPEG, MPEG, Postscript и т. п. Вообще говоря для

запуска клиентом программ независимо от типа документа была

разработанапрограмма Luncher, но в последнее время гораздо большее

распространение получил механизм согласования запускаемых программ через

MIME-типы. Другуючасть программного комплекса WWW составляет сервер протокола

HTTP, базы данных документов в формате HTML,управляемые сервером, и программное

обеспечение, разработанное в стандарте спецификации CGI. До самого последнего

времени (до образованияNetscape) реально использовалось два HTTP-сервера:

сервер CERN и сервер NCSA. Но в настоящее время число базовых серверов

расширилось. Появился оченьнеплохой сервер для MS-Windows и Apachie-сервер для

Unix-платформ. Существуют и другие, но два последних можно выделить из

соображений доступностииспользования. Сервер для Windows - это shareware, но

без встроенного самоликвидатора, как в Netscape. Учитывая распространенность

персоналок внашей стране, такое программное обеспечение дает возможность

попробовать, что такое WWW. Второй сервер -это ответ на угрозу коммерциализации.

Netscape уже не распространяет свой сервер Netsite свободно и прошел слух,

чтоNCSA-сервер также будет распространяться на коммерческой основе. В

результате был разработан Apachie, который по словам его авторов будетfreeware,

и реализует новые дополнения к протоколу HTTP, связанные с защитой от

несанкционированного доступа, которые предложены группой поразработке этого

протокола и реализуются практически во всех коммерческих серверах.

База данных HTML-документов—это часть файловой системы, которая содержит

текстовые файлы в формате HTML и связанные сними графику и другие ресурсы.

Особое внимание хотелось бы обратить на документы, содержащие элементы экранных

форм. Эти документы реальнообеспечивают доступ к внешнему программному

обеспечению.

Прикладное программное обеспечение, работающее с сервером, можно разделить на

программы-шлюзы и прочие. Шлюзы—этопрограммы, обеспечивающие взаимодействие

сервера с серверами других протоколов, например ftp, илис распределенными на

сети серверами Oracle. Прочие программы—это программы, принимающие данные от

сервера и выполняющие какие-либо действия: получение текущей даты,

реализациюграфических ссылок, доступ к локальным базам данных или просто

расчеты.

Завершая обсуждение архитектуры World Wide Web хотелось бы еще раз

подчеркнуть, что ее компоненты существуютпрактически для всех типов

компьютерных платформ и свободно доступны в сети. Любой, кто имеет доступ в

Internet, может создать свой WWW-сервер,или, по крайней мере, посмотреть

информацию с других серверов.

Основные компоненты технологии World Wide Web

К 1989 году гипертекст представлял новую, многообещающую технологию, которая

имела относительно большое числореализаций с одной стороны, а с другой стороны

делались попытки построить формальные модели гипертекстовых систем, которые

носили скорее описательныйхарактер и были навеяны успехом реляционного подхода

описания данных. Идея Т. Бернерс-Ли заключаласьвтом, чтобы применить

гипертекстовую модель к информационным ресурсам, распределенным в сети, и

сделать это максимально простым способом.Он заложил три краеугольных камня

системы из четырех существующих ныне, разработав:

язык гипертекстовой разметки документов HTML (HyperText Markup Lan-guage);

• универсальный способ адресации ресурсов в сети URL (Universal Resource

Locator);

• протокол обмена гипертекстовой информацией HTTP (HyperText Transfer

Protocol).

Позже команда NCSA добавила к этим трем компонентам четвертый:

• универсальный интерфейс шлюзов CGI (Common Gateway Interface).

Идея HTML—пример чрезвычайно удачного решения проблемы построения

гипертекстовой системы припомощи специального средства управления отображением.

На разработку языка гипертекстовой разметкисущественное влияние оказали два

фактора: исследования в области интерфейсов гипертекстовых систем и желание

обеспечить простой и быстрый способ создания гипертекстовой базы

данных,распределенной на сети.

В 1989 году активно обсуждалась проблема интерфейса гипертекстовых систем,

т.е. способов отображения гипертекстовойинформации и навигации в гипертекстовой

сети. Значение гипертекстовой технологии сравнивали со значением

книгопечатания. Утверждалось, чтолист бумаги и компьютерные средства

отображения/воспроизведения серьезно отличаются друг от друга, и поэтому форма

представления информации тожедолжна отличаться. Наиболее эффективной формой

организации гипертекста были признаны контекстные гипертекстовые ссылки, а

кроме того былопризнано деление на ссылки, ассоциированные со всем документом в

целом и отдельными его частями.

Самым простым способом создания любого документа является его набивка в

текстовом редакторе. Опыт создания хорошоразмеченных для последующего

отображения документов в CERN_е был - трудно найти физика, которыйне

пользовался бы системой TeX или LaTeX. Кроме того к тому времени существовал

стандарт языка разметки—Standard Generalised Markup Language (SGML).

Следует также принять во внимание, что согласно своим предложениям Бернерс-Ли

предполагал объединить в единую систему имеющиесяинформационные ресурсы CERN, и

первыми демонстрационными системами должны были стать системы для NeXT и

VAX/VMS.

Обычно гипертекстовые системы имеют специальные программные средства

построения гипертекстовых связей. Самигипертекстовые ссылки хранятся в

специальных форматах или даже составляют специальные файлы. Такойподход хорош

для локальной системы, но не для распределенной на множестве различных

компьютерных платформ. В HTML гипертекстовые ссылки встроеныв тело документа и

хранятся как его часть. Часто в системах применяют специальные форматы хранения

данных для повышения эффективности доступа.В WWW документы—это обычные ASCII-

файлы, которые можно подготовить в любом текстовом редакторе. Таким образом,

проблема созданиягипертекстовой базы данных была решена чрезвычайно просто.

В качестве базы для разработки языка гипертекстовой разметки был выбран SGML

(Standard Generalised Markup Language).Следуя академическим традициям,

Бернерс-Ли описал HTML в терминах SGML (как описывают язык программирования в

терминах формыБекуса-Наура). Естественно, что в HTML были реализованы все

разметки, связанные с выделением параграфов,шрифтов, стилей и т. п., т.к.

реализация для NeXT подразумевала графический интерфейс. Важным компонентом

языка стало описание встроенных и ассоциированных гипертекстовых

ссылок,встроенной графики и обеспечение возможности поиска по ключевым словам.

С момента разработки первой версии языка (HTML 1.0) прошло уже пять лет. За

это время произошло довольно серьезноеразвитие языка. Почти вдвое увеличилось

число элементов разметки, оформление документов все больше приближается к

оформлению качественныхпечатных изданий, развиваются средства описания не

текстовых информационных ресурсов и способы взаимодействия с прикладным

программнымобеспечением. Совершенствуется механизм разработки типовых стилей.

Фактически, в настоящее время HTML развивается в сторону создания

стандартногоязыка разработки интерфейсов как локальных, так и распределенных

систем.

Вторым краеугольным камнем WWW стала универсальная форма адресации

информационных ресурсов. Universal ResourceIdentification (URI) представляет

собой довольно стройную систему, учитывающую опыт адресации и идентификации

e-mail, Gopher, WAIS, telnet,ftp и т. п. Но реально из всего, что описано в

URI, для организации баз данных в WWW требуется только Universal Resource

Locator (URL). Безналичия этой спецификации вся мощь HTML оказалась бы

бесполезной. URL используется в гипертекстовых ссылках и обеспечивает доступ к

распределеннымресурсам сети. В URL можно адресовать как другие гипертекстовые

документы формата HTML, так и ресурсыe-mail, telnet, ftp, Gopher, WAIS,

например. Различные интерфейсные программы по разному осуществляют доступ к

этим ресурсам. Одни, как напримерNetscape, сами способны поддерживать

взаимодействие по протоколам, отличным от протокола HTTP, базового для WWW,

другие, как например Chimera,вызывают для этой цели внешние программы. Однако,

даже в первом случае, базовой формой представления отображаемой информации

является HTML, ассылки на другие ресурсы имеют форму URL. Следует отметить, что

программы обработки электронной почты в формате MIME также имеют возможность

отображать документы, представленные в формате HTML. Дляэтой цели в MIME

зарезервирован тип “text/html”.

Третьим в нашем списке стоит протокол обмена данными в World Wide Web

-HyperText TransferProtocol. Данный протокол предназначен для обмена

гипертекстовыми документами и учитывает специфику такого обмена. Так в

процессе взаимодействия, клиент может получить новый адрес ресурса на сети

(relocation), запросить встроенную графику, принять и передать параметры и

т. п. Управление в HTTP реализовано в виде ASCII-команд. Реально

разработчик гипертекстовой базы данных сталкивается с элементами протокола

только при использовании внешних расчетных программ или при доступе к

внешним относительно WWW информационным ресурсам, например базам данных.

Последняя составляющая технологии WWW - это уже плод работы группы NCSA --

спецификация Common Gateway Interface. CGIбыла специально разработана для

расширения возможностей WWW за счет подключения всевозможноговнешнего

программного обеспечения. Такой подход логично продолжал принцип публичности и

простоты разработки и наращивания возможностей WWW.Если команда CERN предложила

простой и быстрый способ разработки баз данных, то NCSA развила этот принцип на

разработку программных средств. Надозаметить, что в общедоступной библиотеке

CERN были модули, позволяющие программистам подключать свои программы к серверу

HTTP, ноэто требовало использования этой библиотеки. Предложенный и описанный в

CGI способ подключения не требовал дополнительных библиотек и

буквальноошеломлял своей простотой. Сервер взаимодействовал с программами через

стандартные потоки ввода/вывода, что упрощает программированиедо предела. При

реализации CGI чрезвычайно важное место заняли методы доступа, описанные в

HTTP. Ихотя реально используются только два из них (GET и POST), опыт развития

HTML показывает, что сообщество WWW ждет развития и CGI по мереусложнения

задач, в которых будет использоваться WWW-технология.

ГЛАВА 2

 Защита информации в глобальной сети Internet


Информация о работе «Защита информации в Интернете»
Раздел: Информатика, программирование
Количество знаков с пробелами: 111505
Количество таблиц: 0
Количество изображений: 0

Похожие работы

Скачать
113599
3
11

... информации и дезорганизации работы абонентских пунктов; - организационно-технические мероприятия, направленные на обеспечение сохранности конфиденциальных данных. 2. Основные методы и средства защиты информации в сетях Разобрать подробно все методы и средства защиты информации в рамках ВКР просто невозможно. Охарактеризую только некоторые из них. 2.1 Физическая защита информации К ...

Скачать
42791
1
0

... и локальных сетей и принесенному ими ущербу Несмотря на кажущийся правовой хаос в рассматриваемой области, любая деятельность по разработке, продаже и использованию средств защиты информации регулируется множеством законодательных и нормативных документов, а все используемые системы подлежат обязательной сертификации Государственной Технической Комиссией при президенте России. 2.3 ...

Скачать
76940
6
10

... действий могут носить плачевный характер (см. введение) и, поэтому в следующем разделе речь идет о классификации информационных угроз и экономической оценки ущерба от их реализации. Защита информации – это защищенность информационных систем, информационных ресурсов хозяйствующего субъекта, а также объектов его интеллектуальной собственности от внешних и внутренних угроз, затрудняющих эффективное ...

Скачать
96484
2
43

... Pro 2008 по результатам тестирования брандмауэров в лаборатории Matousec показал наилучшие результаты даже при настройках по умолчанию. Глава 3. Разработка рекомендаций по составу программного комплекса для защиты информации в ЛВС Кунгурского сельскохозяйственного колледжа Прежде, чем рекомендовать состав программного комплекса по защите информации в ЛВС КСХК. Необходимо реализовать политику ...

0 комментариев


Наверх