Зміст

 

1. Індексування: технологія, принципи

2. Транспортні ресурси мережі Інтернет

Список використаних джерел

 


1. Індексування: технологія, принципи

Здійснення ефективного пошуку документів можливе лише за умови певної організації зберігання самих документів і відомостей про них. Інакше кажучи, необхідно дотримуватися зручного порядку в розташуванні документів у фондосховищах та їхніх бібліографічних записів у пошукових масивах. Для цього доцільно групувати документи і бібліографічні записи їх за певними ознаками. Ознаками групування можуть виступати формальні характеристики документів (прізвища авторів, назви творів, роки видання тощо), але для здійснення тематичного бібліографічного пошуку, тобто пошуку документів за їхнім змістом, як основні мають виступати саме ознаки змісту. Групування документів відповідно до їх тематики, галузі знання і забезпечує індексування [2, c. 44].

Суть індексування полягає в тому, щоб передати зміст документів, а в разі необхідності й деякі формальні ознаки у вигляді коротких закодованих повідомлень, так званих пошукових образів документів (ПОД). Наявність ПОД забезпечує подальший пошук документів завдяки зіставленню ПОД із пошуковим приписом.

Індексування здійснюється на основі певних інформаційно-пошукових мов. Інформаційно-пошукова мова (ІПМ) — це спеціалізована штучна мова, призначена для передачі змісту і формальних ознак документів, а також інформаційних запитів пошуку потрібних документів. Як будь-яка мова, ІПМ має абетку (система графічних знаків для запису слів і виразів), лексику (сукупність слів, якими користується мова), граматику (засоби, правила, якими користуються для побудови і поєднання слів). Індексуючи документ, здійснюють переклад відомостей про нього з природної мови на штучну — інформаційно-пошукову.

Залежно від ІПМ, яка використовується в тому чи іншому пошуковому масиві, документи підлягають обробці за такими видами індексування: систематизація, предметизація, координатне індексування. Усі ці види індексування пов'язані з розподілом документів за певними класами. Далі розглядатимуться ІПМ класифікаційного типу, на яких базуються предметизація та систематизація і які більше поширені. ІПМ, покладені в основу координатного індексування, використовуються в автоматизованій інформаційно-пошуковій системі (АІПС) і розглядатимуться в курсах інформатики.

Початковим, найпростішим методом розподілу сукупності певних об'єктів є метод групування, тобто розчленування цієї сукупності на групи якісно однорідних об'єктів. У групи об'єкти об'єднуються за найпростішими, зазвичай зовнішніми ознаками, які не розкривають природу і суть досліджуваних явищ, наприклад, групування людей за зростом або кольором волосся. Документи та бібліографічні записи їх також можуть групуватися, наприклад, за абеткою прізвищ авторів, номерами, місцями або роками видання й т. ін.

На більш високому рівні розвитку дослідницького процесу стоїть класифікація. У науці під класифікацією розуміють процес розподілу чисельності об'єктів на підчисельності (класи, підкласи). Оскільки такий розподіл здійснюється за істотними, найважливішими ознаками об'єктів, виникають взаємопов'язані класи, встановлюються зв'язки між окремими об'єктами. Таким чином, для класифікації характерне більш глибоке проникнення в суть досліджуваних об'єктів, що визначається усвідомленням їхніх загальних ознак, властивостей і відношень. У результаті розподілу об'єктів створюється система супідрядних понять (класів). Якщо класи відображають поняття якоїсь галузі знання або діяльності людей, така система також називається класифікацією [4, c. 45].

Класифікація широко використовується в науковій і практичній діяльності людей. Це метод дослідження, який дає змогу впорядкувати явища, предмети і тим самим полегшує процес їх вивчення, допомагає розкрити внутрішні закономірності об'єктивного світу. Кожна наука розробляє класифікацію об'єктів свого вивчення, без чого неможливе узагальнення закономірностей їх розвитку.

Кожен предмет, явище, процес мають багато ознак. Навіть такий простий предмет, як стіл, може мати ознаки форми (круглий, квадратний, овальний), призначення (письмовий, обідній, журнальний), матеріалу (дерев'яний, металевий, пластмасовий) тощо. Істотність ознаки, обраної для класифікації об'єктів, визначається завданнями і метою дослідження, тобто з усіх ознак обираються ті, що найбільше сприяють вирішенню поставлених дослідником завдань. Ознака, за якою здійснюється класифікація об'єктів, називається основою ділення. Так, класифікуючи художню літературу, основою ділення найчастіше обирають національну ознаку — українська література, польська література, французька література. Кожну з національних літератур, у свою чергу, можна поділити на прозові твори й поетичні, а далі на жанри, наприклад, романи, оповідання, нариси тощо.

Важливе значення має класифікація у бібліотечній, бібліографічній, видавничій, архівній, книготорговельній, науково-інформаційній та інших видах діяльності. Об'єктом класифікації в названих галузях виступають документи, тому класифікації називаються документними.

Документні класифікації в органах НТІ забезпечують доведення інформаційних повідомлень до абонентів інформації і, відповідно, впровадження останніх досягнень науки у виробництво, поширення цінного досвіду. У бібліотечних фондах зібрано документи, які відображають духовні надбання людства, і метою бібліотечних класифікацій є сприяння прилученню читачів до цих надбань, сприяння їхньому вихованню і навчанню, культурному розвитку суспільства. У видавничій, книготорговельній справі класифікація дає змогу забезпечити публікацію документів з різноманітних галузей науки, сфер діяльності, тем і проблем, довести інформацію про опубліковані видання та видання, що готуються до друку, до зацікавлених споживачів. Документні класифікації в архівах допомагають упорядкувати їхні фонди, сприяють вивченню досвіду людства, надбанню знань про минуле. Класифікації, які використовуються в діловодстві, дають змогу підтримувати зручний порядок у зберіганні ділової документації і завдяки цьому полегшують управлінську діяльність.

Щоб класифікація успішно розв'язувала поставлені перед нею завдання, вона має відповідати певним вимогам.

Будь-яка класифікація є результатом логічної операції, що базується на загальних правилах, сформульованих формальною логікою. По-перше, ділення на класи має здійснюватися за однією певною основою ділення і не змінюватися в процесі ділення. По-друге, ділення має здійснюватися безперервно, тобто між членами ділення є відношення супідрядності (родове поняття поділяється на видові, ціле — на частини). По-третє, члени ділення мають виключати один одного, тобто не може бути в різних місцях класифікації однакових класів. У структурному відношенні класифікація має бути повною, тобто охоплювати весь обсяг об'єктів, що класифікуються. З іншого боку, для всіх без винятку об'єктів мають бути оформлені класи, до яких можна було б зарахувати будь-який з об'єктів класифікації.

Це загальні правила, на яких будуються будь-які класифікації і, зокрема, документні. Крім того, до документних класифікацій висуваються деякі специфічні, характерні саме для них вимоги. Суть вимоги науковості полягає в тому, що класифікація має відтворювати сучасний рівень розвитку науки і практичної діяльності людей, реальні зв'язки між галузями науки і сферами діяльності, об'єктивні закони розвитку природи і суспільства. Класифікація має надавати можливість відображення документів з найактуальнішої тематики, про найновіші досягнення науки і виробництва, має відображати стан терміносистеми в певній галузі знання. Класифікація має використовувати найновіші досягнення теорії інформаційного пошуку, каталогізації та інших суміжних дисциплін.

Універсальність класифікації полягає у максимальній повноті відображення всієї сукупності людських знань; у наданні можливості відобразити документи на різних носіях інформації, виданих різними мовами; у можливості використання в інформаційних установах різних профілів і масштабу; документів, які відповідають на запити як загального, так і вузькофахового характеру.

Вимога багатоаспектності виявляється у можливості класифікації відображати документи в різних аспектах з урахуванням їх змісту і певних формальних ознак (вид, читацьке призначення, мова публікації тощо) [1, c. 36].

Суть вимоги адаптивності полягає і в тому, що у класифікації має бути враховано умови, в яких її використовують, вона має легко скорочуватись або розгортатися залежно від конкретних потреб. До того ж класифікація має бути "гостинною", тобто до неї досить легко, без порушення структури мають додаватися розділи для нових проблем і предметів, вилучатися застарілі тощо.

І, нарешті, до класифікації ставиться вимога чіткості й простоти побудови, що забезпечує одержання потрібної інформації у мінімальні строки при найменших затратах праці й у стислому обсязі.


Информация о работе «Принципи індексування документів в мережі Інтернет»
Раздел: Информатика, программирование
Количество знаков с пробелами: 15844
Количество таблиц: 0
Количество изображений: 0

Похожие работы

Скачать
213419
24
23

... ·  пошуковий механізм, який користувачі використовують як інтерфейс для взаємодії з базою даних. Засоби пошуку типу агентів, павуків, кроулерів і роботів використовуються для збору інформації про документи, які знаходяться в мережі Інтернет. Це спеціальні програми, які займаються пошуком сторінок в мережі, збирають гіпертекстові посилання з цих сторінок і автоматично індексують інформацію, яку ...

Скачать
102810
0
0

... і т. д. Отже, йдеться про інформацію, яка є результатом наукової обробки первинних документів і має риси інформаційно-аналітичного дослідження. До сфери наукової обробки документів входить систематичне визначення кола питань, що виникають у процесі базової (професійної) діяльності споживача. Завданням референтів-аналітиків є виявлення, відбір, аналітико-синтетична обробка документної інформації та ...

Скачать
10051
0
0

... робот, тим більшу кількість перехресних посилань він проіндексував. 2. Як додати свій сайт до пошукової системи чи у каталог? Нижче приведено список найпопулярніших сайтів та addurl до них: Зареєструвати сайт в Яндекс - найпоширеніша система пошуку інформації в мережі Інтернет у Росії. Адурілка яндекса знаходиться за цією адресою: http://webmaster.yandex.ru/ Зазвичай, сайти з уні ...

Скачать
38435
2
0

... ) (іграшки +м'які) права людини ~ (США |Америка) путеводитель по Праге " (агентство | тур) поставщики /2 модем музыкальное / (-2 4) образование Далі можна запропонувати учням практичну роботу на пошук інформації, коли запити сформовані та записані вчителем, а учням необхідно заповнити таблицю за результатами пошуку та зробити висновки (табл.3). Потім необхідно навчити учнів планувати пошук, ...

0 комментариев


Наверх