4.1 Початок дослідження методів обробки китайських текстів
Деякі говорять, що, коли можлива машинна обробка ієрогліфічних текстів, алфавіт більше не потрібний. Але все навпаки. Без алфавіту ЕОМ не могло стати знаряддям підвищення культури широких мас. ЕОМ, що обробляли ієрогліфічні тексти, потребували значних коштів, у них застосовувалися складні операції, одній людині важко було працювати на такій машині. Масове впровадження ЕОМ можливе було тільки у випадку використання машин, що обробляли тексти, записані алфавітом. Це також вигідно й з боку встановлення зв'язку з міжнародною інформаційною системою. Це так само вірно, як і те, що алфавітні друкарські машинки мали масове застосування, а ієрогліфічні могли експлуатуватися не широким колом людей, а лише спеціально підготовленими друкарками в установах. Для того щоб машинна обробка китайських текстів ішла в ногу з часом , необхідно було використовувати систему, що сполучала два методи: обробляла на ЕОМ і ієрогліфічні тексти, і алфавітні. Перший із цих методів варто було застосовувати організаціям, що мали для цього необхідні людські й матеріальні ресурси й до того ж існувала велика потреба у використанні ієрогліфів. Другий - приватними особами, у родині, у шкільних класах, у порівняно невеликих установах.
У той час багатьма організаціями Пекіна проводилися експерименти з метою створення штучного інтелекту. Наприклад, в Академії китайської медицини ЕОМ використовували для постановки діагнозів хворим, ведення історій хвороби, виписки рецептів; в Інституті мовознавства на ЕОМ проводилися експерименти в рамках діалогу "людина - машина"; в Інституті психології за допомогою ЕОМ ставили експерименти по "розумінню китайської мови". У всіх цих експериментах використовували алфавіт, а не ієрогліфи. Чому? Причина дуже проста: обробка ієрогліфічних текстів вимагала дорогого устаткування й складних процедур. Тому система сполучення двох методів фактично вже існувала, причому машини, що обробляли алфавітні тексти, зайняли провідне положення[9,156-157].
Звичайно, це не означило, що не потрібно було розвивати електронно-обчислювальну техніку, яка обробляла б ієрогліфічні тексти. При обробці ієрогліфічних текстів основні труднощі полягали у введенні ієрогліфів в ЕОМ. До теперішнього часу розроблено більше 400 способів введення ієрогліфів в ЕОМ. Вони підрозділяються на три групи:
1) графічні: ієрогліфи вводяться безпосередньо в ЕОМ у порядку черговості по елементах. Цей метод уже затвердився, підходить для використання в таких великих установах, як друкарні;
2) кодування за допомогою числового коду: більше 400 наявних способів належать головним чином саме до цієї групи;
3) перетворення алфавіту.
4.2 Способи кодування ієрогліфів
Способи кодування ієрогліфів за допомогою числового коду також підрозділяються на кілька видів.
1. Кодування елементів. Елементи, з яких складаються ієрогліфи, бувають великими й малими. Великий елемент відповідає, як правило, ключу ієрогліфа, малі елементи утворяться в результаті подальшого розкладання великого. Кожному елементу відповідає певна клавіша на панелі ЕОМ або ж йому дається певний числовий код.
2. Кодування ієрогліфів за їхніми особливими ознаками. У цьому випадку кодуються певні особливі ознаки ієрогліфів, наприклад третій або четвертий кут, перша або остання риска.
3. Кодування по рисках. Ієрогліфи складаються з рисок, які зводяться до декількох основних видів. Кожному такому виду відповідає клавіша на панелі ЕОМ або ж йому дається певний числовий код. Це старий спосіб, що розвивається на новій основі.
4. Числове кодування: кожному ієрогліфу на підставі його місця в словнику, частотності вживання або якої-небудь іншої характеристики дається числовий код. Найбільш старим і розповсюдженим з таких кодів є чотиризначний телеграфний код.
5. Кодування методом комбінації звучання й накреслення: текст вводиться частково за допомогою алфавіту або алфавітних скорочень, частково - ієрогліфами. Такого роду способів надзвичайно багато.
У той час було неможливо використовувати тільки один спосіб введення ієрогліфів в ЕОМ. Звичайно, неможливо було також використовувати 400 або 40 способів. Чим більше способів - тим вужчий ринок збуту відповідної продукції, застосування такої техніки також створювало масу незручностей. Як можна було скоротити число способів? Шлях рішення питання - проведення єдиної політики в області розробки способів введення ієрогліфів в ЕОМ шляхом класифікації цих способів по групах, концентрації, підйому й стандартизації. Класифікація - це об'єднання всіх способів у зазначені п'ять або деякої іншої кількостей груп. Концентрація - це зведення знаннь про ті чи інші особливості введення ієрогліфів в ЕОМ до якогось загального знаменника. Підйом - це проведення колективних досліджень і загальне підвищення рівня розробок. Стандартизація - це затвердження у якості стандарту кращих з таких удосконалених способів. Кожні кілька років проводилася робота по аналізуванню й удосконалюванню. Застосування цього "четирьохступінчастого методу проведення єдиної політики" прискорило розвиток способів уведення ієрогліфів в ЕОМ[11,56-62].
Корінним недоліком методів кодування ієрогліфів за допомогою числового коду були великі витрати розумової енергії. Необхідна була спеціальна підготовка, вивчене легко забувається; якщо володів одним із цих методів - не володів іншим.
... : обмежувався конкуруючий імпорт, ліцензувались усі види імпорту — більш пільговий для пріоритетних галузей, менш пільговий — для інших. Заходи по лібералізації полегшують тут доступ в економіку зарубіжних технологій, сприяють розвиткові експортної бази, включаючи створення підприємств із 100% експортною орієнтацією. Вартим уваги явищем останнього десятиліття є досить активний експорт підприє ...
0 комментариев