5. Добытчик на все руки
Система MineSet от Silicon Graphics представляет собой инструментарий для интеллектуального анализа данных на основе мощной визуальной оболочки. Ее особенностью является использование нескольких взаимодополняющих стратегий добычи, анализа и интерпретации данных. Архитектура MineSet имеет открытый характер, что позволяет работать с информационным хранилищем, построенном на основе реляционных баз данных или "плоских" ASCII-файлах. Процесс анализа начинается с выборки некоторого подмножества данных для дальнейшего исследования, которые могут преобразовываться. Тем самым создается информационная модель в виде, наиболее подходящем для последующего изучения.
Набор инструментальных средств MineSet состоит из 3 основных модулей:
- управляющего модуля. Он включает в себя графический интерфейс пользователя, который называется Tool Manager, и базирующийся на сервере процесс - DataMover;
- модуля аналитического Data Mining, находящегося на сервере и имеющего четыре интеллектуальных инструмента;
- модуля визуального Data Mining, находящегося на клиентской машине и состоящего из пяти инструментов.
Менеджер инструментов (Tool Manager) предоставляет интерактивный графический интерфейс, с помощью которого пользователь получает доступ ко всем возможностям и инструментам MineSet в единой интегрированной среде. С его помощью пользователь получает доступ к данным.
Процесс DataMover осуществляет доступ к данным, производит их выборку и преобразования, инициализирует работу запускаемых на сервере инструментов аналитического data mining и возвращает данные на клиентскую станцию для распределения их по визуальным инструментам.
К инструментам аналитического Data Mining относят четыре взаимодополняющих инструмента аналитической добычи данных, основанных на методах искусственного интеллекта с использованием машинного обучения. Это Генератор ассоциативных связей (Association Rule Generator), Генератор Дерева решений (Decision Tree Inducer), Генератор свидетельств (Evidence Inducer) и утилита определения Значимости признаков (Column Importance).
MineSet содержит пять инструментов для визуального Data Mining, позволяющих выполнять интерактивное визуальное представление и исследование данных. Это Ландшафтный визуализатор (Map Visual-izer), Визуализатор дисперсии (Scatter Visualizer), Визуализатор деревьев (Tree Visualizer), Визуализатор правил (Rule Visualizer) и Визуализатор свидетельств (Evidence Visualizer).
6. Data Mining в Бизнесе
С помощью Data Mining предприятия розничной торговли могут выполнять анализ покупательской корзины, знание которой необходимо для улучшения рекламы, выработки стратегии создания запасов товаров и способов их раскладки в торговых залах. Исследование временных шаблонов помогает торговым предприятиям принимать решения о создании товарных запасов, а создание прогнозирующих моделей дает возможность торговым предприятиям узнавать характер потребностей различных категорий клиентов с определенным поведением.
Достижения технологии Data Mining в банковском деле позволят выявлять мошенничество с кредитными карточками, сегментировать клиентов по категориям, а также прогнозировать изменения клиентуры.
В области телекоммуникаций методы Data Mining помогают компаниям более энергично продвигать свои программы маркетинга и ценообразования (анализ записей о подробных характеристиках вызовов и выявление лояльности клиентов).
Data Mining может применяться во множестве других областей. Например, в автомобильной промышленности при сборке автомобилей производители должны учитывать требования каждого отдельного клиента, поэтому нужна возможность прогнозирования популярности определенных характеристик и знание того, какие характеристики обычно заказываются вместе. Авиакомпании могут выявлять клиентов, которых поощрительными мерами можно побудить летать больше.
7. Крупнейшая онлайновая сеть научной и технической информации
Общепризнанным источником научной и технической информации является международная сеть научной и технической информации STN International (Scientific & Technical Information Network). Она находится в совместном управлении германского Специализированного информационного центра ФИЦ Карлсруэ (Fachinformationszentrum (FIZ) Karlsruhe), Реферативной службы по химии Американского химического общества (Chemical Abstracts Service (CAS), American Chemical Society) и Информационного центра по науке и технике Японской научно-технической корпорации (Information Center for Science and Technology (JICST), Japan Science and Technology Corporation). В настоящее время сеть STN International обеспечивает онлайновый доступ к более чем 200 базам данных во всех областях науки и техники (см. табл. 1).
После нахождения нужных публикаций или документов можно заказать их полные тексты, используя систему автоматизированной доставки через Интернет - FIZ AutoDoc/ChemPort. Многие известные международные библиотеки и издательства уже сегодня связаны с системой FIZ AutoDoc/ChemPort, и их численность постоянно увеличивается.
Чтобы иметь доступ к FIZ AutoDoc, необходимо зарегистрироваться, получить идентификатор для подключения и пароль (www.fiz-karlsruhe.de/autodoc).
Таблица 1. Наиболее крупные базы данных STN
Базы данных | Количество документов, млн. |
BEILSTEIN | 7,7 |
BIOSIS | 12,0 |
CA/CAPLUS | 16,1 |
COMPENDEX | 4,4 |
EMBASE | 8,0 |
INPADOC | 30,0 |
INSPEC | 6,5 |
INVESTEXT | 9,4 |
JAPIO | 6,3 |
MEDLINE | 11,0 |
PROMT | 7,9 |
REGISTRY | 23,3 |
SCISEARCH | 17,7 |
WORLDCAT | 41,0 |
WPINDEX | 9,5 |
... последовательные ступени обработки сырья, либо играющих вспомогательную роль одна по отношению к другой. И в случае межотраслевых объединений тресты представляют собой комбинаты. ГЛАВА 2. «МЯГКИЕ» ФОРМЫ ОБЪЕДИНЕНИЙ. 2.1. КОНСОРЦИУМ Консорциум — временный союз хозяйственно независимых фирм, целью которого могут быть разные ...
... кредиты иностранных центральных и частных банков, а также МВФ. Использование заемных ресурсов связано с выполнением определенных требований кредитора. 3.3 Политика управления валютными резервами в кратко- и среднесрочном периоде и ее эффект Важную роль в развитии международных экономических отношений Молдовы играет финансовое регулирование внешнеэкономических связей через формирование и ...
... предыдущего чрезмерного стравления, в восстановлении будут преобладать разновидности сорняков. Глава 3. Проблемы горных территорий и возможные способы их решения. Природные и антропогенные катаклизмы. Природные катаклизмы в горах представляют результат геотектонической природы гор и их экологических характеристик. Однако катаклизмы зачастую вызываются деятельностью человека. Перед ...
... по ГХК "Краснолиманская Показатели 1999 2000 Отклонение, пунктов Отклонение, % 1. Рентабельность капитала 2. Рентабельность основного капитала 3. Рентабельность производства 4. Рентабельность продаж 26,4 33,3 43,8 30,5 28,1 36,5 48,6 32,7 +1,7 +3,2 +4,8 +2,2 +6,4 +9,6 +11,0 +7,2 2.3 Управление затратами на ...
0 комментариев