Next: Описание программ, входящих в
Up: Составные части программной системы.
Previous: Составные части программной системы.
Contents
- Шаблон.
Предполагается, что данные о потоках, собранные разными коллекторами, представлены
в разных форматах, но содержат сходные данные. (Предопределённые поля NetFlow)
Для унификации работы с индексным файлом необходимо представлять данные в некотором
внутреннем формате, не зависящем от представления данных в хранилище.
Внутренний формат описывается сущностью "шаблон". Шаблон выполняет три функции:
- установление символьных меток (имён) и длин полей внутреннего представления записи.
- указание типа данных, определяющего преобразования, которые необходимо произвести
над данными при их чтении из файла условий и при выводе.
- определение дополнительных индексных баз данных для поиска по конкретным полям.
- Файл условий.
Определяет условия фильтрации. Поля должны соответствовать полям заданным в шаблоне.
- Индексные файлы.
Индексный файл является базой данных и создается с помощью библиотеки BerkeleyDB.
Существуют два типа баз данных:
- Первичная - в качестве ключа используется вся запись, представленная во внутреннем
формате - как конкатенация всех полей. Первичная база
единственна. Она содержит все данные о потоках, которые выбраны из хранилища.
- Вторичные - в качестве ключа используется одно поле записи, представленной
во внутреннем формате. Вторичные базы неразрывно связаны с первичной. Построение вторичных
индексных файлов может дать выигрыш в скорости фильтрации. Для быстрого поиска нужных
записей для каждого поля, которое указано в файле, задающем условия поиска,
желательно создание вторичных баз данных.
- Файлы, хранящие записи NetFlow.
Хранилище потоков - набор записей, описывающих потоки и собранных определённым
коллектором.
Aleks Sherikov
2006-05-23