Поиск XML- документов в ЭБ КарНЦ РАН
В данной работе задачу поиска XML-документов в коллекциях ЭБ КарНЦ РАН можно сформулировать следующим образом. Обозначим через D={d1,d2, …, dn} - множество XML- документов коллекции, каждый из которых хранится в отдельном файле j.xml, j=1, …, n. Предполагается, что для каждой коллекции задано m- элементов описания структуры документа, на основе значений которых будет проводиться отбор искомых документов из данной коллекции.
Для решения поставленной задачи поиска рассматривается несколько подходов.
- Например, можно открывать файлы j.xml, j=1, …, n по очереди и с помощью DOM-модели (интерфейсы которой используются для доступа к элементам XML- документа) реализовать алгоритм поиска искомых документов, а затем их отсортировать.
- Одним из общеизвестных способов ускорения поиска данных в БД является индексация.