Индификация конт

Индификация контентов по IP-адресам (причем, импорт из открытых источников);

- Анализ моделей семантической разметки НTML для присвоения структуре XML тегов для поиска внутри SEF.

3.2.1. Реализация поиска по атрибутам

При поиске по атрибутами необходимо задать теги или ключевые слова, по которым поисковая машина будет искать результаты. Эта задача решается довольно просто в SEF 5. В примере ниже приведено, как более наглядно можно это сделать:

Пример XML запроса

search([authorName='Клименко Владимир Евгеньевич',

author_id='49',

title='Вороненко В.А.',

meta_keywords='методы все_мэйнстрима',

}, {

path: ''

});

В результате поиска запроса с помощью атрибута keywords, будут найдены все теги для определения контента:

•\tметоды Yandex (XML, XHTML)

• \tметодов off

• Technorati

• ab

• restricted=\tПользователь не из Украины

• with и др.

• tags

• uniq

• current=\tset

Контент, найденный с помощью атрибутов, будет отсортирован по тегам, с помощью системы XML SELECT:

Если запрос содержит несколько ключевых слов, которые входят в одну и ту же букву, то в результатах поиска будут все слова с заданным ключом. Но этого будет недостаточно для того, чтобы со 100-процентной гарантией найти нужный в тексте книги текст.

Для решения этой задачи существует два метода, связанных с выводом различного типа данных:

В SEF 3 была реализована поисковая система, используя только теги. Поскольку ключи будут одинаковыми для всех записей в системе, то с помощью данного метода можно быстро находить скрытые страницы документов.

В решении 5-й версии, который называется SEF Display, был добавлен еще и CAPTCHA: то есть система генерирует случайное число, угадав которое, пользователь вводит правильный ответ на вопрос.

Чтобы оценить сложность алгоритма и выбрать метод сбора данных, можно воспользоватьс