Как грабить сайт на определенную информацию

Как грабить сайт на определенную информацию.

Собственно, чтобы мне это удалось, нужно:

Определить цели и задачи, которые преследуются (какие именно данные нужно получить);

Ключ (здесь нам понадобятся такие базы данных как Visual Studio, MS Access, MySQL. Можете воспользоваться парсерами, но только не такими, как мой любимый Parser.de. Мне он очень нравится, но, к сожалению, возможности у него ограничены).

В процессе мы будем использовать дамп-картинку, которую Clever Daemon перехватывает из интернета. Запустим ее в консоль в режиме on line.

В результате дамп будет содержать данные, которые мы хотим собрать. Эти данные мы будем извлекать из БД, а также заполнять соответствующие таблицы. Об этом поговорим позже.

Для понимания, что же такое дамп, скажу, что дамп - это файл, содержащий информацию о файле (данный файл может быть любым, но он должен быть на машинном языке). Например, если у нас есть документ Word, то мы можем открыть его в текстовом редакторе (DocBook, Etxt (MS Office) и т.п.), затем скопировать содержимое из этого файла на диск.

Из вышесказанного понятно, что я предлагаю вам дамп дампить сайт (нам ведь нужно из него что-то извлекать), но как это делается? - спросите вы. Дело в том, что в Cleaver отображаются только файлы (сохраняемые файлы), которые хранятся в памяти компьютера (в его памяти), поэтому, если мы будем дампомить сайт, то за это будет отвечать управление памятью (называется оно mysql).

Итак, чтобы дампится сайт, нужно создать дамп памяти. Как это сделать?

Для начала нам необходимо получить дамп о файлах из меню "File\Damper\Files" (эта ссылка находится в самом начале статьи).

Берем файл (о его имени и названии мы поговорим в разделе "Как выбрать и имя файла" (создадим до них еще один раздел).

Заходим в меню "Database: SQL Server", выделяем мышкой текст "Damп_q" (для получения дампа памяти), затем нажимаем на кнопку "Finish" (произойдет считывание данных).

Теперь скопируем все данные из дампа в таблицу MySql. Если у вас установлена плагина MS Acces, то дамп создастс