Перейти к содержимому



Добавить ссылку
Фотография

BatchURLScraper - Извлечение данных методами XPath, CSSPath и RegExp

Форум ZiSMO.biz
10
Сообщений в теме: 10

OFFLINE Отправлено

site_analyzer
Пользователи
  • Онлайн:3ч 21м
1
Представляю вашему вниманию бесплатную программу BatchURLScraper, предназначенную для извлечения данных со страниц сайтов используя XPath, CSS-селекторы и RegExp.

buscr.png

buscr-scrape-rules.png
 
buscr-settings.png

Возможности программы BatchURLScraper:
  • парсинг и извлечение данных по списку URL
  • гибкая настройка парсинга используя XPath, XQuery, CSSPath и RegExp
  • модуль для тестирования правил парсинга
  • возможность использования списков proxy
  • экспорт отчетов в Excel (CSV-формат)
Страница скачивания (5 Мб): Ссылка
VirusTotal: Ссылка

Буду рад любым отзывам и пожеланиям по работе программы.

Сообщение отредактировал site_analyzer: 26 11 2020 - 18:38

Администрация форума не имеет отношения к пользователям форума и к публикуемой ими информации. Пользовательское соглашение
    • 0
  • Наверх
  • Ответить

OFFLINE Отправлено

Alec84
Постоянный
  • Онлайн:64д 10ч 18м
136

Было уже тут :)

Вы опоздали мол.


    • 0
  • Наверх
  • Ответить

OFFLINE Отправлено

site_analyzer
Пользователи
  • Онлайн:3ч 21м
1

Было уже тут :)
Вы опоздали мол.

Тему скрыли, тк не было ссылки на вирустотал
Теперь есть )
    • 0
  • Наверх
  • Ответить

OFFLINE Отправлено

foxyman007
Premium plus
  • Онлайн:11д 17ч 49м
23

Посмотрите эти темы, это может подойти https://zismo.biz/topic/962470-vnimanie-cervisy-dlia-ls-v-vk-pochti-bez-banov-kli/?st=0  или это https://zismo.biz/topic/1016849-massovoe-obschenie-cherez-e-mail-trafik-i-prodazhi-bez-re/


Сообщение отредактировал foxyman007: 27 11 2020 - 09:37

Рекламный пост


    OFFLINE Отправлено

    Alec84
    Постоянный
    • Онлайн:64д 10ч 18м
    136

    Тему скрыли, тк не было ссылки на вирустотал
    Теперь есть )

    Там же Ссыль на Офиц Сайт была и я её установил ( а и да походу я же и сказал, что мол на Вирус тотал то надо бы ссыль ).

    Помнится я Лойс ему поставил даже, она реально Офиц была то :)

    Так то да, для тех кто в Теме, нужная Прога.

    Так сказать и вашу Апнул не хотя мол :)


      • 0
    • Наверх
    • Ответить

    OFFLINE Отправлено

    Правый Наушник
    Форумчанин
    • Онлайн:172д 12ч 15м
    1 497

    Там же Ссыль на Офиц Сайт была и я её установил ( а и да походу я же и сказал, что мол на Вирус тотал то надо бы ссыль ).

    Помнится я Лойс ему поставил даже, она реально Офиц была то :)

    Так то да, для тех кто в Теме, нужная Прога.

    Так сказать и вашу Апнул не хотя мол :)

    А эта прога зачем?:)


      • 0
    • Наверх
    • Ответить

    OFFLINE Отправлено

    WoS
    Premium plus
    • Онлайн:75д 14ч 58м
    246

    А эта прога зачем? :)

    "для извлечения данных со страниц сайтов используя XPath, CSS-селекторы и RegExp"
      • 0
    • Наверх
    • Ответить

    OFFLINE Отправлено

    Правый Наушник
    Форумчанин
    • Онлайн:172д 12ч 15м
    1 497

    "для извлечения данных со страниц сайтов используя XPath, CSS-селекторы и RegExp"

    Ах, вот как. Ну да, так гораздо понятней стало)))

    Пример можно?)


      • 0
    • Наверх
    • Ответить

    OFFLINE Отправлено

    WoS
    Premium plus
    • Онлайн:75д 14ч 58м
    246

    Ах, вот как. Ну да, так гораздо понятней стало)))
    Пример можно?)

    Пример - вытащить все ссылки на темы из раздела Халява. Потом по этим ссылкам вытащить все номера телефонов, страницы инстаграм и ВК. Использовать полученные данные для спама
      • 1
    • Наверх
    • Ответить

    OFFLINE Отправлено

    Правый Наушник
    Форумчанин
    • Онлайн:172д 12ч 15м
    1 497

    Пример - вытащить все ссылки на темы из раздела Халява. Потом по этим ссылкам вытащить все номера телефонов, страницы инстаграм и ВК. Использовать полученные данные для спама

    Спасибо добрый человек :)


      • 0
    • Наверх
    • Ответить

    OFFLINE Отправлено

    site_analyzer
    Пользователи
    • Онлайн:3ч 21м
    1
    Еще примеры в этой статье по работе с программой Ссылка
      • 0
    • Наверх
    • Ответить

    OFFLINE Отправлено

    site_analyzer
    Пользователи
    • Онлайн:3ч 21м
    1
    Новая версия BatchURLScraper 1.4 (build 27), 08.12.2020:
    • исправлена ошибка с валидацией HTML-темплейтов
    • оптимизирована работа с регулярными выражениями
    • добавлена возможность неучета повторений при скрейпинге
    • исправлена проблема с учетом пауз между запросами
    • диапазон пауз между запросами расширен до полутора минут
    • доработан и улучшен перевод программы
    • устранены утечки памяти

      • 0
    • Наверх
    • Ответить



    Напишите сообщение


      

    Самое интересное

     



    1