Web Content Extractor

shopmaster 17 Февраль, 2009 13:06 Контент Постоянная ссылка Трекбэки (0)

Одним из самых простых в работе и эффективных windows-грабберов является программа под названием Web Content Extractor компании Newprosoft (здесь их официальная страница).

На момент написания последняя версия программы - 3.1.

В этой первой статье по Web Content Extractor  я приведу просто описание производителя, поскольку программа на английском, и всё описание тоже, что не всегда удобно российским шопмастерам.

Итак, знакомьтесь: Web Content Extractor 3.1 

Вам необходимо извлечь большое количество информации со страниц различных Веб-сайтов, но мысль о том, что это нужно сделать вручную через "коопировать-сохранить" приводит вас в бешенство? Значит, пришло время попробовать программу Web Content Extractor! Она автоматизирует извлечение информации и позволит вам сохранить результаты в нужном вам формате.

Программа "Web Content Extractor" компании "Newprosoft" собирает информацию с заданных сайтов в автоматическом режиме и одним нажатием клавиши представляет её в нужном вам формате!

"Web Content Extractor" - это наиболее мощная и простая в использовании программа, предназначенная для извлечения информации и граббинга в Интернете. "Web Content Extractor" предоставляет дружеский интерфейс и помощников, которые проведут вас через процесс создания сценариев извлечения информации и задания правил работы на нужных вам сайтах в простой визуальной форме. Вам не потребуется писать ни строчки кода! Извлечение информации со страниц Веб-сайтов полностью автоматизировано.

"Web Content Extractor" пригодится многим пользователям компьютеров. Например, вам нужно собрать всю информацию о товарах (названия, описания, цены, изображения, и т.д.) со страниц определённого сайта. Вместо того, чтобы выполнять эту утомительную работу вручную, вы можете создать проект в программе "Web Content Extractor" и нужная вам информация будет извлечена в автоматическом режиме без вашего участия. Таким образом, вы сохраните огромное количество времени, и вам не придётся выполнять утомительную ручную работу!

"Web Content Extractor" позволяет пользователям создавать проекты с заданием определённого целевого Веб-сайта для страниц с одинаковой структурой (например, магазинов, каталогов продукции, сайтов электронной коммерции, финансовых сайтов, бизнес-справочников, результатов запросов в поисковиках, и т.д. и т.п.) и сохранять резульаты работы в базе проекта. Полученную информацию можно экспортировать в различные форматы, в том числе в эксель (CSV), аксэс, TXT, HTML, XML, SQL или MySQL (для последних двух программа формирует соответствующий скрипт). Такое большое количество форматов для экспорта результатов позволяет вам произволить дальнейшую обработку полученной информации в той программе, с которой вы привыкли работать.

Конфигурирование задание на извлечение информации - очень простой процесс, потому что вы просто следуете шагам, предлагаемым помощником по конфигурации. Сначала вы определяете шаблон для извлечения данных, вводите исходный урл, с которого "Web Content Extractor" начнёт работу с сайтом, задаёте правила работы с сайтом, глубину проникновения на сайт, и даёте имя своему проекту. Глубина проникновения на сайт может быть задана в произвольном виде, что позволяет очень гибко настроить программу. Так, программу можно настроить на переход по линкам, если в их теле содержится определённое вами выражение. После того, как проект настроен, вы можете запустить его одним щелчком мыши.

При помощи программы "Web Content Extractor" вы можете быстро ихвлечь информация с большого количества страниц, использую многопотоковые возможности программы,- она позволяет скачивать информацию в 20 потоков одновременно. Всё, что от вас потребуется - нажать на кнопку запуска извлечения информации! Вам не придётся больше лазать по сайтам от страницы к странице, вырезая информацию с каждой из них и копируя к себе в Word.

"Web Content Extractor" оценят пользователи, стремящиеся к комфортной и продуктивной работе в интернете.

Кто может извлечь пользу от применения "Web Content Extractor"? Кто угодно!

  • "Web Content Extractor" поможет бизнесменам извлечь и собрать рыночную информацию, ценовую информацию о товарах, данные о недвижимости.
  • "Web Content Extractor" поможет любителям чтения найти, собрать и сохранить информацию о книгах, включая их названия, авторов, описания, ISBNы, изображения обложек и цены.
  • "Web Content Extractor" позволит коллекционерам автоматизировать выставленные на аукционы предложения.
  • "Web Content Extractor" поможет журналистам извлекать новости и статьи с новостных сайтов.
  • "Web Content Extractor" извлечёт информацию с сайтов, посвящённых отдыху и туризму, названия, адреса, описания, изображения, цены гостиниц, ресторанов, туров и пр.
  • "Web Content Extractor" поможет одиноким собрать информацию с сайтов знакомств и привести её в порядок.
  • "Web Content Extractor" поможет занятым поиском работы собрать предложения с сайтов, посвящённых найму на работу, и обработать нужные предложения быстрее и эффективнее.

Вы хотите получать информацию быстро, в автоматическом режиме, не теряя времени на переход по страницам и вырезание-вклеивание нужной вам информации? Хотите собирать информацию с большого количества страниц? Хотите сохранять добытую информацию в нужном вам формате? "Web Content Extractor" - ваш выбор!

Демо-ролики программы "Web Content Extractor" в формате flash:

Вы можете посмотреть демо-ролики о программе "Web Content Extractor", которые покажут вам насколько просто сконфигурировать программу и извлечь данные с Веб-сайтов.

Извлечение информации о ноутбуках из магазина "Shopzilla" (скачать файл проекта WCE):

Извлечение результатов поиска на сайте недвижимости "Illinoisrealtor":

Извлечение подробной информации о местах отдыха на сайте "Vacationhomes" (скачать файл проекта WCE):

Извлечение информации о видеофильмах с "Youtube" (скачать файл проекта WCE):

 


Закладки:These icons link to social bookmarking sites where readers can share and discover new web pages.
    blinkbits BlinkList blogmarks co.mments connotea del.icio.us De.lirio.us digg Fark feedmelinks Furl LinkaGoGo Ma.gnolia NewsVine Netvouz RawSugar Reddit scuttle Shadows Simpy Smarking Spurl TailRank Wists YahooMyWeb ecto NewsGator

Комментарии

  1. К сожалению сайт источника программы на реконструкции, где можно ещё скачать программу?

    Написал(а) iNETsHOP — 28 ÐÑ 2009, 03:49

  2. да, к сожалению, так и есть - то ли у разработчиков другие интересы, то ли они готовят какой-то крупный апдейт. я когда покупал лицензию, они даже получив деньги не чухнулись, пришлось нажать через платежные системы, которые пригрозили им отключением, только после этого они встрепенулись. но сайт проработал недолго, потом опять перешел в "реконструкцию". так что лучше всего ссылки искать на торренте или на нулледе.

    shopmaster Написал(а) shopmaster — 01 ÐÐ 2009, 15:50


Добавить комментарий

Добавить комментарий
 authimage


Powered by BlogMasters.Ru