RegExp Extractor 1.10 (build 76) - Proxy-Base Community - Анонимность и безопасность в интернете.
Бесплатные прокси. Количество:
Прокси для пользователей форума (API). Количество:
Купить доступ к прокси-листам (API). Количество:
 



Информация по хайдам / репутации

(РЕКОМЕНДУЮ) №1 >>>DDos Атака<<|>>DDoS Service<<< ДДОС СЕРВИС<<|>>Заказать DDOS
Бесплатные прокси уже в Telegram
Все инфопродукты и приватная информация бесплатно
Старый 09.06.2013, 16:39   #1 (permalink)
HTTP/S
 
Регистрация: 25.01.2010
Сообщений: 96
Member ID: 6139

Репутация: 156
Репутация: 156
Сказал(а) спасибо: 294
Поблагодарили 66 раз(а) в 32 сообщениях
Топикстартер (автор темы) Хорошо RegExp Extractor 1.10 (build 76)

RegExp Extractor 1.10 (build 76)



RegExp Extractor это утилита, предназначенная для извлечения различных данных из текстовых файлов и файлов журнала,
используя условия и правила написаные с использованием регулярных выражений.


Запускать прожку только при выключеном Интернете !!!

При включеном слетает рега, стучит на сервер о своей регистрации.
Лицензия в блеке у производителя. После запуска можно включить Интернет.

RegExp Extractor is an utility designed to extract various data from text files and logs using conditions and rules written using regular expressions.

Howto Use

To use this program you need to know regular expressions (regexp).

Source file(s) - file that you want to extract data from. You can use mask here, ex. c:\temp\*.txt

Output file - output file for the extracted data.

Output dir - RegExp Extractor can produce several output files. This option allows to define destination folder for them.

Save other lines to file - save the lines, that don't match any regular expression, here.

Conditions/Rules Tabs

Each tab contains set of conditions and rules to extract data.
For ex., "emails" tab contains conditions and rules to extract emails, "url-domains" tab contains conditions and rules to extract domains from the urls.

To add a new tab use [+] button below the tabs, to remove an existing tab use [-] button.

When you press "Start" button, RegExp Extractor will extract data from source file(s) using conditions and rules from the active tab.

Each set of conditions & rules has the Title (name of the tab).

Extract Conditions
Each line contains the regular expression with the name. Conditions are used in Extract Rules.

Extract Rules
Each line contains the rule - what data to extract.

Example 1.

Condition: email=/[a-z0-9][a-z0-9.-]+[a-z0-9]@[a-z0-9][a-z0-9.-]+[a-z0-9]/
Rule: email:$0

In this example: email is the name of the used condition.
/[a-z0-9][a-z0-9.-]+[a-z0-9]@[a-z0-9][a-z0-9.-]+[a-z0-9]/ is the regular expression to extract emails.
$0 specifies that we need to extract all sub-strings of the source line, that match the condition. For our example it is email.

Example 2.

Condition: url-domain=/https?://([a-z0-9][a-z0-9.-]+[a-z0-9])|(www\.[a-z0-9.-]+[a-z0-9])/i
Rule: url-domain:$1$2

url-domain is the name of the used condition.
/https?://([a-z0-9][a-z0-9.-]+[a-z0-9])|(www\.[a-z0-9.-]+[a-z0-9])/i is the regular expression to extract urls.
$1$2 specifies to extract the first ([a-z0-9][a-z0-9.-]+[a-z0-9]) and the second (www\.[a-z0-9.-]+[a-z0-9]) groups from sub-strings that match regular expression.

Also you can use another characters in the rules to produce result lines, for ex.: email:The email is $0
Result lines will look like this:

The email is email1@domain1.com
The email is email2@domain2.com

Separate by conditions

This option allows you to save lines that match different conditions into different files in the output folder.
See Example below.

Example 3.

Separate by conditions = On

Conditions

sent-ok=/sent ok/i
blocked=/blocked/i
http=/(https?://)|(www\.)[a-z0-9.-]+//
err=/(-ERR \[[0-9]{3}\] : ).+ : (.+)/

Rules

sent-ok!:$L
blocked!^err:$L
http!^err:$L
err!:$L

This example demonstrates how to save all lines that have sent ok sub-sting to sent-ok.txt,
lines that have blocked sub-string AND don't match the err condition to blocked.txt,
lines that have urls (that match http condition) AND don't match the err condition to http.txt,
lines that match err condition to err.txt.

Sign ! after the name of the condition in rule expression means that RegExp Extractor will stop processing rules if the line matches the condition from this rule. If we omit ! in our example then RegExp Extractor will save the line sent ok: blocked to the both files: sent-ok.txt and blocked.txt.

^ in blocked!^err means that the line should match the condition blocked and match the condition err.

Also you can use ~ sign that means that the line SHOULD NOT match the condition after that sign.
Example: blocked!~sent-ok:$L
$L means taht you need to extract WHOLE the line. Not only the sub-string that matches the regular expression.

Example 4.

Separate by conditions = Off

Conditions

http=/https?://([a-z0-9][a-z0-9.-]+[a-z0-9])|(www\.[a-z0-9.-]+[a-z0-9])/i

Rules

http>>$1$2.txt:$L

In this rule we specified the output file name $1$2.txt where $1$2 is the domain of the extracted url.
This example demonstrates how to separate lines by domain.
Вложения
Тип файла: rar REE.rar (662.3 Кб, 11 просмотров)
RefCat вне форума   Ответить с цитированием
Старый 09.06.2013, 16:42   #2 (permalink)
HTTP/S
 
Регистрация: 25.01.2010
Сообщений: 96
Member ID: 6139

Репутация: 156
Репутация: 156
Сказал(а) спасибо: 294
Поблагодарили 66 раз(а) в 32 сообщениях
Топикстартер (автор темы) По умолчанию Re: RegExp Extractor 1.10 (build 76)

Подскажите плиз.
Какие задать регулярки и правила что бы из этого:
Цитата:
178.63.0.144 - - [20/Jan/2013:15:26:53 +0100] "GET /p-80.html HTTP/1.1" 200 262 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; KuKu 0.65)"
92.28.36.132 - - [28/Mar/2012:22:20:22 +0100] "GET /p-11055.html HTTP/1.0" 200 262 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; KuKu 0.65)"
99.6.122.78 - - [28/Jan/2013:16:27:23 +0100] "GET /p-9090.html HTTP/1.0" 200 262 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; KuKu 0.65)"
31.220.206.219 - - [28/Apr/2013:23:50:45 +0100] "GET /p-54321.html HTTP/1.1" 206 303 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; KuKu 0.65)"
8.28.16.254 - - [11/Apr/2013:09:42:13 +0200] "GET /p-80.html HTTP/1.1" 304 134 "-" "Mozilla/4.0 (compatible)"
58.218.185.113 - - [16/Apr/2013:01:41:57 +0200] "GET /p-808.html HTTP/1.0" 200 262 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; KuKu 0.65)"
Извлечь (получилось) это:
Цитата:
178.63.0.144:80
92.28.36.132:11055
99.6.122.78:9090
31.220.206.219:54321
8.28.16.254:80
58.218.185.113:808
Спасибо.

Последний раз редактировалось RefCat; 09.06.2013 в 17:08.
RefCat вне форума   Ответить с цитированием
Старый 09.06.2013, 23:29   #3 (permalink)
***VIP*** Reverser
Proxy-Base-Com Team
 
Аватар для Unlimited
 
Регистрация: 10.07.2009
Сообщений: 2,271
Member ID: 1157
ICQ .
Jabber unlimited@proxy-base.ru

Репутация: 13491
Репутация: 13491
Сказал(а) спасибо: 2,808
Поблагодарили 4,497 раз(а) в 1,372 сообщениях
По умолчанию Re: RegExp Extractor 1.10 (build 76)

Цитата:
Сообщение от RefCat Посмотреть сообщение
Подскажите плиз.
Какие задать регулярки и правила что бы из этого:
Извлечь (получилось) это:Спасибо.
Ответил в этой теме: http://proxy-base.org/f29/notepad_vo...tml#post133076
__________________


Donate

Платная подписка в приватный раздел
$$$ Партнерская программа приват-раздела

--> Хочешь получить +10 к репе, а также бесплатный доступ в VIP раздел?


---

Бесплатная регистрация на форуме Proxy-Base



Garsuk.com - новый проект от Proxy-Base.Com Team
Абузоустойчивый хостинг с защитой от DDoS атак
Multi-Threaded Site Pinger - вдуватель индекса. Аддурилка. Индексатор сайтов, быстрая индексация сайта, добавить сайт в индекс.

NEW! Полезные SEO инструменты от Proxy-Base.Com

SED v4.x - купить по самой низкой цене! Скидка мемберам Proxy-Base.Com
НЕРЕАЛЬНАЯ цена на SED дорген, скидка до 30%
SMS Рассылка по всей России (любые объемы, самые низкие цены)
Супер-тарифы МТС (дешевые звонки и смс по России)
Разработка программ и скриптов
Взлом программного обеспечения на заказ (программы, скрипты)

[VIP] Proxy List

Online Virus Checker (vircheck)
Free Socks 4/5 (Alive)
Proxy Gear Pro (Proxy Combine: checker, parser, grabber)
Платная подписка в приватный раздел (Private section): http://proxy-base.com/vip
web-coding, seo на заказ
activity, white
FFF
Unlimited вне форума   Ответить с цитированием
Пользователь сказал cпасибо:
Старый 10.06.2013, 14:04   #4 (permalink)
VPN
 
Аватар для kill4you
 
Регистрация: 12.08.2009
Адрес: proxy-base.org
Сообщений: 318
Member ID: 2045
ICQ 316817

Репутация: 1437
Репутация: 1437
Сказал(а) спасибо: 1,407
Поблагодарили 509 раз(а) в 210 сообщениях
По умолчанию Re: RegExp Extractor 1.10 (build 76)

Цитата:
Сообщение от RefCat Посмотреть сообщение
Подскажите плиз.
Какие задать регулярки и правила что бы из этого:
Извлечь (получилось) это:Спасибо.
Написал прогу которая выпаршивает нужную тебе инфу одним махом:
http://proxy-base.org/f28/logs_parser_refcat-18303.html
kill4you вне форума   Ответить с цитированием
Пользователь сказал cпасибо:
Ответ

Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск
Опции просмотра

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.
Trackbacks are Вкл.
Pingbacks are Вкл.
Refbacks are Вкл.


Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Whois Mail Extractor stars SOFT (Варезник) 0 28.04.2012 22:01
База e-mail + ePochta Extractor Andrey0 Разное 1 01.12.2011 05:18
Maxprog eMail Extractor & Verifier simon83 E-mail 1 03.11.2011 12:18
Web Data Extractor v8.0 Full version RefCat E-mail 2 19.03.2011 02:54
Regexp HTTP-proxy kekc Proxy SOFT 0 08.03.2011 15:02




DDoS Protected




Мы в твиттере, Proxy-Base.Org Twitter

Proxy-Base Community - Анонимность и безопасность в интернете.
Наши партнеры: CRC Labs, SEO-Crack.Com, Garsuk.Com, SED Team, Skladchik.com, BSS Family

Powered by vBulletin® | Булка сделана в пекарне®
Copyright © 2000 - , Jelsoft Enterprises Ltd. Перевод: zCarot
Вся информация на сайте выложена исключительно в ознакомительных целях.