Архив за Июнь 2008

WordPress.com – предлагают работу куль-хацкерам Гы-Гы :)

Июнь 28, 2008

Сидел в общем, недавно, «игрался» HTTP хидерами и параметрами формы сабмита коментов на один из моих постов и решил поснифать трафик через CommView. И в ответах сервера я увидел это:


58 2D 68 61 63 6B 65 : close..X-hacke
27 72 65 20 72 65 61 r: If you’re rea
2C 20 79 6F 75 20 73 ding this, you s
69 74 20 61 75 74 6F hould visit auto
6D 2F 6A 6F 62 73 20 mattic.com/jobs
20 74 6F 20 6A 6F 69 and apply to joi
2C 20 6D 65 6E 74 69 n the fun, menti
65 61 64 65 72 2E 0D on this header..
20 57 65 64 2C 20 31 .Expires: Wed, 1

«Вот така х..йня малята»
Copyright – Дід Панас.

Прикольно! WordPress предлагает работу всем Куль-Хацкерам :-) )))))

У Zango дела плохи

Июнь 21, 2008

Компания Zango, ведущий игрок на рынке Adware, уволила 68 своих сотрудников, при общей численности в ~200 человек. К тому же она изменила свою стратегию и сосредоточила все ресурсы на одном проекте – Platrium. Похоже, что дела у компании идут не очень хорошо. Одно время в адалте компанию Zango обвиняли в краже сайнов у вэбмастеров. На самом деле воровали сайны не Zango, а ее клиенты-рекламодатели. Они покупали «ключевые слова» при появлении которых в браузере пользователя (в строке адреса сайта или в тексте загруженной страницы) происходила подмена на «ключевые слова» рекламодателей. Причем «ключевыми словами» рекламодателей могли быть как URL адреса так куски текста. Какой-то умник догадался, что таким образом можно подменять чужие реферальные ссылки на свои. В результате у адалт бизнеса было украдено несколько миллионов долларов. В общем-то это копейки, но вэбмастера вонь подняли на весь Интернет. И начались наезды на Zango, потому как она являлась главным инструментом в руках нечистоплотных рекламодателей.

Легко ли добыть адреса e-mail?

Июнь 14, 2008

Решил недавно поставить эксперимент, который ответил бы на мой вопрос – легко ли заполучить в свои руки приватную СПАМ-базу, использую только свои мозги? :)

Первый шаг – создать URL список из сайтов, главные страницы которых будем парсить на предмет присутствия e-mail.

Второй шаг – скачать главные страницы 1000 сайтов.

Третий шаг – отпарсить эти страницы на предмет присутствия e-mail.

В качестве инструментов я написал несколько программ:

  1. Программа спайдер-парсер, при помощи которой я «вытянул» 1000 URL-ов из одного очень известного украинского портала.
  2. Программа качалка – с ее помощью я скачал все доступные главные страницы со списка «1000 URL-ов».
  3. Программа, при помощи которой я попытался вытянуть из каждой скачаной страницы все доступные e-mail.

И вот каков результат:

Из 1000 главных страниц сайтов моя программа смогла вытянуть 316 уникальных e-mail адреса. И это с учетом того, что я при поиске e-mail адреса на каждой странице ориентировался только на «mailto:» и парсил только одну-единственную страницу сайта. А если бы я парсил каждый сайт вглубь на несколько уровней? Уверен, что тогда бы количество собранных e-mail было бы намного больше.

Общая статистика:

  1. Из 1000 сайтов 22 был в офлайне. 978 были в онлайне.
  2. Минимальный размер одной страницы: 52 Байта (страничка с META-редиректом :)
  3. Максимальный размер одной страницы: 232 КБайта.
  4. Средний размер одной страницы: 33.6 КБайта.
  5. В однопотоковом режиме на скачивание из интернета 1000 страниц ушло 52 минуты и 36 МБайтов трафика (download) при скорости соединения до 400 килобит/сек.

Скорость скачивания каждой страницы очень сильно варьировалась – от 40 до 400 килобит/сек. Очевидно сказывалась удаленность соответствующего сайта, загруженность хостинга и т.д. Из-за того, что страницы скачивались в один поток, не было возможности утилизировать свой Интернет-канал на 100%.

Как все оказывается легко. Будем думать дальше:)))