Чистка базы allsubmitter от мертвых ссылок

Пошаговое руководство как вычистить вашу базу allsubmitter’a от мертвых каталогов. Под мертвым я понимаю такой каталог, у которого даже нет главной страницы.

  1. сохранить свой блек лист в файл, чтоб не попортить
  2. экспортировать твою базу в txt
  3. полученный список скормить http://mosk.pijj.ru/get_urls.php (многие базы содержат всякий текстовой мусор)
  4. полученный список прогнать через http://mosk.pijj.ru/get_domains.php (получишь только доменный имена)
  5. сохранить в txt файл и импортировать в сабмиттер в отдельную категорию сняв все галочки в окошке импорта
  6. выделить все в этой категории и жмякнуть ссылочку “определить параметры сайта” количество потоков >40 (при 100 засирает два мегабита на так) и оставив только галочку “ответ сервера”
  7. ждем окончание работы
  8. сортируем результат по колонке “ответ сервера”
  9. все что отличается от 200 удаляем в блек лист
  10. чистим и удаляем эту нашу тестовую категорию (больше не понадобится) и
  11. жмякаем по ссылке “чистка каталогов” и из нашей базы удаляется все что есть в блек листе (т.е. наши не отвечающие сайты)
  12. восстанавливаем блек лист

Скачать скрипты get_domains.php, get_urls.php

P.S. пофиксил мелкий баг

comments | published опубликовано: Jun 10, 06:47 PM