Книгомания - парсер Инфанаты.

Дата: Март 12, 2009 - 6:49 дп

В предыдущем посте я озвучил проблему описания большого количества книг. Как один из путей повышения скорости описания я вскольз упоминул о возможности выдрать описания с какой либо онлайновской библиотеки, например, инфанаты. Что-ж, сказано - приступил к реализации.

Нам поможет знание php и mysql (можно и без нее, но с ней проще).

У меня получилось два скрипта. Первый - находит ссылки на все книжки на инфанате, тупо пролистывая каждую страницу и ищя в ней ссылку определенног оформата. Второй скрипт - выдирает по этим ссылкам описание, картинку и складывает их на диск или в базу (я пока еще не решил)

В данный момент находятся все книжки на инфанате (через несколько часов будет готово, т.к. работает скрипт локально на машине).

Завтра запущю процесс выдирания описания и картинок.

через некоторое время у меня будет уже готовенькая база. :)

ЕЕ я применю как помощник в описании своей коллекции.

После того как я все это проверю и заточю, я буду постоянно отслеживать появление новых книг и аккуратно сохранять информацию о них.

Оставить комментарий

CAPTCHA image