Книгомания - парсер Инфанаты.
В предыдущем посте я озвучил проблему описания большого количества книг. Как один из путей повышения скорости описания я вскольз упоминул о возможности выдрать описания с какой либо онлайновской библиотеки, например, инфанаты. Что-ж, сказано - приступил к реализации.
Нам поможет знание php и mysql (можно и без нее, но с ней проще).
У меня получилось два скрипта. Первый - находит ссылки на все книжки на инфанате, тупо пролистывая каждую страницу и ищя в ней ссылку определенног оформата. Второй скрипт - выдирает по этим ссылкам описание, картинку и складывает их на диск или в базу (я пока еще не решил)
В данный момент находятся все книжки на инфанате (через несколько часов будет готово, т.к. работает скрипт локально на машине).
Завтра запущю процесс выдирания описания и картинок.
через некоторое время у меня будет уже готовенькая база.
ЕЕ я применю как помощник в описании своей коллекции.
После того как я все это проверю и заточю, я буду постоянно отслеживать появление новых книг и аккуратно сохранять информацию о них.