Пересборка FB2

Аватар пользователя larin

Теперь при скачивании fb2 он пересобирается с учётом всех изменений в базе.
Если исходный файл битый и пересобрать не удалось, то отдаётся как было.
На страничке редактирования книги добавил скачивание оригинального файла.

Аватар пользователя s_Sergius

Полезная штука.
Но есть нюанс, например, в книге Маша и медведь. Снегурочка обе кнопочки (скачать) и (оригинал FB2) выдают исходную версию fb2, а в книге Сказки. Руслан и Людмила опять же обе (скачать) и (оригинал FB2) выдают пересобранную.

Аватар пользователя Антонина82

А я проверила вот на этой книжке
Там и с названием и с обложкой были корявости. Переводчик не был указан. Обложка была прикреплена от другого издания.
Новый фб2 скачался в исправленными данными. Эта книжка часть сборника

Аватар пользователя s_Sergius

Антонина82 написал:
Новый фб2 скачался в исправленными данными.

А попробуйте нажать (оригинал FB2) и сравнить результаты. У меня получается одно и тоже, а должно-то быть разное, по идее.
Аватар пользователя Антонина82

У меня тоже одинаковый вариант получился.

Аватар пользователя larin

Кэши недопрочистились.
Скоро пройдёт.
Надеюсь.

Аватар пользователя Антонина82

Отличная новость!

Антонина82 написал:
Отличная новость!

Не вижу ничего отличного. Узаконенный вандализм.
Весь дескрипшен файла перелопачен.
Например: в блоке [src-title-info] перезаписывает оригинальные данные об авторе на русскоязычные, стирает жанр...
Да много чего...
Аватар пользователя ProstoTac

Это всего-навсего недоделки здравой идеи.

Хорошо что увели Пересборку FB2 с основной страницы книги. Большинству это не надо.
Возможно что-бы файлы в которых есть различия между (fb2-info) и базой выводились списком в "библиотека - недоделанное".
И по запросу сравнивались и перезаливадись через подтверждение.

Аватар пользователя larin

Lyka написал:
Возможно что-бы файлы в которых есть различия между (fb2-info) и базой выводились списком в "библиотека - недоделанное".
И по запросу сравнивались и перезаливадись через подтверждение.

Зачем?
Скачивается всегда самый свежий вариант, соответствующий страничке книги.
Зачем плодить дубли?

Т.е. пересобранные FB2 только выдаются с сайта, а в Daily идут исходные?

Аватар пользователя s_Sergius

Обнаружилась пара недочетов при пересборке:

1. Обложки.
Кроме оригинальной, в fb2 дополнительно cохраняется урезанная (200x314) версия обложки. Лишнее это, наверное.

2. Аннотации.
Вся аннотация сохраняется в один абзац, разбитый html-ными тегами <br/>.
В результате и валидатор ругается, и многоабзацная аннотация сливается в одну кучу.
Пример: Петру Великому покорствует Персида

Аватар пользователя s_Sergius

Up.

Все, конечно, отлично. Но валидаторы сайта и FBE при заливке ругается на добавленные жанры, на поля типа домашней страницы автора, или его е-мэйла. Добавляется в файл урезанная обложка, на которую при перезаливке и валидатор сайта ругается. Про свистопляску с аннотацией я уж не говорю, но еще, видимо, трется информация в custom-info...
И, может это и не связано, но что-то последнее время у меня дикие проблемы с объединением дублей. Пробовал на разных браузерах, разных системах, разных машинах.

Аватар пользователя Антонина82

alexk написал:

И, может это и не связано, но что-то последнее время у меня дикие проблемы с объединением дублей. Пробовал на разных браузерах, разных системах, разных машинах.

Проблемка есть, но назвать ее часто встречающейся, я бы не стала. Логику, почему робот не хочет объединять отдельные произведения, я не поняла.

ммм, 3 к 2 примерно. Неуспешные к успешным
Причем бывает, что через пару дней объединить удается, а один файлик я две недели ежедневно пытался объединить...

Аватар пользователя ProstoTac

" дикие проблемы с объединением дублей" - какого рода проблемы?

все очень просто - нажал "объединить", ввел в окошке ID, дальше браузер вроде как трудится, потом ожидает, потом выдаем мне абсолютно пустую страницу с адресом типа "lib.rus.ec/b/645085/join/645071"
Всё. Повторные попытки дают аналогичный результат.

Аватар пользователя ProstoTac

Хм-м-м. Я как-то с таким не встречался - всегда объединял со страницы "Исправить". Хотя на той странице (автора) какой-то глюк.

Глюка не вижу. Хотя у меня частые глюки изза всеразличных проксей-впнов.
Да собсно не важен этот конкретный случай, у меня висит минимум три, которых я сам правил, да еще до кучи просто замеченные дубли.

alexk написал:
Все, конечно, отлично. Но валидаторы сайта и FBE при заливке ругается на добавленные жанры, на поля типа домашней страницы автора, или его е-мэйла.

FBE ругается на прозвище автора, его почту, добавленный жанр еще при сохранении файла

В скачанных файлах полностью отсутствует раздел document-info.

Аватар пользователя s_Sergius

s_Sergius написал:
Обнаружилась пара недочетов при пересборке:

1. Обложки.
Кроме оригинальной, в fb2 дополнительно cохраняется урезанная (200x314) версия обложки. Лишнее это, наверное.

2. Аннотации.
Вся аннотация сохраняется в один абзац, разбитый html-ными тегами <br/>.
В результате и валидатор ругается, и многоабзацная аннотация сливается в одну кучу.
Пример: Петру Великому покорствует Персида

Просьба таки исправить непотребство!

Аватар пользователя Drunkenmunky

s_Sergius написал:
Просьба таки исправить непотребство!

Кстати, да!
Пару недель назад, чисто для "потестить новую функцию" вот сюда - http://lib.rus.ec/b/442002
заменил обложку, добавил авторов.
И ничего.
Аватар пользователя Foggycat

Чисто потестить http://fb4.online/b/442002 заменил обложку, уточнил названия глав и убрал несуществующую аннотацию (сравнить с этим http://fb4.online/b/426339)
а когда загрузил "заменить" её, во-первых, выбросило сюда где я её нашёл, но старую , а новой нет...я с этим роботом не на равных...роботы человечество уже одолели...Хи )))
Чуть удалось подправить вручную...
PS. .. в принципе, мог помочь подправлять книги на досуге, но с такой загрузкой опускаются руки... и хвост...уж лучше дразнить местных котов)))

Аватар пользователя PrePress

s_Sergius написал:
s_Sergius написал:
Обнаружилась пара недочетов при пересборке:

1. Обложки.
Кроме оригинальной, в fb2 дополнительно cохраняется урезанная (200x314) версия обложки. Лишнее это, наверное.

2. Аннотации.
Вся аннотация сохраняется в один абзац, разбитый html-ными тегами <br/>.
В результате и валидатор ругается, и многоабзацная аннотация сливается в одну кучу.
Пример: Петру Великому покорствует Персида

Просьба таки исправить непотребство!

Поддерживаю!

Блин, реально задолбало добавление уменьшенной копии обложки в файл. Тут наткнулся на книгу, где этих копии уже две, что ж будет после пятого редактирования? Умоляю, поправьте этот ужас.

Наблюдается странная проблема - возможно, пересборки.
Вот есть книжка http://lib.rus.ec/b/137274, у нее в fb2-info на странице описан внятный document-info, в нем и авторы дока, и версия 1.1, и хистори.
А в скачанном файле Zhelyaznyi_Pyatiknizhie_Korvina_1.Devyat_printsev_Ambera.137274.fb2.zip раздел document-info отсутствует.
Можно ли это починить? Или это проблема данного конкретного файла, он какой-то плохой?
Спасибо.

mpotanin написал:
Наблюдается странная проблема - возможно, пересборки.
Вот есть книжка http://lib.rus.ec/b/137274, у нее в fb2-info на странице описан внятный document-info, в нем и авторы дока, и версия 1.1, и хистори.
А в скачанном файле Zhelyaznyi_Pyatiknizhie_Korvina_1.Devyat_printsev_Ambera.137274.fb2.zip раздел document-info отсутствует.
Можно ли это починить? Или это проблема данного конкретного файла, он какой-то плохой?
Спасибо.
Это не проблема этого конкретного файла, это со всеми скачиваниями так.
Если хочешь, чтобы эта информация присутствовала, то Исправить/Скачать оригинал. На Флибусте точно так же. Но будь готов, что аннотация и возможно ФИО автора будут не правильные, а взятые из файла, а не из Либрусека. И обложка тоже будет оригинальная или НЕ будет вовсе, если в исходном файле её не было.
Собственно, обложки Либрусек портит. Я вот сделал книжку, обложка была нормальная в png, Либрусек её перевёл в jpg и получилась говённая обложка.
Аватар пользователя tvnic

Цитата:
Просьба таки исправить непотребство!

На хер она нужна, эта пересборка! Объясните, какие у нее плюсы?
Пока вижу минусы - наполовину урезанный дескрипшен, на странице книги отображается не обложка, а картинка из файла (если она в конкретном файле есть, видимо).
------------
Хотя есть и плюс - не надо корячиться с дескрипшеном. Автор, название, серия, год и хватит.
------------
Мне кажется, на странице книги лучше оставлять кнопку скачивания на оригинал (ну и его замену), а пересборку где-то еще. И информация об этом должна быть для всех.
Аватар пользователя lokiiii

tvnic написал:
Цитата:
Просьба таки исправить непотребство!

На хер она нужна, эта пересборка! Объясните, какие у нее плюсы?
Пока вижу минусы - наполовину урезанный дескрипшен, на странице книги отображается не обложка, а картинка из файла (если она в конкретном файле есть, видимо).
------------
Хотя есть и плюс - не надо корячиться с дескрипшеном. Автор, название, серия, год и хватит.
------------
Мне кажется, на странице книги лучше оставлять кнопку скачивания на оригинал (ну и его замену), а пересборку где-то еще. И информация об этом должна быть для всех.

Присоединяюсь, задолбался уже через /orig скачивать, неудобно, но всё равно проще чем постоянно br/ и мини cover фиксить.
Аватар пользователя V_E

  • Долго не обращал внимания, на эту ветку, но жизнь заставила с нею ознакомиться. Теперь хочу понять, с целью определения перспектив дальнейшей работы: 1. Верно ли, что при скачивании файла (если скачивается не оригинал) в нем убирается информация о версии файла, авторе файла (не книги) и другая информация? 2. Как скачивать оригиналы нескольких книг одновременно? 3. В чем был смысл введения пересборки?

    3. Ну во-первых это красиво))))
    Просто корректно не получилось. А получилось некорректно. Но либо главным тут результат нравится, либо не могут поправить, либо лень.
    Вот мы и боремся - с некорректной пересборкой.... Меня еще крайне бесит, то что сменилась система именования файлов - эта дурацкая точка в непонятном месте...
    Что самое интересное, до этого был такой же косяк с дробной частью номера в серии. Его пофиксили. Хотя на первый вопрос - "Зачем?" был послан в грубой форме))) Видимо еще кому-то мешало. Ждем-с...
    Не хочу сбегать на флибу, у меня и нумерация в библиотеке здешняя, и интерфейс тут удобнее. Но задумываюсь.

    Аватар пользователя V_E

    alexk написал:
    3. Ну во-первых это красиво))))

    — Почему ваше орудие не стреляло?
    — Было двадцать причин: во-первых, не было пороха...
    — Все, дальше можно не продолжать!
    Аватар пользователя ProstoTac

    Из всех библиотек на введение возможности ковыряния/редактирования дескриптора on-line первым решился только либрусек (Ларин). И возможность последующей скачки файла с учетом все изменений в базе данных - пересборки. Хотя необходимость такой фичи обсуждалась неоднократно, учитывались и трудности/проблемы такой возможности. Я думаю, что со временем Ларин отладит все нескладухи.
    Учитывая, что масса файлов с ошибками в дескрипторе заливается как есть, без предварительной правки, возможности редактирования дескриптора on-line представляется действительно нужной.

    Аватар пользователя V_E

    ProstoTac написал:
    Учитывая, что масса файлов с ошибками в дескрипторе заливается как есть, без предварительной правки, возможности редактирования дескриптора on-line представляется действительно нужной.

    Можно поподробнее?
    Хоть, какие-то серьезные аргументы есть? В чем сакральный смысл? Все было ясно: скачал, посмотрел версию, прочел, поправил, изменил версию, сохранил. Залил. По номеру серии можно было прикинуть ожидаемое качество книги. А теперь как? Но ведь "раз звезды зажигают, значит — кому-то это нужно". Хотя столько лет без этого обходились. Неужели край подошел? Или это рассуждения в духе Е. Гайдара начала 90-х гг.: "Такого требование прогресса. И наплевать, что вы все сдохните" (цитата не точна, передаю смысл). Вполне готов принять упреки в неспособности понять высокие материи, но, опять: «Зачем?» И ответы на поставленные вопросы хотел бы услышать: про удаление версий, скачивание нескольких оригиналов.

    Я за ручную корректировку. С автоматической переделкой FB2 каждый раз при скачивании каждым пользователем библиотеки создается файл со своим ID. Поэтому и дальнейшее хождение в Сети будет тучи файлов, которые автоматически проверить на дубли нельзя. Тот-же хэш файлов будет разный.
    Как вариант вешать на файл метку (по примеру Вики) - изменение базы по файлу было столько-то дней назад. Или FB2-info соответствует базе.

    Аватар пользователя ProstoTac

    Версия не должна меняться - корректируется только сам дескриптор! Следовательно, существуют (в теории) два файла - оригинальный залитый и пересобранный с учетом всех последних изменений (касающихся только дескриптора) в БД. Следовательно, никаких "прикинуть ожидаемое качество книги" не ожидается.
    «Зачем?» - повторяю - масса файлов с ошибками в дескрипторе заливается как есть, без предварительной правки, иногда вообще с "голым" дескриптором. Потом работа ручками над именем-отчеством автора, серией, переводчиками, названием оригинального издания, жанрами, обложками и проч. и проч. совместно с (при случае) редактированием тела (боди) файла.
    Так я себе думаю, что должно быть по логике.
    "...поправил, изменил версию, сохранил. Залил." - а дескриптор тоже поправили? А все доступные издательские данные учтены при этом? Вот именно...
    Дескриптор - своеобразный аналог бумажной карточки в бумажной библиотеке. А поскольку у либрусека большие претензии именоваться именно библиотекой, то дескриптор... Читаем сначала.

    Аватар пользователя tvnic

    larin написал:
    Теперь при скачивании fb2 он пересобирается с учётом всех изменений в базе.
    Если исходный файл битый и пересобрать не удалось, то отдаётся как было.
    На страничке редактирования книги добавил скачивание оригинального файла.

    Все больше запутываешься в этих изменениях.
    Какие изменения в базе учитываются в пересборке?
    Оригинальный файл - это какой? Залитый первым или последний - с версией выше и всяческими исправлениями и изменениями в нем заливальщиком?
    Аватар пользователя ProstoTac

    Какие изменения в базе учитываются в пересборке? - Все зафиксированные, касающиеся дескриптора и только дескриптрора.
    Оригинальный файл - это какой? - Это действительно залитый первым. Любой другой "с версией выше и всяческими исправлениями и изменениями в нем заливальщиком" будет иметь другой 6-ти значный либрусековский номер и, следовательно, является уже другим оригинальным файлом.
    Сейчас при скачке оригинальны и пересобраный файл имеют одинаковый 6-ти значный либрусековский номер.

    Аватар пользователя tvnic

    Если это так, то:
    Можно ли считать, что в пересборке данные (т.е. изменения в базе) более верные, чем в каком-либо файле "с версией выше"? Не факт.
    Есть книги, у которых более 3-х версий с изменениями. И не столько в дескрипшене, сколько в самом тексте. Получается, что пересборка отсекает их - качай оригинал или пересобранный файл с исправленным, но покоцанным дескрипшеном.
    Да, другие оригинальные файлы доступны, но какой тогда смысл в пересборке, если исправления в тексте она не учитывает?

    Не так. При скачивании исправленного качается файл с именем типа Valerev.Novyiy_mir_Ivana_Malyarenko.210526.fb2, при скачивании оригинала - 210526.fb2
    И зачем-то запихивается информация типа 210526 и инвентарный номер автора в правленый файл.

    Аватар пользователя tvnic

    Сейчас тоже сравнил варианты у http://www.lib.rus.ec/b/668658
    Книга почти только что залита, вроде в базе никто ничего не правил, но пересборка готова. Со скомканной аннотацией.
    Из плюсов - в дескрипшене ничего не пропало.

    Аватар пользователя V_E

    М-да, дело плохо, прочел все, но мало что понял. Ладно, остался последний вопрос: можно ли скачать несколько исходных файлов одним архивом? Или нужно качать каждый по отдельности? И еще: эта... скажем так - новация существует только на либрусеке? или на флибусте тоже? В смысле - откуда лучше книги брать и куда заливать? Потому как если действительно при пересборке меняется обложка, режется аннотация и происходят прочие описанные здесь вещи, так стоит ли стараться и добросовестно делать книгу "ручками"? Абы как распознал, собрал и выложил. Все равно пересоберут? Или опять я что-то не так понял?

    Аватар пользователя tvnic

    Оцениваю эту "новацию" тоже с точки зрения тщательной подготовки книги. Часть усилий пересборка элементарно может похерить.
    Хотелось бы узнать точную схему работы этого новшества - что и на каком этапе теряется.

    Аватар пользователя V_E

    tvnic написал:
    Хотелось бы узнать точную схему работы этого новшества - что и на каком этапе теряется.

    Поддерживаю! Неплохо бы, как у Робинзона Крузо: слева "худо", справа "хорошо". И еще вопрос: а со стилями что-нибудь при пересборке происходит? Пока ощуение такое: это.. мероприятие "или как бы сказать.. операция" (Операция "Ы" и другие приключения Шурика) полезно для халтурщиков, заливающих книги как попало. Теперь ломаю голову - есть ли смысл продолжать правку и вычитку скаченных книг? Поди все труды пропадут... Тем более номер версии теперь не показатель... Или снова ошибся?
    Аватар пользователя tvnic

    V_E написал:
    tvnic написал:
    Хотелось бы узнать точную схему работы этого новшества - что и на каком этапе теряется.

    есть ли смысл продолжать правку и вычитку скаченных книг? Поди все труды пропадут... Тем более номер версии теперь не показатель...

    1. залита книга. Например, 7 лет назад. Есть ошибки в тексте. Версия 1.0
    2. кто-то исправил ошибки и, например, прописал серию. Версия 1.1
    3. спустя время онлайн добавили аннотацию. Версия не изменилась.
    ------------
    Оригиналом будет какой вариант?
    Что будет в пересборке? И все ли изменения будут в ней присутствовать?

    Понятное дело, оригиналом будет последняя залитая версия. Именно та, которой изначально был присвоен номер. По идее, ничего теряться не должно. Только если заменяете, например, родную аннотацию онлайновой, выскочат хтмл-тэги и тд. На практике периодически уходит документ-инфо и что-то еще, читайте ветку, народ жалуется на конкретные вещи.

    Аватар пользователя ProstoTac

    Не цепляйтесь к версии. Основной файл и ориг существуют в паре с одинаковым 6-тизначным номером (именно к этому номеру надо цепляться) файла в библиотеке - и там и там одинаковая версия.
    Допустим, в наличии версии v1.0 и v1.1 (бывает такое), то и там и там свой оригинал наряду с основным есть. Даже независимо от удаленных/объединенных, во всех этих файлах остаются свой оригфайл. И над каким файлом Вы поиздевались/внесли изменения. Какой файл Вы поредактировали, прилепили аннотацию (Вы же не уточнили, к какой версии Вы приписали анно), - там будут Ваши актуальные изменения. Ибо редактируется конкретный файл с конкретным 6-тизначным номером, а не какая-то конкретная версия. Другое дело, смысл в существовании при удаленных файлах своих оригов - это дело/забота Ларина...
    Я так это понимаю...
    Существующие проблемы с непрописыванием/неучетом/исчезновением данных из БД в файл - думаю временные, как и многие другие, нескладухи...
    upd. С пятого раза написал внятно...

    X