Список форумов www.ice-graphics.com www.ice-graphics.com
Форум ICE-Graphics
 
 FAQFAQ   ПоискПоиск   ПользователиПользователи   ГруппыГруппы   РегистрацияРегистрация 
 ПрофильПрофиль   Войти и проверить личные сообщенияВойти и проверить личные сообщения   ВходВход 

Как IceBook Reader определяет имя автора и название книги?

 
Начать новую тему   Ответить на тему    Список форумов www.ice-graphics.com -> Ошибки и проблемы
Предыдущая тема :: Следующая тема  
Автор Сообщение
Bowman



Зарегистрирован: 07.11.2003
Сообщения: 6

СообщениеДобавлено: Чт Ноя 13, 2003 10:03 am    Заголовок сообщения: Как IceBook Reader определяет имя автора и название книги? Ответить с цитатой

Не секрет, что книги получаем из разных источников с различным форматированием, бОльшая часть книг в текстовом формате (по крайней мере у меня и во многих онлайновых библиотеках). К большому сожалению IceBook Reader далеко не всегда определяет корректно имя автора и название книги-что делать, сколько людей-столько и форматов. Подскажите, плз, как IceBook Reader определяет имя автора и название книги? Зная этот алгоритм, появится возможность хранить книгу в своей библиотеке в понятном для IceBook Reader формате. Rolling Eyes
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
ICE Graphics
Site Admin


Зарегистрирован: 26.01.2003
Сообщения: 2752

СообщениеДобавлено: Чт Ноя 13, 2003 2:22 pm    Заголовок сообщения: Re: Как IceBook Reader определяет имя автора и название книг Ответить с цитатой

Bowman писал(а):
Не секрет, что книги получаем из разных источников с различным форматированием, бОльшая часть книг в текстовом формате (по крайней мере у меня и во многих онлайновых библиотеках). К большому сожалению IceBook Reader далеко не всегда определяет корректно имя автора и название книги-что делать, сколько людей-столько и форматов. Подскажите, плз, как IceBook Reader определяет имя автора и название книги?


Мне просто интересно, и чаcто ICE Reader ошибался ?

Так вот, автомат определяющий автора на то и создавался, чтобы определять автора и название практически при любом форматировании. Понятно, что это задача сама по себе труднорешаемая. Поэтому пришлось заложить некоторые упрощения. Главный критерий, чтобы было несколько книг одного автора.

Bowman писал(а):
Зная этот алгоритм, появится возможность хранить книгу в своей библиотеке в понятном для IceBook Reader формате. Rolling Eyes


А нет смысла его обнародовать. Так как с переделкой бибилиотеки этот алгоритм будет меняться.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Bowman



Зарегистрирован: 07.11.2003
Сообщения: 6

СообщениеДобавлено: Чт Ноя 13, 2003 2:32 pm    Заголовок сообщения: Re: Как IceBook Reader определяет имя автора и название книг Ответить с цитатой

ICE Graphics писал(а):

Мне просто интересно, и чаcто ICE Reader ошибался ?

К чести ICE Reader-а, ошибается он не часто, но бывает, что несколько книг одного автора записываются, например, как "Пупкин Вася" и как "Вася Пупкин". Соответственно, приходится ручками "выравнивать".

ICE Graphics писал(а):

А нет смысла его обнародовать. Так как с переделкой бибилиотеки этот алгоритм будет меняться.

Может хотя бы добавить в алгоритм какое-нибудь НЕпеределываемое правило? Например, если первая строка файла начинается с "author:", то за этим словом однозначно следует "автор" и через дефис "название" книги
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
ICE Graphics
Site Admin


Зарегистрирован: 26.01.2003
Сообщения: 2752

СообщениеДобавлено: Чт Ноя 13, 2003 2:51 pm    Заголовок сообщения: Re: Как IceBook Reader определяет имя автора и название книг Ответить с цитатой

Bowman писал(а):
ICE Graphics писал(а):

Мне просто интересно, и чаcто ICE Reader ошибался ?

К чести ICE Reader-а, ошибается он не часто, но бывает, что несколько книг одного автора записываются, например, как "Пупкин Вася" и как "Вася Пупкин". Соответственно, приходится ручками "выравнивать".

Ну разве это ошибка ? Smile И тут уже никакой автомат не поможет.

Bowman писал(а):
ICE Graphics писал(а):

А нет смысла его обнародовать. Так как с переделкой бибилиотеки этот алгоритм будет меняться.

Может хотя бы добавить в алгоритм какое-нибудь НЕпеределываемое правило? Например, если первая строка файла начинается с "author:", то за этим словом однозначно следует "автор" и через дефис "название" книги

Конечно можно добавить какое-нибудь правило. Но я думаю пока нет смысла про это говорить. А специальный заголовок появится при экспорте. Когда будет добавлен экспорт книг ICE Reader в разные форматы типа TXT, HTML, ... Так вот, этот заголовок можно будет и вручную создавать для любого файла. И тогда автомат не будет включаться, а будет просто брать информацию из него. Формат этого заоловка пока не определён. А значит и давать какие-либо рекомендации пока рано
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
solomax



Зарегистрирован: 07.10.2003
Сообщения: 41

СообщениеДобавлено: Пт Ноя 14, 2003 8:26 am    Заголовок сообщения: на вот таком названии ошибался Ответить с цитатой

ЭРАСТ ФАНДОРИН - 1

Борис АКУНИН
АЗАЗЕЛЬ
конспирологический детектив


автор получается "Борис АКУНИН" (всё ок)
а вот название "ЭРАСТ ФАНДОРИН - 1"
хотя вроде должно быть "АЗАЗЕЛЬ"

но этоврядли баг ...
очень хорошее распознавалово
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
ICE Graphics
Site Admin


Зарегистрирован: 26.01.2003
Сообщения: 2752

СообщениеДобавлено: Пт Ноя 14, 2003 1:08 pm    Заголовок сообщения: Re: на вот таком названии ошибался Ответить с цитатой

solomax писал(а):
ЭРАСТ ФАНДОРИН - 1

Борис АКУНИН
АЗАЗЕЛЬ
конспирологический детектив


автор получается "Борис АКУНИН" (всё ок)
а вот название "ЭРАСТ ФАНДОРИН - 1"
хотя вроде должно быть "АЗАЗЕЛЬ"

но этоврядли баг ...
очень хорошее распознавалово


Чтобы понять насколько трудная задача, советую вручную попробовать понять где название без попытки понять текст. Ну как будто это китайский текст.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Bowman



Зарегистрирован: 07.11.2003
Сообщения: 6

СообщениеДобавлено: Пт Ноя 14, 2003 1:56 pm    Заголовок сообщения: Re: на вот таком названии ошибался Ответить с цитатой

ICE Graphics писал(а):

Чтобы понять насколько трудная задача, советую вручную попробовать понять где название без попытки понять текст. Ну как будто это китайский текст.

Ага, а я что говорил Very Happy !!
Bowman писал(а):

Может хотя бы добавить в алгоритм какое-нибудь НЕпеределываемое правило? Например, если первая строка файла начинается с "author:", то за этим словом однозначно следует "автор" и через дефис "название" книги

А если серьезно, будем ждать появления опции экспорта, чтобы понять как заголовки лепить... Confused Если честно, я и раньше не представлял, что автоматически реально понять где автор, а где название...То, что сделано вызывает только уважение (аплодисменты), но все-таки иногда хочется определенности...
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
ICE Graphics
Site Admin


Зарегистрирован: 26.01.2003
Сообщения: 2752

СообщениеДобавлено: Пт Ноя 14, 2003 2:05 pm    Заголовок сообщения: Re: на вот таком названии ошибался Ответить с цитатой

Bowman писал(а):
А если серьезно, будем ждать появления опции экспорта, чтобы понять как заголовки лепить... Confused Если честно, я и раньше не представлял, что автоматически реально понять где автор, а где название...То, что сделано вызывает только уважение (аплодисменты), но все-таки иногда хочется определенности...


Экспорт будет чуть позже. Сначала нужно сделать одну совершенно ненужную вещь, как многие посчитают, которая сможет раздуть размер дистрибутива раз в 5. И весчь это как всегда не простая. А уж после неё будет экспорт.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Показать сообщения:   
Начать новую тему   Ответить на тему    Список форумов www.ice-graphics.com -> Ошибки и проблемы Часовой пояс: GMT + 3
Страница 1 из 1

 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах


Powered by phpBB © 2001, 2005 phpBB Group