Форум
» Назад на решение задач по физике и термеху
Регистрация | Профиль | Войти | Забытый пароль | Присутствующие | Справка | Поиск

» Добро пожаловать, Гость: Войти | Регистрация
    Форум
    Физика
        Бесплатные электронные книги по физике
Отметить все сообщения как прочитанные   [ Помощь ]
» Добро пожаловать на форум "Физика" «

Переход к теме
<< Назад Вперед >>
Несколько страниц [ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 ]
Модераторы: duplex, Roman Osipov, gvk
  

Guest



Новичок

--Для этого нужна open-source программа распознования, понимающая русский текст


да, и ее надо писать, или я плохо ищу в сети?
А над этим нужен search engine, который будет по текстам всех книг искать нужные слова. Желательно с богатым синтаксисом.


--Есть еще вариант - общедоступный сисок книг, но доступ к самим файлам можно получить, оказав какую-нибудь помощь в расширении библиотеки, например отсканировав отсутствующую в ней книгу.

Да, такие схемы работают, какое-то время.


--neofit
(пароль что-то пока не пришел)

Всего сообщений: Нет | Присоединился: Never | Отправлено: 16 нояб. 2003 4:39 | IP
VF



Administrator

Guest

--Для этого нужна open-source программа распознования, понимающая русский текст

да, и ее надо писать, или я плохо ищу в сети?


Действительно, таких программ нет. И учитывая их сложность вряд ли стоит ожидать в ближайшее время open-source программу, понимающую руский язык. Правда это не слишком большое препятствие. Пусть часть ПО будет закрытая или даже коммерческая. Есть движок FineReader под Linux, но на сколько ему далеко до рабочей программы и сколько он стоит (есть информация, что 9K $) остается под вопросом... Интересно, версия под Windows позваляет запускать распознование из командной строки и настраивать опции сохранения?

А над этим нужен search engine, который будет по текстам всех книг искать нужные слова. Желательно с богатым синтаксисом.

С этим проблем нет. Можно использовать shareware-версию Яndex.Server Standard. Поиск на сайте неплохо работает даже при использовании формы, посылающей запрос к серверу Яндекса (такие формы для поиска стоят на http://exir.ru/books.htm).

В Яндексе есть и платные решения для поиска по CD.

Да, такие схемы работают, какое-то время

А что потом происходит?

Общий вид системы (оптимистичный ): пользователь закачивает книгу на сервер, она автоматически распознается и полученный текст в виде одна страница - один HTML-файл выкладывается на сайт с надписью, что это автоматический OCR и информацией о том, как получить оригинал. Локальный поисковый движек все периодически индексирует и в результате можно найти нужную книгу с точностью до страницы. Сайт индексируют и глобальные поисковики, что дает приток новых пользователей. Учитывая общий объем выложенных текстов число посетителей из поисковиков будет значительным.

Но делать это нужно только на легальной основе. На переговоры с авторами и издателями уйдет много времени. Какие книги можно легально распространять без получения согласия правообладателей? Те, которые написаны более 50 лет назад?

Всего сообщений: 3109 | Присоединился: май 2002 | Отправлено: 16 нояб. 2003 14:12 | IP
castleofmusic


Удален

изданные в СССР и в Европе книги можно распространять, если автор уже 50 лет как умер, или если издано 75 лет назад. Изданные в США книги можно распространять, если они изданы до 1923 года (из-за микки мауса, который был создан в 1927 году, копирайт в США может никогда больше не истекать, пока жива фирма Walt Disney Inc. - Бойкотируйте её!)
Также можно распространять книги, издаваемые по свободным лиценциям GDL (GNU documentation license), OPL (open publication license) и т.п.

Всего сообщений: N/A | Присоединился: N/A | Отправлено: 16 нояб. 2003 14:52 | IP
neofit


Удален

как временное решение подойдет готовый движок (если позволяет написать вокруг себя скрипты) и яндекс искалка.

На длительную перспективу нужна легальная библиотека с открытым доступом (типа Гутеберга: http://promo.net/pg/)  которая будет ядром (полезность такой библиотеки конечно резко ограничена, некоторых областей просто не было 75 лет назад). Это позволит написать opensource OCR для кириллицы и поиск, для удобства всех желающих (комерческий OCR распространять нельзя, равно как и менять что-либо в коде яндекса).  Вокруг библиотеки будет форум для обмена нужными книгами.  Скачав движок, каждый сможет усторить домашную библиотеку по своему усмотрению.  

Идея, которую вы описали с индексированием всей библиотеки очень хорошая, но копирайт не даст ее осуществить на практике для комерческих книг.

Кстати, можно пытаться выкладывать книги найденые в свободном доступе на интернете (например на сайтах авторов), с условием, что они будут сняты по первому требованию владельцев копирайта (принцип библиотеки Мошкова).

P.S. В идеале еще неплохо было бы иметь гипертекстовую  структуру над всей библиотекой (типа такой: http://mathworld.wolfram.com/topics/Algebra.html)

(Сообщение отредактировал neofit 17 нояб. 2003 4:28)

Всего сообщений: N/A | Присоединился: N/A | Отправлено: 17 нояб. 2003 3:26 | IP
tot ra


Удален

Andrei G
впринципе я пока занимаюсь составлением каталога, поиска по нему и наполнением.. сам я пока только две книги собственноручно отсканировал и выложил.. это Гмурман "Мат. Статистика" и Гивоне "Микропроцессоры", остальное из сети достаю и сортирую... но поискать - поищу, если найду - выложу.

насчёт OCR всей библиотеки то я крайне сомневаюсь что это рационально - в обыкновенных городских библиотеках подобного нет, правда там и представить такого невозможно, а поисковик наврядли будет индексировать с тысячу файлов по несколько мегабайт, а если и будет, то в относительном поиске имеет значение длина фразы относительно размера файла.. скажем файл с одной только надписью "мама" имеет больший приоритет чем с перечислением всей семьи... это я образно.. да и занимать эти файлы будут много.. или я чего то непонял.

(Сообщение отредактировал tot ra 17 нояб. 2003 3:42)

Всего сообщений: N/A | Присоединился: N/A | Отправлено: 17 нояб. 2003 3:37 | IP
botholph


Удален

А вот на ру-боард есть спец. топик как раз по каталогизации - загляните!

http://www.forum.ru-board.com/topic.cgi?forum=5&topic=10085#1

Всего сообщений: N/A | Присоединился: N/A | Отправлено: 17 нояб. 2003 6:58 | IP
botholph


Удален


Цитата: gvk написал 15 нояб. 2003 21:42

Кажется, я, кажется брал в Корнелле - посмотрю дома в чем проблема - то ли у меня в файле, то ли где при переработках...
.......
Нет, оказывается - это вообще неизвестно откуда книга - я не нашел даже следов или библ. описания - пожалуйста, скажите, где ее посмотреть.



Эта часть книги лежит на djvuzone: 031008124812.djvu
По ссылкам  на другие, вероятно напечатана после 1915, но хотелось бы знать ее название  т.к. написана она весьма неплохо (правда некоторые куски он заимствовал у J. Page или у самого S. Lie).

Да не иссякнет бдительность (!) of castleofmusic, с которой тщательно фильтруется djvuzone (:-).



Вскрытие показало - это статья

Dickson, L. E.
Differential equations from the group stand-point. Annals of Math. (2) 25, 287-378 (1924). Published: 1924

Это легко найти с помощью прекрасной службы
http://www.emis.de/MATH/JFM/JFM.html
- это переведенный в общедоступный HTML-вид старинный реф. журнал Jahrbuch ueber die Fortschritte der Mathematik (охват 1866-1940 примерно - т.е то, что Math. Reviews не имеет)

А саму статью кто-то, имеющий доступ к коммерческому архиву JSTOR (www.jsor.org) выложил, обрезав титульный лист - побоялся ответсвтености...
В JSTOR - кто не знает есть отсканированные амер. и не только журналы аж с момента их основания (19 век...)


Всего сообщений: N/A | Присоединился: N/A | Отправлено: 17 нояб. 2003 7:14 | IP
neofit


Удален

botholph

Спасибо

tot ra

Е-библиотека без поиска, это как интернет без google, по-моему. В методах поиска и ранкования информации за последние 5 лет произошла революция.

Всего сообщений: N/A | Присоединился: N/A | Отправлено: 17 нояб. 2003 12:28 | IP
Guest



Новичок

Посоветуйте пожалуйста подборку по теории категорий и функторов кроме Букур и Деляну

Всего сообщений: Нет | Присоединился: Never | Отправлено: 17 нояб. 2003 13:48 | IP
Andrei G


Удален

П. Koн Универсальная  Алгебра
Шафаревич Основные понятия алгебры
Курош введение в высшую алгебру



(Сообщение отредактировал Andrei G 17 нояб. 2003 16:12)

Всего сообщений: N/A | Присоединился: N/A | Отправлено: 17 нояб. 2003 14:10 | IP

Эта тема закрыта, новые ответы не принимаются

Переход к теме
<< Назад Вперед >>
Несколько страниц [ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 ]

Форум работает на скрипте © Ikonboard.com