Людмила Александровна З
Администратор
- Православный христианин
НАБЛЮДЕНИЕ о файн-ридере:
В большинстве своем в pdf-файле возможно выделить текст и скопировать его. Если это не получается в Adobe Reader, то возможно открыть файл в интернет-броузере и проверить возможность выделения и копирования текста. В ряде случаев, скопированный текст отображается криво из-за неправильной кодировки. В этом случае можно использовать он-лайн декодер (http://www.artlebedev.ru/tools/decoder/) и после расшифровки уже нормальный текст копировать в word.
НАБЛЮДЕНИЕ ПО НАБОРУ ИВРИТА:
"Текст набирал в онлайн клавиатуре http://www.lexilogos.com/keyboard/hebrew.htm" Если вы набирайте слово как написано в тексте, клавиатура будет набирать его "задом наперед", но при копировании в ворд, все снова встанет как нужно.
ПРОВЕРКА ДРЕВНЕГРЕЧЕСКОГО:
Проверяю написание всех слов в он-лайн словаре древнегреческого http://gurin.tomsknet.ru/alphaonline.html, чтобы правильно написать слово.
ПРО PDF
Если в работе текст УЖЕ содержится в pdf. Распознавать не нужно. Просто открыть в Adobe Acrobat (можно в PDF Reader) - Ctrl+A (выделить все), копировать и вставить в Word.
Дальше нужно избавиться от нежелательных разрывов абзацев.
Потом расставить стили, проверить и все. Иногда ситуация
усложняется обилием сносок, которые нужно сначала вытянуть из сырого текста, потом вставить обратно.
ПЕРЕВОД В НОВУЮ ОРФОГРАФИЮ
Предлагаю всем воспользоваться сайтом:
http://slavenica.com/
В верхнее окно вставляем текст с дореволюционным текстом.
Выбираем в переводчике перевести с Русского-петровское правописание на Русский - новое правописание. Далее подправляем. Надеюсь всем пригодится.
ПРОВЕРКА ГРЕЧЕСКОГО
Нашла для проверки греческих слов вот такой ресурс: http://translate.academic.ru/
Только нужно выбрать язык оригинала и перевода.
Если ошибетесь в букве, сайт предлагает исправленное слово, которое можно скопировать и вставить в качестве правильного.
РАЗДЕЛЕНИЕ ТЕКСТА НА ОТДЕЛЬНЫЕ СТРАНИЦЫ.
Быстрое разделение отсканированного разворота книги на отдельные страницы:
https://igordanyk.ucoz.ru/news/bystroe_ ... -05-12-185
ПРО НАБОР ЦСЯ.
Для церковно-славянского языка можно использовать шрифт Ponomar Unicode TT и виртуальную клавиатуру, предложенную выше. http://ponomar.net/cu_vkeyb.html вот тут http://ponomar.net/ можно скачать раскладку и сам шрифт.
Просим ЦСЯ выделять красным и потом сообщать, что в тексте есть ЦСЯ.
РУССКО-ГРЕЧЕСКИЙ ПЕРЕВОДЧИК
Собственно, хотел поделиться ссылкой на греческо-русский переводчик. http://www.webtran.ru/translate/greek/from-russian/
Так как есть книги, где вставки из Евангелии на греческом ну просто изобилуют на каждой странице. Без их понимания можно потерять смысл повествования и допустить грубую ошибку в наборе.
Однако не зря говорят: век живи – век учись)) Оказывается на azbyka.ru есть греческие Ветхий и Новый завет с подстрочным переводом! https://azbyka.ru/biblia/UBS/index.htm?NT/Jn
И там можно найти все что нужно, уже с нормальным переводом. Поэтому, переводчик особо и не нужен. Хотя… Может кому и пригодится. Переводит достаточно корректно, можно выбрать и другие языки, кроме греческого.
НАБОР ГРЕЧЕСКОГО
Есть ещё такой сервис для набора греческого: http://www.slavonicpro.ru/polytonic.html
НАБОР ИВРИТА:
"Также удобно пользоваться страничкой набора иврита онлаин, где можно составлять возможные комбинации. Правда, я пока не разобрался как копировать набранный текст переводить в ворд, копирование не сохраняет тест в исходом варианте, а мешает буквы слева на право. Если слов не много - можно пока копировать по букве )
https://www.lexilogos.com/keyboard/hebrew.htm "
ПРО ФАЙН-РИДЕР
Сделал для себя небольшое, но весьма приятное открытие в FineReader. Оказывается там есть "Русский (Старая орфография) (со словарной поддержкой). После его подключения, качество распознавания текста значительно выросло.
ПРО УДАРЕНИЯ
Если вам, при работе в Microsoft Word, нужно поставить ударение в слове — после нужной буквы напишите 0300 - нажмите одновременно Alt+X и отпустите. Можно использовать 0301 или 0302 — меняется наклон апострофа.
ОФОРМЛЕНИЕ СНОСОК
При оформлении сносок соблюдается следующая последовательность знаков.
1. Если сноска относится к слову или группе слов внутри предложения, то запятая, точка с запятой, двоеточие ставятся после знака сноски: текст 1, текст 1; текст 1:
2. Если есть знаки вопросительный, восклицательный и многоточие, относящиеся ко всему предложению, то они ставятся перед знаком сноски: текст? 1 текст! 1 текст… 1 .
3. Если сноска относится ко всему предложению и в конце его отсутствуют знаки, указанные в п. 2, то после знака сноски ставится точка: текст 1.
4. Кавычки ставятся перед знаком сноски: «текст» 1 .
5. Сноска, относящаяся к слову или группе слов, заключенных в скобки, ставится перед закрывающей скобкой: (текст 1 ); сноска, относящаяся ко всему предложению, имеющему конечную вставку, ставится после скобки: (текст )1 .
Правила русской орфографии и пунктуации. Полный академический справочник / Под ред. В.В. Лопатина //13. Сочетание знаков препинания, последовательность их расположения; взаимодействие знаков в сложных конструкциях, §160
ПРО РАСПОЗНАВАНИЕ
Наблюдение от одного из помощников:
"В гугл диске функция распознавания доступна совершенно бесплатно.
https://support.google.com/drive/answer ... ktop&hl=ru
Всё работает отлично. Минус один — определяет язык автоматически. В случае моего текста получается местами каша, так как в нем есть и греческий текст и немецкий и английский."
ВАРИАНТ РЕШЕНИЯ ПРОБЛЕМЫ ВЫВОДА КНИГИ ИЗ FINEREADER В WORD
Добрый день всем!
Наконец то разобрался с проблемой сносок. Для себя определил (может и другим поможет кстати) следующий как мне показалось наиболее оптимальный вариант действий, особенно актуальный для больших (более 100-200 страниц) книг:
1. Распознаю в Finereader.
2. Редактирую спорные моменты в той же Finereader, за исключением исправления ЯТЬ, АГО и твердого знака и т.д.
3. По окончанию предыдущих пунктов вывожу в WORD с обязательным выбором режима "простой текст", но с сохранением разделения на страницы. При этом теряются (и это плюс) часто (по статистике) ненужные рамки, которые в WORD приходится многих волонтерам удалять вручную, тратя огромное кол-во времени.
4. После вывода файла, открываю WORD на одном мониторе, Finereader - на втором и занимаюсь сносками следующим образом: т.к. разделение на страницы мы в пункте 3 сохранили, то очень легко определять где какие сноски нужно вставить - вставляю их вручную, нажимая в WORD "вставить сноску" и копируя текст сноски прямо из Finereader. Даже если сносок много, делается это более менее быстро, зато они точно привяжутся к тексту, даже если потом страницы поменяются (а так и происходит обычно при дальнейшем форматировании).
5. Следующим шагом идет оформление текста в WORD: изменения "ЯТЬ", "АГО" и твердый знак, уменьшение свободных строк между страницами (в новых версиях WORD есть специальный инструмент для автоформата и расстановки переносов - очень удобно), и т.д. и т.п.
6. Финальная вычитка получившегося документа и при необходимости сверка с оригиналом (часто как в пункте 4).
Вдруг кому то поможет данный алгоритм?!
--
С уважением,
Михаил.
***
ПРО ЗАГОЛОВКИ. В идеале, чтобы после сканирования делать все обычным текстом
без какого-либо форматирования, а потом уже по сырому раскрашивать
стилями. Заголовки - Заголовок 2 (3 и тп.), подпись к картинке -
Подзаголовок, все остальное - обычный текст, стиль Обычный.
ПРО ФРАГМЕНТЫ С ДРУГИМ РАЗМЕРОМ ШРИФТА
Если у Вас в тексте есть фрагменты, напечатанные другим размером шрифта, чем основной текст, то делаем так:
более мелкий шрифт — выделяем зеленым цветом,
более крупный шрифт — выделяем оранжевым цветом.
Только обязательно сообщите потом в письме, что такие места есть.
КАК МОЖНО АВТОМАТИЧЕСКИ ЗАМЕНЯТЬ ТИРЕ/ДЕФИС МЕЖДУ ЦИФРАМИ НА СРЕДНЕЕ ТИРЕ
Замена тире ТОЛЬКО между ЦИФРАМИ:
1. длинного тире на среднее :
Надо заменить: ([0-9])(^0151)([0-9])
На: \1^0150\3
Обязательно поставить галочку «Подстановочные знаки»
2. дефис на среднее:
Надо заменить: ([0-9])(^0045)([0-9])
На: \1^0150\3
Обязательно поставить галочку «Подстановочные знаки»
Подставляйте коды (маркер) по Вашему желанию и меняйте как хотите)
Коды:
дефис 0045
среднее тире 0150
длинное тире 0151
В большинстве своем в pdf-файле возможно выделить текст и скопировать его. Если это не получается в Adobe Reader, то возможно открыть файл в интернет-броузере и проверить возможность выделения и копирования текста. В ряде случаев, скопированный текст отображается криво из-за неправильной кодировки. В этом случае можно использовать он-лайн декодер (http://www.artlebedev.ru/tools/decoder/) и после расшифровки уже нормальный текст копировать в word.
НАБЛЮДЕНИЕ ПО НАБОРУ ИВРИТА:
"Текст набирал в онлайн клавиатуре http://www.lexilogos.com/keyboard/hebrew.htm" Если вы набирайте слово как написано в тексте, клавиатура будет набирать его "задом наперед", но при копировании в ворд, все снова встанет как нужно.
ПРОВЕРКА ДРЕВНЕГРЕЧЕСКОГО:
Проверяю написание всех слов в он-лайн словаре древнегреческого http://gurin.tomsknet.ru/alphaonline.html, чтобы правильно написать слово.
ПРО PDF
Если в работе текст УЖЕ содержится в pdf. Распознавать не нужно. Просто открыть в Adobe Acrobat (можно в PDF Reader) - Ctrl+A (выделить все), копировать и вставить в Word.
Дальше нужно избавиться от нежелательных разрывов абзацев.
Потом расставить стили, проверить и все. Иногда ситуация
усложняется обилием сносок, которые нужно сначала вытянуть из сырого текста, потом вставить обратно.
ПЕРЕВОД В НОВУЮ ОРФОГРАФИЮ
Предлагаю всем воспользоваться сайтом:
http://slavenica.com/
В верхнее окно вставляем текст с дореволюционным текстом.
Выбираем в переводчике перевести с Русского-петровское правописание на Русский - новое правописание. Далее подправляем. Надеюсь всем пригодится.
ПРОВЕРКА ГРЕЧЕСКОГО
Нашла для проверки греческих слов вот такой ресурс: http://translate.academic.ru/
Только нужно выбрать язык оригинала и перевода.
Если ошибетесь в букве, сайт предлагает исправленное слово, которое можно скопировать и вставить в качестве правильного.
РАЗДЕЛЕНИЕ ТЕКСТА НА ОТДЕЛЬНЫЕ СТРАНИЦЫ.
Быстрое разделение отсканированного разворота книги на отдельные страницы:
https://igordanyk.ucoz.ru/news/bystroe_ ... -05-12-185
ПРО НАБОР ЦСЯ.
Для церковно-славянского языка можно использовать шрифт Ponomar Unicode TT и виртуальную клавиатуру, предложенную выше. http://ponomar.net/cu_vkeyb.html вот тут http://ponomar.net/ можно скачать раскладку и сам шрифт.
Просим ЦСЯ выделять красным и потом сообщать, что в тексте есть ЦСЯ.
РУССКО-ГРЕЧЕСКИЙ ПЕРЕВОДЧИК
Собственно, хотел поделиться ссылкой на греческо-русский переводчик. http://www.webtran.ru/translate/greek/from-russian/
Так как есть книги, где вставки из Евангелии на греческом ну просто изобилуют на каждой странице. Без их понимания можно потерять смысл повествования и допустить грубую ошибку в наборе.
Однако не зря говорят: век живи – век учись)) Оказывается на azbyka.ru есть греческие Ветхий и Новый завет с подстрочным переводом! https://azbyka.ru/biblia/UBS/index.htm?NT/Jn
И там можно найти все что нужно, уже с нормальным переводом. Поэтому, переводчик особо и не нужен. Хотя… Может кому и пригодится. Переводит достаточно корректно, можно выбрать и другие языки, кроме греческого.
НАБОР ГРЕЧЕСКОГО
Есть ещё такой сервис для набора греческого: http://www.slavonicpro.ru/polytonic.html
НАБОР ИВРИТА:
"Также удобно пользоваться страничкой набора иврита онлаин, где можно составлять возможные комбинации. Правда, я пока не разобрался как копировать набранный текст переводить в ворд, копирование не сохраняет тест в исходом варианте, а мешает буквы слева на право. Если слов не много - можно пока копировать по букве )
https://www.lexilogos.com/keyboard/hebrew.htm "
ПРО ФАЙН-РИДЕР
Сделал для себя небольшое, но весьма приятное открытие в FineReader. Оказывается там есть "Русский (Старая орфография) (со словарной поддержкой). После его подключения, качество распознавания текста значительно выросло.
ПРО УДАРЕНИЯ
Если вам, при работе в Microsoft Word, нужно поставить ударение в слове — после нужной буквы напишите 0300 - нажмите одновременно Alt+X и отпустите. Можно использовать 0301 или 0302 — меняется наклон апострофа.
ОФОРМЛЕНИЕ СНОСОК
При оформлении сносок соблюдается следующая последовательность знаков.
1. Если сноска относится к слову или группе слов внутри предложения, то запятая, точка с запятой, двоеточие ставятся после знака сноски: текст 1, текст 1; текст 1:
2. Если есть знаки вопросительный, восклицательный и многоточие, относящиеся ко всему предложению, то они ставятся перед знаком сноски: текст? 1 текст! 1 текст… 1 .
3. Если сноска относится ко всему предложению и в конце его отсутствуют знаки, указанные в п. 2, то после знака сноски ставится точка: текст 1.
4. Кавычки ставятся перед знаком сноски: «текст» 1 .
5. Сноска, относящаяся к слову или группе слов, заключенных в скобки, ставится перед закрывающей скобкой: (текст 1 ); сноска, относящаяся ко всему предложению, имеющему конечную вставку, ставится после скобки: (текст )1 .
Правила русской орфографии и пунктуации. Полный академический справочник / Под ред. В.В. Лопатина //13. Сочетание знаков препинания, последовательность их расположения; взаимодействие знаков в сложных конструкциях, §160
ПРО РАСПОЗНАВАНИЕ
Наблюдение от одного из помощников:
"В гугл диске функция распознавания доступна совершенно бесплатно.
https://support.google.com/drive/answer ... ktop&hl=ru
Всё работает отлично. Минус один — определяет язык автоматически. В случае моего текста получается местами каша, так как в нем есть и греческий текст и немецкий и английский."
ВАРИАНТ РЕШЕНИЯ ПРОБЛЕМЫ ВЫВОДА КНИГИ ИЗ FINEREADER В WORD
Добрый день всем!
Наконец то разобрался с проблемой сносок. Для себя определил (может и другим поможет кстати) следующий как мне показалось наиболее оптимальный вариант действий, особенно актуальный для больших (более 100-200 страниц) книг:
1. Распознаю в Finereader.
2. Редактирую спорные моменты в той же Finereader, за исключением исправления ЯТЬ, АГО и твердого знака и т.д.
3. По окончанию предыдущих пунктов вывожу в WORD с обязательным выбором режима "простой текст", но с сохранением разделения на страницы. При этом теряются (и это плюс) часто (по статистике) ненужные рамки, которые в WORD приходится многих волонтерам удалять вручную, тратя огромное кол-во времени.
4. После вывода файла, открываю WORD на одном мониторе, Finereader - на втором и занимаюсь сносками следующим образом: т.к. разделение на страницы мы в пункте 3 сохранили, то очень легко определять где какие сноски нужно вставить - вставляю их вручную, нажимая в WORD "вставить сноску" и копируя текст сноски прямо из Finereader. Даже если сносок много, делается это более менее быстро, зато они точно привяжутся к тексту, даже если потом страницы поменяются (а так и происходит обычно при дальнейшем форматировании).
5. Следующим шагом идет оформление текста в WORD: изменения "ЯТЬ", "АГО" и твердый знак, уменьшение свободных строк между страницами (в новых версиях WORD есть специальный инструмент для автоформата и расстановки переносов - очень удобно), и т.д. и т.п.
6. Финальная вычитка получившегося документа и при необходимости сверка с оригиналом (часто как в пункте 4).
Вдруг кому то поможет данный алгоритм?!
--
С уважением,
Михаил.
***
ПРО ЗАГОЛОВКИ. В идеале, чтобы после сканирования делать все обычным текстом
без какого-либо форматирования, а потом уже по сырому раскрашивать
стилями. Заголовки - Заголовок 2 (3 и тп.), подпись к картинке -
Подзаголовок, все остальное - обычный текст, стиль Обычный.
ПРО ФРАГМЕНТЫ С ДРУГИМ РАЗМЕРОМ ШРИФТА
Если у Вас в тексте есть фрагменты, напечатанные другим размером шрифта, чем основной текст, то делаем так:
более мелкий шрифт — выделяем зеленым цветом,
более крупный шрифт — выделяем оранжевым цветом.
Только обязательно сообщите потом в письме, что такие места есть.
КАК МОЖНО АВТОМАТИЧЕСКИ ЗАМЕНЯТЬ ТИРЕ/ДЕФИС МЕЖДУ ЦИФРАМИ НА СРЕДНЕЕ ТИРЕ
Замена тире ТОЛЬКО между ЦИФРАМИ:
1. длинного тире на среднее :
Надо заменить: ([0-9])(^0151)([0-9])
На: \1^0150\3
Обязательно поставить галочку «Подстановочные знаки»
2. дефис на среднее:
Надо заменить: ([0-9])(^0045)([0-9])
На: \1^0150\3
Обязательно поставить галочку «Подстановочные знаки»
Подставляйте коды (маркер) по Вашему желанию и меняйте как хотите)
Коды:
дефис 0045
среднее тире 0150
длинное тире 0151