ПОЛЕЗНЫЕ СОВЕТЫ

Людмила Александровна З · 24 Июн 2020

НАБЛЮДЕНИЕ о файн-ридере:
В большинстве своем в pdf-файле возможно выделить текст и скопировать его. Если это не получается в Adobe Reader, то возможно открыть файл в интернет-броузере и проверить возможность выделения и копирования текста. В ряде случаев, скопированный текст отображается криво из-за неправильной кодировки. В этом случае можно использовать он-лайн декодер (http://www.artlebedev.ru/tools/decoder/) и после расшифровки уже нормальный текст копировать в word.

НАБЛЮДЕНИЕ ПО НАБОРУ ИВРИТА:
"Текст набирал в онлайн клавиатуре http://www.lexilogos.com/keyboard/hebrew.htm" Если вы набирайте слово как написано в тексте, клавиатура будет набирать его "задом наперед", но при копировании в ворд, все снова встанет как нужно.

ПРОВЕРКА ДРЕВНЕГРЕЧЕСКОГО:
Проверяю написание всех слов в он-лайн словаре древнегреческого http://gurin.tomsknet.ru/alphaonline.html, чтобы правильно написать слово.

ПРО PDF
Если в работе текст УЖЕ содержится в pdf. Распознавать не нужно. Просто открыть в Adobe Acrobat (можно в PDF Reader) - Ctrl+A (выделить все), копировать и вставить в Word.
Дальше нужно избавиться от нежелательных разрывов абзацев.
Потом расставить стили, проверить и все. Иногда ситуация
усложняется обилием сносок, которые нужно сначала вытянуть из сырого текста, потом вставить обратно.

ПЕРЕВОД В НОВУЮ ОРФОГРАФИЮ
Предлагаю всем воспользоваться сайтом:
http://slavenica.com/
В верхнее окно вставляем текст с дореволюционным текстом.
Выбираем в переводчике перевести с Русского-петровское правописание на Русский - новое правописание. Далее подправляем. Надеюсь всем пригодится.

ПРОВЕРКА ГРЕЧЕСКОГО
Нашла для проверки греческих слов вот такой ресурс: http://translate.academic.ru/
Только нужно выбрать язык оригинала и перевода.
Если ошибетесь в букве, сайт предлагает исправленное слово, которое можно скопировать и вставить в качестве правильного.

РАЗДЕЛЕНИЕ ТЕКСТА НА ОТДЕЛЬНЫЕ СТРАНИЦЫ.
Быстрое разделение отсканированного разворота книги на отдельные страницы:
https://igordanyk.ucoz.ru/news/bystroe_ ... -05-12-185

ПРО НАБОР ЦСЯ.
Для церковно-славянского языка можно использовать шрифт Ponomar Unicode TT и виртуальную клавиатуру, предложенную выше. http://ponomar.net/cu_vkeyb.html вот тут http://ponomar.net/ можно скачать раскладку и сам шрифт.
Просим ЦСЯ выделять красным и потом сообщать, что в тексте есть ЦСЯ.

РУССКО-ГРЕЧЕСКИЙ ПЕРЕВОДЧИК
Собственно, хотел поделиться ссылкой на греческо-русский переводчик. http://www.webtran.ru/translate/greek/from-russian/
Так как есть книги, где вставки из Евангелии на греческом ну просто изобилуют на каждой странице. Без их понимания можно потерять смысл повествования и допустить грубую ошибку в наборе.
Однако не зря говорят: век живи – век учись)) Оказывается на azbyka.ru есть греческие Ветхий и Новый завет с подстрочным переводом! https://azbyka.ru/biblia/UBS/index.htm?NT/Jn
И там можно найти все что нужно, уже с нормальным переводом. Поэтому, переводчик особо и не нужен. Хотя… Может кому и пригодится. Переводит достаточно корректно, можно выбрать и другие языки, кроме греческого.

НАБОР ГРЕЧЕСКОГО
Есть ещё такой сервис для набора греческого: http://www.slavonicpro.ru/polytonic.html

НАБОР ИВРИТА:
"Также удобно пользоваться страничкой набора иврита онлаин, где можно составлять возможные комбинации. Правда, я пока не разобрался как копировать набранный текст переводить в ворд, копирование не сохраняет тест в исходом варианте, а мешает буквы слева на право. Если слов не много - можно пока копировать по букве )
https://www.lexilogos.com/keyboard/hebrew.htm "

ПРО ФАЙН-РИДЕР
Сделал для себя небольшое, но весьма приятное открытие в FineReader. Оказывается там есть "Русский (Старая орфография) (со словарной поддержкой). После его подключения, качество распознавания текста значительно выросло.

ПРО УДАРЕНИЯ
Если вам, при работе в Microsoft Word, нужно поставить ударение в слове — после нужной буквы напишите 0300 - нажмите одновременно Alt+X и отпустите. Можно использовать 0301 или 0302 — меняется наклон апострофа.

ОФОРМЛЕНИЕ СНОСОК
При оформлении сносок соблюдается следующая последовательность знаков.
1. Если сноска относится к слову или группе слов внутри предложения, то запятая, точка с запятой, двоеточие ставятся после знака сноски: текст 1, текст 1; текст 1:
2. Если есть знаки вопросительный, восклицательный и многоточие, относящиеся ко всему предложению, то они ставятся перед знаком сноски: текст? 1 текст! 1 текст… 1 .
3. Если сноска относится ко всему предложению и в конце его отсутствуют знаки, указанные в п. 2, то после знака сноски ставится точка: текст 1.
4. Кавычки ставятся перед знаком сноски: «текст» 1 .
5. Сноска, относящаяся к слову или группе слов, заключенных в скобки, ставится перед закрывающей скобкой: (текст 1 ); сноска, относящаяся ко всему предложению, имеющему конечную вставку, ставится после скобки: (текст )1 .
Правила русской орфографии и пунктуации. Полный академический справочник / Под ред. В.В. Лопатина //13. Сочетание знаков препинания, последовательность их расположения; взаимодействие знаков в сложных конструкциях, §160

ПРО РАСПОЗНАВАНИЕ
Наблюдение от одного из помощников:
"В гугл диске функция распознавания доступна совершенно бесплатно.
https://support.google.com/drive/answer ... ktop&hl=ru
Всё работает отлично. Минус один — определяет язык автоматически. В случае моего текста получается местами каша, так как в нем есть и греческий текст и немецкий и английский."

ВАРИАНТ РЕШЕНИЯ ПРОБЛЕМЫ ВЫВОДА КНИГИ ИЗ FINEREADER В WORD

Добрый день всем!

Наконец то разобрался с проблемой сносок. Для себя определил (может и другим поможет кстати) следующий как мне показалось наиболее оптимальный вариант действий, особенно актуальный для больших (более 100-200 страниц) книг:

1. Распознаю в Finereader.
2. Редактирую спорные моменты в той же Finereader, за исключением исправления ЯТЬ, АГО и твердого знака и т.д.
3. По окончанию предыдущих пунктов вывожу в WORD с обязательным выбором режима "простой текст", но с сохранением разделения на страницы. При этом теряются (и это плюс) часто (по статистике) ненужные рамки, которые в WORD приходится многих волонтерам удалять вручную, тратя огромное кол-во времени.
4. После вывода файла, открываю WORD на одном мониторе, Finereader - на втором и занимаюсь сносками следующим образом: т.к. разделение на страницы мы в пункте 3 сохранили, то очень легко определять где какие сноски нужно вставить - вставляю их вручную, нажимая в WORD "вставить сноску" и копируя текст сноски прямо из Finereader. Даже если сносок много, делается это более менее быстро, зато они точно привяжутся к тексту, даже если потом страницы поменяются (а так и происходит обычно при дальнейшем форматировании).
5. Следующим шагом идет оформление текста в WORD: изменения "ЯТЬ", "АГО" и твердый знак, уменьшение свободных строк между страницами (в новых версиях WORD есть специальный инструмент для автоформата и расстановки переносов - очень удобно), и т.д. и т.п.
6. Финальная вычитка получившегося документа и при необходимости сверка с оригиналом (часто как в пункте 4).

Вдруг кому то поможет данный алгоритм?!

--
С уважением,
Михаил.

***

ПРО ЗАГОЛОВКИ. В идеале, чтобы после сканирования делать все обычным текстом
без какого-либо форматирования, а потом уже по сырому раскрашивать
стилями. Заголовки - Заголовок 2 (3 и тп.), подпись к картинке -
Подзаголовок, все остальное - обычный текст, стиль Обычный.

ПРО ФРАГМЕНТЫ С ДРУГИМ РАЗМЕРОМ ШРИФТА
Если у Вас в тексте есть фрагменты, напечатанные другим размером шрифта, чем основной текст, то делаем так:
более мелкий шрифт — выделяем зеленым цветом,
более крупный шрифт — выделяем оранжевым цветом.
Только обязательно сообщите потом в письме, что такие места есть.

КАК МОЖНО АВТОМАТИЧЕСКИ ЗАМЕНЯТЬ ТИРЕ/ДЕФИС МЕЖДУ ЦИФРАМИ НА СРЕДНЕЕ ТИРЕ
Замена тире ТОЛЬКО между ЦИФРАМИ:
1. длинного тире на среднее :
Надо заменить: ([0-9])(^0151)([0-9])
На: \1^0150\3
Обязательно поставить галочку «Подстановочные знаки»
2. дефис на среднее:
Надо заменить: ([0-9])(^0045)([0-9])
На: \1^0150\3
Обязательно поставить галочку «Подстановочные знаки»
Подставляйте коды (маркер) по Вашему желанию и меняйте как хотите)
Коды:
дефис 0045
среднее тире 0150
длинное тире 0151

Жанна2525 · 16 Авг 2020

Добрый день!

Набираю книгу дореволюционного издания. Оригинал в формате djvu. Качество печати не слишком хорошее. Орфография дореволюционная. Много латыни и греческого. То есть даже если распознавать текст, неуместных ошибок будет неприятно много. Поэтому набираю руками.
А сейчас стала надиктовывать в ближайшем он-лайн сервисе "Голос в текст" https://www.textfromtospeech.com/ru/voice-to-text/
Ошибок тоже много, но даже при невнятном чтении русский текст (а иногда и латынь) распознается. Как минимум я избегаю ошибок (и необходимости набора руками) в таких длинных словах с множеством согласных как "государственный" или "заведовавший" и т.д. Вычитывать же набранный текст в любом случае приходится, но проще исправить окончания и набрать имена римских деятелей, чем не упустить ошибку в середине слова.
Как показала практика, при распознавании речи в текст обработка текста происходит быстрее.

Также при первичном наборе текста я ставлю номера страниц. При вычитке текста выделяю их красным. Потом набираю многочисленные ссылки (сначала набираю текст, потом ссылки - так быстрее), и для набора ссылок номера страниц оригинала в тексте становятся удобным подспорьем. По мере набора текста ссылок удаляю их.

Латинские фразы проверяю в яндексе, благо тексты эти в большинстве своем в сети есть. Очень удобно: точное совпадение слов показано жирным шрифтом, а неточное - обычным. Сразу видно, на какие слова в своей фразе стоит обратить внимание.

Елена Анатольевна · 22 Сен 2021

Людмила Александровна З написал(а):
НАБЛЮДЕНИЕ ПО НАБОРУ ИВРИТА:
"Текст набирал в онлайн клавиатуре http://www.lexilogos.com/keyboard/hebrew.htm" Если вы набирайте слово как написано в тексте, клавиатура будет набирать его "задом наперед", но при копировании в ворд, все снова встанет как нужно.

Добрый вечер (день)!

Пожалуйста, напишите поподробнее, как скопировать иврит, набранный на указанной выше клавиатуре, так, чтобы он читался так, как в тексте автора, а не "задом наперед". "Все, как нужно" в моем исполнении не встает.

Перевожу в Word, копируется рисунком, а не текстом.

Дмитрий Шихов · 8 Янв 2022

Сайт для распознавания текста с pdf: https://img2txt.com/ru Иврит - Hebrew (heb), Греческий - Greek (ell). Делаете скан текста на экране, вырезаете лишние слова, сохраняете картинку. На сайте открываете эту картинку и выбираете язык. Если слова получились с ошибками (особенно иврит), то попробуйте сделать скан при увеличенном шрифте текста.

Павел 21 · 22 Апр 2023

Добрый день, подскажите пожалуйста, кто знает, как быстро убрать разрывы (лишние длинные пробелы) возникшие из-за боковых полей между строками при распознавании.

Людмила Александровна З · 18 Апр 2024

КАК ПОДСВЕТИТЬ ОШИКИ В ТЕКСТЕ. Можно порекомендовать к использованию редакторами расширение Корректор грамматики и орфографии - LanguageTool: https://languagetool.org/ru
https://addons.mozilla.org/ru/firefox/addon/languagetool/
https://chromewebstore.google.com/detail/корректор-грамматики-и-ор/oldceeleldhonbafppcapldpdifcinji?utm_source=lt-homepage
Очень удобно подсвечивает ошибки при работе с текстом. Это помогло хотя бы минимально избежать ошибок на сайте.

ПОЛЕЗНЫЕ СОВЕТЫ

Людмила Александровна З

Жанна2525

Участник, заслуживающий доверия

Елена Анатольевна

Участник, заслуживающий доверия

Дмитрий Шихов

Павел 21

Людмила Александровна З