3.6. Программное обеспечение, использованное при создании
методического пособия
При созданни методического пособия были использованы следующее программное обеспечение: ABBYY FineReader 6.0 Professional, HomeSite 5, Adobe Photoshop, ImageReady.
Программа оптического распознавания текста FineReader была использована для того, чтобы быстро перевести нужный для дальнейшей работы текст в электронный вид. FineReader позволяет ввести содержимое бумажного документа в текстовый редактор. Введённый текст и графические изображения можно сохранить в форматах текстового редактора или передать их в электронную таблицу: в форматах PDF и HTML без изменения оформления документа.
FineReader – омнифонтовая система оптического распознавания текстов. Это означает, что она позволяет распознавать тексты, набранные практически любыми шрифтами, без предварительного обучения. Особенностью программы FineReader является высокая точность распознавания и малая чувствительность к дефектам печати, что достигается благодаря применению технологии «целостного целенаправленного адаптивного распознавания».
Целостность: объект описывается как целое с помощью значимых элементов и отношений между ними.
Целенаправленность: распознавание строится как процесс выдвижения и целенаправленной проверки гипотез.
Адаптивность: способность OCR-системы к самообучению.
В соответствии с этими тремя принципами система сначала выдвигает гипотезу об объекте распознавания (символе, части символа или нескольких склеенных символах), а затем подтверждает или опровергает ее, пытаясь последовательно обнаружить все структурные элементы и связывающие их отношения. В каждом структурном элементе выделяются части, значимые для человеческого восприятия: отрезки, дуги, кольца и точки. Следуя принципу адаптивности, программа самостоятельно «настраивается», используя положительный опыт, полученный на первых уверенно распознанных символах. Целенаправленный поиск и учет контекста позволяют распознавать разорванные и искаженные изображения, делая систему устойчивой к возможным дефектам письма.
Процесс ввода документа в компьютер был осуществлен в два шага:
Первый – это сканирование. В нем сканер играет роль «глаза» компьютера: «просматривает» изображение и передает его системе. При этом полученное изображение является ни чем иным, как набором черных, белых или цветных точек, картинкой, которую невозможно отредактировать ни в одном текстовом редакторе.
Второй – это распознавание. Обработка изображения OCR-системой.
Обработка изображения системой FineReader заключается в анализе графического изображения, переданного сканером, и распознавания каждого символа. Процессы анализа макета страницы (определение областей распознавания, таблиц, картинок, выделение в тексте строк и отдельных символов) и распознавания изображения тесно связаны между собой: алгоритм поиска блоков использует информацию о распознанном тексте для более точного анализа страницы.
В результате работы в окне текстового редактора FineReader отображается распознанный текст, который был отредактирован и сохранен в формате HTML.
При сканировании первоначальный вид графических изображений получился недостаточно хорошего качества. Поэтому было решено сгенерировать поясняющие иллюстрации в РНР-редакторе РНР Expert Editor и обработать их в программе Photoshop. Затем все поясняющие иллюстрации были оптимизированы и сохранены для использования в Web.
Программа HomeSite использовалась для редактирования текста в HTML-формате.
HomeSite – это HTML-редактор для профессиональных Web-разработок, которые пишутся на HTML и используют различные скриптовые языки для создания Web-страниц. Этот редактор имеет множество настроек и прекрасно работает с другими приложениями Macromedia, поэтому он был выбран в качестве основного инструмента для редактирования кода будущих уроков методического пособия.
|