«Пользователи давно просят нас добавить возможность распознавания медицинского почерка в программу ABBYY FineReader. И это понятно, ведь все мы знаем, как непросто порой бывает разобрать текст, написанный врачом, – комментирует Иван Бодягин, директор департамента продуктов для распознавания текстов компании ABBYY. – В 12-ой версии FineReader мы значительно улучшили распознавание сложного арабского языка, и использованные при этом подходы помогли нам в работе с почерком врачей».
Арабская письменность выглядит для людей, не знающих язык, как сложная последовательность связанных элементов: зачастую визуально довольно сложно выделить в словах отдельные буквы. Поэтому для распознавания арабского языка традиционно применяется подход, при котором распознаются не отдельные символы, а слова целиком. Схожие проблемы обычно возникают и при попытке разобрать почерк врачей, поэтому опыт распознавания языков со сложной письменностью был крайне полезен при создании ABBYY FineReader MedText.
Система распознавания медицинских текстов основана на вероятностных графических моделях (PGM), байесовских сетях (BN) и скрытых марковских моделях (HMM). ABBYY FineReader распознает почерк врача большими блоками. В наиболее сложных случаях программа обрабатывает целые строки как один объект распознавания, превращая изображение в граф вероятностных состояний, из которых потом кристаллизуется осмысленный текст.
При создании модуля MedText компания ABBYY впервые применила новую разработку – Метод детектирования внутренней логики письма. С его помощью можно определить, какие из завитушек в строке соответствуют реальным буквам, а какие были добавлены врачом для красоты.
Настоящим прорывом стала Система расшифровки врачебных сокращений. Вклад в ее создание сделали практически все сотрудники ABBYY, а также пользователи программ компании, когда-либо бравшие больничный или получавшие от врачей рецепты. Все их справки и направления были тщательно проанализированы лингвистами. Благодаря этой работе Система расшифровки врачебных сокращений, применяемая в ABBYY FineReader, позволяет не только перевести рецепт в читаемый текст, но и объясняет пользователю, что же все-таки имел в виду врач.
Сейчас ABBYY работает над мобильной версией ABBYY FineReader MedText, чтобы пользователи могли распознавать выписанные рецепты сразу после выхода из кабинета врача.