Сетевой журнал: галерея ИТ-проектов

ABBYY: единый государственный экзамен

Единый государственный экзамен (ЕГЭ) – важнейший государственный проект, который осуществляется в рамках федеральной программы развития образования. Он призван повысить объективность итоговой аттестации выпускников, а также вступительных экзаменов в вузах. "Самая главная цель ЕГЭ – оценить качество знаний, уровень школы и каждого учителя", – отметил в бытность свою министром образования России Владимир Филиппов.

Заказчиком в данном проекте выступает Министерство образования и науки РФ, а главным его координатором и организатором самих экзаменов является Центр тестирования министерства. Более семи лет с центром сотрудничает компания ABBYY, и уже четыре года – с момента введения ЕГЭ – она принимает активное участие в этом эксперименте.

Роль ABBYY заключается в создании ПО для автоматизированной обработки – сканирования, распознавания, верификации и экспорта – заполненных выпускниками экзаменационных бланков. Сама обработка осуществляется в регионах, а ее результаты поступают в единую базу Центра тестирования в Москве, где проверяются и оцениваются ответы. Оценки транслируются в обратном направлении, так что каждый выпускник, обратившись в местный экзаменационный пункт, может узнать свои результаты (а по окончании экзаменов там же получить отпечатанное свидетельство со всеми оценками). На всю процедуру по каждому из двенадцати предметов отводится четыре дня. Подобные масштаб и скорость обработки беспрецедентны, проект не имеет аналогов в мировой практике. Как признал первый заместитель министра образования России В.А. Болотов, "…провести экзамены и обработать такое количество тестов в настолько сжатые сроки совсем недавно казалось практически нереальным". Однако точное распознавание и правильная организация процесса позволили добиться требуемой оперативности.

TestReader
Программный продукт, о котором идет речь, называется ABBYY TestReader и разработан специально для нужд учебных заведений. Наряду с проведением ЕГЭ он успешно применяется более чем в 60 российских вузах, а также в ряде зарубежных образовательных учреждений для приема экзаменов и зачетов, обработки анкет, заявлений и т.д.

В 2001 году, когда проходил первый ЕГЭ, этой программы еще не существовало, и бланки обрабатывались с помощью системы распознавания рукописных символов ABBYY FormReader. Проанализировав полученный опыт, в компании ABBYY приняли решение создать на ее основе ПО, "заточенное" под потребности администраторов и операторов в регионах – тех людей, на плечи которых ложится основная нагрузка при обработке бланков. Так появился TestReader; официальный выпуск продукта состоялся осенью 2002 года, но уже при проведении второго ЕГЭ, т.е. в мае – июне 2002-го, он был бесплатно роздан в регионы в качестве дополнительного ПО. Местным учреждениям предоставлялось решить, какой продукт – FormReader или TestReader – лучше подходит для обработки экзаменационных ответов, и все сделали выбор в пользу новой системы. В двух последующих ЕГЭ уже применялся только TestReader, причем версия программы каждый раз обновлялась с учетом пожеланий пользователей, высказанных на предыдущем экзамене. Для ЕГЭ 2005 года ABBYY также готовит новую версию ПО.

Основное внимание при разработке TestReader было сосредоточено на удобстве использования, простоте освоения и производительности. Программа совместима с любыми моделями сканеров, не требует ни длительного обучения, ни специальной подготовки. Работа с ней сводится к добавлению документов в автоподатчик сканера, автоматическому распознаванию отсканированных бланков и, если необходимо, корректировке (либо подтверждению) отдельных распознанных символов.

TestReader существует в двух вариантах – однопользовательском (Desktop) и сетевом (Network). Первая из них, предназначенная для установки в небольших пунктах обработки информации, представляет собой однопользовательскую систему, крайне простую в освоении и эксплуатации. На всем протяжении обработки форм ее оператору приходится иметь дело всего с двумя "кнопками" пользовательского интерфейса. Понятно, что освоение такой системы не представляет сложности. В то же время возможности ABBYY TestReader Desktop таковы, что один оператор обрабатывает с высоким качеством до 1000 бланков ежедневно.

ABBYY TestReader Network – это программный комплекс, предназначенный для распределенной обработки данных и рассчитанный на эксплуатацию в пунктах обработки, функционирующих с большой загрузкой, например региональных. Он построен по архитектуре клиент – сервер и функционирует по конвейерному принципу. Весь объем операторской работы разделен на несколько обособленных этапов, выполнение каждого из которых максимально автоматизировано. При этом система допускает параллельную обработку нескольких так называемых "проектов" (потоков бланков, которые могут быть совершенно не связаны между собой по содержанию, – скажем, результатов экзаменов по физике и английскому языку). Это позволяет заметно повысить общую пропускную способность пункта обработки информации.

Представление о возможностях TestReаder Network может дать рассказ о проведении экзамена 2004 года М.Б. Астапова, и.о. руководителя департамента образования и науки Краснодарского края. “Наш регион, – сказал он, – один из самых больших по числу выпускников, принимавших участие в эксперименте по введению ЕГЭ. Только экзамен по математике у нас сдавали 54 350 человек. Благодаря технологии компании ABBYY нам удалось обработать результаты этого экзамена менее чем за три дня".

Начиная с 2004 года каждый регион может выбрать свой собственный режим обработки результатов экзамена сообразно имеющемуся оборудованию, численности выпускников, размерам территории и другим параметрам.

TestReader построен на базе технологии ABBYY FormReader и предусматривает обработку черно-белых, серых и цветных форм, а также ввод данных с документов разных видов в одном потоке. Последнее особенно удобно – нет необходимости тратить время на сортировку. Программа распознает печатный текст на 177 языках, а текст, написанный печатными буквами от руки, – на 18 языках. Она способна интерпретировать метки, используемые для выбора вариантов ответов в тестах, причем безошибочно отличает выбранную метку от зачеркнутой (отмеченной ошибочно и затем полностью закрашенной). С ее помощью экзаменаторы могут разработать (полностью самостоятельно или по готовому шаблону) собственный бланк и настроить ПО для его обработки. Очень важная составляющая продукта – методические рекомендации ABBYY, подготовленные компанией на основе немалого опыта внедрения и эксплуатации TestReader, а также возможность в любой момент получить комментарии специалистов по системе и ее внедрению.

Надежность и объективность
Выпускники сдают ЕГЭ в специализированных пунктах проведения экзаменов, которых в 2004 году насчитывалось более 820 (на 65 регионов). Каждый экзаменуемый заполнял бланк регистрации (анкету) и два бланка с ответами. Собранные бланки передавались в пункты первичной обработки информации (в прошлом году их было 240, в нынешнем – около пятисот), и там проводилось их сканирование и распознавание. Затем данные либо в электронном, либо в смешанном виде поступали в региональные центры обработки. Оттуда информация передавалась в Центр тестирования, где и производилась финальная обработка результатов, а итоги экзамена транслировались по вышеописанной цепочке в обратном направлении.

Ответы, даваемые в свободной форме, невозможно проверить автоматически. Тем не менее они также подвергаются обработке в региональном центре: путем сканирования и распечатки с них снимают копии, которые передаются на проверку экспертам. Это удобно и обеспечивает дополнительную гарантию объективности: ответ сохраняется в электронном виде и всегда может быть "поднят" из базы данных, а возможность выставления предвзятой оценки исключена – ведь ни фамилии выпускника, ни другой контактной информации на поступающем эксперту бланке нет.

Нововведением 2004 года стала усовершенствованная процедура апелляции. В свое время организаторы экзамена не учли, что многие выпускники, рассчитывая на повышение оценки, могут подавать апелляции "просто так", без особенных оснований. Когда количество таких учеников стало исчисляться сотнями, прежняя, практически не автоматизированная процедура рассмотрения апелляций стала источником проблем. Ведь для каждого случая необходимо собирать полное досье – копии бланков, все протоколы проверки и т.п., находящиеся в разных базах. Теперь апелляционные комиссии в регионах получили возможность оперативно "вытаскивать" из своих баз данных, а также из центральной базы все документы, касающиеся подавшего апелляцию выпускника. Можно себе представить, насколько свободнее вздохнули организаторы ЕГЭ, когда этот процесс был максимально автоматизирован.

Распознавание отличается исключительной надежностью. Технология FormReader, на которой основан TestReader, позволяет добиться высочайшей точности. Кроме того, экзаменационные бланки специально разработаны так, чтобы их можно было быстро и точно обрабатывать при помощи компьютера (такие бланки называют машиночитаемыми), выпускников же заблаговременно предупреждают о том, что заполнять тесты следует как можно аккуратнее, хотя это требуется и при обычных экзаменах. Наконец, автоматизированная обработка идет под наблюдением оператора, который при необходимости корректирует результаты распознавания.

Представителям ABBYY, правда, приходилось выслушивать скептические высказывания по поводу надежности операторов: не могут ли они подыграть кому-то из выпускников? В действительности это абсолютно исключено. Поскольку бланки полностью обезличены, оператор никогда не знает, чей именно ответ проходит сейчас через сканер и выдается на экран. Надежная защита от подтасовок и злоупотреблений обеспечивается целым рядом организационных и технических мер.

Подготовка и поддержка
Подготовка к ЕГЭ для ABBYY начинается в марте, с семинара для представителей регионов: вновь подключающиеся регионы знакомятся с системой в целом; те же, которые уже проводили экзамен, узнают о произошедших изменениях. Эта практика существует с самого первого года проведения ЕГЭ и зарекомендовала себя как очень удачная.

В интернете, кроме того, функционирует закрытый сайт для участников проекта. Он посвящен технической поддержке ЕГЭ и содержит всю необходимую информацию. На сайте работает ряд форумов, где каждый участник может оперативно получить консультацию специалистов.

Во время самих экзаменов ABBYY поддерживает круглосуточную "горячую линию" для администраторов региональных центров обработки. То же делают и другие участники проекта, имеющие собственную службу технической поддержки, при этом разные организации, естественно, помогают друг другу.

Однако главным фактором, обеспечивающим успешное разрешение технических проблем, следует, видимо, считать простоту и надежность самой программы TestReader. Когда в 2003 году в систему ЕГЭ вливалось рекордное количество регионов, нагрузка на всех участников проекта выросла лавинообразно. Опасаясь, что какой-то сбой или непонимание между участниками приведет к срыву проекта, ABBYY даже сформировала специальные мобильные группы экстренного реагирования, сотрудники которых готовы были при необходимости вылететь на помощь в любую точку страны. Однако это не понадобилось – все вопросы удалось благополучно разрешить при помощи "горячей линии".

Достижения и перспективы
В 2002 году во время проведения ЕГЭ с помощью продукта компании ABBYY за 25 дней было обработано около 1,5 млн. бланков с ответами. В 2003-м экзамен сдавало более 650 тыс. школьников, а количество бланков превысило 3,3 млн., в 2004-м соответствующие цифры перевалили за 820 тыс. и 5 млн., а в 2005-м наверняка еще вырастут. Но и в компании ABBYY, и в Центре тестирования уверены, что применяемая технология позволит обработать результаты быстро и безошибочно.

Российский эксперимент вызвал значительный интерес за рубежом. "Мы рекомендуем технологию ABBYY для проведения государственных экзаменов в странах Восточной Европы, так как считаем ее наиболее эффективной и надежной для организации столь масштабных проектов", – заявил Алгирдас Забулионис, директор Национального экзаменационного центра Литвы, являющийся также экспертом Совета Европы по вопросам образования, Института "Открытое общество" (фонд Сороса) и Всемирного банка. С помощью TestReader и практически по той же схеме, что и ЕГЭ, уже проводятся государственные выпускные экзамены в Польше, Латвии, Литве, Белоруссии и на Украине.

Что касается российского ЕГЭ, то он не только растет "вширь", охватывая все больше регионов, но и постоянно развивается содержательно, организационно и технически, а вслед за самим экзаменом совершенствуется и TestReader.

сетевой форум
поиск
подписка на журнал
о сетевом