Сетевой журнал: галерея ИТ-стратегии
 
 

Документооборот: "Чёртики" прячутся в деталях

Речь у нас пойдет о конкретных решениях обеспечения функции ввода документов в системах электронного документооборота , которые поставляет российская софтверная компания ABBYY Software House, одна из немногих "прорубивших окно" не только в Европу, но и в Америку. Вице-президент по корпоративным проектам Арам Пахчанян от лица компании делится с читателями накопленным ею опытом.

Чтобы за деревьями увидеть лес
Давайте начнем с определений и общих мест. А. Пахчанян считает, что система электронного документооборота (СЭД) – это информационная система, поддерживающая управление предприятием с помощью документов.

В России существует традиция "документальной" основы ведения дел, которая присуща далеко не всем странам. Слово "делопроизводство" и сам бюрократический подход унаследованы Россией от Германии еще в петровские времена. И по сию пору полноценно документооборот существует только в этих странах. Канцелярия, отдел делопроизводства, общий отдел, которые занимаются организацией прохождения документов по подразделениям учреждений и предприятий – это присуще немногим странам. В этом смысле у нас в России хорошие исторические традиции для развития рынка систем документооборота. В США, например, к идее электронного документооборота люди пришли через хаос деловых бумаг.

В эпоху компьютерных технологий идея их использования для управления документами лежит на поверхности. Сначала компьютеризируются архивы, потом их трансформируют в интерактивные хранилища, с которыми можно работать, перемещая документы от исполнителя к исполнителю. Интересно, что в Европе систем электронного документооборота продается больше, чем в Америке; больше там и компаний, которые их разрабатывают, – даже продаваемые в Америке системы часто оказываются родом из Европы.

Разные страны приходят к идее применения компьютеров в работе с документами по-разному. Мы в России движемся к ней от жестко регламентированного рамками стандартов делопроизводства. В госструктурах, на крупных и средних предприятиях общий отдел присутствует традиционно. Автоматизация общего отдела логична, и именно она становится первым шагом: общий отдел заменяется автоматом, который организует движение административных документов – приказов, постановлений и т.д. Затем делается попытка включить в процесс все остальные документы и все этапы работы с ними: создание, редактирование, согласование, утверждение, архивацию. Разработчики СЭД помогают компаниям успешно завершить их начинания: на рынке продаются решения для полного цикла документооборота – от допроизводственного документооборота (с соблюдением всех формальных правил и регламентов) до полного документооборота, обслуживающего главные бизнес-процессы клиентов.

По мнению специалистов ABBYY, если судить по оборотам компаний, работающих на российском рынке СЭД, то выделить среди них лидеров не представляется возможным: их позиции примерно равны. Даже двукратная разница в обороте мало о чем может свидетельствовать ввиду малости абсолютного объема рынка. Технологических лидеров определить проще, они объективно есть – это Documentum, Hummingbird, IBM и некоторые другие. Все они могут обеспечить наибольшее количество вариантов решений, которые хорошо масштабируются, решают проблемы территориально распределенного и крупного предприятия, учитывают многие специализированные требования. Documentum, например, явно позиционирует свои решения как наиболее соответствующие крупным коммерческим компаниям, хотя у них есть реализации и в госструктурах. Остальные разработчики (прежде всего российские) предлагают менее мощные решения, но более эффективные в конкретных применениях, в конкретных рыночных сегментах. Рынок между этими двумя типами разработчиков поделен (что не исключает конкуренцию, порой жесткую).

Ау! Заказчик!
Поставщики СЭД остро ощущают такую проблему: в организациях нет структур, которым эту систему можно продать. Кто заинтересован в ее внедрении? Общий отдел новой системой просто упраздняется и значит, становится скорее ее противником, нежели союзником. Для руководителя ИТ-службы автоматизация этих функций зачастую на первом месте не стоит. С его позиции существует множество других более насущных задач: автоматизация управления финансами, производством, логистикой, отношениями с филиалами, партнерами и клиентами, обновление оборудования, наконец. Редкий ИТ-руководитель понимает, что СЭД – это средство управления предприятием. Такая позиция вполне объяснима, ведь в большинстве случаев он не является лицом, принимающим решения на уровне стратегии компании. Его деятельность пока еще слабо структурирована, а он сам не умеет отделить текущие дела от главных. Зачастую его не допускают на советы директоров.

Основой управления компанией является именно документ: пока он не будет создан, ничего не сдвинется с места. Управлять предприятием на словах невозможно, так же, как невозможно строить контроль выполнения работ без привязки к документам. Нужна детальная проверка выполнения заданий, реального положения дел. Отчеты, проекты должны лежать в одной системе – и постепенно люди начинают это понимать. Например, раньше представители вендоров на конференции DOCFLOW делали упор на возможности своих систем. Зачастую за деталями терялась стратегическая цель: основная масса слушателей не понимала, зачем они нужны, а на частные вопросы специалистов общих отделов о возможностях поддержки сугубо конкретных процессов делопроизводства, которые в стандартных настройках системы не предусмотрены, выступающие отвечали, что они обеспечиваются настройками при развертывании системы у заказчика, а это вызывало скепсис и разочарование у тех самых специалистов делопроизводства. Не было правильного позиционирования СЭД, их производители не могли донести до принимающих ключевые решения людей идею, зачем такие системы нужны именно им. О том, что нужны они для эффективного управления предприятием, докладчики вспоминали в последнюю очередь.

Главным пользователем СЭД является первое лицо предприятия, это его рабочий инструмент. Система помогает ему (если, конечно, он действительно руководитель) снести "потемкинские деревни" в бизнес-процессах, сделать эти процессы прозрачными, в том числе и в части участия в них самого руководителя. Управленцу новой волны нужна помощь информационных систем, чтобы понимать состояние дел на предприятии. Особенно остро необходимость в такой помощи ощущается им в самом начале работы на новом месте. Часто первое, что ему приходит в голову, – автоматизировать именно документооборот, формализовать его процедуры. Вот и получается, что СЭД – это основное средство управления, которое одновременно может стать средством интеграции всех других информационных систем предприятия.

Возможности СЭД как интеграционной платформы могут заинтересовать и руководителя ИТ-службы, которому близки проблемы управляемости ИТ-систем компании, но который не дозрел (в силу изложенных выше причин) до понимания истинного места ИТ в общей структуре бизнеса. Только со временем профессиональный рост выводит спектр интересов ИТ-руководителя за пределы ЛВС, СКС, серверов, СУБД, операционных систем и т.п. Он начинает понимать, что его ценность как сотрудника определяется осведомленностью в современных ИТ-проблемах и умением решать с их помощью насущные потребности основного бизнеса компании.

Монолитные системы класса ERP, CRM, SCM, ECM и т.п. сами претендуют на роль общих корпоративных решений. Но им катастрофически не хватает гибкости. Их время уходит. Компании хотят строить архитектуру своих информационных систем в виде некой интеграционной платформы и вертикальных сервисов, что гарантирует оперативную функциональную гибкость и масштабируемость системы. Руководитель ИТ-подразделения должен выступать как системный архитектор, из готовых кубиков ИТ-решений строя то, что нужно компании именно сегодня, – завтра будет нужно нечто иное, потому что бизнес динамичен: у компании появляются новые возможности, новые направления работы, новые структуры, оптимизированные схемы бизнес-процессов… Необходимы методы быстрой корректировки информационной инфраструктуры.

Лидеры информационных технологий – Microsoft, IBM, SAP, Sun и т.д. – давно осознали это. Они предлагают интеграционные технологии, которые могут служить платформой для специализированных сервисов. Сервисы стыкуются между собою на основе открытых протоколов, поддерживаемых этими платформами. В качестве пользовательского клиента логично использовать браузер и на его уровне проводить сборку системы: браузер становится индивидуальным порталом, через который пользователь добирается до сервисов, необходимых ему в данный момент. Такова идеология будущих информационных систем.

"Бумаги" пока много
Наши общегосударственное и местные правительства в рамках федеральных и локальных программ компьютеризации намерены уменьшить поток бумажных документов, регламентирующих отношения граждан с властью. Может ли это означать скорый кризис систем ввода бумажных документов в электронные хранилища информации? Обратимся за ответом к опыту таких стран, как, например, Швеция и Австралия, где давно существуют массово доступные для населения телекоммуникационные средства, с помощью которых они могут "общаться с властью", не прибегая к бумаге. По отношению к передовым странам ИТ в России развиваются опережающими темпами, и поэтому то, что они проходили за десять лет, мы можем пройти года за два-три. Наблюдать положение дел с ИТ в этих странах поучительно и интересно, поскольку это наше недалекое будущее. В Австралии, которая около пятнадцати лет занимается автоматизацией налоговых служб, сбором налоговой информации, добились перехода на новые технологии половины населения. Другая половина продолжает заполнять бумажные декларации. И это за пятнадцать лет напряженной работы большой группы специалистов при условиях законодательной поддержки. В Швеции на новые способы коммуникаций переключилось 30–40% городского населения, а в "глубинке" и того меньше – около 10%.

Оказывается, бумага остается эффективным средством организации информации. На ней можно разместить практически любые данные наиболее удобным для себя образом, причем другому человеку не составит особого труда правильно их интерпретировать, если соблюдены общеизвестные правила. В электронных средствах обмена информацией между людьми встает некоторый автомат, который должен ее преобразовать. Автомат требует протокола взаимодействия с инфраструктурой. Протокол должен быть стандартизован. Любые изменения, касающиеся передачи информации, должны оперативно отслеживаться в работе всех автоматов. А это гораздо дороже, чем ввести новую бумажную форму документа. Рассчитывать на технологию "тонкого" клиента не приходится, потому что какая-то часть средств обработки должна присутствовать на рабочем месте пользователя (чтобы снять нагрузку с интернета, чтобы позволить пользователю вести работу с документом не только в режиме on-line). А коль скоро какая-то часть средств обработки оказывается у пользователя, клиент перестает быть "тонким" и требует того самого трудоемкого обновления. Появились средства автоматического дистанционного обновления. Может, выручат они? Отталкиваясь от собственного опыта, специалисты компании ABBYY делают пессимистический прогноз. Во всем мире по разным регионам рассредоточены тысячи ее пользователей. У нее два программных продукта, пользоваться ими не сложно, компания справляется с сервисной поддержкой. Но что будет, если продукт усложнится и при обслуживании потребует заполнения громоздких электронных форм? Только техническая поддержка любой массовой информационной технологии (а раз речь идет об "электронном правительстве", то счет пользователей должен идти на миллионы) высокозатратна для любой организации, даже для такой, как государство. Массовые информационные технологии, решая одни проблемы, порождают массу других. Очень быстро накапливается балластное "наследие" (legacy).

Не стоит забывать и про субъективный фактор. Покупая программный продукт (ПП), пользователь готов к его изучению, преодолению сложностей установки, он готов решать проблемы, связанные с его эксплуатацией. Пользователи ПП – это люди квалифицированные или готовые приобрести квалификацию. Иная ситуация с массовыми технологиями. Обязать население применять их – задача трудновыполнимая: здесь нужен стимул. Может быть, через некоторое время, когда информационные технологии и уровень информационной культуры населения "подрастут", можно будет изменить эту точку зрения. Но сегодня, когда внедрение информационных систем в масштабах одного предприятия с ограниченным штатом, со строгой внутренней дисциплиной и аппаратом поддержки этой дисциплины сталкивается с саботажем и консерватизмом, распространение ИТ в их современном виде на пространство страны выглядит преждевременным. Современные ИТ к массовому обслуживанию не готовы. Очень легко получить груду бесполезного, морально устаревшего технологического лома в масштабах государства и укоренить в населении незаслуженный скепсис к ИТ.

В продолжение темы можно привести несколько примеров из практики компании. Специалистам ABBYY приходится заниматься нормализацией информации – приведением к стандартному виду оформления типовых документов. Оказывается, эта частная задача чрезвычайно трудоемка. Простейшая процедура – написание телефонного номера. Кто-то пишет его с региональным кодом, кто-то без, одни этот код указывают в скобках, другие без скобок, кто-то использует в качестве префикса значок "+", кто-то не использует… А автоматизированная система обработки документов обязана разбираться во всех этих частностях. На сегодняшний день задача нормализации информации не решена даже во многих госструктурах (казалось бы, в самых дисциплинированных структурах страны) – ни в налоговом ведомстве, ни в таможенной службе; только-только подбираются к ее решению в ОБЭП МВД.

Не стоит думать, что это "национальные особенности" российского документооборота. Вот пример "оттуда". Сотрудникам ABBYY, по долгу службы поддерживающим коммерческую деловую переписку с зарубежными компаниями, не известно ни одного средства, с помощью которого можно было бы передать контракт в электронном виде с электронной подписью в какую-нибудь европейскую или американскую страну – его обязательно нужно оформить на бумаге. До сих пор ни в одной стране не стандартизована электронная форма наиболее часто используемого коммерческого документа – счета-фактуры. Даже когда покупатель заказывает товар по интернету, он получает бумажный счет-фактуру. Вот так и ходят между организациями в огромных количествах бумажные счета! Порой компании, договариваясь между собой, находят агентов-посредников, которые готовы конвертировать счета, оформленные по корпоративному стандарту одной компании, в счета, отвечающие внутреннему стандарту другой компании. Оказывается, на этом можно зарабатывать!

Еще один пример, на сей раз уже из интернациональной практики, – банкоматы. Их внедряют уже много лет во всем мире, но до сих пор с их эксплуатацией много проблем: кто-то умудряется красть номера карточек, кто-то из-за сбоев в обслуживающей системе остался "неплатежеспособен" на протяжении нескольких часов и т.д. А нужна простая надежная система, которая не вызовет вопросов у домохозяйки и устоит под атакой хакера. Пока таких банкоматов нет.

Вот и получается, что на фоне общей стагнации продаж сложных корпоративных информационных систем растет сегмент систем ввода информации (не менее, чем на 10% в год!), и "львиную" долю в них составляют средства ввода бумажных документов. Таковы данные для развитых стран, где культура использования ИТ значительно выше, чем в среднем в мире. Для остальных регионов показатель востребованности этих систем еще выше.

На чьей стороне закон?
В некоторых сферах общественной жизни давно пора законодательными актами утвердить электронный обмен документами. Например, в финансовой сфере, там, где позволяют полномочия, ЦБ РФ это уже сделал: внутри банковской системы ни один документ в бумажном виде уже не перемещается. Можно было бы таким же образом формализовать взаимоотношения между разными вертикалями федеральных структур. До сих пор корреспонденция в госструктурах передается (официально) только на бумаге. Перейти на безбумажные технологии здесь можно недорого и быстро.

К сожалению, недоработки в законе об электронной подписи (ЭП) стали камнем преткновения на дороге автоматизации документооборота. На практике он не работает из-за задержек в оформлении документов, регламентирующих отношения между организациями, которые хотят использовать ЭП. Пока же все заканчивается бумагой с подписью и печатью, и у неофитов полно поводов усомниться в значении СЭД.

Что делать с "бумагой"?
СЭД известны уже на протяжении нескольких лет, интерес к ним растет во всем мире, они успели стать традиционными и выработать стандарты на свою функциональность. В видении компании ABBYY такими стандартами являются:

  • поддержка полного жизненного цикла документа – от создания до архивации;
  • поддержка коллективной работы с документами;
  • управление знаниями с развитым архивом и доступом к любым данным;
  • дистанционный доступ в технологии тонкого клиента;
  • поддержка всех современных систем хранения документов;
  • поддержка ввода документов.

    Поскольку "бумаги" пока много и так будет еще долго, разработанная компанией ABBYY система оптического распознавания (OCR) FineReader остается популярной не только в России, но и во всем мире (увы, нечастый случай для российского программного продукта). Может, лет через десять, когда появятся электронные средства отображения информации, по своим потребительским свойствам похожие на печатный документ, актуальность функции ввода бумажных документов СЭД уменьшится. Пока же документооборот без таких средств неполноценен. Большая часть современных СЭД имеет встроенные системы ввода бумажных документов, и примерно половина из них во всем мире, по оценкам ABBYY, работает с ее продукцией.

    FineReader в версии "scripting edition" можно полностью интегрировать в клиентскую часть системы документооборота. В этом случае пользователь работает с ним как с одной из функций общей системы. Иногда делается по-другому. Компонент FineReader "engine" устанавливается на серверную часть СЭД. Тогда документ распознается прямо при регистрации, далее его можно хранить и в формате PDF с сохранением текста с таким расчетом, чтобы можно было и посмотреть на документ, и организовать внутри него полнотекстовый архив. Оба эти решения очень популярны. Подавляющее большинство крупных российских производителей СЭД интегрировало их в свои решения. В Европе FineReader завоевал 80% рынка СЭД, в США – 30%.

    Перед современными системами ввода стоит задача обработки документов и форм в одном потоке. Предполагается, что формы могут быть машиночитаемыми и такими, в которых системе нужно "проявить интеллект", чтобы отыскать информацию. Для обработки форм компанией разработан специальный продукт FormReader, в котором реализована технология гибких форм (FlexiForm).

    Кроме разработки и продвижения ПП FineReader и FormReader компания ABBYY на рынке документооборота занимается дистрибуцией продукта под названием Ascent Capture, созданного американской компанией Kofax. Он позволяет организовать полный цикл ввода документов. У ABBYY есть свое решение для системы ввода – AIDIS (ABBYY Integrated Document Input System), но оно соответствует нише "легких" (low end) систем. Чтобы перейти в разряд мощных, ей нужно наращивать функциональность, гибкость и надежность.

    Главная задача Ascent Capture – добиться качественного изображения документа на выходе и после этого передать его в любую СЭД. Эта система нужна там, где идет обработка больших объемов документации. Поток разных документов на входе идентифицируется и разбивается системой на разные типы в соответствии с заданной пользователем бизнес-логикой их обработки, и далее каждый тип документов обрабатывается по-своему. Система может проиндексировать документы, подсчитать количество страниц, какие-то из них пустить на обычное распознавание, какие-то отправить на распознавание их как форм, что-то направить на верификацию операторам. Она одинаково может обработать и бумажные, и электронные документы, разумеется, в последнем случае опустив процесс распознавания.

    Все дело в деталях
    (важно только изобрести нужные и научиться хорошо их делать)
    Роль FineReader на рынке и направление его развития сейчас кардинально пересматривается. Дальнейшая борьба за повышение качества распознавания может оказаться для пользователя несущественной. Принципиальна ли для OCR разница между тремя и двумя ошибками на странице (при том, что арифметически подсчитанная разница в качестве распознавания составляет более 30%)? Вряд ли. Более важным становится время, затраченное в целом на обработку документа, естественно, с сохранением качества распознавания.

    Одна из особенностей FineReader заключается в том, что эта программа одинаково хорошо приспособлена и для розничного, и для корпоративного рынка, например для интеграции в профессиональные приложения. И развивается этот продукт, ориентируясь на оба рынка, хотя корпоративный сектор представляется компании ABBYY более перспективным. Маркетинговая идея разработки и политика продвижения программного продукта FormReader тоже соответствует этой стратегии.

    Кроме систем ввода ABBYY параллельно занимается не менее интеллектуальноемкими и перспективными разработками, например лингвистическими технологиями, связанными с архивом информации. Пока эффективных систем в этой области мало, в основном они строятся на базе полнотекстового архива с незначительно улучшающими его дополнениями.

    Один из компонентов СЭД – управление знаниями, имеющее следующие задачи:

  • предоставлять человеку удобные для него (а не для машины) средства архива информации;
  • позволить быстро оценить содержание документа;
  • создавать метаданные.

    Метаданные формируются на основе предварительных описаний предмета, составляющего интерес пользователя, и позволяют создавать экспертные представления по направлениям деятельности компании на базе накопленной в ней информации.

    Документы отражают знания людей в виде неких формализованных текстов и изображений. Чтобы конвертировать их обратно в знания, нужен эффективный процесс составления нового знания. ABBYY ставит перед собой задачу разработки системы, которая сумеет из данных эффективно извлекать нужную пользователю информацию. Логика функционирования этой технологии в ABBYY уже разработана: есть движок, есть и продолжают создаваться новые тематические словари. Но рыночные методы ее применения пока под вопросом. Важно проанализировать реальный спрос.

    Некоторые ожидания пользователей в этой области понятны уже сегодня. Ясно, что управление знаниями остро необходимо для интернета, для корпоративных и публичных порталов. Но как только появляются новые средства, новые инструменты, они порождают новые требования, не всегда предусмотренные поставщиком. В силу этого компания не должна спешить. Богатый опыт продвижения FineReader помогает предвидеть и обходить "острые углы", появление которых сопутствует выпуску нового продукта на рынок, и детально проработать варианты его применения. "Чертики сидят в деталях!" – любят повторять немцы, и опыт компании говорит о том, что эти "чертики" порой обходятся гораздо дороже целого. Первое, что хочет сделать компания, это понять, где спрос наиболее острый, и максимально "заточить" под него новый продукт. Тогда новация получит благодарных клиентов, которые реально будут пользоваться ею. Задача сделать продукт для всех заманчива с точки зрения возврата инвестиций, но, по мнению маркетологов из ABBYY, в данном случае ошибочна.

    В ABBYY надеются, что с учетом накопленного с OCR опыта инновация будет развиваться на рынке быстрее, чем FineReader, которому в этом году уже исполнилось 10 лет.

    Валерий Васильев

  • сетевой форум
    архив
    подписка на журнал
    о сетевом