Saved trees
UMIS AND ITS USERS CONTRIBUTED TO SAVING 54 959 TREES
Български

Programme: Innovations and Competitiveness

Planning region: All

Description

A Data Pro is a global leader in multilingual data processing, media monitoring and analysis (MMA), risk and compliance and business intelligence services. The unprecedented growth in the volumes of unstructured information flows that form a high demand for our services, however, is way too high - times faster than our ability to acquire and process it manually, although we do have excellent content management systems. This is why a strategic priority is maximum automation in all processes. This is especially true for the MMA segment which involves manual collection of content, manual coding / classification and manual interpretation.
Unlike other segments within the company, to function properly the implemented systems must have the property "intelligence" - e.g. to autonomously make decisions according to the semantics of the data. Having invested (over BGN 3 mln) in the development of such systems for several years already, we achieved encouraging results (such as an automated journalism system). As a result of our efforts in industrial development and experimental research we authored three proprietary clustering, classification and named entity recognition (NER) algorithms - copyright protected and collectively referred to as Serendipity (def."pleasant surprise"). Serendipity is an artificial intelligence that can fundamentally change the delivery process of MMA services by achieving a nearly full automation. To operate Serendipity needs a front-end application that enables its managemnet, CMS interoperability, visualization and supervised machine training by analysts and customers. A mainframe hardware system is also needed to provide sufficient computing power to conduct parallel processing and acceleration of the artificial intelligence engine. The purchase of these assets forms the basis of the project so as to implement development to achieve a fundamentally new process that would ensure the competitiveness of A Data Pro in the long-run.








Activities
Activity Contracted Amount Reported Amount
Придобиване/разработване на специализиран софтуер, необходим за внедряването на иновативния процес (Дейността ще бъде осъществена чрез придобиване/разработване на 1 бр. ДНА на софтуерна платформа за интеграция на три-компонентен изкуствен интелект с механизъм за машинно обучение): Промяната на производствения процес за осигуряване на услугата "медиен мониторинг и анализ" (като аутсорсинг услуга, като услуга за крайни клиенти или като компонент от други процеси) ще се осъществи чрез внедряването на Serendipity предимно чрез дейност 1 на проекта - т.е. чрез закупуване на фронт-енд приложение, което да осигури интегрирана работа между разработените компоненти, и между тях и съществуващата система за управление на съдържание. Това прави дейността критична за успеха на проекта. Тя включва придобиването/разработването, инсталирането, настройката, тестването и въвеждането в експлоатация на 1 бр. дълготраен нематериален актив офиса на А Дейта Про в гр. Пловдив, където са съсредоточени основните дейности и процеси по медиен мониторинг и анализ - втори ранг от веригата на принадената стойност в информационния бизнес на компанията. Закупената техника ще се помещава в дейта център в град Пловдив. В рамките на тази дейност ще бъде осигурeно софтуерно приложение, което ще изпълнява четири ключови групи операции, а именно 1. Софтуерно интегриране на трите компонента, разработени от А Дейта Про, така че да работят едновременно/паралелно върху един и същи набор от данни, като се предвижда използването на повече от един такъв паралелно. 2. Софтуерно интегриране на трите компонента на Serendipity така че да позволи да бъде използвана чрез наличната в дружеството система за управление на съдържание, така че да автоматизира процеса на NER, класификация или клъстеризиране на материали 3. Софтуерно интегриране на трите компонента по начин, който да позволява системи за медиен мониторинг на трети страни да комуникират с платформата и да извличат обработени документи - например. чрез директно получаване на данни от клиенти или други доставчици. Платформата трябва да притежава приложно-програмен интерфейс (Application Program Interface), който да позволи пълноценно използване на компонентите. 4. Осигуряване на функционалност за подаване на директна обратна връзка за осъществяване на машинно обучение на интелекта Serendipity от страна на медиа анализатори в компанията (работещи през CMS т.1) или от страна на междинни или крайни клиенти на услугата. С осъществяването на дейността ще бъде придобито/разработено приложение, което ще е едновременно производствено (във връзка с CMS) и потребителско (dashboard), като ще се използва за обслужване главно на корпоративни аутсорсинг клиенти чрез предоставянето по нов начин на услуги по медиа мониторинг или решения, изцяло съставени от, или включващи, MMA процеси. Понастоящем процесът по медиен мониторинг и анализ - е тромав и неефективен. Скоростта на работа на отделните служители, техните ръководители и контрольорите по качеството е изключително ниска на фона на това, което може да се осигури при автоматизация на процеса. Недостатъците на текущия производствен процес са много : 1. Всеки отделен документ трябва да бъде прочетен от човек, за да се прецени дали е релевантен или не. Което губи много време само в пресяване на неточно подбран пул от статии. Търсенето по ключови думи е твърде неефективно, за да гарантира висока степен на прецизност и същевременно пълнота и сигурност в резултатите. 2. Кодирането на всеки документ изисква анализаторите да са запознати с правилата за всеки отделен клиент, и с ръководства, което води до накъсаност на работата, дълги периоди за запознаване с изискванията и свикване с тях, чести грешки при смяна на хора, заместване и др. 3. Допускат се грешки поради високи очаквания за производителност, продиктувани от постоянно нарастващите обеми и мн.др. 4. Може би най-сериозното предизвикателство е не толкова управлението на процеса, колкото загубата на време. Когато една дейност е толкова трудово интензивна, тя се осъществява със значително забавяне в публикуването или предоставянето на резултатите на клиента - в ера, когато скоростта на реакциите определя конкурентоспособността на компаниите, клиентите не могат да си позволят забавяне с дни. 687 200.00 685 000.00
Придобиване на ново оборудване, необходимо за внедряване в производството на иновативния процес (Дейността ще бъде осъществена чрез Доставка, монтаж, инсталиране и въвеждане в експлоатация на 2 бр. машини за дуплексно сканиране и 1 бр. процесорен акселератор за обучение на изкуствен интелект): Тази дейност включва закупуването, инсталирането, настройката, тестването и въвеждането в експлоатация на 3 броя материални активи в производствените офиси на А Дейта Про в гр. Пловдив и в гр. София, където са съсредоточени дейностите по медиа мониторинг и анализ - втори ранг от веригата на принадената стойност в информационния бизнес на компанията. Предвиденото оборудване ще изпълнява две цели, които са в крайна противоположност в спектъра на добавена стойност в MMA процесите, но са неизменна част от тях Първата машина, предвидени за доставка в гр. Пловдив и инсталация върху наето пространство в професионален дейта център, ще служи за ускоряване на процеса на машинно обучение чрез осигуряването на необходимата процесорна мощ. За разлика от обикновените сървъри, процесорната технология за изкуствен интелект позволява ускорение на процеса на получаване, изчисляване и анализ хардуерно, което позволява изпълнението на стотици хиляди задачи паралелно. Не очакваме "супер" компютър или резистивни чипове, каквито наскоро обявиха от лабораторията на IBM, но ще търсим оборудване с висока скорост на локалната памет, което да позволи хилядократно увеличение на скоростта на машинния анализ върху множество ядра в сравнение с обикновените микропроцесори. По същество тя прилича на сървърна технология, но е в специализирана архитектура за ускоряване на паралелни изчислителни процеси. Очаква се доставка до 6 месеца от сключване на договора Други два машини са предвидени за доставка в гр. София и в гр. Пловдив. Ако ускорителят служи за внедряване на Serendipity чрез инсталирането и върху нея, то останалите машина са предназначени, за да осигурят достатъчно входящи данни от различно естество за машинния алгоритъм. Така се затваря почти напълно цикъла на автоматизация на MMA процеса. Тук е моментът да отбележим, че в хода на развойната си дейност, както и в резултат на закупуване на специализирано оборудване и софтуер, А Дейта Про разработи или придоби изключително важни системи - кроулър, изчистващ алгоритъм, дистрибутиращ алгоритъм и др. Всички те са вече внедрени в MMA процеса, но засега са променили в значителна степен само част от входящата информация - такава, която може да се събира онлайн и е налична в цифров вид. За да се автоматизира напълно процесът и за да се зареди изкуственият интелект Serendipity и с други документи, следва да бъде премахнат и друг bottleneck на процеса - цифровизацията на печатни материали. Това е смисълът от закупуването на такова оборудване. Процесът ще бъде разделен така, че националната преса да се получава за сканиране в офиса в гр. София, а регионалните издания - в Пловдив. Ето защо е предвидено закупуване и инсталиране по една машина за конвейерно дуплексно цветно сканиране и странициране на преса, резултатът от което ще бъде изпращан чрез файлове към системата, инсталирана в гр. Пловдив. Това оборудване ще позволи значителна автоматизация при дигитализацията на печатни медии. Макар и на пръв поглед да са много различни, и двата типа оборудване (акселератор и скенери) формират комплексно оборудване, необходимо за внедряване в производството на иновативния процес по автоматизация и особено в областта на машинното обучение. Нито една от компаниите, които обслужваме не разполага със системи, които са способни да интерпретират едновременно всички видове документи / материали - коментари, онлайн статии , печатни статии, коментари под статии и т.н. Още по-малко да ги клъстеризират. Така например, ако дадена компания е спомената в една статия в печата и тя е открита и онлайн, това ще бъде интерпретирано грешно като две отделни статии. Елиминирането на дублажи чрез клъстеризиране, но разширявайки и способността на машинния интелект Serendipity да идентифицира вида на медията и дори да класифицира статиите различно според данните в нея, формират важни предимства за нас - предимства, които чрез аутсорсинг стават такива и за нашите клиенти. 760 310.00 751 000.00

Notes:

Elements in light blue allow detailed view when selected
All amounts are in Bulgarian lev (BGN) / 1 EUR = 1,95583 BGN
The project is financed by the Operational Programme "Technical Assistance" and co-financed by the European Union through the European Regional Development Fund.
In implementing the project № 0115-CCU-2.1 "Information system for management and monitoring of EU funds in 2014-2020 - UMIS 2020" (BG161PO002-2.1.01-0007-C0001).