Identification

UMIS Number BG16RFOP002-1.001-0522-C01
Project Name Implementation of an AI tool "Serendipity" for fundamental alteration of the media monitoring and analysis processes in A Data Pro
Beneficiary 130163919 A Data Pro Ltd
Funding ERDF ==> Innovations and Competitiveness
Date of the Contract/Order 18.01.2017
Start Date 18.01.2017
End Date 18.10.2018
Status of Implementation of the Contract/Order of the Grant Closed (completion date)
Location of Performance
  • България, Югозападна и южно-централна България, Южен централен, Пловдив, Пловдив, гр.Пловдив
  • България, Югозападна и южно-централна България, Югозападен, София-Град, Столична, гр.София

Description

Brief description
А Дейта Про е глобален лидер в многоезиковата обработка на данни, медийния мониторинг и анализ (MMA), проучването на риска и бизнес разузнаването. Глобалният ръст на обемите на неструктурирана информация, който формира високото търсене на нашите услуги, обаче, е твърде висок - в пъти по-бърз от възможностите ни да я придобиваме и обработваме ръчно, независимо че разполагаме  с отлични системи за управление на съдържание (CMS). Затова наш стратегически приоритет е максимална автоматизация на всички процеси. Това важи особено силно за MMA сегмента където се извършва ръчно събиране на медийно съдържание, кодирането / класифицирането и неговата интерпретация.
За разлика от други сегменти, тук използваните системи трябва да притежават свойството "интелигентност" -  да могат автономно да взимат решения според семантиката на данните. Инвестираме (над 3 млн.лв.) в разработката на такива системи от няколко години с обнадеждаващи резултати (напр. системи за авто-журналистика). В резултат на проведените индустриални и експериментални изследвания разполагаме и с три собствени разработки за клъстеризация, класифициране и автоматично извеждане на именовани обекти (NER) - защитени с авторско право и общо наричани Serendipity (от англ. "приятна изненада"). Serendipity е изкуствен интелект, който може да промени фундаментално процеса на доставка на MMA услуги чрез почти пълната му автоматизация. За да работи Serendipity е нужно фронт-енд приложение, което да я управлява, да осъществява връзка с наличните CMS решения, да визуализира данни и да позволява супервизирано машинно трениране от анализатори и клиенти. Необходима е и мейн-фрейм хардуерна система, която да осигури достатъчна изчислителна мощ за провеждането на паралелна обработка и ускоряване на изкуствения интелект.  Закупуването на тези активи е в основата на проекта с цел внедряване на разработките за постигане на качествено нова, фундаментална промяна на процеса и повишаване конкурентоспособността на А Дейта Про.
Activities
  • Activity: Придобиване/разработване на специализиран софтуер, необходим за внедряването на иновативния процес (Дейността ще бъде осъществена чрез придобиване/разработване на 1 бр. ДНА на софтуерна платформа за интеграция на три-компонентен изкуствен интелект с механизъм за машинно обучение): Промяната на производствения процес за осигуряване на услугата "медиен мониторинг и анализ" (като аутсорсинг услуга, като услуга за крайни клиенти или като компонент от други процеси) ще се осъществи чрез внедряването на Serendipity предимно чрез дейност 1 на проекта - т.е. чрез закупуване на фронт-енд приложение, което да осигури интегрирана работа между разработените компоненти, и между тях и съществуващата система за управление на съдържание. Това прави дейността критична за успеха на проекта. Тя включва придобиването/разработването, инсталирането, настройката, тестването и въвеждането в експлоатация на 1 бр. дълготраен нематериален актив офиса на А Дейта Про в гр. Пловдив, където са съсредоточени основните дейности и процеси по медиен мониторинг и анализ - втори ранг от веригата на принадената стойност в информационния бизнес на компанията. Закупената техника ще се помещава в дейта център в град Пловдив. В рамките на тази дейност ще бъде осигурeно софтуерно приложение, което ще изпълнява четири ключови групи операции, а именно 1. Софтуерно интегриране на трите компонента, разработени от А Дейта Про, така че да работят едновременно/паралелно върху един и същи набор от данни, като се предвижда използването на повече от един такъв паралелно. 2. Софтуерно интегриране на трите компонента на Serendipity така че да позволи да бъде използвана чрез наличната в дружеството система за управление на съдържание, така че да автоматизира процеса на NER, класификация или клъстеризиране на материали 3. Софтуерно интегриране на трите компонента по начин, който да позволява системи за медиен мониторинг на трети страни да комуникират с платформата и да извличат обработени документи - например. чрез директно получаване на данни от клиенти или други доставчици. Платформата трябва да притежава приложно-програмен интерфейс (Application Program Interface), който да позволи пълноценно използване на компонентите. 4. Осигуряване на функционалност за подаване на директна обратна връзка за осъществяване на машинно обучение на интелекта Serendipity от страна на медиа анализатори в компанията (работещи през CMS т.1) или от страна на междинни или крайни клиенти на услугата. С осъществяването на дейността ще бъде придобито/разработено приложение, което ще е едновременно производствено (във връзка с CMS) и потребителско (dashboard), като ще се използва за обслужване главно на корпоративни аутсорсинг клиенти чрез предоставянето по нов начин на услуги по медиа мониторинг или решения, изцяло съставени от, или включващи, MMA процеси. Понастоящем процесът по медиен мониторинг и анализ - е тромав и неефективен. Скоростта на работа на отделните служители, техните ръководители и контрольорите по качеството е изключително ниска на фона на това, което може да се осигури при автоматизация на процеса. Недостатъците на текущия производствен процес са много : 1. Всеки отделен документ трябва да бъде прочетен от човек, за да се прецени дали е релевантен или не. Което губи много време само в пресяване на неточно подбран пул от статии. Търсенето по ключови думи е твърде неефективно, за да гарантира висока степен на прецизност и същевременно пълнота и сигурност в резултатите. 2. Кодирането на всеки документ изисква анализаторите да са запознати с правилата за всеки отделен клиент, и с ръководства, което води до накъсаност на работата, дълги периоди за запознаване с изискванията и свикване с тях, чести грешки при смяна на хора, заместване и др. 3. Допускат се грешки поради високи очаквания за производителност, продиктувани от постоянно нарастващите обеми и мн.др. 4. Може би най-сериозното предизвикателство е не толкова управлението на процеса, колкото загубата на време. Когато една дейност е толкова трудово интензивна, тя се осъществява със значително забавяне в публикуването или предоставянето на резултатите на клиента - в ера, когато скоростта на реакциите определя конкурентоспособността на компаниите, клиентите не могат да си позволят забавяне с дни., Contracted Amount: 687 200.00 , Reported Amount: 685 000.00
  • Activity: Придобиване на ново оборудване, необходимо за внедряване в производството на иновативния процес (Дейността ще бъде осъществена чрез Доставка, монтаж, инсталиране и въвеждане в експлоатация на 2 бр. машини за дуплексно сканиране и 1 бр. процесорен акселератор за обучение на изкуствен интелект): Тази дейност включва закупуването, инсталирането, настройката, тестването и въвеждането в експлоатация на 3 броя материални активи в производствените офиси на А Дейта Про в гр. Пловдив и в гр. София, където са съсредоточени дейностите по медиа мониторинг и анализ - втори ранг от веригата на принадената стойност в информационния бизнес на компанията. Предвиденото оборудване ще изпълнява две цели, които са в крайна противоположност в спектъра на добавена стойност в MMA процесите, но са неизменна част от тях Първата машина, предвидени за доставка в гр. Пловдив и инсталация върху наето пространство в професионален дейта център, ще служи за ускоряване на процеса на машинно обучение чрез осигуряването на необходимата процесорна мощ. За разлика от обикновените сървъри, процесорната технология за изкуствен интелект позволява ускорение на процеса на получаване, изчисляване и анализ хардуерно, което позволява изпълнението на стотици хиляди задачи паралелно. Не очакваме "супер" компютър или резистивни чипове, каквито наскоро обявиха от лабораторията на IBM, но ще търсим оборудване с висока скорост на локалната памет, което да позволи хилядократно увеличение на скоростта на машинния анализ върху множество ядра в сравнение с обикновените микропроцесори. По същество тя прилича на сървърна технология, но е в специализирана архитектура за ускоряване на паралелни изчислителни процеси. Очаква се доставка до 6 месеца от сключване на договора Други два машини са предвидени за доставка в гр. София и в гр. Пловдив. Ако ускорителят служи за внедряване на Serendipity чрез инсталирането и върху нея, то останалите машина са предназначени, за да осигурят достатъчно входящи данни от различно естество за машинния алгоритъм. Така се затваря почти напълно цикъла на автоматизация на MMA процеса. Тук е моментът да отбележим, че в хода на развойната си дейност, както и в резултат на закупуване на специализирано оборудване и софтуер, А Дейта Про разработи или придоби изключително важни системи - кроулър, изчистващ алгоритъм, дистрибутиращ алгоритъм и др. Всички те са вече внедрени в MMA процеса, но засега са променили в значителна степен само част от входящата информация - такава, която може да се събира онлайн и е налична в цифров вид. За да се автоматизира напълно процесът и за да се зареди изкуственият интелект Serendipity и с други документи, следва да бъде премахнат и друг bottleneck на процеса - цифровизацията на печатни материали. Това е смисълът от закупуването на такова оборудване. Процесът ще бъде разделен така, че националната преса да се получава за сканиране в офиса в гр. София, а регионалните издания - в Пловдив. Ето защо е предвидено закупуване и инсталиране по една машина за конвейерно дуплексно цветно сканиране и странициране на преса, резултатът от което ще бъде изпращан чрез файлове към системата, инсталирана в гр. Пловдив. Това оборудване ще позволи значителна автоматизация при дигитализацията на печатни медии. Макар и на пръв поглед да са много различни, и двата типа оборудване (акселератор и скенери) формират комплексно оборудване, необходимо за внедряване в производството на иновативния процес по автоматизация и особено в областта на машинното обучение. Нито една от компаниите, които обслужваме не разполага със системи, които са способни да интерпретират едновременно всички видове документи / материали - коментари, онлайн статии , печатни статии, коментари под статии и т.н. Още по-малко да ги клъстеризират. Така например, ако дадена компания е спомената в една статия в печата и тя е открита и онлайн, това ще бъде интерпретирано грешно като две отделни статии. Елиминирането на дублажи чрез клъстеризиране, но разширявайки и способността на машинния интелект Serendipity да идентифицира вида на медията и дори да класифицира статиите различно според данните в нея, формират важни предимства за нас - предимства, които чрез аутсорсинг стават такива и за нашите клиенти., Contracted Amount: 760 310.00 , Reported Amount: 751 000.00

Participating Organizations

Partners None
Contractors
  • Contractor: BGService OOD, Contracted Amount*: 411 000.00 , Reported Amount**: 685 000.00
  • Contractor: Reset Computers Ltd, Contracted Amount*: 358 920.00 , Reported Amount**: 598 200.00
  • Contractor: Zetta Systems, Contracted Amount*: 72 580.00 , Reported Amount**: 152 800.00
Subcontractors None
Members of the Consortium None

Notes:

* The projected contract value may be lower than the reported one because of any of the following reasons:

  • For physical person, the contracted value does not include the employer expenses, which are admissible expenses and are accounted under the project
  • The Beneficiary has reported expense only with an invoice without a contract with the selected contractor
  • The beneficiary has reported over again expenses to the MA

** This column represents the amount of costs claimed by the beneficiary

Indicators

Indicator 1 Private investment matching public support for innovation or R&D projects (all activities), Measure Unit: евро, Base Value: 0.00 , Target amount: 304 036.00 , Reached amount: 303 456.39
Indicator 2 Number of enterprises receiving support, Measure Unit: предприятия, Base Value: 0.00 , Target amount: 1.00 , Reached amount: 1.00
Indicator 3 Финансирани проекти за еко-иновации, Measure Unit: Брой, Base Value: 0.00 , Target amount: 1.00 , Reached amount: 1.00

Financial Information

Total Project cost 1 447 510.00 BGN
Grant 848 956.00 BGN
Self amount 598 554.00 BGN
Total actual amounts paid 842 500.00 BGN
Percentage of EU co-financing 85.00 %

Financial Corrections

None

Notes:

1 The quoted value represents the maximum amount of the imposed financial correction. Depending on the performance of the contract, the actual amount of the deducted financial correction may be lower.

2 A financial correction with a zero total value means that it has been canceled as a result of a court judgment.

Procurements

Procedure 1 Subject to due process: Доставка, монтаж, инсталиране и въвеждане в експлоатация на 2 бр. машини за дуплексно сканиране , Estimated Amount: 156 400.00
  • Differentiated position 1: Доставка, монтаж, инсталиране и въвеждане в експлоатация на 2 бр. машини за дуплексно сканиране
    Contractor: Zetta Systems
    Contract total funded value: 72 580.00
Procedure 2 Subject to due process: Доставка, монтаж, инсталиране и въвеждане в експлоатация на процесорен акселератор за обучение на изкуствен интелект, Estimated Amount: 603 910.00
  • Differentiated position 1: Доставка, монтаж, инсталиране и въвеждане в експлоатация на процесорен акселератор за обучение на изкуствен интелек
    Contractor: Reset Computers Ltd
    Contract total funded value: 358 920.00
Procedure 3 Subject to due process: Придобиване/Разработване на софтуерна платформа за интеграция на три-компонентен изкуствен интелект с механизъм за машинно обучение , Estimated Amount: 687 200.00
  • Differentiated position 1: Придобиване/Разработване на софтуерна платформа за интеграция на три-компонентен изкуствен интелект с механизъм за машинно обучение
    Contractor:
    Contract total funded value:

Notes:

All amounts are in Bulgarian lev (BGN) / 1 EUR = 1,95583 BGN