Дейност 1: Извършване на изследвания, изпитвания, измервания и валидиране, необходими за разработването на продуктова (стока или услуга) или производствена иновация (иновация в бизнес процесите, насочена към производство на стоки и предоставяне на услуги).: Целта е разработване на радикална процесова иновация на световно ниво, водеща до качествено нови методи за създаване на AMELERT, чрез експериментално развитие.
Дейността ще се изпълнява изцяло от квалифициран персонал на кандидата със следните задачи:
1. Скриптове за мониторинг на медиите и извличане на необходимата информация за продукта (M1-18)
А Дейта Про разполага с частична база данни с медийни източници от някои европейски и световни пазари. Тя не включва всички медии от наличните държави и всички целеви езици и съдържа част от необходимите данни – име на източник, URL, държава и език. Основна задача тук е допълване на базата с нови медии от целевите пазари и езици, проучване, изследвания и развитие на скриптове за мониторинг и извличане на необходимата информация от медиите.
2. Проучване, обучение и тестване на големи езикови модели за идентифициране на споменати лица (физически и юридически), местоположения и за идентифициране на вида престъпление на английски най-малко два от основните световни езици (М1-9)
В тази задача ще бъдат подбрани, обучени и тествани големи езикови модели с машинно обучение за разпознаване на споменати лица (юридически или физически лица, за разпознаване на място на престъплението (напр. Държава или град), както и такива за разпознаване на вида престъпление, от категориите включени в регулациите за борба с прането на пари (AML). Този компонент е от изключително значение за конкурентните предимства в процеса по изработката и при пазарната реализация на иновативния информационен продукт вбъдеще. Благодарение на тези езикови модели, AMELERT ще може автоматично да извлича, записва в структуриран вид и предоставя бързо най-важната информация за крайните потребители с висока точност. Моделите ще бъдат подбрани и обучени така, че да идентифицират лица, местоположения и вид престъпление на езика на статията и да ги записва на английски език с правилната секторна терминология, така че да съответства на възприетите понятия, без място за тълкуване. Това е основен иновативен компонент и носител на добавена стойност, който ще позволява на международни инвеститори лесно да се информират за важни за решенията им локални за субекта криминални събития.
3. Големи езикови модели за автоматично генериране на резюмета на статии базирани на споменатите лица (entity centric resumes) от най-малко два от основните световни езици и на английски език (М1-12)
Тази задача е носител на втория иновативен компонент на предложената процесова иновация. Тук, за 12 месеца екипът ще проучи, адаптира, обучи и тества езикови модели за създаване на резюмета на статии, формирани около споменатото лице. Идеята тук е не просто да се генерира резюме на статията, а да се генерира такова резюме, което кратко точно и ясно описва в какъв контекст е представен споменания обект (лице) в нея, във връзка с какво престъпление, има ли присъда и др.
За двете групи големи езикови модели (т. 2 и 3) ще бъде направено проучване за подходящи налични модели. Ако такива не съществуват, новините на езици, различни от английски, ще бъдат превеждани автоматично на английски, след което ще бъдат обработвани от модел за английски език.
4. Разработване на общ технологичен процес и провеждане на тестове за демонстрация и валидация на технологията в релевантна среда (М13-18)
В рамките на тази задача ще създадем услувия са комуникация между компонентите в общ автоматизиран процес и ще проведем тестове за качеството на изпълнение на процеса в цялост. Резултатите (сигналите) ще се визуализират в съществуваща в А Дейта Про система за управление на съдържанието, която позволява проверка и експертна обработка на резултатите. Тя разполага с база данни и API, които позволяват лесна интеграция с клиентски системи и подаване на сигналите веднага след тяхното създаване. При необходимост, екипът ще дообучи моделите и подобри скриптовете.
Чрез изпълнението на дейността ще достигнем най-малко TRL 6 на иновативния процес.
|
1 189 656.00
|
0.00
|