О возможности определения префикса и суффикса слова по подсловам фиксированной длины

  • Галина Н. Жукова Национальный исследовательский университет «Высшая школа экономики» https://orcid.org/0000-0003-1835-7422
  • Юрий Г. Сметанин Федеральный исследовательский центр «Информатика и управление» Российской академии наук , 119333, г. Москва, ул. Вавилова, д. 40 https://orcid.org/0000-0003-0242-6972
  • Михаил В. Ульянов Московский государственный университет им. М.В. Ломоносова , 119991, г. Москва, Ленинские горы, д. 1; Институт проблем управления им. В.А. Трапезникова Российской академии наук, 117997, г. Москва, ул. Профсоюзная, д. 65 https://orcid.org/0000-0002-5784-9836
Ключевые слова: pеконструкция слова, префикс, суффикс, мультимножество подслов, подслова фиксированной длины, оператор сдвига

Аннотация

      В прикладных задачах бизнес-информатики, связанных с анализом данных (в частности, при анализе и прогнозировании временных рядов при исследовании лог-файлов бизнес-процессов) возникают задачи качественного анализа. Методы качественного анализа достаточно часто используют символьное кодирование как способ представления информации об исследуемых процессах. В ряде ситуаций, обусловленных фрагментарностью таких описаний, возникает задача реконструкции полного символьного описания процесса (слова) по его последовательным фрагментам (подсловам). По мультимножеству всех подслов достаточно большой длины исходное слово восстанавливается однозначно. В случае недостаточно длинных подслов возможно множество различных реконструкций исходного неизвестного слова. Число допустимых реконструкций можно сократить, если определить суффикс и префикс реконструируемого слова. Предложен метод определения префикса и суффикса слова над конечным алфавитом, состоящих из символов каждый, на основании мультимножества подслов фиксированной длины, равной. Принимается гипотеза о том, что это мультимножество порождено смещением на один символ окна фиксированной длины по неизвестному слову.Метод определения префикса и суффикса основан на построениии анализе матрицы, образованной записанными по строкам в произвольном порядке подсловамиз  и использовании оператора, действующего на мультимножества символов алфавита, образованных соседними столбцами этой матрицы.Метод позволяет определить префикс  и суффикс  неизвестного слова в случае, если  для любых  от 1 до . В случае, если  только для некоторых значений , в префиксе и суффиксе определяются символы в соответствующих позициях, а для остальных символов выполняется условие . В худшем случае метод констатирует, что  для всех  от 1 до , но не определяет сами символы. Это ситуация, при которой префикс и суффикс совпадают, но не могут быть определены.

Скачивания

Данные скачивания пока не доступны.
Опубликован
2020-06-28
Как цитировать
Жукова Г. Н., Сметанин Ю. Г., & Ульянов М. В. (2020). О возможности определения префикса и суффикса слова по подсловам фиксированной длины. БИЗНЕС-ИНФОРМАТИКА, 14(2), 84-92. https://doi.org/10.17323/2587-814X.2020.2.84.92
Раздел
Математические методы и алгоритмы бизнес-информатики