РЕФЕРАТИВНА БАЗА ДАНИХ "УКРАЇНІКА НАУКОВА"
Abstract database «Ukrainica Scientific»


Бази даних



Вид пошуку
Пошуковий запит: (<.>ID=REF-0000721833<.>)
Загальна кількість знайдених документів : 1

Buriachok V. 
Implementation of an index optimize technology for highly specialized terms based on the phonetic algorithm Metaphone / V. Buriachok, M. Hadzhyiev, V. Sokolov, P. Skladannyi, L. Kuzmenko // Вост.-Европ. журн. передовых технологий. - 2019. - № 5/2. - С. 64-71. - Бібліогр.: 18 назв. - англ.

У процесі формування баз даних, наприклад для задоволення потреб закладів охорони здоров'я, доволі часто виникає проблема щодо введення та подальшої обробки імен і прізвищ лікарів і пацієнтів, які є вузькоспеціалізованими за вимовою та написанням. Це пояснюється тим, що імена та прізвища людей не можуть бути унікальними, їх напис не підпадає під жодні правила фонетики, а їх довжини у разі їх викладення різними мовами можуть не співпадати. З появою інтернету такий стан справ стає взагалі критичним і може призвести до того, що за однією адресою може бути відправлено декілька копій електронних листів. Вирішити означену проблему можуть допомогти фонетичні алгоритми порівняння слів DaitchMokotoff, Soundex, NYSIIS, Polyphone та Metaphone, а також алгоритми Левенштейна та Джаро, алгоритми на основі Q-грам, які надають можливість знаходити відстані між словами. Найбільшого поширення серед них отримали алгоритми Soundex і Metaphone, які призначені для індексування слів по їх звучанням з урахуванням правил вимови. Шляхом застосування алгоритму Metaphone зроблено спробу оптимізації процесів фонетичного пошуку для задач нечіткого співпадіння, наприклад, у разі дедублікації даних у різноманітних базах даних і реєстрах для зменшення кількості помилок невірного введення прізвищ. Із аналізу найбільш розповсюджених прізвищ видно, що частина з них є українського або російського походження. У цьому випадку правила, за якими вимовляються та записуються прізвища, наприклад українською мовою, кардинально відрізняються від базових алгоритмів для англійської та достатньо відрізняються для російської мови. Саме тому фонетичний алгоритм має враховувати передусім особливості формування українських прізвищ, що нині є надзвичайно актуальним. Наведено результати експерименту з формування фонетичних індексів і збільшення продуктивності у разі використання сформованих індексів. Запропоновано метод адаптації пошуку для інших сфер і кількох споріднених мов на прикладі пошуку по лікарським засобам.


Індекс рубрикатора НБУВ: З970.66

Рубрики:
  

Шифр НБУВ: Ж24320 Пошук видання у каталогах НБУВ 
Повний текст  Наукова періодика України 
Додаткова інформація про автора(ів) публікації:
(cписок формується автоматично, до списку можуть бути включені персоналії з подібними іменами або однофамільці)
  Якщо, ви не знайшли інформацію про автора(ів) публікації, маєте бажання виправити або відобразити більш докладну інформацію про науковців України запрошуємо заповнити "Анкету науковця"
 
Національна бібліотека України імені В. І. Вернадського
Відділ наукового формування національних реферативних ресурсів
Інститут проблем реєстрації інформації НАН України

Всі права захищені © Національна бібліотека України імені В. І. Вернадського