Коляда А. С. Применение латентного размещения Дирихле для анализа публикаций из наукометрических баз данных / А. С. Коляда, В. А. Яковенко, В. Д. Гогунский // Пр. Одес. політехн. ун-ту. - 2014. - Вип. 1. - С. 186-191. - Библиогр.: 6 назв. - рус.Цель работы - определение наиболее подходящей тематической модели для классификации научных публикаций по авторам-однофамильцам. Проанализированы вероятностные тематические модели и предложено использование модели латентного размещения Дирихле - лидирующей среди вероятностных тематических моделей благодаря многочисленным обобщениям и приложениям к анализу коллекций текстовых документов. Для сравнения выбрана модель латентно семантического анализа, недостатки которой решаются при помощи рассматриваемой модели. Модель применена в проекте по извлечению публикаций из наукометрических баз данных. В этом проекте применение тематического моделирования позволяет решить проблему разделения публикаций авторов-однофамильцев, где в качестве коллекции документов выбраны названия публикаций. Результаты показали, что модель латентного размещения Дирихле уступает латентно-семантическому анализу, когда используется малый обьем содержимого документов. Поэтому для коллекций документов малого объема предпочтительным является использование латентно-семантического анализа, а для больших объемов - латентного размещения Дирихле. Індекс рубрикатора НБУВ: Ч231.684
Рубрики:
Шифр НБУВ: Ж69121 Пошук видання у каталогах НБУВ Повний текст Наукова періодика України Додаткова інформація про автора(ів) публікації: (cписок формується автоматично, до списку можуть бути включені персоналії з подібними іменами або однофамільці) Якщо, ви не знайшли інформацію про автора(ів) публікації, маєте бажання виправити або відобразити більш докладну інформацію про науковців України запрошуємо заповнити "Анкету науковця"
|