Д. Серікбаев атындағы ВКТУ сайты
  • Қаріп өлшемі
    16px
    Сайттың түстері
    Суреттер

СРАВНИТЕЛЬНОЕ ИССЛЕДОВАНИЕ МОДЕЛЕЙ LSTM И BERT ДЛЯ ЗАДАЧ МУЛЬТИКЛАССИФИКАЦИИ С ИСПОЛЬЗОВАНИЕМ НАБОРА ДАННЫХ NER

Авторлар

Аты-жөні Жұмыс орны
Dina Oralbekova Institute of Information and Computational Technologies
Оркен Мамырбаев -
Аягоз Имансакипова -
Алия Жунусова -
Куралай Мухсина -
Нурбапа Мекебаев -

Жарияланды:

2025-07-06

Мақала тілі:

Орыс тілі

Қаралымдар:

106

Кілт сөздер:

NLP, мультиклассификация, NER, LSTM, BERT, малоресурсный язык

Аңдатпа

В статье проведён сравнительный анализ моделей LSTM и BERT, применяемых к задачам мультиклассификации на казахском языке с использованием набора данных для распознавания именованных сущностей. Основной акцент исследования сделан на преодолении проблемы ограниченности ресурсов для обработки текстов на казахском языке, посредством адаптации существующих методов машинного обучения для анализа многомерных классификационных задач. Оба подхода продемонстрировали свою эффективность в различных аспектах обработки текстовых данных, включая моделирование контекстных зависимостей и точную классификацию по множеству категорий. Модель LSTM показала высокую способность к учёту временных зависимостей в тексте, что делает её пригодной для решения задач классификации в условиях ограниченных языковых ресурсов. В то же время, модель BERT, основанная на архитектуре Transformer, продемонстрировала превосходные результаты в области контекстного анализа и обработки сложных текстовых структур, что обеспечивает её более высокую производительность при мультиклассификации текстов на казахском языке. Результаты экспериментов свидетельствуют о том, что обе модели могут эффективно применяться для задач классификации текстов на казахском языке, однако модель BERT продемонстрировала более стабильные и надёжные результаты, обусловленные её способностью к более глубокому контекстуальному пониманию. Полученные данные подчёркивают значимость использования современных методов обработки естественного языка для языков с ограниченными ресурсами и открывают перспективы для их дальнейшего исследования и практического применения.

Oralbekova, D., Мамырбаев, О., Имансакипова, А., Жунусова, А., Мухсина, К., & Мекебаев, Н. (2025). СРАВНИТЕЛЬНОЕ ИССЛЕДОВАНИЕ МОДЕЛЕЙ LSTM И BERT ДЛЯ ЗАДАЧ МУЛЬТИКЛАССИФИКАЦИИ С ИСПОЛЬЗОВАНИЕМ НАБОРА ДАННЫХ NER. Д. Серікбаев атындағы ШҚТУ Хабаршысы, (2). Retrieved from https://journals.ektu.kz/vestnik/article/view/1013

Осы автор(лар)дың ең көп оқылған мақалалары

Жарияланымның атауы Авторлар Тиістілігі Тілі Көрулер Күні Дәйексөз
1 A,The Research And Development Of A Cryptography Algorithm Based On Polylinear Algebra Using Blockchain Methodology Amirkhanova D., Мамырбаев O.
  • Satbayev University
  • Institute of information and Computing Technologies
EN 182 2025-03-28
2 Thermodynamic Model Of Studying The Dynamics Of The Temperature Balance By Calculating Heat Energy In Agricultural Sector Aitkazina A., Мамырбаев О.
  • Al-Farabi Kazakh National University
  • Joldasbekov Institute of Mechanics and Engineering
EN 150 2024-03-29