"РАСПОЗНАВАНИЕ ГОЛОСА В СФЕРЕ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ"

ТРИБУНА УЧЁНОГО электронный научно-практический журнал

✒ ОПУБЛИКОВАТЬ СТАТЬЮ В НАШЕМ ЖУРНАЛЕ

ОПУБЛИКОВАТЬ СТАТЬЮ

•
РЕГИСТРАЦИЯ
•
ВХОД
•
РАСПОЗНАВАНИЕ ГОЛОСА В СФЕРЕ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ
Статья опубликована в журнале за "Февраль 2020"
Автор(ы) статьи: Мавлянов Б.Б.
PDF файл статьи
УДК 007.5 Мавлянов Бахрам Бахрамович студент 3 курса бакалавриата, Математический факультет, Ярославский государственный университет им. П.Г. Демидова, Россия, г. Ярославль e-mail: bakhram.mavlyanov@yandex.ru РАСПОЗНАВАНИЕ ГОЛОСА В СФЕРЕ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ Аннотация: В данной статье рассматривается технология распознавания голоса, как одного из направлений искусственного интеллекта. Особое внимание уделено методам распознавания голоса, предпосылкам и перспективам развития данной области. Ключевые слова: распознавание голоса, распознавание речи, информационные системы, искусственный интеллект. Mavlyanov Bakhram Bakhramovich 3rd year bachelor student, Faculty of Mathematics, Yaroslavl State University named of P.G. Demidov, Russia, Yaroslavl THE VOICE RECOGNITION IN THE FIELD OF INFORMATIONTECHNOLOGY Abstract: This article discusses voice recognition technology as one of the areas of artificial intelligence. Special attention is paid to voice recognition methods, prerequisites and prospects for the development of this field. Keywords: voice recognition, speech recognition, information systems, artificial intelligence. К 2019 году развитие информационных технологий достигло невероятного уровня, и процесс внедрения информационных технологий в нашу жизнь будет только усиливаться. Процессы сбора, обработки, хранения информации вышли на новый уровень благодаря современным вычислительным мощностям. Данный скачок также связан с развитием сети Интернет. Благодаря Интернету произошла популяризация информационных технологий. В настоящее время развитие цифрового общества достигло такого уровня, который позволяет перейти на Журнал «Трибуна ученого» Выпуск 02/2020 https://tribune-scientists.ru 1 новый этап. Новый этап развития предполагает создание системы, в которой человек играет второстепенную роль. С развитием искусственного интеллекта участие человека приобретает формальный характер, и его роль заключается в том, чтобы осуществлять контроль процессов, а не участвовать в них напрямую. Проблема взаимодействия пользователя и программ, использующих технологии искусственного интеллекта, является одним из важнейших направлений исследований в области информационных технологий. Перед специалистами стоит задача создания максимально удобных для конечного пользователя инструментов коммуникации с компьютерами самых разных типов. Естественно-языковой интерфейс является одним из наиболее перспективных инструментов такого рода [1]. Естественно-языковой интерфейс — это, по простому говоря, использование голоса, в качестве команды для информационной системы. Автоматическое распознавание голоса - это одно из наиболее динамично развивающихся направлений в области искусственного интеллекта, запрос общества на которое переоценить сложно. Сложность использования голоса в качестве входных данных заключается в различиях между речью человека и традиционным форматом ввода информации в компьютер. В то время как программные средства как правило рассчитаны на получение точного и чётко определённого ответа при вводе, то человеческая речь и произнесённые слова не являются точными. Наиболее современный метод распознавания голоса заключается в том, чтобы проводить анализ функций, и этот метод обычно приводит к независимому от источника звука распознаванию голоса. Вместо того, чтобы находить точное или приближенное к точному совпадению между голосовым сообщением и ранее сохраненным голосовым шаблоном, этот метод обрабатывает человеческую речь, используя «преобразования Фурье» или «линейное предсказательное кодирование (LPC)», а затем пытается найти сходства между ожидаемым и оцифрованным голосовым сообщением. Эти Журнал «Трибуна ученого» Выпуск 02/2020 https://tribune-scientists.ru 2 сходства будут присутствовать, несмотря на особенности произношения, скорость произношения, акцент, поэтому нет необходимости в обучении системы. Распознавание речи, которое не зависит от говорящего, оказалось очень сложным, и одной из самых трудно решаемых проблем было разнообразие акцентов и интонации, используемые ораторами разных национальностей [2]. Список литературы: 1. Шпаков Д.В. Распознавание голоса в сфере информационных технологий // Молодой ученый. 2017. № 29. С. 8-11. URL https://moluch.ru/archive/163/45163/ (дата обращения: 23.02.2020). 2. Остроух А.В. Интеллектуальные системы. Красноярск: Научно- инновационный центр, 2015. 110 с. Журнал «Трибуна ученого» Выпуск 02/2020 https://tribune-scientists.ru 3

РАСПОЗНАВАНИЕ ГОЛОСА В СФЕРЕ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ

Статья опубликована в журнале за "Февраль 2020"

Автор(ы) статьи: Мавлянов Б.Б.