IBM побила рекорд в технологиях распознавания речи
IBM удалось снизить долю ошибок в компьютерном распознавании речи до 5,5% — это новый рекорд. Ранее ИИ компании показывал результат в 6,9%, а прежний рекорд алгоритма от Microsoft составлял 5,9% ошибок. Для человека доля ошибок в распознавании речи равна примерно 5%.
Для технологий распознавания речи 5,1% — магическое число. Если процент ошибок системы приблизительно равен ему, это означает, что возможности технологии приблизились к человеческим — люди не разбирают примерно 5% слов в беглой речи.
IBM объявила, что достигла результата в 5,5%, пишет Business Insider. Это означает существенный прорыв в технологиях искусственного интеллекта, который «обитает» в виртуальных помощниках, таких как Siri, Alexa и Google Assistant.
В прошлом году IBM работала над тем, чтобы побить свой прежний рекорд в 6,9% и снизить процент ошибок, и компании это удалось. ПО пока еще не может улавливать все нюансы речи, такие как ее тон или метафоры, однако, снижение доли ошибок при распознавании прямого значения слов — уже большое достижение.
Осенью 2016 года исследователи из Microsoft объявили о том, что в их системе распознавания речи частота ошибок составила 6,3%, тогда у IBM этот показатель был на 0,3% хуже. Затем Microsoft удалось добиться цифры в 5,9%. Однако, сейчас IBM вышел в лидеры. По словам Джорджа Саона, исследователя IBM, компания ставит цель достичь процента ошибок в 5,1%, чтобы сравнять машинное распознавание речи с человеческим.