Компьютер обогнал китайца

image005

Система искусственного интеллекта распознает китайский текст лучше человека

Создана компьютерная система, которая распознает рукописный китайский текст эффективнее человека.

Пишут так, что только компьютер разберет

На минувшей неделе была представлена система искусственного интеллекта, которая способна распознавать рукописный китайский текст.

Само по себе это достижение неново: существует множество приложений, в том числе и со встроенными словарями, которые делают то же самое и существенно облегчают жизнь студентам, изучающим китайский язык.

Подобные программы устанавливаются на смартфон с камерой, после чего владелец наводит объектив на текст, приложение «расшифровывает» его и автоматически вставляет иероглифы в словарь.

Однако у подобных программ есть существенный минус: чаще всего они способны считывать только печатный текст.

Написанные от руки китайские иероглифы отличаются от стандартизированного компьютерного шрифта так же сильно, как шрифт Times New Roman от рецепта, написанного непонятным почерком врача.

image007

GaoxiaoРецепт, выписанный китайским врачом

Однако корпорации Fujitsu удалось решить эту проблему:

ее сотрудники разработали систему искусственного интеллекта, которая распознает рукописный китайский текст с эффективностью 96,7%. Человек делает это несколько хуже — для людей этот показатель равен 96,1%.

Подробнее ознакомиться с описанием системы можно на сайте ее создателей.

Работу над созданием технологии компания начала еще в 2010 году. В 2013 году первые результаты были представлены на самой престижной конференции по компьютерному распознаванию текстов и изображений International Conference on Document Analysis and Recognition . Тогда эффективность расшифровки рукописного китайского текста достигала 94,8%, что на тот момент стало рекордным показателем.

Функционирование системы искусственного интеллекта основано на следующем принципе: сначала она считывает общий вид иероглифа, распознавая его основные черты. После этого в дело вступает следующий «слой» электронных нейронов, которые «всматриваются» в детали символа. Особенность этого процесса заключается в том, что анализ иероглифа происходит как бы в трех измерениях: высота картинки, ее ширина и распознавание градации серых тонов.

image009

FujitsuПринцип работы системы искусственного интеллекта

Для того чтобы научить систему делать это, ученым пришлось увеличить число искусственных нейронных связей с 2,8 млн (показатель 2013 года) до 150 млн. Благодаря тому, что искусственный интеллект теперь может видеть вариации в цвете разных черт иероглифа, он способен создать трехмерную картинку иероглифа и оценить степень искажения черт, сравнив с наиболее похожим стандартным изображением.

21.09.2015

Из источника: http://www.gazeta.ru/science/2015/09/21_a_7763981.shtml

Share on Google+Share on FacebookShare on VKTweet about this on Twitter