Xiaomi обяви, че е постигнала значителен напредък със своята технология за разпознаване на звуци и гласове. Тя се казва AudioSet-2M, като е обучена с нови данни и става още по-прецизна, съобщава GizmoChina.
Новият алгоритъм е постигнал резултат от 50mAP при тестовете, което е най-доброто постижение досега. Компанията твърди, че друг не е успявал за спечели подобен резултат и това я прави лидер в сегмента на глобално ниво.
Xiaomi е използвала данните от AudioSet архива на Google, който е създаден за тази цел. След това е направила свой алгоритъм, който да изучи данните и да ги използва за разпознаване на звуци за целите на аудио тагинг. Иначе казано, да разпознава кой звук какъв е и да го каталогизира с тагове.
Компанията е направила и Mini версия на модела. Тя може да се модифицира за конкретни казуси и ситуации. Xiaomi казва, че дори и в Mini версията си, моделът пак е по-добър от сходните разработки на други компании.
От практическа гледна точка, технологията ще е от полза за различни умни устройства. Например те ще могат да разпознават плач на бебе, различни животни, двигатели на коли и др. Това ще им позволи да реагират според предварително зададени инструкции или пък да информират потребителя за даденото събитие с повече конкретика. Технологията ще е от полза и за хора с увреден слух, тъй като ще може да описва писмено звуците.
Тя може да се приложи и в роботиката. Чрез нея роботите ще могат по-добре да се ориентират в пространството, да се справят с повече ситуации да са полезни асистенти в спешни случаи.