Напоследък производителите на смартфони внедряват AI технологията в почти всяка функция, която техните устройства имат. От камери до управление на RAM, уж всичко използва изкуствен интелект и машинно обучение за по-добра производителност и персонализирани резултати.
В повечето случаи няма как да усетите разликата, но има една функция, която с очите си може да видите как работи. Става въпрос за разпознаването на обекти от реалния свят – способността на телефона да разпознава това срещу което сте насочили камерата му. Начинът, по който тя работи, не е толкова футуристичен, колкото може би си мислите, въпреки че резултатите са доста впечатляващи.
Казано по-просто, услугите, използващи технологията, сравняват изображението което вашия телефон „гледа“ с налична база данни. Най-добрите съвпадения ви се показват като резултати. Тъй като базите данни са твърде големи, за да се поберат на вашия телефон, тези услуги се нуждаят от интернет връзка, за да работят.
Най-популярните услуги в тази област са Google Lens, Bixby Vision и Huawei HiVisio. И тъй като и трите услуги разчитат на разлини бази данни, резултатите се различават. Ето защо от phonearena са решили да ги сравнят.
Предизвикателство първо – разпознаване на храна
Първи кръг – разпознаване на слива
Всяка от услугите може да разпознае банан, но какво се случва с плод който има по-често срещана форма, като сливата например? Google Lens е кратък и точен. Bixby Vision, от друга страна, няма никаква представа. Всички опити са с грешен отговор – първо предметът е скъпоценен камък, след това се оказа топка за крикет и дори репичка. Що се отнася до храната, на Huawei устройството ви е по-добре да използвате специален режим dedicated food, който се захранва от друга компания и осигурява по-точни резултати.
Втори кръг – кроасан
Тук и трите услуги се справят добре без особено затруднение. Само Bixby Vision изглежда малко несигурен.
Втори кръг – шоколадов десерт Snickers
Това е по-предизвикателна задача, тъй като шоколадовите бонбони често имат подобни форми и текстури. Тук Google Lens има проблеми, докато Bixby Vision и HiVision бързо посочиха, че това е Snickers.
Предизвикателство второ – разпознаване на животни
Първи кръг – разпознаване на птица
Разбира се, показаното по-долу не е истинска птица, но изглежда почти като истинска, което може да заблуди алгоритмите на тези услуги. И трите услуги се справят и разпознават, че това е щъркел.
Втори кръг – куче
Тук нещата са доста объркващи, тъй като различните породи кучета трудно се идентифицират, и това би затруднило AI да даде правилно съвпадение. Още повече, че кучето, което служи за модел е порода, която не е популярна в световен мащаб.
Резултатът – единствено Google Lens разпознава, че става въпрос за куче, порода българска овчарка. Твърде впечатляващо е, тъй като оцветяването не е характерно за породата, която се състои най-вече от кучета с черна и бяла козина. Резултатите на другите две услуги са приемливи.
Предизвикателство трето – разпознаване на продукти
Първи кръг – разпознаване на AirPods
Почти перфектни резултати! Казваме почти, защото първите предложения на HiVision не са съвсем точни. Bixby Vision помисли за секунда, че става въпрос за сапун, но бързо стигна до правилния продукт.
Втори кръг – играчка
Тази задача е лесна и трудна. От една страна, шлемът на Дарт Вейдър е един от най-разпознаваемите обекти. От друга страна, има хиляди продукти, от които е част. Точният отговор – ключодържател със светещи LED очи е в топ резултатите на всяко от приложенията.
Трети кръг – очила
Повечето слънчеви очила имат подобна форма, което би затруднило ситуацията, поради което участва чифт с по-отчетлив външен вид и от популярна марка. Google Lens и HiVision се справят перфектно и разпознават очилата на Dolce & Gabbana. Предположението на Samsung е достатъчно близко, но не точно.
Предизвикателство четвърто – разпознаване на текст
Преводът на текст в реално време е може би най-полезната функция, която тези приложения предоставят. Така че е важно да разберем как се справят и с това предизвикателство. Що се отнася до надписи и табели на немски и японски език, и трите приложения се справят добре и ще успеете да разберете какво трябва или какво не трябва да правите.
Има и друго ниво в разпознаването на текст – когато попаднете на текст написан на непознатт за вас език и искате да разберете за какво става дума в него. В този случй, както Google Lens, така и HiVision превеждат текста достатъчно добре, за да можете да разберете за какво става въпрос. Bixby Vision обаче видимо изпитва затруднения.
Вижте какво може да прави изкуственият интелект в смартфоните
Discussion about this post