Технологичният гигант има сериозен принос за еволюцията на изкуствен интелект. Това не е случайно, тъй като AI алгоритмите се използват активно от приложенията на Google. Резултатите от търсачката, навигацията в Maps и много функции на Android са базирани на уникалните софтуерни технологии на компанията. Google Lens е един от най-добрите примери колко полезен може да бъде изкуствения интелект.
Специалистите на Google също така работят нaд Text-To-Speech платформа от ново поколение, която вече демонстрира впечатляващи резултати. Идеята е потребителите да въвеждат описателен текст, който алгоритмите с AI на компанията ще го визуализират в изображение над екрана. Системата с изкуствен интелект е кръстена Imagen и се разработва от Brain Team екипа на Google Research.
Досегашните тестове са доста оптимистични, като Google обещават “безпрецедентна степен на фотореализъм и дълбоко ниво на разбиране на езика”, съобщава Engadget.
Компанията създава и специална бенчмарк платформа, за да съпостави възможностите на Imagen с други компютърни модели в тази категория. Сред тях са DALL-E 2, VQ GAN + CLIP и Latent Diffusion Models. Платформата се казва DrawBench и анализира представянето с повече от 200 различни Text-To-Speech примери. Максималната обективност се гарантира от човешки оценители, които са подканени да изложат своето мнение.
Резултатите показват, че експертния екип предпочита Imagen пред конкурентните платформи за Text-To-Speech в повечето категории, като качеството на извадката и подравняването на Text-To-Speech съдържанието. В официалния сайт на Imagen са селектирани и показани някои от най-добрите модели, които показват как работи системата.
Новата технология на Google няма да е достъпна за широката общественост, по подобие на DALL-E. Алгоритмите се прилагат върху огромна база от данни, но постепенно ще намират интеграция в портфолиото от приложения на компанията.