Google създадоха най-добрия конвертор на текст в снимки чрез изкуствен интелект

Технологичният гигант има сериозен принос за еволюцията на изкуствен интелект. Това не е случайно, тъй като AI алгоритмите се използват активно от приложенията на Google. Резултатите от търсачката, навигацията в Maps и много функции на Android са базирани на уникалните софтуерни технологии на компанията. Google Lens е един от най-добрите примери колко полезен може да бъде изкуствения интелект.

Специалистите на Google също така работят нaд Text-To-Speech платформа от ново поколение, която вече демонстрира впечатляващи резултати. Идеята е потребителите да въвеждат описателен текст, който алгоритмите с AI на компанията ще го визуализират в изображение над екрана. Системата с изкуствен интелект е кръстена Imagen и се разработва от Brain Team екипа на Google Research.

Досегашните тестове са доста оптимистични, като Google обещават “безпрецедентна степен на фотореализъм и дълбоко ниво на разбиране на езика”, съобщава Engadget.

Компанията създава и специална бенчмарк платформа, за да съпостави възможностите на Imagen с други компютърни модели в тази категория. Сред тях са DALL-E 2, VQ GAN + CLIP и Latent Diffusion Models. Платформата се казва DrawBench и анализира представянето с повече от 200 различни Text-To-Speech примери. Максималната обективност се гарантира от човешки оценители, които са подканени да изложат своето мнение.

Резултатите показват, че експертния екип предпочита Imagen пред конкурентните платформи за Text-To-Speech в повечето категории, като качеството на извадката и подравняването на Text-To-Speech съдържанието. В официалния сайт на Imagen са селектирани и показани някои от най-добрите модели, които показват как работи системата.

Новата технология на Google няма да е достъпна за широката общественост, по подобие на DALL-E. Алгоритмите се прилагат върху огромна база от данни, но постепенно ще намират интеграция в портфолиото от приложения на компанията.

Google създадоха най-добрия конвертор на текст в снимки чрез изкуствен интелект

Бъдещите камери на смартфоните ще могат да правят 3D снимки

Нова технология следи движението на очите, за да разкрие дали лъжем

Подобни публикации

Как да изключите Meta AI във Facebook, Instagram, Messenger и WhatsApp

А1 пуска безжични слушалки на лизинг без оскъпяване от до края на април

Сравнение между дизайна, размерите и дисплеите на Xiaomi 14 и Xiaomi 14 Ultra

Какво знаем за OnePlus 13

Samsung Exynos 5400 е 5G модем за смартфони с двойна сателитна комуникация

Ще сложи ли iPhone 16 Pro край на досадните отблясъци в снимките

TikTok ще конкурира Instagram с приложението Notes

Първите устройства с Apple M4 процесор се очакват през 2025г.

Нова технология следи движението на очите, за да разкрие дали лъжем

Популярно

3 лесни начинa да си скрием номера за Android или iPhone

Ще сложи ли iPhone 16 Pro край на досадните отблясъци в снимките

Първите устройства с Apple M4 процесор се очакват през 2025г.

Какво знаем за OnePlus 13

8 скрити функции в YouTube, които всеки потребител трябва да познава

Публикации

DIGITAL Media Ltd.

Welcome Back!

Retrieve your password

Add New Playlist

Google създадоха най-добрия конвертор на текст в снимки чрез изкуствен интелект

Бъдещите камери на смартфоните ще могат да правят 3D снимки

Нова технология следи движението на очите, за да разкрие дали лъжем

Подобни публикации

Популярно

Теми

Публикации

DIGITAL Media Ltd.

Следвайте ни:

Welcome Back!

Retrieve your password

Add New Playlist