Google представила семейство ИИ-моделей PaliGemma 2, отличающееся способностью к распознаванию эмоций на изображениях. Модель может анализировать фотографии, генерировать описания и отвечать на вопросы о изображённых на них людях.
«PaliGemma 2 генерирует подробные, контекстно релевантные подписи для изображений, выходя за рамки простой идентификации объектов, чтобы описывать действия, эмоции и общее повествование сцены», — пишет Google в своём официальном блоге. Для распознавания эмоций PaliGemma 2 необходимо настроить соответствующим образом. Без этого он не работает.
Google утверждает, что обширное тестирование PaliGemma 2 показало значительно меньший уровень токсичности и ненормативной лексики по сравнению с отраслевыми стандартами. Однако компания не раскрыла детали методики тестирования и полный список использованных эталонов.
Google упомянула лишь один использованный бенчмарк — FairFace, базу данных портретов. Несмотря на заявленные хорошие результаты PaliGemma 2 по этому тесту, эксперты критикуют FairFace за неполное представление различных расовых групп, что ставит под сомнение объективность оценки.
Основная обеспокоенность экспертов по поводу открытого доступа к моделям, таким как PaliGemma 2 связана с риском неправомерного использования и потенциального причинения вреда.
Горячие темы