След като вече пусна своите вътрешни ИИ модели за текст и глас, Microsoft обяви първия си текст-към-изображение модел, наречен MAI-Image-1.
Основни характеристики
-
Реализъм и детайли: MAI-Image-1 генерира по-фотореалистични изображения в сравнение с други модели, като включва реалистични отражения и детайли, които обичайните генератори често пропускат.
-
Бързина и ефективност: Моделът работи по-бързо, като същевременно поддържа високо качество на изхода.
-
Фокус върху реални сценарии: Microsoft е събирала обратна връзка от професионалисти в индустрията, за да се гарантира, че моделът предоставя изображения, които имат реална творческа и практическа стойност, вместо повтарящи се или шаблонни резултати.
Наличност
MAI-Image-1 вече е достъпен чрез LMArena, платформа за оценка на големи езикови модели, където моделът вече е в топ 10 за текст-към-изображение генератори. Microsoft планира по-късно разширено използване на модела чрез Copilot и Bing Image Creator.
Контекст и предходни ИИ модели на Microsoft
Няколко месеца по-рано компанията пусна и два свои вътрешни ИИ модела:
-
MAI-Voice 1 – позволява генериране на текст в конкретен стил, тон и глас чрез текстови промпти.
-
MAI-1-preview – чатбот модел, способен да отговаря на въпроси и да участва в диалог с потребителите.
Microsoft описва MAI-Image-1 като инструмент, който предоставя гъвкавост, визуално разнообразие и практическа стойност, насочен към професионалисти, създатели на съдържание и индустриални потребители.









