Google представила TranslateGemma: прорыв в машинном переводе

TranslateGemma: прорыв в машинном переводе

Google представила TranslateGemma — новую линейку открытых моделей перевода. Они созданы на базе Gemma 3 и доступны в трех вариантах: 4B, 12B и 27B параметров. Это значительный шаг к свободному общению на 55 языках.

Новые модели сочетают эффективность и высокое качество. Google удалось уместить знания больших систем в компактные, но мощные открытые модели. Это означает, что для качественного перевода требуется меньше ресурсов.

Модель TranslateGemma 12B превосходит базовую Gemma 3 27B. Оценка проводилась по бенчмарку WMT24++ с использованием MetricX. Разработчики теперь могут получать переводы высокого качества, используя менее половины параметров. Это снижает задержки и увеличивает скорость обработки.

Модель 4B конкурирует с 12B версией. Она идеально подходит для работы на мобильных устройствах. TranslateGemma значительно сократила количество ошибок по сравнению с предыдущими моделями. Качество улучшилось при одновременном повышении эффективности.

Разработка основана на двухэтапном процессе дообучения. Он позволил перенести «интуицию» моделей Gemini в открытую архитектуру. Сначала базовые модели Gemma 3 дообучались на параллельных данных. Использовались как переводы людей, так и синтетические тексты от Gemini.

Затем применялось обучение с подкреплением. Специальные метрики, такие как MetricX-QE и AutoMQM, помогали моделям создавать более точные и естественные переводы. Это обеспечило высокое качество даже для языков с ограниченными ресурсами.

TranslateGemma прошла тестирование на 55 языковых парах. Это включает как основные языки (испанский, французский, китайский, хинди), так и менее распространенные. Google расширила возможности, обучив модели еще на 500 парах.

Новая разработка послужит основой для дальнейших исследований. Ученые смогут дообучать модели для специфических языковых пар или улучшать качество перевода для редких языков. TranslateGemma открывает эру более доступного и качественного машинного перевода.


По материалам:
blog.google

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь

Иран: удар по ядерному Натанзу и подземному городу ракет (видео)

Иран подтвердил авиаудар по Натанзу. Источники в Израиле: GBU-57 уничтожили подземный комплекс с ракетами и центрифугами.

Трамп: США почти выполнили цели против Ирана

Дональд Трамп заявил о скором завершении военной кампании США в регионе после уничтожения ракет, ВМФ и ВВС Ирана.

Трамп: США почти выполнили цели против Ирана

Трамп заявил о выполнении 4 ключевых задач: уничтожены ракеты, ВМС, ВВС и оборонный комплекс Ирана. Пентагон готовит вторжение.

Иран запустил баллистическую ракету в сторону Диего-Гарсии

Радары Персидского залифа зафиксировали пуск иранской ракеты по базе США на острове Чагос. Ракета была перехвачена или самоликвидировалась в полёте.

Трамп: «Мы уничтожаем Иран, у нас неограниченные боеприпасы»

Президент США Дональд Трамп сделал шокирующее заявление о «масштабном наступлении» на Иран, подтвердив переброску войск в регион. Его слова о «неограниченных боеприпасах» подчеркивают решимость Вашингтона в условиях обостряющегося конфликта, вызывая серьезную обеспокоенность в мире.

Больше из категории

Квантовая сеть вышла из лаборатории на улицы Манхэттена

Квантовая сеть больше не лабораторный проект. Cisco успешно продемонстрировала ее работу на улицах Манхэттена, используя существующие оптоволоконные линии. Это шаг к квантовому интернету.

Tesla строит гигантский завод по производству чипов

Tesla запускает гигантский завод по производству чипов Terafab. Проект обеспечит компонентами миллионы электромобилей и роботов, снижая зависимость от внешних поставщиков.

Palantir: ИИ решает исход боевых операций (видео)

На AIPCon 9 офицер Пентагона показал систему Maven, которая за секунды анализирует разведданные и планирует удары.

Квантовые вычисления: 94 защищенных кубита превзошли «голый» процессор

Исследователи Quantinuum добились прорыва в квантовых вычислениях, продемонстрировав работу 94 защищенных логических кубитов. Это открывает новые горизонты для отказоустойчивых квантовых систем.

Теперь можно писать Claude как другу: iPhone-шорткат превращает ИИ в личного ассистента

iPhone-шорткат превращает Claude в личного ассистента. Теперь можно общаться с ИИ через SMS, как с другом, без открытия отдельных приложений.

Израильский стартап привлек 58 миллионов долларов на AI-платформу для брендов

Израильский стартап BrandShield привлек 58 миллионов долларов. AI-платформа для защиты брендов от мошенничества и подделок усилит глобальное присутствие.

Tesla готовится к своему «моменту iPhone» с роботами Optimus

Tesla готовится к своему «моменту iPhone» с роботами Optimus. Компания может повторить успех Apple, перейдя от электромобилей к робототехнике.

Nokia и KDDI защитили дата-центр от квантовых компьютеров

Nokia и KDDI успешно протестировали квантовую защиту для дата-центров в Японии. Новая архитектура обеспечивает безопасность данных от квантовых угроз.