TranslateGemma: прорыв в машинном переводе
Google представила TranslateGemma — новую линейку открытых моделей перевода. Они созданы на базе Gemma 3 и доступны в трех вариантах: 4B, 12B и 27B параметров. Это значительный шаг к свободному общению на 55 языках.
Новые модели сочетают эффективность и высокое качество. Google удалось уместить знания больших систем в компактные, но мощные открытые модели. Это означает, что для качественного перевода требуется меньше ресурсов.
Модель TranslateGemma 12B превосходит базовую Gemma 3 27B. Оценка проводилась по бенчмарку WMT24++ с использованием MetricX. Разработчики теперь могут получать переводы высокого качества, используя менее половины параметров. Это снижает задержки и увеличивает скорость обработки.
Модель 4B конкурирует с 12B версией. Она идеально подходит для работы на мобильных устройствах. TranslateGemma значительно сократила количество ошибок по сравнению с предыдущими моделями. Качество улучшилось при одновременном повышении эффективности.
Разработка основана на двухэтапном процессе дообучения. Он позволил перенести «интуицию» моделей Gemini в открытую архитектуру. Сначала базовые модели Gemma 3 дообучались на параллельных данных. Использовались как переводы людей, так и синтетические тексты от Gemini.
Затем применялось обучение с подкреплением. Специальные метрики, такие как MetricX-QE и AutoMQM, помогали моделям создавать более точные и естественные переводы. Это обеспечило высокое качество даже для языков с ограниченными ресурсами.
TranslateGemma прошла тестирование на 55 языковых парах. Это включает как основные языки (испанский, французский, китайский, хинди), так и менее распространенные. Google расширила возможности, обучив модели еще на 500 парах.
Новая разработка послужит основой для дальнейших исследований. Ученые смогут дообучать модели для специфических языковых пар или улучшать качество перевода для редких языков. TranslateGemma открывает эру более доступного и качественного машинного перевода.