Model Card: Gemma 3
Descripción General
Nombre del Modelo: Gemma 3
Tipo de Modelo: Generación de texto y razonamiento multimodal
Desarrollado por: Google DeepMind
Tamaño en Parámetros: 27B
Uso Previsto
Casos de Uso Recomendados
Traducción y compatibilidad con más de 140 idiomas
Desarrollo de flujos de trabajo automatizados con llamadas a funciones
Análisis y procesamiento de datos visuales junto con análisis de texto y documentos
Casos de Uso No Recomendados
Cualquier uso que viole leyes o regulaciones aplicables, incluyendo leyes de cumplimiento comercial.
Implementaciones sin medidas de seguridad adecuadas o uso para generar contenido dañino, desinformación o material no autorizado.
Factores y Métricas de Rendimiento
Datos de Entrenamiento
Gemma 3 se entrenó con grandes volúmenes de datos de diversas fuentes públicas y de alta calidad, optimizados para tareas de lenguaje natural y comprensión de imágenes.
Frescura de los datos: Entrenamiento hasta 2025.
Ventana de contexto: Hasta 128,000 tokens.
Capacidad multimodal: Modelos de 4B, 12B y 27B soportan texto e imágenes; la versión de 1B es solo texto.
Métricas de Evaluación
Limitaciones y Sesgos
Limitaciones Técnicas
El rendimiento puede verse afectado en idiomas con menos representación en los datos de entrenamiento.
La interpretación de imágenes puede ser limitada en comparación con modelos especializados en visión.
La implementación en hardware con menos memoria puede requerir versiones cuantificadas
Multilingüismo : Gemma 3 admite más de 140 idiomas, con optimización para los más comunes. Sin embargo, la calidad del contenido puede variar en idiomas con menor presencia en los datos de entrenamiento.
Consideraciones Éticas y de Seguridad
Filtrado de contenido y moderación de respuestas
Gemma 3 incorpora mecanismos avanzados de filtrado de contenido para garantizar que las respuestas generadas sean seguras y apropiadas para diversos entornos. Esto incluye la detección y eliminación de lenguaje ofensivo, sesgado o perjudicial, así como la moderación en tiempo real para prevenir la difusión de desinformación o contenido dañino. A través de técnicas de procesamiento del lenguaje natural (NLP) y listas de términos restringidos, el sistema puede identificar y gestionar respuestas potencialmente problemáticas antes de que sean entregadas al usuario.
- Validación de datos de entrada y salida
Para mejorar la confiabilidad de sus respuestas, Gemma 3 implementa validaciones estrictas tanto en los datos de entrada como en los de salida. Esto incluye la detección de intentos de inyección de código, la verificación del contexto de las solicitudes y la supervisión de la coherencia de las respuestas generadas. Además, el sistema puede emplear técnicas como la comparación con bases de datos verificadas o modelos secundarios de validación para reducir el riesgo de generar información incorrecta o engañosa.
Medidas de mitigación de sesgos Empleamos un enfoque multifacético para la recopilación de datos, combinando datos generados por humanos de nuestros proveedores con datos sintéticos para mitigar los posibles riesgos de seguridad. Hemos desarrollado muchos clasificadores basados en modelos de lenguaje grandes (LLM) que nos permiten seleccionar cuidadosamente indicaciones y respuestas de alta calidad, lo que mejora el control de calidad de los datos.
Medidas de mitigación de sesgos Gemma 3 ha sido desarrollado con un enfoque en la equidad y la inclusión, incorporando estrategias para reducir sesgos en sus respuestas. Esto se logra mediante el entrenamiento con conjuntos de datos diversos y balanceados, así como con ajustes específicos en sus algoritmos para evitar la amplificación de estereotipos. Además, se incluyen mecanismos de monitoreo y evaluación continua para identificar posibles sesgos en las respuestas y mejorar el modelo de manera iterativa, asegurando una IA más justa y equitativa.
Última actualización