‎
loginstudio
  • Overview
  • COMIENZA
    • Quickstart
  • Basicos
    • Modelos Disponibles
    • TEXT API (NEW)
    • TEXT API (ACTUAL)
    • Formas de pago
  • Mejores prácticas
    • RAG
    • Prompteo
  • Saptiva Agents
    • Introducción
    • Instalación
    • Quick Start
    • Tutorial
      • Modelos
      • Mensajes
      • Agentes
      • Equipos
      • Human-in-the-Loop
      • Terminación
      • Manejo De Estados
    • Avanzado
      • Agentes Personalizados
      • Selector Group Chat
      • Memoria
      • Logging
      • Serialización
    • Conceptos Del Núcleo
      • Quick Start
      • Aplicaciones De Agentes & Multi-Agentes
      • Entornos De Ejecución Para Agentes
      • Pila De Aplicación
      • Identidad & Ciclo De Vida Del Agente
      • Tema & Suscripción (Topic & Subscription)
    • Guía De Framework
      • Agente & Entorno De Ejecución De Agentes
      • Mensaje & Comunicación
      • Open Telemetry
    • Guía De Componentes
      • Cliente De Modelo
      • Contexto De Modelo
      • Herramientas (Tools)
    • Patrones De Diseño Multi-Agente
      • Agentes Concurrentes
      • Flujo de Trabajo Secuencial
      • Transferencia De Tareas (Handoffs)
      • Mezcla De Agentes (Mixture Of Agents)
      • Multi-Agent Debate
      • Reflexión (Reflection)
    • Ejemplos
      • Planificación De Viajes
      • Investigación De Empresas
      • Revisión De Literatura
    • PyPi
  • Manuales
  • Model cards
    • Quickstart
      • Model Card: DeepSeek R1 Lite
      • Model Card: LLAMA3.3 70B
      • Model Card: Saptiva Turbo
      • Model Card: Phi 4
      • Model Card: Qwen
      • Model Card: Gemma 3
  • DEFINICIONES
    • Temperature
Con tecnología de GitBook
En esta página
  • Descripción General
  • Uso Previsto
  • Factores y Métricas de Rendimiento
  • Limitaciones y Sesgos
  • Consideraciones Éticas y de Seguridad
  1. Model cards
  2. Quickstart

Model Card: Gemma 3

Descripción General

  • Nombre del Modelo: Gemma 3

  • Tipo de Modelo: Generación de texto y razonamiento multimodal

  • Desarrollado por: Google DeepMind

  • Tamaño en Parámetros: 27B

Uso Previsto

Casos de Uso Recomendados

  • Traducción y compatibilidad con más de 140 idiomas

  • Desarrollo de flujos de trabajo automatizados con llamadas a funciones

  • Análisis y procesamiento de datos visuales junto con análisis de texto y documentos

Casos de Uso No Recomendados

  • Cualquier uso que viole leyes o regulaciones aplicables, incluyendo leyes de cumplimiento comercial.

  • Implementaciones sin medidas de seguridad adecuadas o uso para generar contenido dañino, desinformación o material no autorizado.

Factores y Métricas de Rendimiento

Datos de Entrenamiento

  • Gemma 3 se entrenó con grandes volúmenes de datos de diversas fuentes públicas y de alta calidad, optimizados para tareas de lenguaje natural y comprensión de imágenes.

    • Frescura de los datos: Entrenamiento hasta 2025.

    • Ventana de contexto: Hasta 128,000 tokens.

    • Capacidad multimodal: Modelos de 4B, 12B y 27B soportan texto e imágenes; la versión de 1B es solo texto.

Métricas de Evaluación

Limitaciones y Sesgos

Limitaciones Técnicas

  • El rendimiento puede verse afectado en idiomas con menos representación en los datos de entrenamiento.

  • La interpretación de imágenes puede ser limitada en comparación con modelos especializados en visión.

  • La implementación en hardware con menos memoria puede requerir versiones cuantificadas

Multilingüismo : Gemma 3 admite más de 140 idiomas, con optimización para los más comunes. Sin embargo, la calidad del contenido puede variar en idiomas con menor presencia en los datos de entrenamiento.

Consideraciones Éticas y de Seguridad

Filtrado de contenido y moderación de respuestas

  • Gemma 3 incorpora mecanismos avanzados de filtrado de contenido para garantizar que las respuestas generadas sean seguras y apropiadas para diversos entornos. Esto incluye la detección y eliminación de lenguaje ofensivo, sesgado o perjudicial, así como la moderación en tiempo real para prevenir la difusión de desinformación o contenido dañino. A través de técnicas de procesamiento del lenguaje natural (NLP) y listas de términos restringidos, el sistema puede identificar y gestionar respuestas potencialmente problemáticas antes de que sean entregadas al usuario.

  • Validación de datos de entrada y salida

    Para mejorar la confiabilidad de sus respuestas, Gemma 3 implementa validaciones estrictas tanto en los datos de entrada como en los de salida. Esto incluye la detección de intentos de inyección de código, la verificación del contexto de las solicitudes y la supervisión de la coherencia de las respuestas generadas. Además, el sistema puede emplear técnicas como la comparación con bases de datos verificadas o modelos secundarios de validación para reducir el riesgo de generar información incorrecta o engañosa.

  • Medidas de mitigación de sesgos Empleamos un enfoque multifacético para la recopilación de datos, combinando datos generados por humanos de nuestros proveedores con datos sintéticos para mitigar los posibles riesgos de seguridad. Hemos desarrollado muchos clasificadores basados ​​en modelos de lenguaje grandes (LLM) que nos permiten seleccionar cuidadosamente indicaciones y respuestas de alta calidad, lo que mejora el control de calidad de los datos.

  • Medidas de mitigación de sesgos Gemma 3 ha sido desarrollado con un enfoque en la equidad y la inclusión, incorporando estrategias para reducir sesgos en sus respuestas. Esto se logra mediante el entrenamiento con conjuntos de datos diversos y balanceados, así como con ajustes específicos en sus algoritmos para evitar la amplificación de estereotipos. Además, se incluyen mecanismos de monitoreo y evaluación continua para identificar posibles sesgos en las respuestas y mejorar el modelo de manera iterativa, asegurando una IA más justa y equitativa.

AnteriorModel Card: QwenSiguienteTemperature

Última actualización hace 1 mes