Saltar al contenido principal

🛡️ AutoMod con Inteligencia Artificial

Sistema avanzado de moderación automática potenciado por IA para detectar y prevenir comportamientos no deseados.

Tier Requerido

ULTRA - Todas las funcionalidades de IA en AutoMod requieren Server Premium ULTRA

🎯 Descripción

AutoMod con IA utiliza modelos de lenguaje avanzados para entender el contexto real de los mensajes, reduciendo falsos positivos y detectando amenazas sofisticadas que los sistemas tradicionales no pueden detectar.

Modelo IA: OpenAI GPT-4o-mini con Chain of Thought reasoning

🧠 Funcionalidades IA

1. AI Context Analysis - Word Filter

¿Qué hace? Analiza el contexto antes de penalizar por palabras prohibidas, entendiendo la diferencia entre uso malicioso y uso legítimo.

Características:

  • 🎯 Detecta sarcasmo e ironía
  • 📚 Entiende citas y contexto educativo
  • 😊 Distingue bromas amistosas de insultos reales
  • 📉 Reduce falsos positivos en 70-80%

Ejemplos:

Mensaje¿Bloquear?Razón
"vamos a matar la partida"✅ NOContexto gaming legítimo
"te voy a matar"❌ SÍAmenaza directa
"matar el tiempo jugando"✅ NOExpresión idiomática
"odio los lunes jaja"✅ NOHumor inofensivo
"odio a [persona]"❌ SÍDiscurso de odio

¿Cómo funciona? La IA analiza cada mensaje que contiene palabras prohibidas y determina si el uso es ofensivo o inofensivo. Solo bloquea cuando tiene 75%+ de confianza de que es ofensivo.

Configuración: Panel → AutoMod → Word Filter → AI Context Analysis (toggle)


2. AI Duplicate Detection + Parafraseo

¿Qué hace? Detecta mensajes duplicados aunque estén parafraseados. Previene spam sofisticado que cambia palabras pero mantiene el mismo significado.

Características:

  • 🔄 Análisis semántico de similitud
  • 📝 Detecta sinónimos y variaciones
  • 🎯 Threshold configurable (60-95%)
  • 📊 Historial de mensajes por usuario

Ejemplos de Detección:

Usuario envíaSpam detectado como
"Hola amigos" → "Saludos a todos"✅ Parafraseo detectado
"Compra aquí" → "Compra aca"✅ Variación mínima
"Link promoción" (x5 con texto diferente)✅ Spam promocional
Conversación natural con otros❌ NO detecta

Threshold:

  • 60%: Muy sensible, puede tener falsos positivos
  • 75%: Recomendado para la mayoría de servidores
  • 90%: Muy estricto, solo duplicados casi idénticos

Configuración: Panel → AutoMod → Anti-Spam → AI Duplicate Detection


3. AI Toxicity Detection

¿Qué hace? Detecta toxicidad avanzada: insultos, acoso, amenazas, discurso de odio, bullying, contenido inapropiado.

Tipos de Toxicidad:

  • 🤬 Insultos y lenguaje ofensivo
  • 👊 Amenazas y violencia
  • 💔 Acoso y bullying
  • 🚫 Discurso de odio
  • ⚠️ Contenido sexual inapropiado
  • 😡 Agresividad excesiva

Características:

  • 🌍 Multiidioma (español e inglés)
  • 📊 Confidence score (0-100%)
  • 🎯 Threshold configurable
  • ⚡ Acciones: delete, warn, timeout, kick, ban

Threshold Recomendado:

  • 70%: Balance entre precisión y sensibilidad
  • 80%: Más estricto, menos falsos positivos
  • 60%: Más sensible, puede sobre-moderar

Configuración: Panel → AutoMod → AI Moderation → Toxicity Detection


4. AI Scam/Phishing Detection

¿Qué hace? Detecta estafas de Nitro, crypto scams, phishing, fake giveaways, enlaces maliciosos.

Tipos de Scams Detectados:

  • 💎 Fake Nitro scams
  • 🪙 Crypto scams y pump & dump
  • 🎁 Fake giveaways
  • 🔗 Phishing links
  • 💰 Esquemas piramidales
  • 📧 Spam promocional malicioso

Características:

  • 🔍 Análisis de URLs sospechosas
  • 🎯 Detección de patrones de scam
  • 📊 Confidence score
  • ⚡ Prevención automática

Threshold Recomendado:

  • 60%: Recomendado (detecta mayoría de scams)
  • 70%: Más estricto
  • 50%: Muy sensible (puede tener falsos positivos)

Configuración: Panel → AutoMod → AI Moderation → Scam Detection


5. AI Raid Detection

¿Qué hace? Analiza patrones de entrada de miembros nuevos para detectar raids automatizados.

Indicadores de Raid:

  • 👥 Múltiples joins simultáneos
  • 🤖 Nombres similares o generados
  • 📅 Cuentas muy nuevas
  • 🎭 Avatares por defecto
  • ⚡ Comportamiento coordinado

Características:

  • 🧠 Análisis de patrones con IA
  • 🎯 Recomendaciones de acción
  • ⚡ Respuesta automática
  • 📊 Confidence score

Acciones Automáticas:

  • Kick: Expulsar usuarios sospechosos
  • Ban: Banear si alta confianza de raid
  • Alert: Solo alertar al staff

Configuración: Panel → AutoMod → AI Moderation → Raid Detection


🔧 Configuración General

Activar AI Moderation

  1. Ve al Panel: panel.yumechanbot.com → Tu servidor → AutoMod
  2. Activa AI Moderation: Toggle principal de IA en ON
  3. Verifica tier ULTRA: Necesario para todas las funciones IA
  4. Configura cada módulo: Activa solo los que necesites

Ajustar Thresholds

¿Qué es un threshold? Es el nivel de confianza mínimo que la IA necesita para tomar acción.

  • Bajo (50-60%): Muy sensible, más detecciones pero más falsos positivos
  • Medio (70-80%): Recomendado, balance entre precisión y sensibilidad
  • Alto (85-95%): Muy estricto, solo casos muy claros

Seleccionar Acciones

Para cada tipo de detección puedes configurar:

  • Delete: Eliminar mensaje solamente
  • Warn: Advertir al usuario
  • Timeout: Silenciar temporalmente (1min - 1 semana)
  • Kick: Expulsar del servidor
  • Ban: Banear permanentemente

📊 Best Practices

✅ Hacer

  • Empieza con thresholds altos (75-80%) y ajusta según necesidad
  • Prueba en canales de prueba antes de activar en todo el servidor
  • Revisa logs regularmente para ver qué detecta la IA
  • Ajusta gradualmente si ves muchos falsos positivos
  • Combina con moderación manual para mejores resultados

❌ Evitar

  • No uses thresholds demasiado bajos (causan sobre-moderación)
  • No actives todo de golpe (prueba módulo por módulo)
  • No confíes 100% en la IA (siempre revisa casos dudosos)
  • No ignores el feedback de usuarios sobre falsos positivos

💡 Casos de Uso Recomendados

Servidor de Gaming

  • ✅ AI Context Word Filter (permite jerga de gaming)
  • ✅ AI Duplicate Detection (previene spam promocional)
  • ⚠️ Toxicity 70% (permite banter amistoso)

Servidor Educativo

  • ✅ AI Context Word Filter (permite citas educativas)
  • ✅ Scam Detection (protege estudiantes)
  • ✅ Toxicity 80% (ambiente más estricto)

Servidor de Comunidad

  • ✅ Todos los módulos activados
  • ✅ Thresholds balanceados (70-75%)
  • ✅ Raid Detection activo (protección completa)

🔬 Cómo Funciona la IA

Chain of Thought (CoT) Reasoning

La IA analiza mensajes siguiendo un proceso de razonamiento paso a paso:

  1. Análisis del Contenido: Lee y comprende el mensaje
  2. Extracción de Contexto: Identifica emociones, intención, tono
  3. Evaluación de Señales: Busca indicadores de violación
  4. Razonamiento: Considera alternativas y contexto
  5. Decisión Final: Determina si hay violación y confidence score

JSON Schema Validation

Todas las respuestas de la IA usan JSON schema forzado para:

  • ✅ Garantizar formato consistente
  • ✅ Evitar respuestas inválidas
  • ✅ Facilitar procesamiento automático

Temperature 0

Usamos temperatura 0 para:

  • ✅ Máxima consistencia en decisiones
  • ✅ Respuestas determinísticas
  • ✅ Menos variabilidad aleatoria

💰 Costos

Cada análisis de IA cuesta aproximadamente $0.0001-0.0003 (0.01-0.03 céntimos). Con 10,000 mensajes diarios, el costo sería de ~$1-3/mes.

🔐 Privacidad

  • La IA solo analiza el mensaje específico reportado
  • NO guarda ni almacena contenido de mensajes
  • NO tiene acceso a mensajes históricos
  • Solo retorna: {violación: boolean, confidence: number, tipo: string}

🆘 Soporte

Si tienes problemas con AutoMod IA:

  1. Revisa los logs en el panel
  2. Verifica thresholds y acciones configuradas
  3. Prueba en canal de prueba primero
  4. Contacta soporte en el servidor oficial de Yume-chan