🛡️ AutoMod con Inteligencia Artificial
Sistema avanzado de moderación automática potenciado por IA para detectar y prevenir comportamientos no deseados.
ULTRA - Todas las funcionalidades de IA en AutoMod requieren Server Premium ULTRA
🎯 Descripción
AutoMod con IA utiliza modelos de lenguaje avanzados para entender el contexto real de los mensajes, reduciendo falsos positivos y detectando amenazas sofisticadas que los sistemas tradicionales no pueden detectar.
Modelo IA: OpenAI GPT-4o-mini con Chain of Thought reasoning
🧠 Funcionalidades IA
1. AI Context Analysis - Word Filter
¿Qué hace? Analiza el contexto antes de penalizar por palabras prohibidas, entendiendo la diferencia entre uso malicioso y uso legítimo.
Características:
- 🎯 Detecta sarcasmo e ironía
- 📚 Entiende citas y contexto educativo
- 😊 Distingue bromas amistosas de insultos reales
- 📉 Reduce falsos positivos en 70-80%
Ejemplos:
| Mensaje | ¿Bloquear? | Razón |
|---|---|---|
| "vamos a matar la partida" | ✅ NO | Contexto gaming legítimo |
| "te voy a matar" | ❌ SÍ | Amenaza directa |
| "matar el tiempo jugando" | ✅ NO | Expresión idiomática |
| "odio los lunes jaja" | ✅ NO | Humor inofensivo |
| "odio a [persona]" | ❌ SÍ | Discurso de odio |
¿Cómo funciona? La IA analiza cada mensaje que contiene palabras prohibidas y determina si el uso es ofensivo o inofensivo. Solo bloquea cuando tiene 75%+ de confianza de que es ofensivo.
Configuración:
Panel → AutoMod → Word Filter → AI Context Analysis (toggle)
2. AI Duplicate Detection + Parafraseo
¿Qué hace? Detecta mensajes duplicados aunque estén parafraseados. Previene spam sofisticado que cambia palabras pero mantiene el mismo significado.
Características:
- 🔄 Análisis semántico de similitud
- 📝 Detecta sinónimos y variaciones
- 🎯 Threshold configurable (60-95%)
- 📊 Historial de mensajes por usuario
Ejemplos de Detección:
| Usuario envía | Spam detectado como |
|---|---|
| "Hola amigos" → "Saludos a todos" | ✅ Parafraseo detectado |
| "Compra aquí" → "Compra aca" | ✅ Variación mínima |
| "Link promoción" (x5 con texto diferente) | ✅ Spam promocional |
| Conversación natural con otros | ❌ NO detecta |
Threshold:
- 60%: Muy sensible, puede tener falsos positivos
- 75%: Recomendado para la mayoría de servidores
- 90%: Muy estricto, solo duplicados casi idénticos
Configuración:
Panel → AutoMod → Anti-Spam → AI Duplicate Detection
3. AI Toxicity Detection
¿Qué hace? Detecta toxicidad avanzada: insultos, acoso, amenazas, discurso de odio, bullying, contenido inapropiado.
Tipos de Toxicidad:
- 🤬 Insultos y lenguaje ofensivo
- 👊 Amenazas y violencia
- 💔 Acoso y bullying
- 🚫 Discurso de odio
- ⚠️ Contenido sexual inapropiado
- 😡 Agresividad excesiva
Características:
- 🌍 Multiidioma (español e inglés)
- 📊 Confidence score (0-100%)
- 🎯 Threshold configurable
- ⚡ Acciones: delete, warn, timeout, kick, ban
Threshold Recomendado:
- 70%: Balance entre precisión y sensibilidad
- 80%: Más estricto, menos falsos positivos
- 60%: Más sensible, puede sobre-moderar
Configuración:
Panel → AutoMod → AI Moderation → Toxicity Detection
4. AI Scam/Phishing Detection
¿Qué hace? Detecta estafas de Nitro, crypto scams, phishing, fake giveaways, enlaces maliciosos.
Tipos de Scams Detectados:
- 💎 Fake Nitro scams
- 🪙 Crypto scams y pump & dump
- 🎁 Fake giveaways
- 🔗 Phishing links
- 💰 Esquemas piramidales
- 📧 Spam promocional malicioso
Características:
- 🔍 Análisis de URLs sospechosas
- 🎯 Detección de patrones de scam
- 📊 Confidence score
- ⚡ Prevención automática
Threshold Recomendado:
- 60%: Recomendado (detecta mayoría de scams)
- 70%: Más estricto
- 50%: Muy sensible (puede tener falsos positivos)
Configuración:
Panel → AutoMod → AI Moderation → Scam Detection
5. AI Raid Detection
¿Qué hace? Analiza patrones de entrada de miembros nuevos para detectar raids automatizados.
Indicadores de Raid:
- 👥 Múltiples joins simultáneos
- 🤖 Nombres similares o generados
- 📅 Cuentas muy nuevas
- 🎭 Avatares por defecto
- ⚡ Comportamiento coordinado
Características:
- 🧠 Análisis de patrones con IA
- 🎯 Recomendaciones de acción
- ⚡ Respuesta automática
- 📊 Confidence score
Acciones Automáticas:
- Kick: Expulsar usuarios sospechosos
- Ban: Banear si alta confianza de raid
- Alert: Solo alertar al staff
Configuración:
Panel → AutoMod → AI Moderation → Raid Detection
🔧 Configuración General
Activar AI Moderation
- Ve al Panel:
panel.yumechanbot.com→ Tu servidor → AutoMod - Activa AI Moderation: Toggle principal de IA en ON
- Verifica tier ULTRA: Necesario para todas las funciones IA
- Configura cada módulo: Activa solo los que necesites
Ajustar Thresholds
¿Qué es un threshold? Es el nivel de confianza mínimo que la IA necesita para tomar acción.
- Bajo (50-60%): Muy sensible, más detecciones pero más falsos positivos
- Medio (70-80%): Recomendado, balance entre precisión y sensibilidad
- Alto (85-95%): Muy estricto, solo casos muy claros
Seleccionar Acciones
Para cada tipo de detección puedes configurar:
- Delete: Eliminar mensaje solamente
- Warn: Advertir al usuario
- Timeout: Silenciar temporalmente (1min - 1 semana)
- Kick: Expulsar del servidor
- Ban: Banear permanentemente
📊 Best Practices
✅ Hacer
- Empieza con thresholds altos (75-80%) y ajusta según necesidad
- Prueba en canales de prueba antes de activar en todo el servidor
- Revisa logs regularmente para ver qué detecta la IA
- Ajusta gradualmente si ves muchos falsos positivos
- Combina con moderación manual para mejores resultados
❌ Evitar
- No uses thresholds demasiado bajos (causan sobre-moderación)
- No actives todo de golpe (prueba módulo por módulo)
- No confíes 100% en la IA (siempre revisa casos dudosos)
- No ignores el feedback de usuarios sobre falsos positivos
💡 Casos de Uso Recomendados
Servidor de Gaming
- ✅ AI Context Word Filter (permite jerga de gaming)
- ✅ AI Duplicate Detection (previene spam promocional)
- ⚠️ Toxicity 70% (permite banter amistoso)
Servidor Educativo
- ✅ AI Context Word Filter (permite citas educativas)
- ✅ Scam Detection (protege estudiantes)
- ✅ Toxicity 80% (ambiente más estricto)
Servidor de Comunidad
- ✅ Todos los módulos activados
- ✅ Thresholds balanceados (70-75%)
- ✅ Raid Detection activo (protección completa)
🔬 Cómo Funciona la IA
Chain of Thought (CoT) Reasoning
La IA analiza mensajes siguiendo un proceso de razonamiento paso a paso:
- Análisis del Contenido: Lee y comprende el mensaje
- Extracción de Contexto: Identifica emociones, intención, tono
- Evaluación de Señales: Busca indicadores de violación
- Razonamiento: Considera alternativas y contexto
- Decisión Final: Determina si hay violación y confidence score
JSON Schema Validation
Todas las respuestas de la IA usan JSON schema forzado para:
- ✅ Garantizar formato consistente
- ✅ Evitar respuestas inválidas
- ✅ Facilitar procesamiento automático
Temperature 0
Usamos temperatura 0 para:
- ✅ Máxima consistencia en decisiones
- ✅ Respuestas determinísticas
- ✅ Menos variabilidad aleatoria
💰 Costos
Cada análisis de IA cuesta aproximadamente $0.0001-0.0003 (0.01-0.03 céntimos). Con 10,000 mensajes diarios, el costo sería de ~$1-3/mes.
🔐 Privacidad
- La IA solo analiza el mensaje específico reportado
- NO guarda ni almacena contenido de mensajes
- NO tiene acceso a mensajes históricos
- Solo retorna:
{violación: boolean, confidence: number, tipo: string}
🆘 Soporte
Si tienes problemas con AutoMod IA:
- Revisa los logs en el panel
- Verifica thresholds y acciones configuradas
- Prueba en canal de prueba primero
- Contacta soporte en el servidor oficial de Yume-chan