Tecnología, Ciencia y Universo
Resultados para {phrase} ({results_count} de {results_count_total})
Mostrando {results_count} resultados de {results_count_total}
s
- Sin ModeloDescripción: El aprendizaje por refuerzo sin modelo es un enfoque en el que un agente aprende a tomar decisiones y a optimizar su comportamiento(...) Read more
m
- Método de Monte CarloDescripción: El Método de Monte Carlo es una técnica estadística que se utiliza en el aprendizaje por refuerzo para estimar el valor de las(...) Read more
a
- Aprendizaje por Refuerzo Basado en ModeloDescripción: El Aprendizaje por Refuerzo Basado en Modelo (MBRL, por sus siglas en inglés) es un enfoque dentro del aprendizaje por refuerzo que(...) Read more
r
- Recompensa MediaDescripción: La recompensa media en el contexto del aprendizaje por refuerzo se refiere a la cantidad promedio de recompensa que un agente(...) Read more
m
- Max-QDescripción: Max-Q es un algoritmo de aprendizaje por refuerzo jerárquico que se centra en descomponer la función de valor en componentes más(...) Read more
c
- Control Predictivo Basado en ModeloDescripción: El Control Predictivo Basado en Modelo (MPC, por sus siglas en inglés) es un enfoque en la teoría de control que utiliza un modelo(...) Read more
a
- Aprendizaje por Refuerzo MultiagenteDescripción: El Aprendizaje por Refuerzo Multiagente (MARL, por sus siglas en inglés) es un enfoque dentro del aprendizaje por refuerzo donde(...) Read more
l
- Longitud de Descripción MínimaDescripción: La 'Longitud de Descripción Mínima' es un principio fundamental en la teoría de la información que se aplica en el contexto del(...) Read more
c
- Cobertura de MarkovDescripción: La Cobertura de Markov es un concepto fundamental en el ámbito del aprendizaje por refuerzo y la teoría de grafos. Se refiere a un(...) Read more
a
- Aprendizaje por Refuerzo MultiobjetivoDescripción: El Aprendizaje por Refuerzo Multiobjetivo es un enfoque dentro del aprendizaje por refuerzo que se centra en la optimización de(...) Read more
p
- Proceso de Decisión de Markov con Aproximación de FunciónDescripción: El Proceso de Decisión de Markov con Aproximación de Función es una extensión de los Procesos de Decisión de Markov (MDP) que(...) Read more
e
- Estimación de Verosimilitud MáximaDescripción: La Estimación de Verosimilitud Máxima (EVM) es un método estadístico fundamental utilizado para estimar los parámetros de un modelo(...) Read more
a
- Aprendizaje ModularDescripción: El aprendizaje modular es un enfoque educativo que divide el proceso de aprendizaje en módulos o componentes distintos, permitiendo(...) Read more
m
- Meta-PolíticaDescripción: La meta-política en el contexto del aprendizaje por refuerzo se refiere a una política que guía el aprendizaje de otras políticas.(...) Read more
c
- Campo Aleatorio de MarkovDescripción: El Campo Aleatorio de Markov (MRF, por sus siglas en inglés) es un modelo probabilístico que representa las dependencias entre(...) Read more