“Las parámetros son los datos básicos que el Machine Learning tendrá en cuenta para entrenar el modelo. Por entrenamiento entendemos el procedimiento por el que el modelo aprende y encuentra patrones para predecir el mercado objetivo. Por lo tanto, en general los parámetros deben estar relacionados con el mercado objetivo y una mejor elección de los parámetross resulta en mejores pronósticos.
Existen dos tipos de parámetros en Futbol Brain, las estadísticas y las cuotas de mercado.
El menú de estadísticas ofrece una serie de estadísticas diferentes que se pueden utilizar para el equipo local o visitante (o ambos). Los usuarios pueden seleccionar los parámetros más importantes y relevantes con el objetivo de obtener el mejor resultado.
Las opciones para los parámetros de estadísticas se agrupan en categorías, donde encontraremos:
– Estadísticas simples: Valores medios basados en el tamaño de la muestra de partidos anteriores obtenidos para cada equipo. Esto puede incluir tiros a puerta, ataques peligrosos, etc.
– Estadísticas compuestas: Valores medios basados en el tamaño de la muestra de partidos anteriores. Puede incluir goles marcados por el equipo sólo en la misma posición, ataques peligrosos por ratio de goles, victorias, etc.
– Racha: La fórmula relativa a las rachas es el número total de partidos consecutivos que lleva la racha en cuestión. Los partidos de esa muestra son los que el equipo ha disputado como local o como visitante. Los valores incluyen la media de las estadísticas de rachas correspondientes basadas en el tamaño de la muestra de partidos anteriores.
Descripción detallada de las características estadísticas en el Apéndice A.”
“Después de realizar todas las selecciones anteriores, entrenamos el modelo de Machine Learning para obtener los pronósticos de posibles eventos del mercado objetivo. Para entrenar y probar dicho modelo, se crea una división de entrenamiento/prueba del conjunto de datos en una proporción de 70%/30% respectivamente.
El modelo se entrenará con Machine Learning utilizando el conjunto de temporadas asignado para entrenamiento, mientras que el otro conjunto de datos se usará para testear el modelo entrenado . Más información sobre el proceso de aprendizaje automático en metodología. Presiona el botón “”Entrenar ahora”” para entrenar al modelo”
“El modelo de Machine Learning entrena el modelo con el pack de datos pertenecientes a la fase de entrenamiento y testea los resultados con el pack de datos pertenecientes a la fase de testeo o prueba.
Cuando la probabilidad de un pronóstico en la fase de testeo o prueba es más alta que el umbral de fiabilidad utilizado (por defecto 50%), el modelo asume que el mercado entrenado es el evento más probable.
A continuación, como en la fase de testeo o prueba ya se conocen los resultados finales de los partidos (la fase de testeo o prueba son partidos pasados), el modelo nos muestra la cantidad de partidos acertados y fallados. Esto nos proporciona una primera impresión de si el modelo está detectando los resultados que nosotros queremos.
Partidos pronosticados: Son los partidos dentro de la fase de testeo que el modelo detectó como más probable, es decir, que la probabilidad de que el mercado seleccionado fuera más probable que el umbral de fiabilidad (por defecto es 50%).
Pronósticos acertados / fallados: El modelo nos muestra los partidos acertados y fallados dentro de la fase de testeo.
Success Rate: Es el resultado de dividir “”Pronósticos acertados / Pronósticos fallados””.
Fiabilidad (umbral): Es el valor de referencia para predecir o no un evento. Cuando la probabilidad estimada por el modelo es mayor que el umbral de fiabilidad obtenemos un partido pronosticado. Si la probabilidad es inferior al umbral de fiabilidad el partido no será pronosticado.”
“Otra parte importante de los resultados es la relación innata entre los distintos parámetros y la relevancia que les asigna el modelo de Machine Learning tras el entrenamiento. Esta información puede ser muy valiosa en el análisis sobre por qué un sistema tiene éxito o fracasa a la hora de producir una estrategia rentable y qué parámetros desempeñaron un papel importante para llegar a ello.
Con las barras se muestra la relevancia relativa de cada parámetro de mayor a menor. A partir de estos resultados, el usuario puede optar por mejorar el rendimiento del sistema eliminando un parámetro de bajo rendimiento o añadiendo uno nuevo para examinar cómo se ve afectado el equilibrio entre los nuevos parámetros y los que ya estaban.
Además del modelo de entrenamiento, se lleva a cabo un proceso de backtesting para medir la rentabilidad del sistema. Utilizando el mercado objetivo y las cuotas de las bookies, se realiza una simulación con una apuesta simple de stake 1.
En concreto, la pantalla de resultados correspondiente contiene la siguiente información:
La tabla de análisis de probabilidades permite a los usuarios comprender mejor la rentabilidad en diferentes áreas de probabilidades, que indican inversamente diferentes probabilidades para el resultado. Como funcionalidad añadida, los usuarios pueden filtrar por estos rangos, ya sea activando/desactivando o creando nuevos completamente. Esta funcionalidad permite un mejor control de lo que se está utilizando y ajustando para obtener beneficios. “
“De igual forma, se muestra un gráfico de rendimiento acumulado a lo largo del periodo de tiempo que los partidos utilizaron para el backtesting. Esto ofrece una visión progresiva del rendimiento del sistema a lo largo del tiempo y puede ser una buena forma de ver de su estabilidad y de cualquier tendencia o patrón que pueda surgir.
Una funcionalidad adicional en esta parte es la selección de rango de fechas, para un análisis más personalizado.”
“Aquí están listados todos los partidos de la fase de testeo y los que se van incluyendo conforme pasan los días, con detalles de las fechas, los resultados y las cuotas de las bookies del mercado objetivo seleccionado.
Además, hay información relacionada con los procesos de Machine Learning:
Probabilidad: La probabilidad calculada a partir del algoritmo de aprendizaje automático
Pronosticado: “”Sí”” o “”No””. Si la probabilidad es mayor que el umbral de fiabilidad, entonces la predicción para ese juego es “”Sí””, de lo contrario es “”No””.
Acierto: “”Verdadero”” o “”Falso””. Si el partido cumplió con el pronóstico hecho por el modelo de Machine Learning el partido será marcado como acertado, sino como fallado.”
Goals Scored at same position: Average goals scored by a team when played in the same position, meaning home or away.
Goals Scored: Average numbers of goals scored by a team.
Shots on goal Ratio: Average [shots on goal / goals scored+1]. Used to represent “success of shots on goal”.
Dangerous attacks Ratio: Average [dangerous attacks / goals scored+1]. Used to represent “success of dangerous attacks”.
Wins: Average wins for each team.
Draws: Average draws for each team.
Losses: Average losses for each team.
Goles marcados en la misma posición: Media de goles marcados por un equipo cuando juega en la misma posición, es decir, en casa o como visitante.
Goles marcados: Media de goles marcados por un equipo.
Ratio de tiros a puerta: Media [tiros a puerta / goles marcados+1]. Se utiliza para representar el “”acierto de los tiros a puerta””.
Ratio de ataques peligrosos: Media [ataques peligrosos / goles marcados+1]. Se utiliza para representar el “”acierto de los ataques peligrosos””.
Victorias: Media de victorias de cada equipo.
Empates: Media de empates de cada equipo.
Derrotas: Media de derrotas de cada equipo.”
1. Total de disparos
2. Tiros a puerta
3. Tiros desviados
4. Tiros bloqueados
5. Tiros dentro del área
6. Tiros fuera del área
7. Total de pases
8. Precision de pases
9. Balones asegurados
10. Ataques totales
11. Ataques peligrosos
12. Faltas
13. Fuera de juego
14. Córners
15. Tiempo de posesión
16. Tarjetas amarillas
17. Tarjetas rojas
18. Lesiones
19. Tarjetas rojas amarillas
20. Paradas
21. Sustituciones
22. Saques de meta
23. Intentos de gol
24. Tiros libres
25. Lanzamientos
28. Penaltis
29. Goles
La fórmula de cálculo relativa a las rachas es el número total de partidos consecutivos que lleva la racha en cuestión. Los partidos de esa muestra son los que el equipo ha disputado como local o como visitante.
Las rachas que mostramos abajo incluyen la media de la estadística correspondiente (basada en el tamaño de la muestra de partidos anteriores) obtenida para cada equipo. Las características se pueden calcular para el equipo “”Local”” y/o “”Visitante””.
Victorias: Victorias consecutivas de cada equipo.
Sin ganar: Partidos consecutivos en los que cada equipo no ganó (perdió o empató).
Derrotas: Derrotas consecutivas de cada equipo.
Sin derrotas: Partidos consecutivos en los que cada equipo no ha perdido (ha ganado o empatado).
Empate: Partidos consecutivos en los que cada equipo empató .
Sin empates: Partidos consecutivos de cada equipo que no terminaron en empate (ni ganados ni perdidos).
Victoria a cero: Partidos consecutivos en los que cada equipo ganó sin marcargoles.
Perder a cero: Partidos consecutivos en los que cada equipo perdió sin marcar ningún gol.
Sin marcar: Partidos consecutivos en los que cada equipo no consiguió marcar (independientemente del resultado).
Portería a cero: Partidos consecutivos para cada equipo en los que el equipo enemigo no marcó ningún gol.
Sin portería a cero: Partidos consecutivos para cada equipo en los que recibió al menos 1 gol.
Remontada: Partidos consecutivos en los que en algún momento el equipo iba perdiendo pero acabó ganando.