REGRESIÓN LOGÍSTICA (APRENDIZAJE SUPERVISADO) USO DE MATERIALES DE ENDODONCIA PARA LA OBTURACION DE CONDUCTOS


DIPLOMADO EN EN INTELIGENCIA ARTIFICIAL

                                                                   MODULO IV

              APRENDIZAJE AUTOMATICO CON PYTHON Y ASISTENTES INTELIGENTES

              Ortega Irusta Elsy Nilda

              Este es el chat GPT 

             https://chat.openai.com/c/0422891d-c494-4dd1-a5c2-f059ce020ea4

APLICACIÓN PRÁCTICA: REGRESIÓN LOGÍSTICA (APRENDIZAJE SUPERVISADO)

USO DE MATERIALES DE ENDODONCIA PARA LA OBTURACION DE CONDUCTOS

Pensamiento computacional es una habilidad clave que involucra diferentes componentes, como descomposición, reconocimiento de patrones, abstracción y algoritmos. Vamos a aplicar estos componentes al ejemplo de la aplicación práctica de la regresión logística en el contexto de la obturación de conductos en endodoncia.

1. DESCOMPOSICIÓN: El uso de materiales de endodoncia para la obturación de conductos

Divide el problema en partes más pequeñas y manejables.

Descomposición del problema:

1. Identificar el objetivo: Predecir el éxito de la obturación de conductos utilizando materiales de endodoncia.

2. Recopilar datos: Obtener datos relevantes, como características del material, condiciones del conducto y resultados de la obturación.

3. Analizar datos: Explorar los datos para entender patrones y relaciones.

2. RECONOCIMIENTO DE PATRONES:

Identifica tendencias o comportamientos en los datos.

Reconocimiento de patrones:

1. Identificar correlaciones: Analizar si ciertos materiales tienen una mayor tasa de éxito en la orturación.

2. Descubrir relaciones: Examinar cómo las condiciones del conducto influyen en la eficacia de la orturación.

3. ABSTRACCIÓN:

Identifica los aspectos clave y elimina los detalles innecesarios.

Abstracción:

1. Identificar características clave: Seleccionar las características más relevantes de los materiales y condiciones del conducto.

2. Simplificar el modelo: Utilizar solo las variables más importantes para predecir el éxito de la obturación.

4. ALGORITMOS:

Desarrolla una solución paso a paso para resolver el problema.

Implementación de la regresión logística:

1. Preparación de datos: Dividir los datos en conjuntos de entrenamiento y prueba.

2. Entrenamiento del modelo: Utilizar un algoritmo de regresión logística para aprender la relación entre las características y el resultado de la obturación.

3. Validación del modelo: Evaluar la precisión del modelo utilizando datos de prueba.

5. PROGRAMACIÓN TRADICIONAL:

Enfoque donde las reglas son codificadas manualmente.

Programación tradicional:

1. Definir reglas: En el contexto de endodoncia, podríamos establecer reglas basadas en la experiencia, como "si el material X es utilizado en conductos con características Y, entonces la obturación es exitosa".

6. APRENDIZAJE AUTOMÁTICO:

Desarrolla un modelo que aprende automáticamente de los datos.

Aprendizaje automático:

1. Entrenar modelo: Utilizar datos para que el modelo aprenda las relaciones entre las características y el resultado de la obturación sin reglas predefinidas.

2. Ajuste del modelo: Mejorar el rendimiento ajustando los parámetros del modelo.

INTERPRETACIÓN DE COEFICIENTES Y EVALUACIÓN DEL MODELO:

1. Interpretación de coeficientes: Comprender cómo cada coeficiente en la regresión logística afecta la predicción.

2. Evaluación del modelo: Utilizar métricas como precisión, sensibilidad y especificidad para evaluar la calidad del modelo.

Este enfoque combina pensamiento computacional con conceptos clave de regresión logística para abordar el problema de la obturación de conductos en endodoncia, permitiendo la automatización del proceso de toma de decisiones.

CONCEPTOS CLAVE DE LA REGRESIÓN LOGÍSTICA:

1. Variable Dependiente (o Respuesta):

   - Es la variable que estamos tratando de predecir. En el contexto de la obturación de conductos, podría ser el éxito (1) o fracaso (0) de la obturación.

2. Variables Independientes (o Características):

   - Son las variables que se utilizan para predecir la variable dependiente. En el ejemplo, podrían ser características del material de endodoncia y condiciones del conducto.

3. Función Logística (Sigmoide)*

   - La función logística transforma cualquier valor real en el rango de 0 a 1. Esto es esencial para modelar la probabilidad de un evento. La fórmula de la función logística es: \( \sigma(z) = \frac{1}{1 + e^{-z}} \), donde \( z \) es una combinación lineal de las variables independientes.

4. Hipótesis de la Regresión Logística:

   - La relación entre las variables independientes y la variable dependiente se establece mediante la hipótesis de regresión logística. Puede expresarse como: \( P(Y=1) = \frac{1}{1 + e^{-(\beta_0 + \beta_1X_1 + \beta_2X_2 + ... + \beta_nX_n)}} \), donde \( \beta_0, \beta_1, ..., \beta_n \) son los coeficientes del modelo.

5. Coeficientes (Pesos):

   - Son los valores que se multiplican por las variables independientes en la hipótesis. Estos coeficientes son ajustados durante el entrenamiento del modelo para minimizar el error.

6. Entrenamiento del Modelo:

   - Es el proceso de ajustar los coeficientes del modelo utilizando un conjunto de datos de entrenamiento. Se busca minimizar la diferencia entre las predicciones del modelo y los valores reales observados.

7. Umbral de Decisión:

   - Es un valor que se establece para determinar en qué categoría (éxito o fracaso en este caso) se clasifica una observación. Si la probabilidad predicha es mayor que el umbral, se clasifica como 1; de lo contrario, se clasifica como 0.

8. Función de Costo:

   - Mide cuán lejos están las predicciones del modelo de los valores reales. Durante el entrenamiento, el objetivo es minimizar esta función de costo para obtener un modelo preciso.

 

9. Evaluación del Modelo:

   - Se realiza utilizando métricas como precisión, sensibilidad, especificidad y área bajo la curva ROC para determinar qué tan bien el modelo se desempeña en datos no vistos.

10. Regularización:

    - Es una técnica utilizada para prevenir el sobreajuste al agregar términos adicionales a la función de costo que penalizan coeficientes grandes.

Estos conceptos son esenciales para comprender cómo funciona la regresión logística y cómo se aplica en el aprendizaje supervisado para predecir eventos binarios.

CÓMO FUNCIONA LA REGRESIÓN LOGÍSTICA Y CÓMO SE APLICA EN EL APRENDIZAJE SUPERVISADO PARA PREDECIR EVENTOS BINARIOS

Continuemos con el estudio basándonos en los conceptos proporcionados:

CASO DE ESTUDIO: Obturación de Conductos en Endodoncia

1. Recopilación de Datos:

   - Se recopilan datos sobre diferentes materiales de endodoncia, condiciones de los conductos y el resultado de la obturación (éxito o fracaso).

2. Selección de Variables:

   - Se identifican características clave, como la composición del material, la longitud del conducto, etc., para utilizar como variables independientes en el modelo.

3. Función Logística y Hipótesis:

   - La función logística se utiliza para modelar la probabilidad de éxito en la obturación. La hipótesis se formula como una combinación lineal de las variables independientes con coeficientes ajustables.

4. Entrenamiento del Modelo:

   - Se divide el conjunto de datos en entrenamiento y prueba. Los coeficientes del modelo se ajustan iterativamente durante el entrenamiento utilizando técnicas como el descenso del gradiente para minimizar la función de costo.

5. Umbral de Decisión:

   - Se elige un umbral para clasificar las predicciones. Por ejemplo, si la probabilidad predicha es mayor al 0.5, se clasifica como éxito; de lo contrario, como fracaso.

6. Evaluación del Modelo:

   - Se evalúa la precisión del modelo utilizando métricas como la matriz de confusión, precisión, sensibilidad, especificidad y la curva ROC. Esto proporciona información sobre la capacidad del modelo para predecir correctamente el éxito o el fracaso en la obturación.

7. Interpretación de Coeficientes:

   - Se interpreta cómo cada coeficiente afecta la probabilidad de éxito. Coeficientes positivos aumentan la probabilidad, mientras que los negativos la disminuyen.

8. Regularización (opcional):

   - Se aplica regularización si es necesario para prevenir el sobreajuste, ajustando los coeficientes y controlando su magnitud.

9. Implementación en Programación Tradicional:

   - Se podría comparar el modelo de regresión logística con un enfoque basado en reglas predefinidas en la programación tradicional. Sin embargo, la ventaja del aprendizaje automático es su capacidad para adaptarse a patrones complejos sin reglas explícitas.

10. Aplicación Práctica:

    - El modelo entrenado se utiliza para predecir el éxito de la obturación en nuevos casos, brindando una herramienta valiosa para tomar decisiones en el ámbito de la endodoncia.

En resumen, la regresión logística aplicada a la obturación de conductos en endodoncia combina el pensamiento computacional y los principios de aprendizaje supervisado para crear un modelo predictivo que puede mejorar la toma de decisiones en el campo de la Odontología. La evaluación cuidadosa y la interpretación de resultados son esenciales para garantizar la utilidad y confiabilidad del modelo.

INTERPRETACIÓN DE COEFICIENTES Y  EVALUACIÓN DEL MODELO.

INTERPRETACIÓN DE COEFICIENTES:

 

En el contexto de la regresión logística para la obturación de conductos en endodoncia, los coeficientes proporcionan información sobre cómo cada variable independiente afecta la probabilidad de éxito en la obturación. Aquí hay algunos puntos clave de interpretación:

- Signo del Coeficiente:

  - Si el coeficiente es positivo, un aumento en la variable correspondiente aumenta la probabilidad de éxito.

  - Si el coeficiente es negativo, un aumento en la variable correspondiente disminuye la probabilidad de éxito.

- Magnitud del Coeficiente:

  - Cuanto mayor sea la magnitud del coeficiente, mayor será la influencia de esa variable en la predicción.

- Coeficientes Significativos:

  - Coeficientes significativos (p < 0.05) indican que la variable tiene un impacto significativo en la predicción.

Ejemplo de interpretación:

- Si el coeficiente de "Longitud del Conducto" es positivo y significativo, significa que a medida que la longitud del conducto aumenta, la probabilidad de éxito en la obturación también aumenta.

EVALUACIÓN DEL MODELO:

Para evaluar la efectividad del modelo de regresión logística, se utilizan diversas métricas:

1. Matriz de Confusión:

   - Proporciona una visión detallada de los resultados del modelo, mostrando la cantidad de verdaderos positivos, falsos positivos, verdaderos negativos y falsos negativos.

2. Precisión:

   - Mide la proporción de predicciones correctas entre todas las predicciones realizadas. Se calcula como \(\frac{TP + TN}{TP + FP + TN + FN}\).

3. Sensibilidad (Recall):

   - Indica la proporción de casos positivos que el modelo ha identificado correctamente. Se calcula como \(\frac{TP}{TP + FN}\).

4. Especificidad:

   - Mide la proporción de casos negativos que el modelo ha identificado correctamente. Se calcula como \(\frac{TN}{TN + FP}\).

5. Curva ROC (Característica de Operación del Receptor):

   - Representa la relación entre la tasa de verdaderos positivos y la tasa de falsos positivos al variar el umbral de decisión.

6. Área Bajo la Curva ROC (AUC-ROC):

   - Proporciona una medida agregada del rendimiento del modelo. Un AUC-ROC cercano a 1 indica un buen rendimiento del modelo.

EVALUACIÓN DEL MODELO EN EL CONTEXTO:

- Una alta precisión y sensibilidad indicarían que el modelo es capaz de predecir correctamente tanto los casos de éxito como los de fracaso en la obturación.

- Una alta especificidad sería importante para minimizar los falsos positivos, evitando la clasificación incorrecta de casos que no son exitosos como exitosos.

- La interpretación y evaluación deben considerarse en conjunto para comprender completamente la capacidad del modelo para predecir el éxito en la obturación de conductos.

CÓDIGO EN PYTHON

Para aplicar la regresión logística en Python, puedes utilizar bibliotecas como scikit-learn. Aquí hay un ejemplo básico utilizando un conjunto de datos ficticio para ilustrar el proceso:

Este código utiliza datos ficticios y demuestra cómo entrenar un modelo de regresión logística, hacer predicciones y evaluar el rendimiento del modelo mediante una matriz de confusión, un reporte de clasificación y la curva ROC con su área bajo la curva (AUC-ROC). Asegúrate de ajustar el código según las características reales de tus datos.

Esta es mi interacción con google colab.

# Importar bibliotecas
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import confusion_matrix, classification_report, roc_auc_score, roc_curve
import matplotlib.pyplot as plt

# Generar datos ficticios
np.random.seed(42)
data = pd.DataFrame({
    'Longitud del Conducto': np.random.uniform(5, 25, 100),
    'Material A': np.random.randint(0, 2, 100),
    'Material B': np.random.randint(0, 2, 100),
    'Éxito': np.random.randint(0, 2, 100)
})

# Dividir el conjunto de datos en características (X) y variable objetivo (y)
X = data[['Longitud del Conducto', 'Material A', 'Material B']]
y = data['Éxito']

# Dividir el conjunto de datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Inicializar y entrenar el modelo de regresión logística
model = LogisticRegression()
model.fit(X_train, y_train)

# Hacer predicciones en el conjunto de prueba
y_pred = model.predict(X_test)

# Evaluar el modelo
conf_matrix = confusion_matrix(y_test, y_pred)
print("Matriz de Confusión:")
print(conf_matrix)

# Imprimir reporte de clasificación
print("\nReporte de Clasificación:")
print(classification_report(y_test, y_pred))

# Calcular el AUC-ROC
y_prob = model.predict_proba(X_test)[:, 1]
roc_auc = roc_auc_score(y_test, y_prob)
print(f"\nÁrea bajo la Curva ROC (AUC-ROC): {roc_auc}")

# Plotear la curva ROC
fpr, tpr, thresholds = roc_curve(y_test, y_prob)
plt.figure(figsize=(8, 6))
plt.plot(fpr, tpr, label=f'AUC-ROC = {roc_auc:.2f}')
plt.plot([0, 1], [0, 1], 'r--')
plt.title('Curva ROC')
plt.xlabel('Tasa de Falsos Positivos (FPR)')
plt.ylabel('Tasa de Verdaderos Positivos (TPR)')
plt.legend()
plt.show()
Matriz de Confusión: [[1 5] [7 7]] Reporte de Clasificación: precision recall f1-score support 0 0.12 0.17 0.14 6 1 0.58 0.50 0.54 14 accuracy 0.40 20 macro avg 0.35 0.33 0.34 20 weighted avg 0.45 0.40 0.42 20 Área bajo la Curva ROC (AUC-ROC): 0.38095238095238093

Este código utiliza datos ficticios y demuestra cómo entrenar un modelo de

regresión logística, hacer predicciones y evaluar el rendimiento del modelo

mediante una matriz de confusión, un reporte de clasificación y la curva ROC

con su área bajo la curva (AUC-ROC). Asegúrate de ajustar el código según

las características reales de tus datos.

Ejemplo de Algoritmo: Regresión lineal

Si deseas aplicar la regresión lineal para predecir el éxito de la obturación

de conductos en endodoncia, a continuación, te proporcionaréun ejemplo básico

en Python utilizando scikit-learn. Ten en cuenta que la regresión lineal es

más adecuada para problemas de regresión, pero en este caso, lo emplearemos

de manera simplificada para ilustrar el proceso:

Esta es mi interacción con google colab.

# Importar bibliotecas
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
import matplotlib.pyplot as plt

# Generar datos ficticios
np.random.seed(42)
data = pd.DataFrame({
    'Longitud del Conducto': np.random.uniform(5, 25, 100),
    'Material A': np.random.randint(0, 2, 100),
    'Material B': np.random.randint(0, 2, 100),
    'Éxito': np.random.uniform(0, 1, 100) * 10  # Usamos valores continuos para simular regresión
})

# Dividir el conjunto de datos en características (X) y variable objetivo (y)
X = data[['Longitud del Conducto', 'Material A', 'Material B']]
y = data['Éxito']

# Dividir el conjunto de datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Inicializar y entrenar el modelo de regresión lineal
model = LinearRegression()
model.fit(X_train, y_train)

# Hacer predicciones en el conjunto de prueba
y_pred = model.predict(X_test)

# Evaluar el modelo
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
print(f"Error Cuadrático Medio (MSE): {mse}")
print(f"Coeficiente de Determinación (R^2): {r2}")

# Plotear las predicciones vs. los valores reales
plt.scatter(y_test, y_pred)
plt.xlabel('Valores Reales')
plt.ylabel('Predicciones')
plt.title('Predicciones vs. Valores Reales')
plt.show()

Este código utiliza datos ficticios y demuestra cómo entrenar un modelo de

regresión lineal, hacer predicciones y evaluar el rendimiento del modelo

mediante el Error Cuadrático Medio (MSE) y el Coeficiente de Determinación

(R^2). Ten en cuenta que, para un problema de clasificación binaria como el

éxito de la orturación, la regresión lineal no es la elección ideal, pero lo

incluyo aquí para ilustrar el proceso en un contexto más general de regresión

Para problemas de clasificación, la regresión logística es más apropiada,

como discutimos anteriormente.

EJEMPLOS DE ALGORITMOS CON LIBRERÍA SCIKIT-LEARN.

Aquí te presento ejemplos específicos utilizando la librería scikit-learn

para implementar tanto la regresión logística como la regresión lineal.

Regresión Logística con scikit-learn:

Esta es mi interacción con google colab.

# Importar bibliotecas
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import confusion_matrix, classification_report, roc_auc_score, roc_curve
import matplotlib.pyplot as plt

# Generar datos ficticios
np.random.seed(42)
data = pd.DataFrame({
    'Longitud del Conducto': np.random.uniform(5, 25, 100),
    'Material A': np.random.randint(0, 2, 100),
    'Material B': np.random.randint(0, 2, 100),
    'Éxito': np.random.randint(0, 2, 100)
})

# Dividir el conjunto de datos en características (X) y variable objetivo (y)
X = data[['Longitud del Conducto', 'Material A', 'Material B']]
y = data['Éxito']

# Dividir el conjunto de datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Inicializar y entrenar el modelo de regresión logística
model = LogisticRegression()
model.fit(X_train, y_train)

# Hacer predicciones en el conjunto de prueba
y_pred = model.predict(X_test)

# Evaluar el modelo
conf_matrix = confusion_matrix(y_test, y_pred)
print("Matriz de Confusión:")
print(conf_matrix)

# Imprimir reporte de clasificación
print("\nReporte de Clasificación:")
print(classification_report(y_test, y_pred))

# Calcular el AUC-ROC
y_prob = model.predict_proba(X_test)[:, 1]
roc_auc = roc_auc_score(y_test, y_prob)
print(f"\nÁrea bajo la Curva ROC (AUC-ROC): {roc_auc}")

# Plotear la curva ROC
fpr, tpr, thresholds = roc_curve(y_test, y_prob)
plt.figure(figsize=(8, 6))
plt.plot(fpr, tpr, label=f'AUC-ROC = {roc_auc:.2f}')
plt.plot([0, 1], [0, 1], 'r--')
plt.title('Curva ROC')
plt.xlabel('Tasa de Falsos Positivos (FPR)')
plt.ylabel('Tasa de Verdaderos Positivos (TPR)')
plt.legend()
plt.show()

Matriz de Confusión: [[1 5] [7 7]] Reporte de Clasificación: precision recall f1-score support 0 0.12 0.17 0.14 6 1 0.58 0.50 0.54 14 accuracy 0.40 20 macro avg 0.35 0.33 0.34 20 weighted avg 0.45 0.40 0.42 20 Área bajo la Curva ROC (AUC-ROC): 0.38095238095238093


Regresion Lineal con scikit-learn:

Esta es mi interacción con google colab.

# Importar bibliotecas
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
import matplotlib.pyplot as plt

# Generar datos ficticios
np.random.seed(42)
data = pd.DataFrame({
    'Longitud del Conducto': np.random.uniform(5, 25, 100),
    'Material A': np.random.randint(0, 2, 100),
    'Material B': np.random.randint(0, 2, 100),
    'Éxito': np.random.uniform(0, 1, 100) * 10  # Usamos valores continuos para simular regresión
})

# Dividir el conjunto de datos en características (X) y variable objetivo (y)
X = data[['Longitud del Conducto', 'Material A', 'Material B']]
y = data['Éxito']

# Dividir el conjunto de datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Inicializar y entrenar el modelo de regresión lineal
model = LinearRegression()
model.fit(X_train, y_train)

# Hacer predicciones en el conjunto de prueba
y_pred = model.predict(X_test)

# Evaluar el modelo
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
print(f"Error Cuadrático Medio (MSE): {mse}")
print(f"Coeficiente de Determinación (R^2): {r2}")

# Plotear las predicciones vs. los valores reales
plt.scatter(y_test, y_pred)
plt.xlabel('Valores Reales')
plt.ylabel('Predicciones')
plt.title('Predicciones vs. Valores Reales')
plt.show()

Error Cuadrático Medio (MSE): 11.529664018066956 Coeficiente de Determinación (R^2): -0.2922461477760554



Estos son ejemplos básicos para ilustrar cómo implementar regresión logística y regresión lineal utilizando scikit-learn. Asegúrate de ajustarlos según las características reales de tus datos.

ÁRBOL DE DECICIONES EN BASE A LA INFORMACION BRINDADA.

Por supuesto, aquí tienes un ejemplo de cómo implementar un árbol de decisiones con la librería scikit-learn en Python, basándonos en la información proporcionada sobre la obturación de conductos en endodoncia:

Esta es mi interacción con google colab.

# Importar bibliotecas
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier, plot_tree
from sklearn.metrics import confusion_matrix, classification_report, roc_auc_score, roc_curve
import matplotlib.pyplot as plt

# Generar datos ficticios
np.random.seed(42)
data = pd.DataFrame({
    'Longitud del Conducto': np.random.uniform(5, 25, 100),
    'Material A': np.random.randint(0, 2, 100),
    'Material B': np.random.randint(0, 2, 100),
    'Éxito': np.random.randint(0, 2, 100)
})

# Dividir el conjunto de datos en características (X) y variable objetivo (y)
X = data[['Longitud del Conducto', 'Material A', 'Material B']]
y = data['Éxito']

# Dividir el conjunto de datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Inicializar y entrenar el modelo de árbol de decisiones
model = DecisionTreeClassifier(random_state=42)
model.fit(X_train, y_train)

# Hacer predicciones en el conjunto de prueba
y_pred = model.predict(X_test)

# Evaluar el modelo
conf_matrix = confusion_matrix(y_test, y_pred)
print("Matriz de Confusión:")
print(conf_matrix)

# Imprimir reporte de clasificación
print("\nReporte de Clasificación:")
print(classification_report(y_test, y_pred))

# Calcular el AUC-ROC
y_prob = model.predict_proba(X_test)[:, 1]
roc_auc = roc_auc_score(y_test, y_prob)
print(f"\nÁrea bajo la Curva ROC (AUC-ROC): {roc_auc}")

# Plotear el árbol de decisiones
plt.figure(figsize=(12, 8))
plot_tree(model, filled=True, feature_names=X.columns, class_names=['Fracaso', 'Éxito'])
plt.show()

Matriz de Confusión: [[5 1] [7 7]] Reporte de Clasificación: precision recall f1-score support 0 0.42 0.83 0.56 6 1 0.88 0.50 0.64 14 accuracy 0.60 20 macro avg 0.65 0.67 0.60 20 weighted avg 0.74 0.60 0.61 20 Área bajo la Curva ROC (AUC-ROC): 0.6666666666666666


Este código utiliza un árbol de decisiones para predecir el éxito de la obturación de conductos. El árbol se visualiza al final del código. Asegúrate de ajustar el código según las características específicas de tus datos y necesidades.

Conclusiones y reflexiones: Aplicar la regresión logística con aprendizaje supervisado en el uso de materiales de endodoncia para la obturación de conductos me proporciono  componentes que yo no conocía. Se usó datos ficticios que no están fuera de la realidad, estas herramientas para mí son nuevas y las utilizare en la práctica docente. Lo que más me impresiono fue el árbol de decisiones que es un resumen completo de lo aprendido. 
















Comentarios

Entradas populares de este blog

TIPOS DE MALOCLUSION CLASE II DE ANGLE EN ODONTOLOGÍA: APLICACIÓN DEL ALGORITMO NAIVE BAYES EN APRENDIZAJE SUPERVISADO.

DIAGNÓSTICO EN PERIODONTITIS EN ODONTOLOGÍA: APLICACIÓN DEL ALGORITMO NAIVE BAYES EN APRENDIZAJE SUPERVISADO.