SEGUNDA PUBLICACIÓN

LOS CÓDIGOS EN CHAT GPT EJECUTADOS EN GOOGLE COLAB

Para este segundo ejercicio, se copiará cada código obtenido en chatGPT y se copiará a Google Colaboratory, para verificar los datos ficticios mediante DataFrame, posteriormente para mostrar la estadística descriptiva y algunos gráficos, recordando al siguiente enlace:

https://chat.openai.com/share/7272bfd1-2155-4efd-be7e-151fe42c42f7

I. Se muestra datos en archivo CSV:

1. ID,Grupo,Dieta,Horas_Ejercicio,SGLT2,IMC,Edad
1,A,Equilibrada,4,95,23.5,22
2,A,Equilibrada,3,92,22.1,21
3,B,Alta_en_Grasas,Azúcares,2,110,29.3,25
4,A,Equilibrada,5,88,24.2,23
5,B,Alta_en_Grasas,Azúcares,1,120,30.5,27
6,A,Equilibrada,3,94,23.9,24
7,B,Alta_en_Grasas,Azúcares,2,115,28.1,26
8,A,Equilibrada,4,91,22.8,20
9,A,Equilibrada,5,87,23.0,21
10,B,Alta_en_Grasas,Azúcares,1,118,31.2,28
11,A,Equilibrada,3,93,23.7,22
12,B,Alta_en_Grasas,Azúcares,2,112,29.8,24
13,A,Equilibrada,4,90,22.5,20
14,A,Equilibrada,5,86,23.2,21
15,B,Alta_en_Grasas,Azúcares,1,116,30.0,27
16,A,Equilibrada,3,92,24.0,23
17,B,Alta_en_Grasas,Azúcares,2,113,28.5,26
18,A,Equilibrada,4,89,22.3,22
19,A,Equilibrada,5,85,23.4,21
20,B,Alta_en_Grasas,Azúcares,1,114,30.7,28
21,A,Equilibrada,3,91,23.8,24
22,B,Alta_en_Grasas,Azúcares,2,111,29.2,25
23,A,Equilibrada,4,88,22.7,20
24,A,Equilibrada,5,84,23.1,21
25,B,Alta_en_Grasas,Azúcares,1,117,31.0,27
26,A,Equilibrada,3,90,23.6,22
27,B,Alta_en_Grasas,Azúcares,2,114,28.7,26
28,A,Equilibrada,4,87,22.4,22
29,A,Equilibrada,5,83,23.3,21
30,B,Alta_en_Grasas,Azúcares,1,115,30.3,28

II. El modelo para archivos CSV:

import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error

# Load the data
data = pd.read_csv('data.csv')

# Split the data into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(data[['x1', 'x2']], data['y'], test_size=0.25)

# Create a linear regression model
model = LinearRegression()

# Fit the model to the training data
model.fit(X_train, y_train)

# Make predictions on the test data
y_pred = model.predict(X_test)

# Evaluate the model
mse = mean_squared_error(y_test, y_pred)
print('Mean squared error:', mse)

# Save the model
model.save('model.pkl')

III. Los datos para un DataFRame y la predicción

# Load the saved model
model = joblib.load('model.pkl')

# Make predictions on new data
new_data = pd.DataFrame({'x1': [1, 2, 3], 'x2': [4, 5, 6]})
y_pred = model.predict(new_data)

# Print the predictions
print(y_pred)
 
IV. Una representación tabular de los datos y variables. 

ID Grupo                  Dieta  Horas_Ejercicio  SGLT2   IMC  Edad
0   1     A            Equilibrada                4    95  23.5    22
1   2     A            Equilibrada                3    92  22.1    21
2   3     B  Alta_en_Grasas_Azúcares                2   110  29.3    25
3   4     A            Equilibrada                5    88  24.2    23
4   5     B  Alta_en_Grasas_Azúcares                1   120  30.5    27
 
V. La salida estadística:
# prompt:

model.score(X_test, y_test)
 
Para utilizar un DataSet, es importante Python y las respectivas
bibliotecas, para evitar los errores en GoogleColab. 
 






Comentarios