Bases de datos utilizadas
A continuación se describen algunas las bases de datos que se utilizarán a lo largo del curso (el resto se explican en los ejemplos o ejercicios en las que son utilizadas). En cada caso, se incluye un enlace para descargar la base de datos en formato CSV.
Tasa Euro/Dólar: Contiene el registro diario histórico de la tasa de cambio del Euro a Dólar durante el 2023. Las columnas de la base de datos son las siguientes:
- Date: Fecha de medición (yyyy-mm-dd), desde enero del 2003 hasta enero del 2023.
- Open: tasa de apertura.
- High: tasa más alta alcanzada en el día.
- Low: tasa más baja alcanzada en el día.
- Close: tasa de cierre del día.
- Adj Close: tasa de cierre ajustada del día (precio de cierre sin dividendos).
El código para cargar la base de datos en R es:
Precios de electricidad: Un conjunto de datos históricos que contiene el precio por hora de la electricidad para Bélgica. Las columnas de la base de datos son las siguientes:
- MTU: Hora de inicio (formato fecha y hora) del coste de la electricidad.
- EUR_MWh: Precio por hora (Euros por MWh).
El código para cargar la base de datos en R es:
Pacientes: Contiene datos respecto a los ataques al corazón de distintos pacientes hospitalarios. El detalle de algunas de las columnas de la base de datos que utilizaremos son las siguientes:
- age: edad del paciente (en años).
- sex: sexo del paciente (Hombre: 1 y Mujer: 0).
- cp: Tipo de dolor en el pecho, Valor 1: angina típica, Valor 2: angina atípica, Valor 3: dolor no anginoso, Valor 4: asintomático.
- trtbps: presión arterial en reposo (en mm Hg).
- chol: nivel de colestorol (en mg/dl).
- fbs: azúcar en sangre en ayunas \(>\) 120 mg/dl (V = 1; F = 0).
- thalachh: frecuencia cardíaca máxima alcanzada (en latidos por minuto).
- oldpeak: tiempo de duración del último ataque al corazón (en minutos).
El código para cargar la base de datos en R es:
Dólar: La base de datos contiene el valor del dólar observado de algunos de los días de los meses de junio y julio, tomados por el el SII:
- Mes: Mes del año (“Junio”, “Julio”).
- Dia: Día del mes.
- Valor: Valor del dólar observado en pesos chilenos.
El código para cargar la base de datos en R es:
Diabetes: El connjunto de datos proviene originalmente del Instituto Nacional de Diabetes y Enfermedades Digestivas y Renales. El objetivo del conjunto de datos es estudiar de forma diagnóstica si un paciente tiene diabetes, en función de ciertas medidas de diagnóstico incluidas en el conjunto de datos. Se impusieron varias restricciones a la selección de estas instancias de una base de datos más grande. En particular, todos los pacientes aquí son mujeres de al menos 21 años de ascendencia indígena Pima. Las columnas de la base de datos son las siguientes:
- Pregnancies: Para expresar el número de embarazos.
- Glucose: Para expresar el nivel de Glucosa en sangre (mg/dL).
- BloodPressure: para expresar la medida de la presión arterial distólica (mm Hg).
- SkinThickness: Para expresar el grosor de la piel (mm).
- Insulin: para expresar el nivel de insulina en sangre (mg/dL).
- BMI: Para expresar el índice de masa corporal.
- DiabetesPedigreeFunction: Para expresar el porcentaje de Diabetes.
- Age: Para expresar la edad en años.
- Outcome: Para expresar el resultado final de tener diabetes, 1 es Sí y 0 es No.
El código para cargar la base de datos en R es: