Representación de datos: observaciones, variables y sus tipos
Trabajo previo¶
Lecturas¶
Çetinkaya-Rundel, Mine, & Hardin, Johanna (2021). Chapter 1: Hello data en Introduction to Modern Statistics (1st ed.). OpenIntro, Inc. https://
Wickham, Hadley; Çetinkaya-Rundel, Mirne; & Grolemund, Garret (2023). Introduction en R for Data Science: Import, Tidy, Transform, Visualize, and Model Data (2nd ed.). O’Reilly Media. https://
Introducción¶
La presentación y descripción efectivas de los datos constituyen el primer paso en un análisis (Çetinkaya-Rundel & Hardin, 2021). Una de las formas más comunes de representar datos es mediante tablas en las cuales cada fila es una observación y cada columna es una variable. Una observación corresponde a un elemento de datos que ha sido estudiado y cada variable a una característica de ese elemento. Por ejemplo, la tabla 1 muestra una tabla con observaciones correspondientes a registros de presencia de especies.
| Nombre científico | Longitud | Latitud | Fecha | Sexo | Edad (años) | Peso (g) | Longitud (cm) | Estado de conservación |
|---|---|---|---|---|---|---|---|---|
| Panthera onca | -84.5678 | 10.1234 | 2024-05-12 | Macho | 5 | 56700 | 170 | Casi amenazada (NT) |
| Ara macao | -83.2345 | 9.8765 | 2024-06-18 | Hembra | 3 | 1000 | 85 | Preocupación menor (LC) |
| Dendrobates auratus | -82.1234 | 8.5432 | 2024-07-22 | Macho | 1 | 2 | 4 | Preocupación menor (LC) |
| Cebus imitator | -85.4321 | 10.6543 | 2024-08-30 | Hembra | 8 | 3000 | 45 | Vulnerable (VU) |
| Iguana iguana | -84.7890 | 9.3456 | 2024-09-15 | Macho | 4 | 4000 | 150 | Preocupación menor (LC) |
| Basiliscus basiliscus | -83.4567 | 8.9876 | 2024-10-05 | Hembra | 2 | 200 | 80 | Preocupación menor (LC) |
| Ateles geoffroyi | -84.1234 | 10.2345 | 2024-11-12 | Macho | 6 | 7000 | 50 | En peligro (EN) |
| Boa imperator | -82.3456 | 9.8765 | 2024-12-01 | Hembra | 10 | 12000 | 300 | Preocupación menor (LC) |
| Sotalia fluviatilis | -83.9876 | 8.1234 | 2024-12-20 | Macho | 12 | 35000 | 210 | En peligro (EN) |
| Chelonia mydas | -84.1234 | 9.6543 | 2025-01-05 | Hembra | 50 | 150000 | 120 | En peligro (EN) |
Tipos de variables¶
Las variables de los datos de la tabla 1 son de varios tipos, cuya jerarquía se muestra en la figura 1.

Figura 1. Tipos de variables. Fuente: (Çetinkaya-Rundel & Hardin, 2021).
Numéricas¶
Corresponden a números a los cuales se les pueden aplicar operaciones como suma, resta, multiplicación, división y otras similares. Las variables numéricas puden ser discretas o continuas.
Discretas¶
Toman valores específicos que se pueden contar. La variable edad, en este caso, es discreta.
Continuas¶
Pueden tomar cualquier valor dentro de un intervalo o rango continuo. Estas variables se caracterizan por su capacidad para representar medidas precisas y pueden asumir un número infinito de valores, incluso dentro de un rango limitado (ej. entre 0 y 1). Las variables peso y longitud son continuas.
Categóricas¶
Las variables categóricas (también llamadas cualitativas), son aquellas que describen una característica o cualidad de una observación y pueden utilizarse para clasificar las observaciones en grupos o categorías. A diferencia de las variables numéricas, que expresan cantidades, las variables categóricas expresan atributos no numéricos. Las variables categóricas pueden ser nominales u ordinales.
Nominales¶
No existe un orden inherente o jerarquía entre las categorías. Las variables nombre científico y sexo son nominales.
Ordinales¶
Hay un orden o jerarquía clara entre las categorías, como en el caso de la variable estado de conservación.
Referencias bibliográficas¶
Çetinkaya-Rundel, Mine, & Hardin, Johanna (2021). Chapter 1: Hello data en Introduction to Modern Statistics (1st ed.). OpenIntro, Inc. https://