Skip to article frontmatterSkip to article content
Site not loading correctly?

This may be due to an incorrect BASE_URL configuration. See the MyST Documentation for reference.

Representación de datos: observaciones, variables y sus tipos

Trabajo previo

Lecturas

Çetinkaya-Rundel, Mine, & Hardin, Johanna (2021). Chapter 1: Hello data en Introduction to Modern Statistics (1st ed.). OpenIntro, Inc. https://openintro-ims.netlify.app/data-hello

Wickham, Hadley; Çetinkaya-Rundel, Mirne; & Grolemund, Garret (2023). Introduction en R for Data Science: Import, Tidy, Transform, Visualize, and Model Data (2nd ed.). O’Reilly Media. https://r4ds.hadley.nz/intro

Introducción

La presentación y descripción efectivas de los datos constituyen el primer paso en un análisis (Çetinkaya-Rundel & Hardin, 2021). Una de las formas más comunes de representar datos es mediante tablas en las cuales cada fila es una observación y cada columna es una variable. Una observación corresponde a un elemento de datos que ha sido estudiado y cada variable a una característica de ese elemento. Por ejemplo, la tabla 1 muestra una tabla con observaciones correspondientes a registros de presencia de especies.

Nombre científicoLongitudLatitudFechaSexoEdad (años)Peso (g)Longitud (cm)Estado de conservación
Panthera onca-84.567810.12342024-05-12Macho556700170Casi amenazada (NT)
Ara macao-83.23459.87652024-06-18Hembra3100085Preocupación menor (LC)
Dendrobates auratus-82.12348.54322024-07-22Macho124Preocupación menor (LC)
Cebus imitator-85.432110.65432024-08-30Hembra8300045Vulnerable (VU)
Iguana iguana-84.78909.34562024-09-15Macho44000150Preocupación menor (LC)
Basiliscus basiliscus-83.45678.98762024-10-05Hembra220080Preocupación menor (LC)
Ateles geoffroyi-84.123410.23452024-11-12Macho6700050En peligro (EN)
Boa imperator-82.34569.87652024-12-01Hembra1012000300Preocupación menor (LC)
Sotalia fluviatilis-83.98768.12342024-12-20Macho1235000210En peligro (EN)
Chelonia mydas-84.12349.65432025-01-05Hembra50150000120En peligro (EN)

Tipos de variables

Las variables de los datos de la tabla 1 son de varios tipos, cuya jerarquía se muestra en la figura 1.

Tipos de variables

Figura 1. Tipos de variables. Fuente: (Çetinkaya-Rundel & Hardin, 2021).

Numéricas

Corresponden a números a los cuales se les pueden aplicar operaciones como suma, resta, multiplicación, división y otras similares. Las variables numéricas puden ser discretas o continuas.

Discretas

Toman valores específicos que se pueden contar. La variable edad, en este caso, es discreta.

Continuas

Pueden tomar cualquier valor dentro de un intervalo o rango continuo. Estas variables se caracterizan por su capacidad para representar medidas precisas y pueden asumir un número infinito de valores, incluso dentro de un rango limitado (ej. entre 0 y 1). Las variables peso y longitud son continuas.

Categóricas

Las variables categóricas (también llamadas cualitativas), son aquellas que describen una característica o cualidad de una observación y pueden utilizarse para clasificar las observaciones en grupos o categorías. A diferencia de las variables numéricas, que expresan cantidades, las variables categóricas expresan atributos no numéricos. Las variables categóricas pueden ser nominales u ordinales.

Nominales

No existe un orden inherente o jerarquía entre las categorías. Las variables nombre científico y sexo son nominales.

Ordinales

Hay un orden o jerarquía clara entre las categorías, como en el caso de la variable estado de conservación.

Referencias bibliográficas

Çetinkaya-Rundel, Mine, & Hardin, Johanna (2021). Chapter 1: Hello data en Introduction to Modern Statistics (1st ed.). OpenIntro, Inc. https://openintro-ims.netlify.app/data-hello