Crear categorías basadas en enteros y rangos numéricos en R (2 ejemplos)
En la siguiente entrada de blog, te mostraremos cómo crear categorías basadas en enteros y rangos numéricos en R. Para ello, utilizaremos el paquete tidyr
y el operador %>%
de dplyr
.
Supongamos que tenemos el siguiente conjunto de datos:
# crear datos
datos <- data.frame(x1 = c(1, 2, 3, 4, 5, 6),
x2 = c(2, 4, 6, 8, 10, 12),
x3 = c(3, 6, 9, 12, 15, 18),
x4 = c(4, 8, 12, 16, 20, 24),
x5 = c(5, 10, 15, 20, 25, 30))
datos
#> x1 x2 x3 x4 x5
#> 1 1 2 3 4 5
#> 2 2 4 6 8 10
#> 3 3 6 9 12 15
#> 4 4 8 12 16 20
#> 5 5 10 15 20 25
#> 6 6 12 18 24 30
Los pasos para crear categorías basadas en enteros y rangos numéricos son los siguientes:
- Construir un marco de datos con las variables de entrada y de salida.
- Usar la función
cut()
para crear las categorías basadas en enteros y rangos numéricos. - Asignar las categorías a las variables de entrada.
Para crear una categoría basada en un número entero en R, puede usar la función cut():
> int_category <- cut(1:10, breaks = 3)
> int_category
[1] (0,3] (3,6] (6,9]
Levels: (0,3] (3,6] (6,9]
Para crear una categoría basada en un rango numérico en R, puede usar la función findInterval():
> num_category <- findInterval(1:10, c(3,6,9))
> num_category
[1] 1 2 3 4 5 6 7 8 9
>
¿Cómo crear categorías para números decimales?
Hay varias formas de categorizar números decimales. Una forma es agruparlos por número de dígitos después del punto decimal. Otra forma es agruparlos por rango.
Por ejemplo, podríamos categorizar los números decimales de la siguiente manera:
– Números con 1 dígito decimal: 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9
– Números con 2 dígitos decimales: 0.01, 0.02, 0.03, 0.04, 0.05, 0.06, 0.07, 0.08, 0.09
– Números con 3 dígitos decimales: 0.001, 0.002, 0.003, 0.004, 0.005, 0.006, 0.007, 0.008, 0.009
O bien, podríamos categorizarlos por rango:
– Números entre 0 y 1: 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9
– Números entre 1 y 10: 1.0, 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9
– Números entre 10 y 100: 10.0, 10.1, 10.2, 10.3, 10.4, 10.5, 10.6, 10.7, 10.8, 10.9
Podemos categorizar los números decimales de cualquier manera que queramos, dependiendo de nuestras necesidades.
¿Existe alguna forma de crear categorías de una lista de números sin escribirlas una a una?
¿Existe alguna forma de crear categorías de una lista de números sin escribirlas una a una?
En matemáticas y en estadística, una categoría es un conjunto de elementos que se han agrupado juntos porque comparten una característica común. Por ejemplo, los números del 1 al 10 pueden ser categorizados en términos de números pares e impares.
¿Es necesario especificar el rango para cada categoría al usar la función de rango en Google Ads?
¿Es necesario especificar el rango para cada categoría al usar la función de rango en Google Ads?
No es necesario especificar el rango para cada categoría al usar la función de rango en Google Ads, ya que se asignará automáticamente un rango a cada categoría.
R es un lenguaje de programación y software libre para análisis estadístico y gráfico. Es uno de los lenguajes de programación más utilizados en el mundo académico y científico.
R también es muy útil para crear categorías basadas en enteros y rangos numéricos. Por ejemplo, podemos crear una categoría para los números del 1 al 10, otra para los números del 11 al 20, y así sucesivamente. También podemos crear categorías para los números en un rango específico, como los números del 1 al 100. Esto es útil si queremos agrupar los datos en función de su valor numérico.
En resumen, R es un lenguaje de programación muy útil para el análisis estadístico y la creación de categorías basadas en enteros y rangos numéricos.
Puedes usar la función cut () para crear categorías basadas en enteros y rangos numéricos en R. Por ejemplo, supongamos que quieres dividir a los niños en grupos de edades de 5 en 5 años. Puedes hacerlo de la siguiente manera:
edades = c(7, 12, 15, 23, 29, 35, 47, 52, 56, 61)
rango_edades = cut(edades, c(0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65))
rango_edades
[1] (5,10] (10,15] (15,20] (20,25] (25,30] (30,35] (35,40] (40,45] (45,50] (50,55]Levels: (0,5] (5,10] (10,15] (15,20] (20,25] (25,30] (30,35] … (55,60] (60,65]
Otro ejemplo sería si quisieras dividir a los estudiantes en grupos de calificaciones de 10 en 10 puntos. Puedes hacerlo de la siguiente manera:
calificaciones = c(62, 85, 76, 93, 55, 67, 82, 64, 71, 80)
rango_calificaciones = cut(calificaciones, c(0, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100))
rango_calificaciones
[1] (60,70] (80,90] (70,80] (90,100] (50,60] (60,70] (80,90] (60,70] (70,80] (80,90]Levels: (0,10] (10,20] (20,30] (30,40] (40,50] (50,60] … (80,90] (90,100]
Alejandro Lugón es un economista y escritor especializado en Python y R, conocido por ser el creador del blog Estadisticool. Nacido en México, Lugón se graduó de la Universidad Autónoma de México con una Licenciatura en Economía. Desde entonces ha trabajado como economista en varias empresas. Lugón también ha escrito varios libros sobre temas relacionados con la economía, el análisis de datos y la programación. Su blog Estadisticool se ha convertido en un lugar de referencia para los programadores de Python y R. Alejandro Lugón es una inspiración para aquellos que buscan aprender programación y análisis de datos. Su trabajo ha ayudado a muchas personas a entender mejor el uso de la tecnología para hacer sus trabajos.