En esta página, mostraré cómo seleccionar ciertas filas de marcos de datos en función de los niveles de una columna de factores en el lenguaje de programación R.
El tutorial está estructurado de la siguiente manera:
Vamos a sumergirnos en:
Creación de datos de ejemplo
Utilizo los datos a continuación como base para este tutorial de programación R:
datos < -datos . marco ( x1 = factor ( c ( "A" , "B" , "A" , "C" , "D" , "B" ) ) , # Crear marco de datos x2 = 1 : 6 ) datos # Imprimir marco de datos |
La Tabla 1 muestra la estructura de nuestros datos de ejemplo: contiene seis observaciones y dos variables. La columna x1 es un factor con cuatro niveles de factor diferentes.
Ejemplo 1: extracción de filas de marcos de datos en función del nivel de un factor
En este ejemplo, mostraré cómo conservar las filas donde nuestra columna de factores tiene un nivel de factor específico.
Para esto, podemos usar los operadores $ y == como se muestra a continuación:
data_new1 <- data [ data$x1 == "A" , ] # Nivel de un factor data_new1 # Imprimir datos actualizados |
El resultado del código de programación R anterior se muestra en la Tabla 2: hemos mantenido solo las filas del marco de datos donde la variable x1 contiene el nivel de factor «A».
Ejemplo 2: Extracción de filas de marcos de datos en función de múltiples niveles de factores
En este ejemplo, explicaré cómo seleccionar filas de marcos de datos por múltiples niveles de factores.
La siguiente sintaxis R mantiene filas donde la columna de factor x1 tiene el nivel de factor «A» o el nivel de factor «D»:
data_new2 <- data [ data$x1 % in % c ( "A" , "D" ) , ] # Múltiples niveles de factor data_new2 # Imprimir datos actualizados |
La Tabla 3 muestra el resultado del código anterior: un marco de datos con tres filas. Todas estas filas tienen el nivel «A» o «D» en la variable x1.
Video, recursos adicionales y resumen
Si necesitas más explicaciones sobre los códigos R de este artículo, te recomiendo echar un vistazo al siguiente vídeo de mi canal de YouTube. En la instrucción del video, muestro los códigos R de esta página en una sesión de programación en vivo en RStudio:
Además, es posible que desee leer algunos de los artículos relacionados en https://statisticsglobe.com/:
- Seleccionar filas de marcos de datos basadas en valores en vector
- droplevels R Ejemplo
- Subconjunto de filas de marcos de datos por condición lógica en R
- Extraer subconjunto de filas de marcos de datos que contienen NA
- Filas únicas de marco de datos basadas en columnas seleccionadas
- Ejemplos de programación R
En resumen: este tutorial ha ilustrado cómo extraer filas según los niveles de los factores en el lenguaje de programación R. Si tiene más preguntas, dígamelas en la sección de comentarios a continuación.
Alejandro Lugón es un economista y escritor especializado en Python y R, conocido por ser el creador del blog Estadisticool. Nacido en México, Lugón se graduó de la Universidad Autónoma de México con una Licenciatura en Economía. Desde entonces ha trabajado como economista en varias empresas. Lugón también ha escrito varios libros sobre temas relacionados con la economía, el análisis de datos y la programación. Su blog Estadisticool se ha convertido en un lugar de referencia para los programadores de Python y R. Alejandro Lugón es una inspiración para aquellos que buscan aprender programación y análisis de datos. Su trabajo ha ayudado a muchas personas a entender mejor el uso de la tecnología para hacer sus trabajos.