| Title: | Traduce al Español Varios Conjuntos de Datos de Práctica | 
| Version: | 0.5.1 | 
| Description: | Provee una versión traducida de los siguientes conjuntos de datos: 'airlines', 'airports', 'AwardsManagers', 'babynames', 'Batting', 'credit_data', 'diamonds', 'faithful', 'fueleconomy', 'Fielding', 'flights', 'gapminder', 'gss_cat', 'iris', 'Managers', 'mpg', 'mtcars', 'atmos', 'palmerpenguins', 'People, 'Pitching', 'planes', 'presidential', 'table1', 'table2', 'table3', 'table4a', 'table4b', 'table5', 'vehicles', 'weather', 'who'. English: It provides a Spanish translated version of the datasets listed above. | 
| License: | CC0 | 
| URL: | https://github.com/cienciadedatos/datos | 
| BugReports: | https://github.com/cienciadedatos/datos/issues | 
| Depends: | R (≥ 3.5.0) | 
| Imports: | babynames, dplyr, forcats, fueleconomy, gapminder, ggplot2, Lahman, nasaweather, nycflights13, palmerpenguins, modeldata (≥ 1.0.0), rlang, tibble, tidyr, yaml | 
| Suggests: | covr, testthat (≥ 2.1.0) | 
| ByteCompile: | true | 
| Encoding: | UTF-8 | 
| Language: | es | 
| LazyData: | true | 
| RoxygenNote: | 7.2.1 | 
| NeedsCompilation: | no | 
| Packaged: | 2023-07-17 01:14:32 UTC; ciruelo | 
| Author: | Riva Quiroga | 
| Maintainer: | Riva Quiroga <riva.quiroga@uc.cl> | 
| Repository: | CRAN | 
| Date/Publication: | 2023-07-17 02:20:02 UTC | 
datos: Traduce al Español Varios Conjuntos de Datos de Práctica
Description
 
Provee una versión traducida de los siguientes conjuntos de datos: 'airlines', 'airports', 'AwardsManagers', 'babynames', 'Batting', 'credit_data', 'diamonds', 'faithful', 'fueleconomy', 'Fielding', 'flights', 'gapminder', 'gss_cat', 'iris', 'Managers', 'mpg', 'mtcars', 'atmos', 'palmerpenguins', 'People, 'Pitching', 'planes', 'presidential', 'table1', 'table2', 'table3', 'table4a', 'table4b', 'table5', 'vehicles', 'weather', 'who'. English: It provides a Spanish translated version of the datasets listed above.
Author(s)
Maintainer: Riva Quiroga riva.quiroga@uc.cl (ORCID)
Authors:
- Edgar Ruiz edgararuiz@gmail.com 
- Mauricio Vargas mvargas@dcc.uchile.cl 
- Mauro Lepore maurolepore@gmail.com (ORCID) 
Other contributors:
- Rayna Harris rayna.harris@gmail.com [contributor] 
- Daniela Vasquez daniela.vazquez@gmail.com [contributor] 
- Joshua Kunst jbkunst@gmail.com [contributor] 
See Also
Useful links:
- Report bugs at https://github.com/cienciadedatos/datos/issues 
Nombres de aerolíneas
Description
Nombres de aerolíneas y su respectivo código carrier de dos dígitos.
Usage
aerolineasFormat
Un data.frame con 16 filas y 2 columnas
- aerolinea
- abreviación de dos caracteres del nombre de la aerolínea 
- nombre
- nombre completo de la aerolínea 
Datos de aeropuertos
Description
Metadatos útiles de los aeropuertos
Usage
aeropuertosFormat
Un data.frame con 1.458 filas y 8 columnas
- codigo_aeropuerto
- código FAA del aeropuerto 
- nombre
- nombre del aeropuerto 
- latitud
- coordenada de ubicación del aeropuerto 
- longitud
- coordenada de ubicación del aeropuerto 
- altura
- altura medida en pies 
- zona_horaria
- diferencia horaria respecto del meridiano de Greenwich (GMT) 
- horario_verano
- horario legal de acuerdo a las políticas de ahorro de energía. A = Zona Horaria de Ahorro de Luz de Día (DST) estándar de los EEUU: comienza el segundo Sábado de Marzo y termina el primer Sábado de Noviembre. U = Desconocido. N = No tiene zona horaria especial. 
- zona_horaria_iana
- zona horaria IANA, que se determina de acuerdo al servicio web GeoNames 
Datos atmosféricos
Description
Datos atmosféricos
Usage
atmosferaFormat
Un data.frame con 41472 filas y 11 columnas
- latitud
- Ubicación de la medida. Grilla espacial de 24 por 24 desde longitud 113.8O a 56.2O y desde latitud 36.2N a 21.2S. 
- longitud
- Ubicación de la medida. Grilla espacial de 24 por 24 desde longitud 113.8O a 56.2O y desde latitud 36.2N a 21.2S. 
- anio
- 72 puntos en el tiempo. Una vez al mes desde enero de 1995 hasta diciembre de 2000. 
- mes
- 72 puntos en el tiempo. Una vez al mes desde enero de 1995 hasta diciembre de 2000. 
- temp_superficie
- Temperatura media mensual basada en la energía emitida desde la Tierra en condiciones de cielo despejado (en K). 
- temperatura
- Temperatura media mensual del aire cerca de la superficie de la Tierra (en K). 
- presion
- Presión media mensual en una ubicación determinada de la superficie de la Tierra (en mb). 
- ozono
- Cantidad media mensual de ozono en la columna atmosférica (en Dobsons). 
- nube_baja
- Porcentaje de la media mensual de cielo cubierto por nubes con una presión superior mayor a 680 mb o aproximadamente menor que 3.24 km. 
- nube_media
- Porcentaje de la media mensual de cielo cubierto por nubes con una presión superior entre 440-680 mb o aproximadamente menor que 3.24 a 6.5 km. 
- nube_alta
- Porcentaje de la media mensual de cielo cubierto por nubes con una presión superior menor o igual a 440 mb o aproximadamente mayor que 6.5 km. 
Datos de aviones
Description
Metadatos de los aviones y sus códigos de cola en el registro de aviación de la FAA. American Airways (AA) y Envoy Air (MQ) reportan número de flota en lugar de número de cola, por lo que no es posible trazarlos.
Usage
avionesFormat
Un data.frame con 3.322 filas y 9 columnas
- codigo_cola
- código de cola 
- anio
- año de fabricación 
- tipo
- tipo de avión 
- fabricante
- fabricante del avión 
- modelo
- modelo del avión 
- motores
- cantidad de motores 
- asientos
- cantidad de asientos 
- velocidad
- velocidad crucero promedio medida en millas por hora 
- tipo_motor
- tipo de motor del avión 
Tabla de estadísticas de bateo
Description
Estadísticas de bateadores
Format
Un data frame con 105.861 filas y 22 columnas
- id_jugador
- ID del jugador 
- id_anio
- Año 
- orden_equipos
- Orden en que el jugador se movió entre equipos dentro de la misma temporada 
- id_equipo
- ID del equipo (factor) 
- id_liga
- ID de la liga (factor con niveles AA, AL, FL, NL, PL, UA) 
- juegos
- Número de juegos en los que participó oficialmente el jugador 
- al_bate
- Turnos al bate 
- carreras
- Carreras anotadas 
- golpes
- Cantidad de veces en la que el jugador alcanzó una base debido a un golpe, sin error de la defensa 
- dobles
- Hits en los que el bateador llegó a segunda base 
- triples
- Golpes en los que el bateador llegó a tercera base 
- cuadrangulares
- Cuadrangulares - jonrones 
- carreras_empujadas
- Carreras empujadas 
- bases_robadas
- Bases robadas 
- atrapado_robando
- Atrapado (out) en intento de robo 
- base_bolas
- Base por bolas 
- ponches
- Ponches 
- base_intencional
- Base por bolas intencional 
- golpeado
- Golpeado por lanzamiento 
- toque_sacrificio
- Toque de sacrificio 
- elavado_sacrificio
- Elevado de sacrificio 
- doble_matanza
- Batazos para doble matanza (doble play) 
Tabla de capitanes
Description
Información de los equipos que dirigieron y algunas estadísticas básicas de los equipos en cada año.
Format
Un data frame con 3.504 filas y 10 columnas
- id_jugador
- ID del jugador 
- anio
- Año 
- id_equipo
- ID equipo (factor) 
- id_liga
- ID liga (factor) 
- en_temporada
- Cero si fue capitán del equipo al equipo toda la temporada. En otro caso denota el orden de entrada en la temporada (uno si fue el primer capitán del equipo que entró esa temporada, dos si fue el segundo capitán del equipo que entró esa temporada, etc) 
- juegos
- Juegos dirigidos 
- juegos_ganados
- Juegos ganados 
- juegos_perdidos
- Juegos perdidos 
- posicion
- Posición del equipo en la clasificación final del año 
- jugador_representado
- Tiene valor "S" (sí) para los jugadores estuvieron de capitán del equipo durante la temporada y "N" (no) en caso contrario (factor). 
Datos de clima
Description
Datos meteorológicos por hora para LGA, JFK y EWR.
Usage
climaFormat
Un data.frame con 3,322 líneas y 9 variables
- origen
- Estación de clima 
- anio
- año de la fecha de registro 
- mes
- mes de la fecha de registro 
- dia
- día de la fecha de registro 
- hora
- hora de la fecha de registro 
- temperatura
- temperatura medida en grados Fahrenheit 
- punto_rocio
- temperatura medida en grados Fahrenheit en la que, dada la presión atmosférica y humedad, condensa el vapor de agua 
- humedad
- humedad relativa 
- direccion_viento
- dirección del viento medida en grados 
- velocidad_viento
- velocidad del viento medida en millas por hora 
- velocidad_rafaga
- velocidad de las ráfagas de viento medida en millas por hora 
- precipitacion
- precipitación de lluvia medida en pulgadas 
- presion
- presión atmosférica al nivel del mar medida en milibares 
- visibilidad
- visibilidad medida en millas 
- fecha_hora
- fecha y hora de registro en formato POSIXct 
Modelos comunes de vehículos
Description
Estos modelos tienen al menos 10 años de datos. Este dataset es adecuado para efectuar un join que restringa el número de observaciones a un nivel manejable.
Usage
comunesFormat
Un data.frame con 347 filas y 4 columnas
- fabricante
- Fabricante 
- modelo
- Modelo 
- total_modelos
- Número total de modelos 
- total_modelos_anio
- Número total de modelos-año 
Vectores de caracteres dentro del paquete stringr
Description
Muestra de vectores de caracteres para practicar la manipulación de cadenas (strings)
Usage
oraciones
frutas
palabras
Format
Un vector
An object of class character of length 50.
An object of class character of length 25.
An object of class character of length 1000.
Details
oraciones - es una selección y adaptación al español de los datos de práctica contenidos en stringr::sentences.
fruta - es una selección y adaptación al español de los datos de práctica contenidos en stringr::fruit.
palabras - es una selección de las 1000 palabras más frecuentes del Corpus de Referencia del Español Actual (CREA) de la RAE, disponible en github.com/rivaquiroga/frecuencias-crea
Examples
length(oraciones)
oraciones[1:5]
length(frutas)
frutas[1:5]
length(palabras)
palabras[1:5]
Datos de crédito
Description
Datos asociados a créditos de consumo.
Format
Un data.frame con 14 filas y 4454 columnas
- Estado
- estado del crédito 
- Antiguedad
- Antigüedad laboral 
- Vivienda
- tipo de propiedad de la vivienda 
- Plazo
- Plazo del crédito en meses 
- Edad
- edad del cliente 
- EstadoCivil
- estado civil 
- Registros
- existencia de registros previos 
- Trabajo
- tipo de trabajo 
- Gastos
- cantidad o monto de gastos 
- Ingresos
- cantidad o monto de ingresos 
- Activos
- cantidad o monto de activos 
- Deuda
- cantidad o monto de deudas 
- Cantidad
- cantidad solicitada de préstamo 
- Precio
- precio del crédito 
Precio de 50.000 diamantes
Description
Un conjunto de datos que contiene los precios de casi 54.000 diamantes.
Usage
diamantesFormat
Un data.frame con 53.940 filas y 10 columnas
- precio
- Precio en dólares americanos ($326-$18,823) 
- quilate
- Peso del diamante (0.2-5.01) 
- corte
- Calidad del corte (Regular, Bueno, Muy bueno, Premium, Ideal) 
- color
- Color del diamante, de J (peor) a D (mejor) 
- claridad
- Medida de que tan claro es el diamante (I1 (peor), SI1, SI2, VS1, VS2, VVS1, VVS2, IF (mejor)) 
- profundidad
- Porcentaje de la profundidad total = z / mean(x, y) = 2 * z / (x + y) (43-79) 
- tabla
- Ancho de la parte superior del diamante con relación a su punto más ancho (43-95) 
- x
- Largo en milimetros 
- y
- Ancho en milimetros 
- z
- Profundidad en milimetros 
Tabla de dirigentes
Description
Información de los equipos que dirigieron y algunas estadísticas básicas de los equipos en cada temporada.
Format
Un data frame con 3.504 filas y 10 columnas
- id_jugador
- ID del jugador 
- anio
- Año 
- id_equipo
- ID equipo (factor) 
- id_liga
- ID liga (factor) 
- orden_temporada
- Orden (secuencia) en la dirigencia de equipos durante una temporada. 0 si fue dirigente del equipo durante toda una temporada. En otro caso denota el orden de entrada a un equipo en una temporada (1 si fue el primer diriente del equipo que entró en esa temporada, 2 si fue el segundo dirigente del equipo que entró en esa temporada, etc.) 
- juegos_dirigidos
- Juegos dirigidos 
- juegos_ganados
- Juegos ganados 
- juegos_perdidos
- Juegos perdidos 
- posicion
- Posición del equipo en la clasificación final de la temporada regular 
- jugador_dirigente
- Tiene valor 'S' (sí) para los jugadores que hayan sido jugadores y dirigentes del equipo durante una temporada y 'N' (no) en caso contrario (factor). 
Muestra de variables categóricas de una encuesta social
Description
Muestra de variables categóricas de la Encuesta Social General de EE.UU.
Usage
encuestaFormat
Un data.frame con 21.473 filas y 9 columnas
- anio
- año de la encuesta, 2000-2014 
- estado_civil
- estado civil 
- edad
- edad. Edad máxima truncada a 89 años 
- raza
- categorías raciales según la encuesta 
- ingreso
- ingreso reportado por los encuestados (US$) 
- partido
- partido político con el que se identifica 
- religion
- religión 
- denominacion
- denominación religiosa a la que pertenece 
- horas_tv
- horas de televisión que ve al día 
Datos del géiser Viejo Fiel (Old Faithful)
Description
Datos de tiempo de duración y espera entre erupciones del géiser Viejo Fiel (Old Faithful), ubicado en el Parque Nacional de Yellowstone, en Wyoming, Estados Unidos.
Usage
fielFormat
Un data frame con 272 observaciones y 2 columnas
- erupciones
- Tiempo de erupciones, en minutos 
- espera
- Minutos entre erupciones 
Tabla de Fildeo
Description
Estadísticas de jardineros
Format
Un data frame con 140.921 filas y 18 columnas
- id_jugador
- ID del jugador 
- id_anio
- Año 
- orden_equipos
- Orden en que el jugador se movió entre equipos dentro de la misma temporada 
- id_equipo
- ID del equipo (factor) 
- id_liga
- ID de la liga (factor con niveles AA, AL, FL, NL, PL, UA) 
- posicion
- Posición del jugdador a la defensiva 
- juegos_jugados
- Juegos jugados 
- juegos_iniciados
- Juegos iniciados 
- InnOuts
- Tiempo jugado por el jugador, expresado en outs 
- outs_realizados
- Outs realizados por el jugador 
- asistencias
- Asistencias realizadas por el jugador 
- errores
- Errores realizados por el jugador 
- doble_matanzas
- Doble matanzas en las que el jugador ha estado envuelto defensivamente 
- bolas_pasadas
- Bolas dejadas pasar (aplicable a los receptores) 
- lanzamientos_desviados
- Lanzamientos desviados (aplicable a los receptores) 
- bases_robadas
- Bases robadas por oponente (aplicable a los receptores) 
- atrapados_robando
- Oponentes atrapados en intento de robo (aplicable a los receptores) 
- clasificacion_zona
- Porcentaje de pelotas atrapadas por un fildeador, en su zona defensiva "típica" 
Datos sobre la flor Iris de Edgar Anderson
Description
El set de datos sobre la flor Iris entrega las medidas en centímetros del largo y ancho de los sépalos y los pétalos de 50 flores de 3 especies de Iris (setosa, versicolor y virginica).
Usage
floresFormat
Un dataframe con 150 casos (filas) y 5 variables (columnas)
- Largo.Sepalo
- Largo del sépalo 
- Ancho.Sepalo
- Ancho del sépalo 
- Largo.Petalo
- Largo del pétalo 
- Ancho.Petalo
- Ancho del pétalo 
- Especie
- A qué especie de la flor Iris corresponde (setosa, versicolor, virginica) 
Tabla de estadísticas de jardineros
Description
Estadísticas de jardineros
Format
Un data frame con 140.921 filas y 18 columnas
- id_jugador
- ID del jugador 
- id_anio
- Año 
- orden_equipos
- Orden en que el jugador se movió entre equipos dentro de la misma temporada 
- id_equipo
- ID del equipo (factor) 
- id_liga
- ID de la liga (factor con niveles AA, AL, FL, NL, PL, UA) 
- posicion
- Posición del jugdador a la defensiva 
- juegos_jugados
- Juegos jugados 
- juegos_iniciados
- Juegos iniciados 
- inn_outs
- Tiempo jugado por el jugador, expresado en outs 
- outs_realizados
- Outs realizados por el jugador 
- asistencias
- Asistencias realizadas por el jugador 
- errores
- Errores realizados por el jugador 
- doble_matanzas
- Doble matanzas en las que el jugador ha estado envuelto defensivamente 
- bolas_pasadas
- Bolas dejadas pasar (aplicable a los receptores) 
- lanzamientos_desviados
- Lanzamientos desviados (aplicable a los receptores) 
- bases_robadas
- Bases robadas por oponente (aplicable a los receptores) 
- atrapados_robando
- Oponentes atrapados en intento de robo (aplicable a los receptores) 
- clasificacion_zona
- Porcentaje de pelotas atrapadas por un fildeador, en su zona defensiva 'típica' 
Tabla de estadísticas de lanzadores
Description
Estadísticas de lanzadores
Format
Un data frame con 46.699 filas y 30 columnas
- id_jugador
- ID del jugador 
- id_anio
- Año 
- orden_equipos
- Orden en que el jugador se movió entre equipos dentro de la misma temporada 
- id_equipo
- ID del equipo (factor) 
- id_liga
- ID de la liga (factor con niveles AA, AL, FL, NL, PL, UA) 
- juegos_ganados
- Juegos jugados ganados 
- juegos_perdidos
- Juegos jugados perdidos 
- juegos_jugados
- Juegos jugados 
- juegos_iniciados
- Juegos jugados iniciados 
- juegos_completados
- Número de juegos completos (9 innings lanzados) que lanzó el jugador 
- blanqueadas
- Número de blanqueos (juegos completos sin permitir carreras) que lanzó el jugador 
- juegos_salvados
- Juegos salvados 
- IPouts
- Outs propinados al equipo contrario (Igual a innings lanzados x 3) 
- hits
- Hits permitidos del oponente 
- carreras_ganadas
- Carreras limpias recibidas 
- cuadrangulares
- Cuadrangulares recibidos 
- BB
- Base por bolas cedidas al oponente 
- ponches
- Ponches propinados al oponente 
- promedio_bateo_rival
- Promedio de bateo del rival 
- promedio_carreras_ganadas
- Promedio de carreras limpias permitidas (normalizada a 9 innings lanzados) 
- IBB
- Base por bolas intencionales cedidas al oponente 
- lanzamientos_desviados
- Lanzamientos desviados lanzados por el lanzador 
- HBP
- Bateadores golpeador por el lanzador 
- BK
- Balks (movimiento ilegal del cuerpo realizado por el lanzador) 
- BFP
- Bateadores a los que el lanzador se ha enfrentado 
- juegos_finalizados
- Juegos en los que el lanzador finalizó el juego 
- carreras
- Carreras recebidas (sucias y limpias) 
- sacrificios_golpeados
- Toques de sacrificio que el oponente le hizo al lanzador 
- vuelos_sacrificio
- Elevado (fly) de sacrificio que el oponente le hizo al lanzador 
- doble_matanza
- Doble matanza inducidas por el lanzador 
Datos de economía de combustible de 1999 y 2008 para 38 modelos populares de automóviles
Description
Este conjunto de datos contiene un subconjunto de los datos de economía de combustible que la Agencia de Protección Medioambiental (EPA) pone a disposición en http://fueleconomy.gov. Contiene solo modelos que tuvieron una nueva versión cada año entre 1999 y 2008, lo que fue utilizado como un proxy de la popularidad del modelo.
Usage
millasFormat
Un data.frame con 234 filas y 11 columnas
- fabricante
- fabricante 
- modelo
- nombre del modelo 
- cilindrada
- tamaño del motor del automóvil, en litros 
- anio
- año de fabricación 
- cilindros
- número de cilindros 
- transmision
- tipo de transmisión 
- traccion
- tipo de tracción (d = delantera, t = trasera, 4 = 4 ruedas) 
- ciudad
- millas por galón de combustible en ciudad 
- autopista
- millas por galón de combustible en autopista 
- combustible
- tipo de combustible (p = premium, r = regular, e = etanol, d = diesel, g = gas natural comprimido) 
- clase
- tipo de auto 
Pruebas de ruta de automóviles de Motor Trend
Description
Los datos fueron extraídos de la revista Motor Trend de Estados Unidos de 1974, y tiene datos de consumo de combustible y 10 aspectos de diseño y rendimiento para 32 automóviles (modelos de 1973-1974).
Usage
mtautosFormat
Un data.frame con 32 filas y 12 columnas
- millas
- millas por galón de Estados Unidos 
- cilindros
- número de cilindros 
- cilindrada
- suma del volumen útil de todos los cilindros del motor en pulgadas cúbicas 
- caballos
- caballos de fuerza brutos 
- eje
- relación del eje de transmisión trasero 
- peso
- peso (1000 libras) 
- velocidad
- tiempo en recorrer 1/4 de milla 
- forma
- forma del motor (en V o en línea) 
- transmision
- tipo de transmisión (0 = automático, 1 = manual) 
- cambios
- número de cambios de la caja de cambios 
- carburadores
- número de carburadores 
Nombres de bebés
Description
Datos completos sobre nombres de bebés provistos por la Social Security Administration de EE.UU. Incluye todos los nombres con al menos 5 usos.
Usage
nombresFormat
Un data.frame con 1924665 observaciones y 5 variables
- anio
- Año del registro 
- sexo
- Sexo del bebé 
- nombre
- Nombre 
- FALSE
- Cantidad de ocurrencias 
- prop
- Proporción 
Datos de tuberculosis de la Organización Mundial de la Salud
Description
Subconjunto de datos del informe anual de tuberculosis de la Organización Mundial de la Salud
Usage
omsFormat
Un data.frame con 7.240 filas y 60 columnas
- pais
- nombre del país 
- iso2
- código ISO de dos dígitos del país 
- iso3
- código ISO de tres dígitos del país 
- anio
- año 
- nuevos_fpp_h014
- casos nuevos, diagnóstico frotis pulmonar positivo (fpp), hombres (h) de 0 a 14 años (014) 
- nuevos_fpp_h1524
- casos nuevos, diagnóstico frotis pulmonar positivo (fpp), hombres (h) de 15 a 24 años (1524) 
- nuevos_fpp_h2534
- casos nuevos, diagnóstico frotis pulmonar positivo (fpp), hombres (h) de 25 a 34 años (2534) 
- nuevos_fpp_h3544
- casos nuevos, diagnóstico frotis pulmonar positivo (fpp), hombres (h) de 35 a 44 años (3544) 
- nuevos_fpp_h4554
- casos nuevos, diagnóstico frotis pulmonar positivo (fpp), hombres (h) de 45 a 54 años (4554) 
- nuevos_fpp_h5564
- casos nuevos, diagnóstico frotis pulmonar positivo (fpp), hombres (h) de 55 a 64 años (5564) 
- nuevos_fpp_h65
- casos nuevos, diagnóstico frotis pulmonar positivo (fpp), hombres (h) de 65 o más años 
- nuevos_fpp_m014
- casos nuevos, diagnóstico frotis pulmonar positivo (fpp), mujeres (m) de 0 a 14 años (014) 
- nuevos_fpp_m1524
- casos nuevos, diagnóstico frotis pulmonar positivo (fpp), mujeres (m) de 15 a 24 años (1524) 
- nuevos_fpp_m2534
- casos nuevos, diagnóstico frotis pulmonar positivo (fpp), mujeres (m) de 25 a 34 años (2534) 
- nuevos_fpp_m3544
- casos nuevos, diagnóstico frotis pulmonar positivo (fpp), mujeres (m) de 35 a 44 años (3544) 
- nuevos_fpp_m4554
- casos nuevos, diagnóstico frotis pulmonar positivo (fpp), mujeres (m) de 45 a 54 años (4554) 
- nuevos_fpp_m5564
- casos nuevos, diagnóstico frotis pulmonar positivo (fpp), mujeres (m) de 55 a 64 años (5564) 
- nuevos_fpp_m65
- casos nuevos, diagnóstico frotis pulmonar positivo (fpp), mujeres (m) de 65 o más años 
- nuevos_fpn_h014
- casos nuevos, diagnóstico frotis pulmonar negativo (fpn), hombres (h) de 0 a 14 años (014) 
- nuevos_fpn_h1524
- casos nuevos, diagnóstico frotis pulmonar negativo (fpn), hombres (h) de 15 a 24 años (1524) 
- nuevos_fpn_h2534
- casos nuevos, diagnóstico frotis pulmonar negativo (fpn), hombres (h) de 25 a 34 años (2534) 
- nuevos_fpn_h3544
- casos nuevos, diagnóstico frotis pulmonar negativo (fpn), hombres (h) de 35 a 44 años (3544) 
- nuevos_fpn_h4554
- casos nuevos, diagnóstico frotis pulmonar negativo (fpn), hombres (h) de 45 a 54 años (4554) 
- nuevos_fpn_h5564
- casos nuevos, diagnóstico frotis pulmonar negativo (fpn), hombres (h) de 55 a 64 años (5564) 
- nuevos_fpn_h65
- casos nuevos, diagnóstico frotis pulmonar negativo (fpn), hombres (h) de 65 o más años 
- nuevos_fpn_m014
- casos nuevos, diagnóstico frotis pulmonar negativo (fpn), mujeres (m) de 0 a 14 años (014) 
- nuevos_fpn_m1524
- casos nuevos, diagnóstico frotis pulmonar negativo (fpn), mujeres (m) de 15 a 24 años (1524) 
- nuevos_fpn_m2534
- casos nuevos, diagnóstico frotis pulmonar negativo (fpn), mujeres (m) de 25 a 34 años (2534) 
- nuevos_fpn_m3544
- casos nuevos, diagnóstico frotis pulmonar negativo (fpn), mujeres (m) de 35 a 44 años (3544) 
- nuevos_fpn_m4554
- casos nuevos, diagnóstico frotis pulmonar negativo (fpn), mujeres (m) de 45 a 54 años (4554) 
- nuevos_fpn_m5564
- casos nuevos, diagnóstico frotis pulmonar negativo (fpn), mujeres (m) de 55 a 64 años (5564) 
- nuevos_fpn_m65
- casos nuevos, diagnóstico frotis pulmonar negativo (fpn), mujeres (m) de 65 o más años 
- nuevos_ep_h014
- casos nuevos, diagnóstico extrapulmonar (ep), hombres (h) de 0 a 14 años (014) 
- nuevos_ep_h1524
- casos nuevos, diagnóstico extrapulmonar (ep), hombres (h) de 15 a 24 años (1524) 
- nuevos_ep_h2534
- casos nuevos, diagnóstico extrapulmonar (ep), hombres (h) de 25 a 34 años (2534) 
- nuevos_ep_h3544
- casos nuevos, diagnóstico extrapulmonar (ep), hombres (h) de 35 a 44 años (3544) 
- nuevos_ep_h4554
- casos nuevos, diagnóstico extrapulmonar (ep), hombres (h) de 45 a 54 años (4554) 
- nuevos_ep_h5564
- casos nuevos, diagnóstico extrapulmonar (ep), hombres (h) de 55 a 64 años (5564) 
- nuevos_ep_h65
- casos nuevos, diagnóstico extrapulmonar (ep), hombres (h) de 65 o más años 
- nuevos_ep_m014
- casos nuevos, diagnóstico extrapulmonar (ep), mujeres (m) de 0 a 14 años (014) 
- nuevos_ep_m1524
- casos nuevos, diagnóstico extrapulmonar (ep), mujeres (m) de 15 a 24 años (1524) 
- nuevos_ep_m2534
- casos nuevos, diagnóstico extrapulmonar (ep), mujeres (m) de 25 a 34 años (2534) 
- nuevos_ep_m3544
- casos nuevos, diagnóstico extrapulmonar (ep), mujeres (m) de 35 a 44 años (3544) 
- nuevos_ep_m4554
- casos nuevos, diagnóstico extrapulmonar (ep), mujeres (m) de 45 a 54 años (4554) 
- nuevos_ep_m5564
- casos nuevos, diagnóstico extrapulmonar (ep), mujeres (m) de 55 a 64 años (5564) 
- nuevos_ep_m65
- casos nuevos, diagnóstico extrapulmonar (ep), mujeres (m) de 65 o más años 
- nuevosrecaida_h014
- nuevas recaídas, hombres (h) de 0 a 14 años (014) 
- nuevosrecaida_h1524
- nuevas recaídas, hombres (h) de 15 a 24 años (1524) 
- nuevosrecaida_h2534
- nuevas recaídas, hombres (h) de 25 a 34 años (2534) 
- nuevosrecaida_h3544
- nuevas recaídas, hombres (h) de 35 a 44 años (3544) 
- nuevosrecaida_h4554
- nuevas recaídas, hombres (h) de 45 a 54 años (4554) 
- nuevosrecaida_h5564
- nuevas recaídas, hombres (h) de 55 a 64 años (5564) 
- nuevosrecaida_h65
- nuevas recaídas, hombres (h) de 65 o más años 
- nuevosrecaida_m014
- nuevas recaídas, mujeres (m) de 0 a 14 años (014) 
- nuevosrecaida_m1524
- nuevas recaídas, mujeres (m) de 15 a 24 años (1524) 
- nuevosrecaida_m2534
- nuevas recaídas, mujeres (m) de 25 a 34 años (2534) 
- nuevosrecaida_m3544
- nuevas recaídas, mujeres (m) de 35 a 44 años (3544) 
- nuevosrecaida_m4554
- nuevas recaídas, mujeres (m) de 45 a 54 años (4554) 
- nuevosrecaida_m5564
- nuevas recaídas, mujeres (m) de 55 a 64 años (5564) 
- nuevosrecaida_m65
- nuevas recaídas, mujeres (m) de 65 o más años 
Datos de Gapminder
Description
Extracto de datos de Gapminder sobre expectativa de vida, PIB per cápita y población, según país
Usage
paisesFormat
Un data.frame de 1704 filas y 6 columnas
- pais
- países incluidos (factor con 142 niveles) 
- continente
- continentes (factor con 5 niveles) 
- anio
- desde 1952 a 2007, datos cada 5 años 
- esperanza_de_vida
- esperanza de vida al nacer, en años 
- poblacion
- población 
- pib_per_capita
- PIB per cápita (en dólares americanos, ajustados según inflación) 
Source
http://www.gapminder.org/data/
Tabla de personas
Description
Nombres de jugadores, fecha de nacimiento e información bibliográfica. Este archivo se usa para obtener detalles acerca de los jugadores listados en bateadores, lanzadores y otros archivos en que los jugadores están identificados por id_jugador.
Format
Un data frame con 19.617 filas y 26 columnas
- id_jugador
- ID del jugador 
- anio_nacimiento
- Año de nacimiento 
- mes_nacimiento
- Mes de nacimiento 
- dia_nacimiento
- Día de nacimiento 
- pais_nacimiento
- País de nacimiento 
- estado_nacimiento
- Estado de nacimiento 
- ciudad_nacimiento
- Ciudad de nacimiento 
- anio_fallecimiento
- Año de fallecimiento 
- mes_fallecimiento
- Mes de fallecimiento 
- dia_fallecimiento
- Día de fallecimiento 
- pais_fallecimiento
- País de fallecimiento 
- estado_fallecimiento
- Estado de fallecimiento 
- ciudad_fallecimiento
- Ciudad de fallecimiento 
- nombre
- Nombre 
- apellido
- Apellido 
- nombre_completo
- Nombre y apellido 
- peso
- Peso en libras 
- estatura
- Estatura en pulgadas 
- bateador
- Si como bateador es diestro (D) o zurdo (Z) 
- lanzador
- Si como lanzador es diestro (D) o zurdo (Z) 
- fecha_primer_juego
- Fecha primer juego en primera división 
- fecha_ultimo_juego
- Fecha último juego en primera división 
- id_retrosheet
- Código de jugador usado en Retrosheet (http://www.retrosheet.org/) 
- id_brw
- Código de jugador usado en Baseball Reference website (http://www.baseball-reference.com/) 
- fecha_fallecimiento
- Fecha de fallecimiento en formato yyyy-mm-dd 
- fecha_nacimiento
- Fecha de nacimiento en formato yyyy-mm-dd 
Medidas de tamaño de pingüinos adultos en busca de comida cerca de la estación Palmer en la Antártica.
Description
Incluye medidas para: especie de pingüino, isla dentro del Archipiélago de Palmer, tamaño (largo de aleta, masa corporal, dimensiones de pico) y sexo.
Usage
pinguinosFormat
Un tibble con 344 filas y 8 variables
- especie
- un factor que indica la especie de pingüino (Adelia, Barbijo y Papúa) 
- isla
- un factor que indica la isla en el archipiélago de Palmer (Biscoe, Dream o Torgersen) 
- largo_pico_mm
- un número que indica el largo del pico (milímetros) 
- alto_pico_mm
- un número que indica el alto del pico (milímetros) 
- largo_aleta_mm
- un entero que indica el largo de la aleta (milímetros) 
- masa_corporal_g
- un entero que indica la masa corporal (gramos) 
- sexo
- un factor que indica el sexo del pingüino (hembra, macho) 
- anio
- un entero que indica el año estudiado (2007, 2008 o 2009) 
Source
*** Pingüinos Adelia: Palmer Station Antarctica LTER and K. Gorman. 2020. Structural size measurements and isotopic signatures of foraging among adult male and female Adélie penguins (Pygoscelis adeliae) nesting along the Palmer Archipelago near Palmer Station, 2007-2009 ver 5. Environmental Data Initiative https://doi.org/10.6073/pasta/98b16d7d563f265cb52372c8ca99e60f. *** Pingüinos Papúa: Palmer Station Antarctica LTER and K. Gorman. 2020. Structural size measurements and isotopic signatures of foraging among adult male and female Gentoo penguin (Pygoscelis papua) nesting along the Palmer Archipelago near Palmer Station, 2007-2009 ver 5. Environmental Data Initiative https://doi.org/10.6073/pasta/7fca67fb28d56ee2ffa3d9370ebda689. *** Pingüínos Barbijo: Palmer Station Antarctica LTER and K. Gorman. 2020. Structural size measurements and isotopic signatures of foraging among adult male and female Chinstrap penguin (Pygoscelis antarcticus) nesting along the Palmer Archipelago near Palmer Station, 2007-2009 ver 6. Environmental Data Initiative https://doi.org/10.6073/pasta/c14dfcfada8ea13a17536e73eb6fbe9e. *** Publicado originalmente en: Gorman KB, Williams TD, Fraser WR (2014) Ecological Sexual Dimorphism and Environmental Variability within a Community of Antarctic Penguins (Genus Pygoscelis). PLoS ONE 9(3): e90081. doi:10.1371/journal.pone.0090081
Tabla de premios de los capitanes
Description
Información de los premios de los capitanes de equipo
Format
Un data frame con 179 filas y 6 columnas
- id_jugador
- ID del jugador 
- nombre_premio
- Nombre del premio recibido 
- anio
- Año 
- id_liga
- ID liga (factor) 
- empate
- Tiene valor "S" (sí) para los premios que corresponden a un empate y "N" (no) en caso contrario. 
- notas
- Comentarios sobre el premio 
Tabla de premios de los dirigentes
Description
Información de los premios de los dirigentes de equipo
Format
Un data frame con 179 filas y 6 columnas
- id_dirigente
- ID del dirigente 
- nombre_premio
- Nombre del premio recibido por el dirigente 
- anio
- Año 
- id_liga
- ID liga (factor) 
- empate
- Tiene valor "S" (sí) para los premios que corresponden a un empate y "N" (no) en caso contrario. 
- notas
- Comentarios sobre el premio 
Periodos de 11 presidentes, desde Eisenhower a Obama
Description
Nombre, fecha de inicio y término de su mandato y partido político de 11 presidentes de EE.UU., desde Eisenhower a Obama.
Format
Un data.frame con 11 filas y 4 columnas
- nombre
- Nombre del presidente 
- inicio
- Fecha de inicio de su periodo presidencial 
- fin
- Fecha de término de su periodo presidencial 
- partido
- Partido político al que pertenece 
Tabla de representantes (bateadores)
Description
Información de los representantes de los bateadores
Format
Un data frame con 3.504 filas y 10 columnas
- id_jugador
- ID del jugador 
- anio
- Año 
- id_equipo
- ID equipo (factor) 
- id_liga
- ID liga (factor) 
- en_temporada
- Cero si representó al equipo toda la temporada. En otro caso denota el orden de entrada en la temporada (uno si fue el primer representante que entró esa temporada, dos si fue el segundo representante que entró esa temporada, etc) 
- partidos
- Partidos dirigidos 
- partidos_ganados
- Partidos ganados 
- partidos_perdidos
- Partidos perdidos 
- posicion
- Posición del equipo en la clasificación final del año 
- jugador_representado
- Tiene valor "S" (sí) para los jugadores que tienen representante en la temporada y "N" (no) en caso contrario (factor). 
Tabla de salarios
Description
Información de los salarios de los jugadores.
Format
Un data frame con 26.428 filas y 5 columnas
- anio
- Año 
- id_equipo
- ID equipo (factor) 
- id_liga
- ID liga (factor) 
- id_jugador
- ID del jugador 
- salario
- Salario en dólares 
Registros de tuberculosis de la Organización Mundial de la Salud (1era variante)
Description
Contiene observaciones de casos registrados en Afganistán, Brasil y China en los años 1999 y 2000.
Format
Un tibble con 6 filas y 4 columnas
- pais
- Nombre del país 
- anio
- Año correspondiente a los valores registrados 
- casos
- Número de casos registrados 
- poblacion
- Población del país 
Registros de tuberculosis de la Organización Mundial de la Salud (2da variante)
Description
Contiene observaciones de casos registrados en Afganistán, Brasil y China en los años 1999 y 2000.
Format
Un tibble con 12 filas y 4 columnas
- pais
- Nombre del país 
- anio
- Año correspondiente a los valores registrados 
- tipo
- Categoría a la que pertenece la observación 
- cuenta
- Cantidad de observaciones para cada tipo 
Registros de tuberculosis de la Organización Mundial de la Salud (3ra variante)
Description
Contiene observaciones de casos registrados en Afganistán, Brasil y China en los años 1999 y 2000.
Format
Un tibble con 6 filas y 3 columnas
- pais
- Nombre del país 
- anio
- Año correspondiente a los valores registrados 
- tasa
- Tasa de casos de tuberculosis en relación a la población total 
Registros de tuberculosis de la Organización Mundial de la Salud (variante 4a)
Description
Contiene observaciones de casos registrados en Afganistán, Brasil y China en los años 1999 y 2000.
Format
Un tibble con 3 filas y 3 columnas
- pais
- Nombre del país 
- 1999
- Casos registrados el año 1999. 
- 2000
- Casos registrados el año 2000. 
Registros de tuberculosis de la Organización Mundial de la Salud (variante 4b)
Description
Contiene observaciones de casos registrados en Afganistán, Brasil y China en los años 1999 y 2000.
Format
Un tibble con 3 filas y 3 columnas
- pais
- Nombre del país 
- 1999
- Población en el año 1999. 
- 2000
- Población en el año 2000. 
Registros de tuberculosis de la Organización Mundial de la Salud (5ta variante)
Description
Contiene observaciones de casos registrados en Afganistán, Brasil y China en los años 1999 y 2000.
Format
Un tibble con 6 filas y 4 columnas
- pais
- Nombre del país 
- siglo
- Siglo correspondiente a los valores registrados 
- anio
- Año correspondiente a los valores registrados 
- tasa
- Tasa de casos de tuberculosis con relación a la población total 
Datos de economía de combustible
Description
Datos de economía de combustible de la Agencia de Protección Medioambiental (EPA) de EE.UU., 1985-2015. Contiene una selección de variables y no considera vehículos con datos incompletos.
Usage
vehiculosFormat
Un data.frame con 33442 filas y 12 columnas
- id
- Identificador único EPA 
- fabricante
- Fabricante 
- modelo
- Nombre del modelo 
- anio
- año de fabricación 
- clase
- tipo de auto 
- transmision
- tipo de transmisión 
- traccion
- tipo de tracción 
- cilindros
- número de cilindros 
- motor
- tamaño del motor del automóvil, en litros 
- combustible
- tipo de combustible 
- autopista
- millas por galón de combustible en autopista 
- ciudad
- millas por galón de combustible en ciudad 
Datos de vuelos
Description
Datos temporales de todos los vuelos que despegaron de Nueva York (JFK, LGA o EWR) durante 2013.
Usage
vuelosFormat
Un data.frame con 336.776 filas y 19 columnas
- anio
- año de la fecha de salida 
- mes
- mes de la fecha de salida 
- dia
- día de la fecha de salida 
- horario_salida
- horario efectivo de salida del vuelo (formato HHMM o HMM), hora local 
- salida_programada
- horario programado para la salida (formato HHMM o HMM), hora local 
- atraso_salida
- atraso de la salida en minutos. Valores negativos indican salida adelantada 
- horario_llegada
- horario efectivo de llegada del vuelo (formato HHMM o HMM), hora local 
- llegada_programada
- horario programado para la llegada (formato HHMM o HMM), hora local 
- atraso_llegada
- atraso de la llegada en minutos. Valores negativos indican llegada adelantada 
- aerolinea
- abreviación de dos letras de la aerolínea. Ver 'aerolineas' para obtener el nombre 
- vuelo
- número de vuelo 
- codigo_cola
- código de cola del avión 
- origen
- origen del vuelo. Ver 'aeropuertos' para metadatos adicionales 
- destino
- destino del vuelo. Ver 'aeropuertos' para metadatos adicionales 
- tiempo_vuelo
- cantidad de tiempo en aire, en minutos 
- distancia
- distancia entre aeropuertos, en millas 
- hora
- hora del horario programado para la salida 
- minuto
- minutos del horario programado para la salida 
- fecha_hora
- fecha y horario programados del vuelo en formato POSIXct