EXPLORACIÓN Y MANIPULACIÓN DE DATOS EN RSTUDIO

###########################
#ANÁLISIS EXPLORATORIO#
###########################

Como en todo análisis es necesario empezar estudiando el comportamiento de los datos, la estructura y dinámica de los mismos para entender lo que miden y si corresponde a nuestros objetivos de investigación. Empecemos:


Presentamos la forma de "llamar" una base datos correspondiente a un paquete existente en R, debemos instalarlo si aun no está en nuestro almacén, por lo pronto tenemos que Forbes es un conjunto de datos de 2000 compañías líderes en el mundo, la lista Forbes 2000 para el año 2004.


Esto no nos muestra ninguna característica importante de los datos y nosotros necesitamos saber su estructura:


Bien, esto si es importante, 2000 observaciones para cada una de las 8 variables, tenrmos variables numéricas "num", enteras "int", categóricas "chr", y "factor"

# DESCRIPCIÓN DE VARIABLES:

rank: el ranking de la empresa,
name: el nombre de la empresa,
country: el país en el que se encuentra la empresa,
category: una categoría que describe los productos que la empresa produce,
sales: la cantidad de ventas de la compañía en miles de millones de dólares estadounidenses,
profits: el beneficio de la empresa en miles de millones de dólares,
assets: los activos de la empresa en miles de millones de dólares estadounidenses,
marketvalue: el valor de mercado de la compañía en miles de millones de dólares estadounidenses.


Con el código anterior podemos saber que tipo de objeto tenemos, por ejemplo corrobora que "forbes" esta definida como una base de datos.


Contamos con 2000 y 8 variables

#Nombres de las variables a disposición


#Verificar el tipo de variable


Es una variable de tipo entera y así para cada variable.

#generar números consecutivos:


#Nombres de categorías

Si tenemos variables categóricas es necesario conocer cuántas y cuáles son esas categorías.



#tabla de frecuencias para las variables:

#categórica


#numérica


Observando la tabla diríamos que el 89% de las empresas venden menos de 20 millones de dólares al año, lo que causa que las ventas no tengan una distribución normal, como se nota en el histograma.

#Indicadores estadísticos

Podemos calcularlos así:


Las ventas mínimas son de 0.01 de mil millones, es decir 10 millones de dólares, mientras que el 50% de las empresas tienen un total mediano de 4 mil  millones de dolares, la empresas venden en promedio 9 mil millones de dolare y el 75% de las empresas solo alcanza los 9 mil millones de dolares al año.

#########################
#MANIPULACIÓN BÁSICA
#########################

Definiremos un objeto que contendrá la variable nombres de las variables:


# N° de registros de algunas variables determinadas


#TRES PRIMERAS EMPRESAS DE ACUERDO A SUS VENTAS


#empresas cuyos activos superan los 100 mil millones de dolares


La función "table" nos permite dividir las respuestas en Si o No, según la interrogante.

#VERIFICACIÓN DE DATOS FALTANTES


donde la función is. devuelve un vector lógico que es VERDADERO cuando el elemento correspondiente del vector suministrado es NA. Un enfoque más cómodo está disponible cuando queremos eliminar todas las observaciones con al menos un valor faltante de un objeto data.frame. La función complete.cases toma un data.frame y devuelve un vector lógico que es VERDADERO cuando la observación correspondiente no contiene ningún valor faltante:

La siguiente función verificará la respuesta:


#######################
#COMPUTANDO DATOS#
#######################

# SIMPLES RESÚMENES ESTADÍSTICOS


El siguiente código presenta un bosquejo de todas las variables:


# GRÁFICOS SIMPLES

Emplearemos una fórmula: valor de mercado - ventas

El histograma del valor de mercado no sigue una distribución normal, mientras que si le aplicamos el log, si tiende a una distribución normal, no es una alternativa, solo nos sirve de muestra.



#DIAGRAMA DE CAJAS


Se aplicó en primer lugar un objeto que reconociera las características a representar y luego se ilustró el gráfico con las características deseadas, para evaluar sus promedios y demás indicadores, esperamos les haya servido y pronto vendrán más análisis.

También visita nuestro canal, tenemos estos videos geniales para tus investigaciones:

🟥 INTELIGENCIA ARTIFICIAL, LO QUE NOS ESPERA 🟥

https://www.youtube.com/watch?v=H1ndSPrlj3k

🟥EXPECTATIVAS DEL INTERNET DE LAS COSAS 🟥

https://www.youtube.com/watch?v=uUrRKQnVTL4

🔷 Algoritmos y Herramientas del Aprendizaje Automático 🔷

https://www.youtube.com/watch?v=1llcPkyizlc

💹 FUNDAMENTOS DE CONTABILIDAD FINANCIERA 💹

https://www.youtube.com/watch?v=9RCD9M1bBHY

🟩 GESTIÓN EMPRESARIAL 🟩 

https://www.youtube.com/watch?v=4w9q7A3ZhXo


Te invito a seguir el blog, para poder recibir notificaciones de nuevas presentaciones, gracias.

Comentarios