ANÁLISIS EXPLORATORIO CON R

Para esta oportunidad utilizaremos el programa R, para presentar diversas herramientas que se pueden usar para un análisis en primera instancia o exploratorio. Se hará uso de la herramienta Notebook, del mismo Rstudio.

Primero ejecutamos la línea de código que nos permite usar los paquetes requeridos para las bases de datos y las funciones.

 Segundo,  nos centraremos en buscar que bases de datos podemos utilizar de los paquetes referenciados.

Y tercero, visualizamos los datos de la base "galton"


# PROCEDEREMOS A CREAR UN HISTOGRAMA

El propósito de este histograma es comparar la altura del padre y del hijo.


En el caso de que dos variables tengan un número desigual de observaciones, la la opción freq = FALSE asegurará que las alturas de dos variables en un intervalo permanezcan iguales si su porcentaje general del contenedor permanece igual. Los límites para los valores de altura están contenidos con xlim = c (60,75). El histograma de la altura del padre se identifica con col = "verde", densidad = 10, y add = TRUE, densidad = 10, ángulo = -45 asegura que el histograma en relieve se pueda identificar con el del anterior. La leyenda había sido añadida para complementar adecuadamente el programa.

La mayor concentración de alturas se dan entre los 65 y 70 cm, (pasado el metro), gráficamente se tiene la evidencia de que las alturas de los padres siguen una distribución normal más asentada que la de los hijos.

# DIAGRAMA DE PARETO

El gráfico de Pareto ha sido diseñado para abordar las preguntas implícitas respondidas por la ley de Pareto. El entendimiento común de la ley de Pareto es que los "recursos mayoritarios" son consumidos por un "usuario minoritario". El mas común de los porcentajes es la regla de 80-20, lo que implica que el 80% de los efectos provienen del 20% de las causas. La ley de Pareto también se conoce como la ley de unos pocos vitales, o el 80-20
regla. El gráfico de Pareto da respuestas muy inteligentes al responder completamente cuanto pertenece a cuantos. Montgomery (2005), página 148, ha enumerado el gráfico de Pareto como una de las siete herramientas principales del control estadístico de procesos.

Ahora analizaremos las causas de contaminación y efecto óxido.



Tan solo la contaminación, el efecto óxido y varios, este último referido a restos orgánicos resultan generar el 80% de toda la contaminación posible.

#DIAGRAMA DE TALLOS Y HOJAS

Velleman y Hoaglin (1984) describen la idea básica de la visualización de tallos y hojas al permitir que los dígitos de los valores de datos realicen la clasificación en orden numérico y luego muestren la misma.


El gráfico de ejecución también se conoce como el diagrama de secuencia de ejecución.


# GRÁFICO DE DISPERSIÓN

El lector está familiarizado con este formato muy básico de gráficos.
Cada vez que tenemos datos emparejados y existe la creencia de que las variables están relacionadas, es natural que las relacionemos unas con otras. Tal visualización es, por supuesto, conocida como la gráfica de dispersión o la gráfica de x-y. 



Te invito a seguir el blog, para poder recibir notificaciones de nuevas presentaciones; además te comentamos que realizamos videos académicos sobre estadística, investigación y tecnología en nuestro canal de youtube, espero lo disfrutes,  tenemos estos videos geniales para tus investigaciones:

🟥 INTELIGENCIA ARTIFICIAL, LO QUE NOS ESPERA 🟥

https://www.youtube.com/watch?v=H1ndSPrlj3k

🟥EXPECTATIVAS DEL INTERNET DE LAS COSAS 🟥

https://www.youtube.com/watch?v=uUrRKQnVTL4

🔷 Algoritmos y Herramientas del Aprendizaje Automático 🔷

https://www.youtube.com/watch?v=1llcPkyizlc

💹 FUNDAMENTOS DE CONTABILIDAD FINANCIERA 💹

https://www.youtube.com/watch?v=9RCD9M1bBHY

🟩 GESTIÓN EMPRESARIAL 🟩 

https://www.youtube.com/watch?v=4w9q7A3ZhXo


Comentarios