¿Qué es R?

Si este es tu primer acercamiento a R, es muy probable que te encuentres analizando las ventajas y utilidades de R sobre otro software estadístico; como veremos más adelante R es mucho más que eso.

A través de R Users Group - Ecuador te invitamos a que explores este software poderoso, que puede ser aplicado ampliamente en el procesamiento, análisis de datos y visualización de resultados.

Empecemos señalando que R es un lenguaje de programación interpretado, de distribución libre, bajo Licencia GNU, y se mantiene en un ambiente para el cómputo estadístico y gráfico. Este software corre en distintas plataformas Linux, Windows, MacOS, e incluso en PlayStation 3. El término ambiente pretende caracterizarlo como un sistema totalmente planificado y coherente, en lugar de una acumulación gradual de herramientas muy específicas y poco flexibles, como se observa generalmente en software de análisis de datos.

Como lo explica John Chambers (Chambers and Hastie [1991]) creador y principal diseñador del lenguaje de programación S (lenguaje progenitor de R)

  • “Buscamos que los usuarios puedan iniciar en un entorno interactivo, en el que no se vean, conscientemente, a ellos mismos como programadores. Conforme sus necesidades sean más claras y su complejidad se incremente, deberían gradualmente poder profundizar en la programación, es cuando los aspectos del lenguaje y el sistema se vuelven más importantes.”

Por esta razón, en lugar de pensar en R como un software estadístico, es preferible verlo como un ambiente en el que se aplican técnicas estadísticas.

Fortalezas

Una de sus grandes fortalezas es que puede ser ampliado mediante paquetes que extienden sus funcionalidades. Actualmente hay más de 11000 paquetes publicados con licencias libres y disponibles en el repositorio general (CRAN), y alrededor de 4000 paquetes destinados al análisis de genomas (Bioconductor), además de paquetes presentes en github con extensiones específicas a nuevas áreas como bioinformática, bioestadística, geoestadística, modelos gráficos, etc.

R es un lenguaje de programación que está en constante evolución y del que se dispone de una amplia documentación, la comunidad en torno a R es muy activa por lo que es sencillo encontrar soluciones rápidamente a los problemas que los usuarios se puedan encontrar.

Aplicaciones


R funciona con cualquier tipo de archivo, es muy flexible, puede trabajar con datos procedentes de todo tipo de archivos: txt, csv, prm, JSON, xls, xlsx, dta, sav, mtp, png, jpeg, mp3, mp4, etc., etc., si, así es, imágenes, audio, video, etc., etc., puedes analizar imágenes, sonidos, videos, etc., etc.

Permite realizar análisis de estadística descriptiva, inferencial, paramétrica, no paramétrica, Bayesiana, univariante, multivariante, funcional, etc.

Permite comprimir y organizar la información en sus formatos .rda o .Rdata.

Permite integración con bases de datos relacionales Postgres, MySql, Oracle, etc., etc. y bases de datos no relacionales CouchDB, MongoDB, etc., etc.

Permite integración con SPSS Modeler, Tableau, Qlik Sense, ArcGIS, SAP, SAS, etc., etc.

La escalabilidad es un elemento clave, así que también permite integración con Hadoop, Spark, Elasticsearch, Kibana, es decir BIGDATA.

Permite el desarrollo de publicaciones, libros, aplicaciones, dashboards y presentaciones con shiny, shinydashboard, flexdashboard, slidify, rpresenter, markdown, bookdown, etc., etc.

Permite su uso con varios IDES como RStudio, RStudio Server, Microsoft R Server, VIM, Eclipse, Emacs Speaks Statistics.

Permite webscraping e integración con redes sociales.

Permite realizar análisis en tiempo real.

Obviamente puedes utilizar servicios soap, rest, etc., etc. y generar tareas automáticas o desarrollar aplicaciones con cloud computing con AWS, AZURE, Google Platform o usar tu propio servidor.

Y bueno, se nos deben escapar muchas opciones, pero esperamos que con este resumen muy breve se genere una mayor curiosidad en tí y te sumes a la comunidad de usuarios de R.

Si estas interesado en aplicar al menos uno de los temas señalados, en futuras publicaciones y capacitaciones los abordaremos.