/ Data science

Anaconda distribución para Data Science ¿Qué es y cómo instalarla?

Anaconda es la distribución más popular para Data Science y machine learning que nos permite trabajar con muchísimos paquetes, que ya vienen pre-instalados, es de código abierto y es un estándar para trabajar con Ciencia de datos, ya que cuenta con un montón de herramientas tanto visuales como por líneas de comandos que nos ayudan con muchísimas tareas.

No necesitamos permisos administrativos o de raíz para instalar Anaconda. Podemos instalarlo para el usuario local con una ubicación de instalación escribible o incluso puede instalarse en todo el servidor con permisos de administrador.

Anaconda-Distribution-Diagram

Beneficios de instalar Anaconda:

  • Más de 1,400 paquetes de ciencias de datos curados y comunitarios de Anaconda.
  • Desarrolle proyectos de ciencias de datos usando sus IDEs favoritos, incluidos Jupyter, JupyterLab, Spyder y RStudio.
  • Analice datos con escalabilidad y rendimiento con Dask, numpy, pandas y Numba.
  • Visualice sus datos con Matplotlib, Bokeh, Datashader y Holoviews
    Crea modelos de machine learning y deep learning con Scikit-learn, Tensorflow, h20 y Theano.
  • Gestiona automáticamente todos los paquetes, incluidas las dependencias entre lenguajes.
  • Funciona en todas las plataformas: Linux, macOS, Windows.
  • Crea entornos virtuales.
  • Descarga paquetes de conda de Anaconda, Anaconda Enterprise, Conda Forge y Anaconda Cloud.
  • Instale y ejecute aplicaciones y editores, incluidos Jupyter, RStudio, Visual Studio Code y Spyder.
  • Gestione sus entornos locales y proyectos de ciencias de datos desde una interfaz gráfica.
  • Conéctese a Anaconda Cloud o Anaconda Enterprise.
  • Acceda a los últimos recursos de aprendizaje y de la comunidad.

¿Pero qué diferencia hay en instalar Anaconda y los paquetes que necesito por aparte?

Pues esa es una pregunta que yo me hice, pues porque dije: yo quiero instalar numpy para trabajar con listas lo puedo hacer con Pipenv o con pip que es la menera rústica de hacerlo, pero aunque Pipenv es la forma más obvia y correcta de hacerlo, estuve investigando que así sea en un entorno virtual, el instalar y desinstalar paquetes puede afectar dependencias de los mismos cuando se tiene muchos paquetes instalados y Anaconda gestiona esto a la perfección, se encarga de actualizar y desactualizar automáticamente, según las necesidades le proyecto que estés trabajando y también pues hay muchas personas que tienen más de dos versiones de python instaladas en su computadora, y con anaconda tu manipulas la versión que quieras tener con un simple comando.

Instalación de Anaconda en Linux Manjaro y otras distros.

Ustedes saben que soy entusiasta de linux, así que me voy a ahorrar explicaciones con linux y mac, de todas formas es bien fácil instalarlo en esos sistemas operativos al igual que en linux.

Descargamos el paquete de la web oficial, Descargar Anaconda, luego de descargarlo nos posicionamos en la carpeta de descargas en consola (o la carpeta donde se descarguen tus archivos) cd descargas y luego escribimos el siguiente comando: sudo sh Anaconda3-5.2.0-Linux-x86_64.sh.

El instalador comenzará y continuará con una serie de preguntas. La aceptación de los Términos y Condiciones es bastante autoexplicativa. Si no está seguro acerca de cualquier configuración, acepte los valores predeterminados. Puedes cambiarlos más tarde. Cambié la ruta de instalación predeterminada durante la fase de instalación de la siguiente manera: /usr/local/anaconda/

Please answer 'yes' or 'no':'
 >>> yes

Anaconda3 will now be installed into this location:
 /root/anaconda3

- Press ENTER to confirm the location
 - Press CTRL-C to abort the installation
 - Or specify a different location below

[/root/anaconda3] >>> /usr/local/anaconda/

Hacia el final, cuando le pregunte si desea anteponer Anaconda a la variable PATH de su SO, seleccione 'no'. En Arch Linux, necesitamos anteponer Anaconda a su variable Path de forma manual. Esto hará que ejecutar los comandos de Conda sea mucho más fácil.

Lo anterior aplica para Arch linux y derivados pero si quieres lo puedes hacer en tu distro no veo porqué no(al menos que la configuración de carpetas sea diferente). Para exportar la variable PATH y que todo sea autoejecutable lo hacemos de esta manera:

Yo tengo instalado Oh my zsh, así que hago lo siguiente:

  • Me posiciono en mi carpeta personal con el comando cd
  • Luego habro el .zshrc con el comando nano .zshrc
  • En la parte superior pego lo siguiente:
# added by Anaconda3 installer
export PATH=$HOME/bin:/usr/local/bin:/usr/local/anaconda/bin:$PATH

Sino tienes instalando Oh my zsh has lo mismo pero en el siguiente archivo .bash.

Testear la instalación:

Para ver si todo está funcionando a la perfección cierra la terminal y abre una nueva y escribe el comando conda list y te saldrá una lista con todos los los paquetes que tienes disponibles para empezar a trabajar. Puedes escribir lo siguiente en la terminal para verificar que python está siendo administrado por Anaconda.

# python -V
 Python 3.6.2 :: Anaconda, Inc.
# which python
 /usr/local/anaconda/bin/python

Entorno visual con Anaconda Navigator:

Si todo está bien solo tienes que tipear este comando: anaconda-navigator y te desplegara el entorno visual, para que hagas lo mismo que haces por linea de comando, pero con unos cuantos clicks.

2018-06-navigator-macos

¿Aún crees que la universidad es buena opción para estudiar? Compara con Teamtreehouse → ¡haciendo clic aquí!

Orlando Morales

Orlando Morales

Arquitecto web, Data scientist freelance y amante de las Artes Marciales, me encanta siempre aprender, emprender y luchar por mejorar mi estilo de vida mientras disfruto de lo que hago.

Leer más